Semantische web

Kunnen we het web gebruiken voor marktanalyses?

Van de 65% van de Nederlanders die deze week schoenen willen gaan kopen, heeft 55% warme gevoelens bij het merk Nike. Voor 80% van hen geldt dat ze de schoenen lekker vinden zitten. 90% vindt dat ze er cool uitzien en 35% is gecharmeerd van de goede prijs/kwaliteit verhouding. [fictief voorbeeld]

Zou het ooit lukken om tot een dergelijke analyse te komen uit de bergen aan informatie die online te vinden zijn in blogs en tweets? Onze vaardigheid om informatie te produceren overstijgt duidelijk onze vaardigheid om die berg gegevens te analyseren. Er is zoveel potentie, maar waar blijven de tools om hiermee om te gaan. Zelfs het krachtige Google schiet hierin (nu nog) tekort.

Laten we eens kijken naar hoe het internet zo groot is gegroeid.

De evolutie van internet

Eerst hadden we web 1.0 oftewel “wij lezen wat zij publiceren”. Websites waren statisch en het medium beperkte zich tot zenden. We noemen dit ook wel het Information Web.

Daarna kregen we meer interactiemogelijkheden met bestaande websites (commenting), maar werd het ook gemakkelijker om zelf content op het web te publiceren (Facebook, YouTube, Twitter, Blogger). Een van de eerste websites in Nederland die voornamelijk bestond uit User Generated Content is de restaurantgids iens.nl. We noemen dit web 2.0. Iedereen kan een publisher zijn oftewel “zij lezen wat wij publiceren”. We noemen dit ook wel het Social Web.

En zo explodeert de enorme hoeveelheid tekst die online te vinden is. Allerlei talen en allerlei onderwerpen. Alles volgen is onmogelijk, maar je wilt ook niets interessants missen. De kunst is om relaties definiëren en structuur aan te brengen in webcontent en data, oftewel “zij analyseren wat wij publiceren”, om zo nieuwe ontdekkingen te doen. We noemen het , het of het Intelligent Web.

Hieronder een overzicht van de evolutie van het internet:

[helaas… de embedded infographic is verdwenen]

Bron: How the WebOS Evolves?
novaspivack.typepad.com2/9/07

Hierboven een timeline van het verleden, heden en de toekomst van het Web (klik hier als het plaatje niet verschijnt). Web 2.0 ging eigenlijk over het upgraden van de ‘voorkant’ en gebruikerservaring van internet. Veel van de hedendaagse innovaties gaan juist over het upgraden van de ‘achterkant’ van het Web en dat zal de focus zijn van Web 3.0 (de voorkant zal naar alle waarschijnlijkheid niet heel veel anders zijn dan bij Web 2.0, maar de onderliggende technologieën zijn geavanceerder en scheppen nieuwe mogelijkheden…

Overigens verschillen de meningen over of dat web 3.0 hetzelfde is als het semantische web, of dat het semantische web een onderdeel is van we 3.0. Deze discussie valt buiten de scope van dit artikel.

Web 3.0 “zij analyseren wat wij publiceren”

Het menselijk brein schiet in de analyse van het semantische web enorm tekort, maar computers kunnen met hun grote rekencapaciteit uitkomst bieden zolang die computers begrijpen wat ze moeten doen. En daar zit de crux. Computers begrijpen de syntax van tekst nog wel, maar de betekenis ervan is een hele stap verder. Als we dit computers duidelijk kunnen maken, kunnen ze ons vervolgens helpen om informatie te halen uit de miljarden documenten op het web.

De moeilijkheid met het semantische web

Het probleem is eigenlijk dat computers geen mensen zijn en niet kunnen werken zonder dat een mens de richting wijst en vertelt wat ze moeten doen. Vervolgens kunnen computers dingen wel sneller doen natuurlijk.

Tim Berners-Lee over het semantische web:

2012: The Year of the Semantic Web – Huffington Post
15 jaar nadat Tim Berners-Lee zijn droom uitsprak zien we dat het semantische web wordt gebruikt in verschillende vakgebieden, variërend van musea tot borstkankeronderzoek. Dit jaar kan het jaar van het semantische web worden als steeds meer branches deze semantische technologie gaan gebruiken…

“I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘’Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.”
– Tim Berners-Lee, directeur van het World Wide Web Consortium (W3C), in 1996.

Een computer ziet de woorden “Paris Hilton” anders dan een mens, die waarschijnlijk eerst aan de persoon Paris Hilton denkt en daarna pas aan het Hilton hotel in Parijs.
Ook begrijpt een computer cynisme niet. Wanneer in een filmrecensie de zinsnede staat “go read the fantastic book”, dan snapt de computer niet dat het negatief is. Je kunt allerlei regels gaan bedenken over hoe wij op het web moeten schrijven en hoe we al onze data daar neerzetten zodanig dat computers het begrijpen, maar dat gaat niet zomaar gebeuren. De droom van Tim Berners-Lee (de bedenker van de term ‘semantic web’) vergt hele slimme computers die juist kunnen omgaan met alle uitzonderingen en steeds bijleren.

Dit artikel opende met een fictieve analyse over Nike schoenen. Maar is het mogelijk om dergelijke analyses te doen? Een enorme uitdaging! Er wordt al hard aan gewerkt om dit mogelijk te maken. Een beetje verbetering zou al welkom zijn om een einde te maken aan keuzestress 😉 .

Ter afsluiting nog een vermakelijke video over het verschil tussen web 2.0 en het semantische web (3.0).

Overige bronnen

Dit artikel werd in 2012 gepubliceerd op ContentCuratie.nl.

Share This

Share this post with your friends!