Democratisch zoeken
Herbert Blankesteijn
De zoekmachine Google is te
goed geworden. Tik 'creditcard' of 'password' in en je maakt kans op pikante
informatie. De laatste tijd is de zoekmachine Google herhaaldelijk in het
nieuws. Wat is het verschil tussen Google en de rest?
Zoeken is een van de meestgebruikte
toepassingen op internet. Tussen honderden zoekmachines woedt een strijd om de
positie van de populairste. Er zijn verschillende wapenwedlopen tegelijk
gaande. Websites bedenken trucs om zo hoog mogelijk te komen in de lijst van
gevonden resultaten bij een bepaalde zoekopdracht. Aan de zoekmachine om zulke
trucs te doorzien en ervoor te zorgen dat ze niet werken. Daarnaast probeert
elke zoekmachine de concurrentie te verslaan.
Zoekmachines richten zich in
de eerste plaats op de inhoud van documenten. De meeste zoekmachines sturen
zelfstandige programmaatjes, spiders, het web op, die een site
'bekijken' en dan de database van de zoekmachine aanvullen. Deze spiders kijken
bijvoorbeeld naar de titel van pagina's (de tekst in de blauwe balk bovenaan
het browservenster) en uiteraard naar de inhoud van het document zelf. Daarbij
gaat het niet alleen om de tekst die de bezoeker ziet, maar ook om de
'brontekst' in de opmaaktaal Html. Wie in het browservenster klikt op Beeld en
dan op Bron ziet deze ruwe tekst. Daarin kunnen zoekwoorden worden
opgenomen zonder dat de bezoeker deze ziet.
Zoekmachines
hebben hier houvast aan, maar sites die hun bezoekersaantal willen opvoeren
kunnen ze misbruiken. Korte tijd heeft het gewerkt om één zoekterm heel vaak in
de Html-tekst van een pagina op te nemen, of er 'sex' in te zetten, omdat 'sex'
zo vaak gezocht word.
Hiertegen hebben zoekmachines
zich gewapend. De geniale zet van Google is geweest om mee te wegen hoe vaak
andere sites verwijzen (linken) naar een bepaald document, en hoe
belangrijk deze sites op hun beurt zijn. Een document met de juiste zoekwoorden
waarnaar vaak wordt verwezen is kennelijk interessanter dan een document met
dezelfde termen, maar minder verwijzingen. Zo ongeveer wordt ook de kwaliteit van
wetenschappelijke publicaties gemeten. Navolgers van Google zijn er inmiddels,
zoals de zoekmachines Teoma en Wisenut.
Google bestaat twee jaar en
blijft vernieuwen. Het was een van de eerste met een 'slanke' webpagina zonder
reclame en andere grafische onzin, die het gebruikt vertraagt. Een andere
zoekmachine die dit doet is Ixquick (www.ixquick.nl). Dat valt duidelijk in de
smaak bij het publiek. Kort geleden heeft Google het zoeken geïntroduceerd in
andere dan Html-documenten. Bestanden uit Office, zoals teksten, spreadsheets
een PowerPoint-presentaties zijn nu vindbaar op internet. Het probleem is, dat
zulke bestanden wel eens door iemand op internet worden gezet voor een collega,
zonder dat het de bedoeling is dat iedereen ze ziet. Omdat er naar min of meer
vertrouwelijke documenten geen links bestaan zullen ze bij Google niet hoog
eindigen onder de zoekresultaten, maar nieuwsgierige personen kunnen ze
opsporen. Beveiligingsgeskundigen waarschuwen inmiddels geen vertrouwelijke
documenten op openbaar toegankelijke webservers te zetten.
Het nieuwste is, dat Google
de gebruikers zelf wil laten aangeven hoe goed ze een site vinden, via een
soort stemknop. Daarmee zou de waardering die websites voor elkaar hebben, in
de vorm van links, worden vervangen door datgene waar het werkelijk om gaat: de
waardering van het publiek. Het gevaar is, dat hiermee makkelijk te knoeien
valt. Mensen kunnen de hele dag op hun eigen website stemmen, of programma's
schrijven die dat doen. En dat kan Google, of een concurrent, dan weer proberen
dicht te timmeren.