Democratisch zoeken

Herbert Blankesteijn

 

De zoekmachine Google is te goed geworden. Tik 'creditcard' of 'password' in en je maakt kans op pikante informatie. De laatste tijd is de zoekmachine Google herhaaldelijk in het nieuws. Wat is het verschil tussen Google en de rest?

 

Zoeken is een van de meestgebruikte toepassingen op internet. Tussen honderden zoekmachines woedt een strijd om de positie van de populairste. Er zijn verschillende wapenwedlopen tegelijk gaande. Websites bedenken trucs om zo hoog mogelijk te komen in de lijst van gevonden resultaten bij een bepaalde zoekopdracht. Aan de zoekmachine om zulke trucs te doorzien en ervoor te zorgen dat ze niet werken. Daarnaast probeert elke zoekmachine de concurrentie te verslaan.

 

Zoekmachines richten zich in de eerste plaats op de inhoud van documenten. De meeste zoekmachines sturen zelfstandige programmaatjes, spiders, het web op, die een site 'bekijken' en dan de database van de zoekmachine aanvullen. Deze spiders kijken bijvoorbeeld naar de titel van pagina's (de tekst in de blauwe balk bovenaan het browservenster) en uiteraard naar de inhoud van het document zelf. Daarbij gaat het niet alleen om de tekst die de bezoeker ziet, maar ook om de 'brontekst' in de opmaaktaal Html. Wie in het browservenster klikt op Beeld en dan op Bron ziet deze ruwe tekst. Daarin kunnen zoekwoorden worden opgenomen zonder dat de bezoeker deze ziet.

 

Zoekmachines hebben hier houvast aan, maar sites die hun bezoekersaantal willen opvoeren kunnen ze misbruiken. Korte tijd heeft het gewerkt om één zoekterm heel vaak in de Html-tekst van een pagina op te nemen, of er 'sex' in te zetten, omdat 'sex' zo vaak gezocht word.

 

Hiertegen hebben zoekmachines zich gewapend. De geniale zet van Google is geweest om mee te wegen hoe vaak andere sites verwijzen (linken) naar een bepaald document, en hoe belangrijk deze sites op hun beurt zijn. Een document met de juiste zoekwoorden waarnaar vaak wordt verwezen is kennelijk interessanter dan een document met dezelfde termen, maar minder verwijzingen. Zo ongeveer wordt ook de kwaliteit van wetenschappelijke publicaties gemeten. Navolgers van Google zijn er inmiddels, zoals de zoekmachines Teoma en Wisenut.

 

Google bestaat twee jaar en blijft vernieuwen. Het was een van de eerste met een 'slanke' webpagina zonder reclame en andere grafische onzin, die het gebruikt vertraagt. Een andere zoekmachine die dit doet is Ixquick (www.ixquick.nl). Dat valt duidelijk in de smaak bij het publiek. Kort geleden heeft Google het zoeken geïntroduceerd in andere dan Html-documenten. Bestanden uit Office, zoals teksten, spreadsheets een PowerPoint-presentaties zijn nu vindbaar op internet. Het probleem is, dat zulke bestanden wel eens door iemand op internet worden gezet voor een collega, zonder dat het de bedoeling is dat iedereen ze ziet. Omdat er naar min of meer vertrouwelijke documenten geen links bestaan zullen ze bij Google niet hoog eindigen onder de zoekresultaten, maar nieuwsgierige personen kunnen ze opsporen. Beveiligingsgeskundigen waarschuwen inmiddels geen vertrouwelijke documenten op openbaar toegankelijke webservers te zetten.

 

Het nieuwste is, dat Google de gebruikers zelf wil laten aangeven hoe goed ze een site vinden, via een soort stemknop. Daarmee zou de waardering die websites voor elkaar hebben, in de vorm van links, worden vervangen door datgene waar het werkelijk om gaat: de waardering van het publiek. Het gevaar is, dat hiermee makkelijk te knoeien valt. Mensen kunnen de hele dag op hun eigen website stemmen, of programma's schrijven die dat doen. En dat kan Google, of een concurrent, dan weer proberen dicht te timmeren.