{\rtf1\ansi\ansicpg1252\uc1 \deff0\deflang1033\deflangfe1043{\fonttbl{\f0\froman\fcharset0\fprq2{\*\panose 02020603050405020304}Times New Roman{\*\falt Times New Roman};}{\f16\froman\fcharset238\fprq2 Times New Roman CE{\*\falt Times New Roman};}{\f17\froman\fcharset204\fprq2 Times New Roman Cyr{\*\falt Times New Roman};}{\f19\froman\fcharset161\fprq2 Times New Roman Greek{\*\falt Times New Roman};}{\f20\froman\fcharset162\fprq2 Times New Roman Tur{\*\falt Times New Roman};}{\f21\froman\fcharset186\fprq2 Times New Roman Baltic{\*\falt Times New Roman};}}{\colortbl;\red0\green0\blue0;\red0\green0\blue255;\red0\green255\blue255;\red0\green255\blue0;\red255\green0\blue255;\red255\green0\blue0;\red255\green255\blue0;\red255\green255\blue255;\red0\green0\blue128;\red0\green128\blue128;\red0\green128\blue0;\red128\green0\blue128;\red128\green0\blue0;\red128\green128\blue0;\red128\green128\blue128;\red192\green192\blue192;}{\stylesheet{\nowidctlpar\widctlpar\adjustright \fs20\lang1043\cgrid \snext0 Normal;}{\*\cs10 \additive Default Paragraph Font;}}{\info{\title Herbert zoekt: Het hele web}{\author Ik}{\operator Ik}{\creatim\yr2006\mo6\dy16\hr9}{\revtim\yr2006\mo6\dy16\hr14\min4}{\version9}{\edmins112}{\nofpages2}{\nofwords552}{\nofchars2869}{\*\company }{\nofcharsws3411}{\vern73}}\paperw11906\paperh16838\margl1417\margr1417\margt1417\margb1417 \deftab708\widowctrl\ftnbj\aenddoc\hyphhotz425\formshade\viewkind4\viewscale100\pgbrdrhead\pgbrdrfoot \fet0\sectd \linex0\headery709\footery709\colsx709\endnhere\sectdefaultcl {\*\pnseclvl1\pnucrm\pnstart1\pnindent720\pnhang{\pntxta .}}{\*\pnseclvl2\pnucltr\pnstart1\pnindent720\pnhang{\pntxta .}}{\*\pnseclvl3\pndec\pnstart1\pnindent720\pnhang{\pntxta .}}{\*\pnseclvl4\pnlcltr\pnstart1\pnindent720\pnhang{\pntxta )}}{\*\pnseclvl5\pndec\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}{\*\pnseclvl6\pnlcltr\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}{\*\pnseclvl7\pnlcrm\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}{\*\pnseclvl8\pnlcltr\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}{\*\pnseclvl9\pnlcrm\pnstart1\pnindent720\pnhang{\pntxtb (}{\pntxta )}}\pard\plain \nowidctlpar\widctlpar\adjustright \fs20\lang1043\cgrid {\fs24 Herbert zoekt: Het hele web
\par Herbert Blankesteijn
\par
\par Dus Webaroo denkt dat je het hele internet in 40 GB kunt comprimeren. Dat meldde WebWereld vorige week. Niet dat dat nieuw was, want op 18 april had ik het Corrie Gerritsma horen zeggen in Radio Online, en de BBC meldde het al op 10 april. Maar het was een mooie aanleiding om erover na te denken.
\par
\par Webaroo is een gratis combinatie van software en 'web packs': gedownloade plukjes internet die je offline meeneemt. Webaroo biedt web packs in categorieën als voetbal, nieuws of bepaalde wereldsteden. Je hebt dus niet de hele wereld tot je beschikking maar een klein tuintje. Wil je naar buiten, door op een link te klikken bijvoorbeeld, dan knal je tegen het hek op. Webaroo wil van die beperking af, en terecht.
\par
\par Het web in 40 GB, kan dat? Webaroo schat het hele web op 20 miljard pagina's, maal 50 kB per pagina is een miljoen GB. Het bedrijf denkt dat door slim weglaten en comprimeren terug te brengen tot 40 GB.
\par
\par Ik heb eens wat pagina's gedownload van Planet, WebWereld, Nu.nl, de New York Times, the Register, Wired en ZdNet. De magerste is de BBC met 130 kB, de vetste Wired met 345 kB voor één pagina, inclusief plaatjes en advertenties.
\par
\par Een pagina ZdNet is 180 kB, even onder het gemiddelde. In Webaroo is daar door het weglaten van advertenties en dergelijke nog 100 kB van over. Daarvan is de helft kale html, kortom de tekst en de meest essentiële layout. Dat kun je nog comprimeren tot een kwart. Blijft over (ik probeer Webaroo hier wat te bevoordelen) zo'n 10 kB per pagina. Zou Webaroo een manier weten om hier alleen de relevante tekstinformatie uit te halen, dan resteert ongeveer 1 kB. Maal twintig miljard pagina's is 20.000 GB. Er zit dan niet één plaatje meer bij. Dat kun je alleen tot 40 GB terugbrengen door pagina's weg te laten. Om precies te zijn 99,8 procent. Als ik minder in het voordeel van Webaroo reken, moeten ze twéé miljoen GB tot 40 terugbrengen en missen ze dus 99,98% én 100% van de plaatjes.
\par
\par Nou kun je vinden dat het meeste dat op internet staat onzin is, maar wat er wél toe doet is voor iedereen iets anders. De een hoeft geen porno, maar de ander juist wel. De een hoeft geen sites over gaming, de ander juist wel. Ik geef het Webaroo te doen om die 99,8 procent te vinden die niemand nodig heeft.
\par
\par Als je offline surft mis je bovendien dingen die de afgelopen dag zijn verschenen. Het laatste nieuws, de laatste postings op weblogs en fora, je rss-feeds, berichten op Hyves, video's op YouTube. Wat zeker niet meekomt zijn sites die in databases zoeken. Reisplanners, telefoongidsen, postcodegidsen, online woordenboeken, sites als funda.nl, rechtspraak.nl etcetera.
\par
\par Het is een probleem als je geen internet hebt. Maar internet onder je arm meenemen, dat kan niet. Het web ís actualiteit, het web leeft. De oplossing is: tóch internet zien te krijgen. In je hotel, in een internetcafé, met een mobiel abonnement of wat dan ook. Nu kost dat nog moeite en geld, maar mobiel internet breidt zich uit en wordt betrouwbaarder, sneller en goedkoper. Webaroo is een slechte remedie voor een probleem dat niet lang meer zal bestaan.
\par }}