Niks spraaktechnologie

Herbert Blankesteijn

 

De laatste tijd wordt vaak een rooskleurig beeld geschetst van spraaktechnologie, waarmee een computer spraak kan voortbrengen en begrijpen. De teneur is: de spraaktechnologie is nog niet wat het wezen moet, maar gaat snel vooruit. Er zijn werkende toepassingen en er is meer interesse dan ooit van toonaangevende bedrijven.

 

'Heb je ook nieuws,' ben ik dan geneigd te vragen, want dit hoor ik al meer dan tien jaar. Spraaktechnologie is net zo'n eeuwige belofte als kernfusie. Het verschil is dat commerciële kernfusie altijd even achter de horizon ligt, terwijl de sprekende en luisterende computer een vaste plaats heeft net om de hoek.

 

Het is bijvoorbeeld niet waar dat op het KPN-informatienummer 118 een computer naar uw vraag luistert. Daar zitten nog steeds dames, alleen ze praten niet meer met u. Ze zoeken het nummer voor u op een cd-rom en zorgen met een druk op de knop dat u dat nummer te horen krijgt. Praten met klanten kost maar tijd. Wat u dan hoort is géén gesynthetiseerde spraak, maar de opgenomen stem van een juffrouw. Niks spraaktechnologie.

 

Een tijdje geleden was ik er getuige van hoe een kennis wel met een computer in dialoog moest. Hij wilde weten hoe laat de trein van Utrecht naar Amsterdam ging. De kennis is een wetenschapsjournalist die bij de radio werkt. Hij heeft dus geen al te gek accent of spraakgebrek en weet iets van de eigenaardigheden van computers. Maar hoe hij ook articuleerde, de plaatsnaam 'Utrecht' werd verstaan als Zutphen, als Roermond, het was te dwaas voor woorden. Ik weet niet eens meer of hij aan 'Amsterdam' is toegekomen, en eigenlijk ook niet of hij die avond zijn woning heeft gehaald.

 

Het klonk als een kopie van een bandopname die ik tien jaar geleden aan een technische universiteit te horen kreeg toen iemand me wilde uitleggen hoeveel werk er op dit gebied nog te doen was. Tante Mien versus De Computer. Geen spraakherkenning maar spraakverwarring; er is sindsdien vast veel werk gedaan maar geholpen heeft het niet.

 

Microsoft ziet een grote toekomst in spraakherkenning. Ja, wat dacht je. Alles wat de moeite waard is om te doen op een pc, kan worden gedaan met bestaande software. Er zijn genoeg programmeerfouten te repareren maar dat levert geen omzet op. Als Gates nog nieuwe programma's wil verkopen moet hij iets propageren wat juist nog níet kan. Ook Intel, IBM en Philips roeren zich op dit gebied. Vind je 't gek? Als Microsoft een wind laat, komen alle vliegen op de geur af. Als Gates investeert, stijgt de kans dat het wat wordt. Maar zelfs Gates kan van een slecht idee geen goed idee maken.

 

Een systeem dat niet alleen een zeer beperkt vocabulaire herkent maar ook met een bekende stem werkt - gunstiger kan niet - kan 97 procent goed scoren, las ik onlangs in Intermediair. Volgens het verkopende bedrijf, dat wel. De laatste keer dat ik zoiets geloofde werkte het helemaal niet. En dan nog, een secretaresse die bij het dicteren elke drie regels een fout maakt, vliegt er uit.

 

Dat zijn zaken die in theorie te verbeteren zijn. Maar zelfs als dat lukt zal spraakherkenning beperkt blijven tot niches als telefonische informatiesystemen (die zelf de concurrentie met Websites zullen verliezen) en hulpmiddelen voor gehandicapten. Want op kantoor, thuis en op school is het laatste wat je wilt dat iedereen tegen zijn computer zit te kwekken.