Niks spraaktechnologie
Herbert Blankesteijn, Intermediair 24-6-'99
In een recent artikel in Intermediair ['Pratende computer breekt door,' Int. 23 p. 125] wordt een rooskleurig beeld geschetst van spraaktechnologie, waarmee een computer spraak kan voortbrengen en begrijpen. De teneur is: de spraaktechnologie is nog niet wat het wezen moet, maar gaat snel vooruit. Er zijn werkende toepassingen en er is meer interesse dan ooit van toonaangevende bedrijven.
'Heb je ook nieuws,' ben ik dan geneigd te vragen, want dit hoor ik al meer dan tien jaar. Spraaktechnologie is net zo'n eeuwige belofte als kernfusie. Het verschil is dat commerciële kernfusie altijd even achter de horizon ligt, terwijl de sprekende en luisterende computer een vaste plaats heeft net om de hoek.
Het is bijvoorbeeld niet waar dat op het KPN-informatienummer 118 een computer naar uw vraag luistert. Daar zitten nog steeds dames, alleen ze praten niet meer met u. Ze zoeken het nummer voor u op een cd-rom en zorgen met een druk op de knop dat u dat nummer te horen krijgt. Praten met klanten kost maar tijd. Wat u dan hoort is géén gesynthetiseerde spraak, maar de opgenomen stem van een juffrouw. Niks spraaktechnologie.
Vorige week was ik er getuige van hoe een kennis wel met een computer in dialoog moest. Hij wilde weten hoe laat de trein van Utrecht naar Amsterdam ging. De kennis is een wetenschapsjournalist die bij de radio werkt. Hij heeft dus geen al te gek accent of spraakgebrek en weet iets van de eigenaardigheden van computers. Maar hoe hij ook articuleerde, de plaatsnaam 'Utrecht' werd verstaan als Zutphen, als Roermond, het was te dwaas voor woorden. Ik weet niet eens meer of hij aan 'Amsterdam' is toegekomen, en eigenlijk ook niet of hij die avond zijn woning heeft gehaald.
Het klonk als een kopie van een bandopname die ik tien jaar geleden aan een technische universiteit te horen kreeg toen iemand me wilde uitleggen hoeveel werk er op dit gebied nog te doen was. Tante Mien versus De Computer. Geen spraakherkenning maar spraakverwarring; er is sindsdien vast veel werk gedaan maar geholpen heeft het niet.
Microsoft ziet een grote toekomst in spraakherkenning. Ja, wat dacht je. Alles wat de moeite waard is om te doen op een pc, kan worden gedaan met bestaande software. Er zijn genoeg programmeerfouten te repareren maar dat levert geen omzet op. Als Gates nog nieuwe programma's wil verkopen moet hij iets propageren wat juist nog níet kan. Ook Intel, IBM en Philips roeren zich op dit gebied. Vind je 't gek? Als Microsoft een wind laat, komen alle vliegen op de geur af. Als Gates investeert, stijgt de kans dat het wat wordt. Maar zelfs Gates kan van een slecht idee geen goed idee maken. De laatste treurig stemmende demonstratie van spraakherkenning zag ik afgelopen december bij Microsoft zelf in Seattle.
Ik heb de Koerslijn maar eens gebeld, in mijn beste ABN. Van de vijf fondsen die ik noemde werden er twee aanvankelijk verkeerd verstaan. Veertig procent fout! En ook hier antwoord van een ingeblikte mevrouw. Een systeem dat niet alleen een zeer beperkt vocabulaire herkent maar ook met een bekende stem werkt - gunstiger kan niet - kan 97 procent goed scoren, lees ik in Intermediair. Volgens het verkopende bedrijf. De laatste keer dat ik zoiets geloofde werkte het helemaal niet. Nul procent. En dan nog, een secretaresse die bij het dicteren elke drie regels een fout maakt, vliegt er uit.
Dat zijn zaken die in theorie te verbeteren zijn. Maar zelfs als dat lukt zal spraakherkenning beperkt blijven tot niches als telefonische informatiesystemen (die zelf de concurrentie met Websites zullen verliezen) en hulpmiddelen voor gehandicapten. Want op kantoor, thuis en op school is het laatste wat je wilt dat iedereen tegen zijn computer zit te kwekken.
Het materiaal dat hier verkrijgbaar is mag worden gedownload, gelezen en zelfs gekopieerd, maar alleen voor eigen gebruik. Vermenigvuldigen met winstoogmerk is niet toegestaan. Alles is copyright Herbert Blankesteijn, tenzij anders vermeld.