Niks spraaktechnologie
Herbert Blankesteijn
De laatste tijd wordt vaak een rooskleurig beeld geschetst van
spraaktechnologie, waarmee een computer spraak kan voortbrengen en begrijpen.
De teneur is: de spraaktechnologie is nog niet wat het wezen moet, maar gaat
snel vooruit. Er zijn werkende toepassingen en er is meer interesse dan ooit
van toonaangevende bedrijven.
'Heb je ook nieuws,' ben ik dan geneigd te vragen, want dit hoor ik al
meer dan tien jaar. Spraaktechnologie is net zo'n eeuwige belofte als
kernfusie. Het verschil is dat commerciële kernfusie altijd even achter de
horizon ligt, terwijl de sprekende en luisterende computer een vaste plaats
heeft net om de hoek.
Het is bijvoorbeeld niet waar dat op het KPN-informatienummer 118 een
computer naar uw vraag luistert. Daar zitten nog steeds dames, alleen ze praten
niet meer met u. Ze zoeken het nummer voor u op een cd-rom en zorgen met een
druk op de knop dat u dat nummer te horen krijgt. Praten met klanten kost maar
tijd. Wat u dan hoort is géén gesynthetiseerde spraak, maar de opgenomen stem
van een juffrouw. Niks spraaktechnologie.
Een tijdje geleden was ik er getuige van hoe een kennis wel met een
computer in dialoog moest. Hij wilde weten hoe laat de trein van Utrecht naar
Amsterdam ging. De kennis is een wetenschapsjournalist die bij de radio werkt.
Hij heeft dus geen al te gek accent of spraakgebrek en weet iets van de
eigenaardigheden van computers. Maar hoe hij ook articuleerde, de plaatsnaam
'Utrecht' werd verstaan als Zutphen, als Roermond, het was te dwaas voor
woorden. Ik weet niet eens meer of hij aan 'Amsterdam' is toegekomen, en eigenlijk
ook niet of hij die avond zijn woning heeft gehaald.
Het klonk als een kopie van een bandopname die ik tien jaar geleden aan
een technische universiteit te horen kreeg toen iemand me wilde uitleggen
hoeveel werk er op dit gebied nog te doen was. Tante Mien versus De Computer.
Geen spraakherkenning maar spraakverwarring; er is sindsdien vast veel werk
gedaan maar geholpen heeft het niet.
Microsoft ziet een grote toekomst in spraakherkenning. Ja, wat dacht je.
Alles wat de moeite waard is om te doen op een pc, kan worden gedaan met
bestaande software. Er zijn genoeg programmeerfouten te repareren maar dat
levert geen omzet op. Als Gates nog nieuwe programma's wil verkopen moet hij
iets propageren wat juist nog níet kan. Ook Intel, IBM en Philips roeren zich
op dit gebied. Vind je 't gek? Als Microsoft een wind laat, komen alle vliegen
op de geur af. Als Gates investeert, stijgt de kans dat het wat wordt. Maar
zelfs Gates kan van een slecht idee geen goed idee maken.
Een systeem dat niet alleen een zeer beperkt vocabulaire herkent maar
ook met een bekende stem werkt - gunstiger kan niet - kan 97 procent goed
scoren, las ik onlangs in Intermediair. Volgens het verkopende bedrijf, dat
wel. De laatste keer dat ik zoiets geloofde werkte het helemaal niet. En dan
nog, een secretaresse die bij het dicteren elke drie regels een fout maakt,
vliegt er uit.
Dat zijn zaken die in theorie te verbeteren zijn. Maar zelfs als dat
lukt zal spraakherkenning beperkt blijven tot niches als telefonische
informatiesystemen (die zelf de concurrentie met Websites zullen verliezen) en
hulpmiddelen voor gehandicapten. Want op kantoor, thuis en op school is het
laatste wat je wilt dat iedereen tegen zijn computer zit te kwekken.