Zoeken met Taal en Spraak
Het gebruik van automatische spraakherkenning in gesproken documenten is relatief nieuw omdat het herkennen van grote hoeveelheden continu gesproken spraak vereist dat zeer veel (> 50.000) verschillende woorden herkend moeten kunnen worden.
Nu de rekenkracht van computers sterk is toegenomen en er veel trainingsmateriaal digitaal beschikbaar is, kan spraakherkenning eindelijk ook hier succesvol worden ingezet. Dat gaat m.b.v. statistische taalmodellen: modellen die uit grote hoeveelheden geschreven materiaal “leren” welke woorden en woordcombinaties waarschijnlijk zijn, gegeven het onderwerp van het gesprek.
Naarmate de techniek beter wordt, kan het begrip “gesproken documenten” ruimer worden geinterpreteerd. Het hoeft niet meer een door een duidelijk articulerend persoon in een rustige omgeving op hoge kwaliteit opgenomen gesprek te zijn (bv het voorgelezen 8-uur journaal).
Ook de door bellers ingesproken antwoorden op de vraag: “welkom, waarover wilt u ons iets vragen?” kunnen nu beschouwd worden als “gesproken documenten” en kunnen op dezelfde manier doorzoekbaar en classificeerbaar gemaakt worden. Als gevolg hiervan zien we dezelfde toepassingen in allerlei soorten call centra.

