Hvad er sprogteknologi?

Af Peter Juel Henrichsen

Sprogteknologi er en type af IT-værktøj der styrker kommunikationen mellem sprogbrugere. Stavetjekkerne og korrekturprogrammerne i vores tekstbehandlingssystemer var nogle af de første praktisk anvendelige sprogteknologier, men i de senere år har de fået selskab af langt mere sofistikerede former for sprogstøtte. Et velkendt eksempel er den automatiske oversætter, som sætter to mennesker i stand til at skrive eller tale sammen hen over en sprogbarriere. Verdens mest benyttede automatiske oversætter er Google Translate.

Et andet eksempel på højteknologisk sprogstøtte er den kunstige stemme, også kendt som talesyntesen. Især syns- og talehandikappede har haft enorm nytte af talesyntese, som har bragt bøger, artikler og tidsskrifter inden for den blindes hørevidde og givet den multihandikappede en talestemme. Steven Hawking, kaldet vor tids Einstein, var en verdenskendt fortaler for teknologien og brugte den som sin kommunikative livline til og med sin egen dødsdag den 14. marts i år.

Talesyntesen er generelt blevet mødt med en vis skepsis. Mange syntes at de tidlige stemmer lød kunstigt. Hvem har ikke smilet af stednavne udtalt forvredent af syntesestemmer i GPS’er og i busser og tog? De seneste par år har kvaliteten dog taget et spring fremad, ikke mindst med skiftet til algoritmer baseret på neurale net. Nu er synteserne, for dansk og mange andre sprog, blevet så gode at man – i kortere forløb – ofte ikke kan afgøre om stemmen tilhører et menneske eller en computer.

Den, for tiden, absolut mest populære og omtalte sprogteknologi er talegenkenderen. Hospitalssektoren har brugt talegenkendelse i årevis, særligt inden for områder som patologi og kirurgi, hvor det er af stor værdi for personalet at slippe tasterne. Læger og assistenter kan i stedet diktere direkte ind i sygejournalen, og før patienten vågner, er journalen opdateret med operationens forløb. Derved mindskes både tidsforbruget og risikoen for fejl, som ellers var en alvorlig faktor den gang diktater måtte aflyttes og nedskrives af en lægesekretær.

Der er mange flere former for sprogteknologi, og alle har det til fælles at de bygger på en struktureret viden om sproget som det bruges af mennesker. At udvikle sprogteknologi består altså i at kombinere data om selve sproget (såsom ordbøger og grammatikker) med modeller af praktiske brugssituationer. I sprogværktøj til professionelle brugere indgår der ofte en model af et fagområde med en bestemt terminologi og en række betegnelser på produkter, steder, personer eller sagsforhold. Hvis værktøjet er udviklet til at støtte kontakten mellem en funktionær og en klient (lærer/elev, behandler/patient, politimand/afhørt osv.), skal der tilføjes viden om de vedtægter og handlinger som kendetegner situationen. Men først og sidst er det de sproglige komponenter som er hjertet i sprogteknologierne. Disse komponenter kan derfor i høj grad genbruges hen over det brede udvalg af sprogteknologier som vi allerede kender, og som vi aner bag horisonten.

Sprogteknologien vil snart gribe lige så dybt ind i vores hverdag som computeren og internettet gjorde. Fra at være et værktøj for specialister er sprogteknologien marcheret direkte ind i vores privatliv. Mange danskere begynder at varetage deres daglige planlægning uden at røre et tastatur: “Siri, skriv til min tandlæge, og aflys min tid i morgen!” Om få år kan enhver tale til sit hjem, sin bil eller sin bageovn og få et talesvar tilbage. De traditionelle sprogteknologier er i færd med at samle sig i en komplet AI-støttet helhed, en humanoid, eller robotassistent med kognitive evner og små ansatser til menneskelige egenskaber som humor og empati. Mange føler en uro ved dette scenarie. Vores sprog er noget af det mest private og personlige vi har. Det er måske grunden til at vi ser så mange nye scifi-film der kredser omkring automaten, ikke bare som assistent, men som ligeværdig partner. Tænk bare på fremragende og tankevækkende film som “Her” (2013) og “Ex Machina” (2014) der begge lader en talende maskine spille den ene rolle i et ømt parforhold.

At vi føler lidt fremtidsangst, er let at forstå, men der er al mulig grund til at møde udviklingen med åben pande og gribe de økonomiske og sociale muligheder som sprogteknologien også giver, særlig for et sprogområde der er stort nok til en ballet.