Dansk Sprogteknologi i verdensklasse – rapport fra sprogteknologiudvalget

Kunstig intelligens skal blive bedre til dansk.

I begyndelsen af 2018 nedsatte Kulturministeren et sprogteknologisk udvalg under Dansk Sprognævn. Udvalget har i løbet af 2018 inddraget mere end 120 offentlige og private institutioner og virksomheder i en række workshops og seminarer for at afdække behovet og afsøge mulighederne for at understøtte brugen af dansk i forbindelse med kunstig intelligens (AI). Resultaterne præsenteres nu i rapporten Dansk Sprogteknologi i verdensklasse.

Meldingen fra alle sider er meget klar: Udvikling af chatrobotter, taleassistenter, tekstanalysesystemer, automatisk oversættelse mm. med høj sproglig kvalitet for dansk er en enorm udfordring for de globale og lokale AI-virksomheder. De investeringer som skal til, er for høje, og det modvirker udviklingen af nye AI-produkter i et sundt og konkurrencedygtigt marked.

Der er derfor brug for offentlige investeringer i åbne sprogresurser og bedre værktøjer til dansk sprogforståelse (tale og tekst) for at det danske samfund kan få udbytte af den nye teknologi. Samtidig bør der investeres mere i uddannelse og forskning i dansk sprogteknologi for at dansk også kan være med i fremtidens systemer.

Gennem årene er der med offentlig og privat støtte blevet udviklet en række sprogresurser og -værktøjer for dansk, men indsatserne har været spredte og ikke koordinerede. Der har bl.a. ikke været tilstrækkelig opmærksomhed på at disse resurser, som ofte har kostet millionbeløb at producere, efterfølgende skulle kunne stilles frit til rådighed. Det betyder at mange datasæt kun er begrænset eller slet ikke anvendelige.

Udvalget foreslår derfor:

  1. At der oprettes en organisation som har til opgave at koordinere indsatsen for dansk sprogteknologi
  2. At der oprettes en dansk sprogbank som skal understøtte udviklingen og vedligeholdelse af danske produkter baseret på sprogteknologi og kunstig intelligens, bl.a. ved at gøre danske sprogresurser og sprogværktøjer frit tilgængelige, herunder en dansk termbank
  3. At uddannelse i dansk sprogteknologi prioriteres
  4. At forskning i dansk sprogteknologi styrkes.

Udvalget foreslår endvidere at offentlige institutioner får mere fokus på at de ved at stille sproglige data til rådighed kan være med til at sikre brugen af dansk på alle samfundsområder.

I forbindelse med udgivelsen af rapporten udgiver udvalget en oversigt over de danske sprogresurser og sproglige datasæt som har kunnet identificeres i forbindelse med udvalgets arbejde, og som evt. kan danne grundlaget for en dansk sprogbank.

Kulturminister Mette Bock udtaler:

“Jeg vil gerne kvittere for det store og fagligt velfunderede arbejde, som Sprogteknologiudvalget har lagt i sin rapport. Der tegner sig et tydeligt billede af, at teknologier med sproglige komponenter spiller en stadig voksende rolle. Det er afgørende, at det danske sprog også kan følge med ind i en tidsalder, hvor sprogteknologien gradvist integreres i flere og flere områder af vores liv. Jeg ser frem til at se nærmere på udvalgets konklusioner og anbefalinger og glæder mig samtidig over, at regeringen allerede har fokus på området i forbindelse med planen om Digital velfærd i verdensklasse, som udkom i oktober 2018 og den Nationale Strategi for Kunstig Intelligens, som blev udgivet i marts.”

Udvalgets formand Sabine Kirchmeier, Dansk Sprognævn, tilføjer: ”Sprogets betydning for udvikling af kunstig intelligens har i alt for lang tid været overset. Mange tror at data kun er tal, men faktum er at der ligger enorme mængder af viden om os og vores samfund gemt i danske tekster og optagelser af dansk tale. Men man skal knække sprogkoden for at forstå indholdet – og det kræver bedre dansk sprogteknologi og fri adgang til flere sproglige data.

Det har været et stort, men også taknemmeligt arbejde at skabe et overblik over det danske sprogs stilling i forhold til sprogteknologi. Emnet er komplekst, men vi har gjort os stor umage med at forklare det grundigt, så rapporten også kan læses som en introduktion til dansk sprogteknologi. Opbakningen til anbefalingerne har været stor, og det er et enigt udvalg der står bag anbefalingerne”.

Læs mere

Læs rapporten Dansk Sprogteknologi i verdensklasse (pdf)

Se Sprognævnets oversigt over danske sprogresurser (xslx)

Kontakt: Sabine Kirchmeier (+45 26 84 63 70).

30 mio. kr. til dansk sprogbank

I forbindelse med Danmarks første nationale strategi for kunstig intelligens, som regeringen præsenterer i dag, har regeringen afsat knap 30 mio. kr. over de kommende fire år til at lave en fælles dansk sprogresurse, som skal være frit tilgængelig for virksomheder, offentlige myndigheder og forskere.

I forbindelse med Danmarks første nationale strategi for kunstig intelligens, som regeringen præsenterer i dag, har regeringen afsat knap 30 mio. kr. over de kommende fire år.

Pengene skal gå til at lave en fælles dansk sprogresurse som skal være frit tilgængelig for virksomheder, offentlige myndigheder og forskere.

“Det er et virkelig fint initiativ som flugter med vores anbefalinger”, udtaler Sprognævnets direktør Sabine Kirchmeier.

“Sprognævnet har længe gjort opmærksom på at det danske sprog kræver særlig opmærksomhed i forbindelse med kunstig intelligens hvis vi ikke skal sakke agterud i forhold til fx de engelsktalende lande. Endvidere bør borgerne møde et korrekt og forståeligt dansk når de kommunikerer med fx robotter og taleassistenter”.

Læs regeringens pressemeddelelse.

Se Sprognævnets video om sprogteknologi, og læs mere om sprogteknologiudvalgets arbejde.

Se temaet om sprogteknologi på sproget.dk.

Lancering af rapporten 25.4.2019

Lancering af rapporten bliver afholdt:

Dato 25.4.2019
Tid 14-16
Sted MBK, Pilestræde 61, 1112 København K.

Indhold: Offentligt arrangement hvor rapportens hovedkonklusioner præsenteres.

Program:

14.00-14.15 Velkomst v. direktør for Dansk Sprognævn Thomas Hestbæk Andersen

14.15-14.45 Sprogteknologiske initiativer i Sverige v. sprogteknologiansvarlig Rickard Domeij, Språkrådet, Sverige

14.45-15.15 Hvilken betydning har sprogteknologi for sprogpolitikken i Norge? v. seniorrådgiver Kristine Eide, Språkrådet i Norge

15.15-15.45 Sprogteknologiudvalgets rapport v. formand for udvalget Sabine Kirchmeier, Dansk Sprognævn

15.45-16.00 De næste skridt i arbejdet med dansk sprogteknologi v. kontorchef Christian Plaschke, Digitaliseringsstyrelsen

Arrangementet er gratis, men tilmelding er nødvendig.

Tilmelding

Regeringens sammenhængsreform: Dansk sprogteknologi i verdensklasse!

Regeringen har 23.10.2018 som led i Sammenhængsreformen lanceret reformsporet “Digital service i verdensklasse”. Reformsporet skal ved hjælp af digitalisering og nye teknologier udvikle den offentlige sektor så borgere og virksomheder kan få en mere sammenhængende og tidsvarende digital service.

Blandt de ambitiøse mål er dansk sprogteknologi i verdensklasse.

Her kommer de uddrag af regeringens plan som omhandler sprogteknologi:

Danmark skal forrest i anvendelsen af kunstig intelligens (resumé)

“Regeringen vil gøre Danmark til ét af de førende lande inden for kunstig intelligens inden 2025. Der igangsættes derfor følgende initiativer:

  • Der udarbejdes en national strategi for kunstig intelligens, der går på tværs af den offentlige og private sektor, og som både sikrer bedre rammer for anvendelsen af kunstig intelligens og samtidig opstiller en række principper for anvendelsen, bl.a. i forhold til privatliv, sikkerhed, retfærdighed mv.
  • Kunstig intelligens afprøves gennem oprettelsen af en række signaturprojekter
  •  Der udvikles en dansk sprogressource, så man fx kan anvende talegenkendelse” (…)

4.3 Danmark skal forrest i anvendelsen af  kunstig intelligens

(…) “Samtidig er det afgørende for udviklingen af kunstig intelligens på flere områder, at man kan anvende talegenkendelse og sprogforståelse. Da Danmark er et lille sprogområde, er sprogressourcen imidlertid ikke udviklet tilstrækkeligt. Derfor vil regeringen tage initiativ til, at der
udvikles en dansk sprogressource til fri afbenyttelse, så arbejdet med kunstig intelligens kan udvikles yderligere i Danmark.” (…)

Dansk sprogteknologi i verdensklasse

“Talegenkendelse og sprogforståelse gør det muligt at understøtte forskellige former for opgaver. Det gælder beslutningsstøtte ved sagsbehandling af miljøgodkendelser, gennemgang af årsregnskaber og revisionserklæringer, klagesager, support- og akutopkald, mailsvar mv. En betydelig barriere for effektiv anvendelse af talegenkendelse og sprogforståelse på dansk er, at Danmark er et lille sprogområde. Derfor igangsættes opbygningen af en sprogressource på dansk, der sættes til fri afbenyttelse, så leverandørerne har en fælles sprogressource af høj kvalitet, der giver dem mulighed for at udvikle gode løsninger inden for talegenkendelse og sprogforståelse med et højt præcisionsniveau.”

Læs om initiativerne på regeringens hjemmeside.

ELRC-workshop 8.10.2018

 

Dato 8.10.2018
Tid 10.00-15.00
Sted Dansk Sprognævn, Worsaaesvej 19, 4., 1972 Frb. C

Indhold: Workshop om maskinoversættelse i regi af EU’s initiativ European Language Resource Coordination (ELRC).
Formålet er at give offentlige institutioner bedre kendskab til EU’s automatiske oversættelsestilbud
og at få dem til at dele oversættelsesresurser.