En stor del af vores viden er formuleret på et sprog. Størstedelen af den viden vi har om Danmark, om danske forhold og om hinanden er formuleret på dansk. Kunstig intelligens er typisk baseret på analyse af store datamængder. Det giver gode resultater når disse data er tal, men det er en langt større udfordring når data består af sprog i form af tekst og lyd. Tal er entydige og svarer til den måde computerne er indrettet på. Sprog er mangetydigt og langt mere komplekst fordi det er en del af vores eksistens og tæt sammenvævet med vores viden om verden, om den måde vores samfund er opbygget på, og om den kultur vi er opvokset i.
Langt de fleste systemer som har en sproglig kapacitet baseret på kunstig intelligens, er udviklet på basis af data fra andre sprog, først og fremmest engelsk. De reflekterer derfor en forestilling om en verden, et samfund og en kultur som ikke stemmer overens med vores. Derfor skal systemer som bruger kunstig intelligens, udvikles på basis af danske sprogdata for at kunne fungere optimalt og gøre nytte i vores samfund.
For at man kan bygge et system som fx kan modtage en besked og udføre en ordre på et givet sprog, skal de grundlæggende data og teknologier være til stede for det pågældende sprog. Fx skal der være adgang til store mængder af lydoptagelser og transskriptioner af lyd til tekst. Der skal være teknologier der kan analysere teksten og omforme den til en ordre som computeren, mobiltelefonen eller robotten kan modtage og udføre. Hvis systemet skal kunne svare, skal der også være teknologier der kan udforme et forståeligt svar som er passende i den givne situation.
Sprogteknologi er den fælles betegnelse for de teknologier der kan håndtere disse processer.
De enkelte teknologier indgår ligeledes som enkeltkomponenter i mange programmer som ikke nødvendigvis involverer kunstig intelligens, som fx dikteringsværktøjer, søgemaskiner og undervisningsprogrammer.
Formål
- Udvalget har til formål at udrede perspektiver og udfordringer for sprogteknologi i en dansk kontekst og komme med forslag til hvordan Danmark bedst sikrer brugen af dansk og andre sprog i digitale tjenester, fx automatisk oversættelse, taleteknologi, IoT (internet of things), robot- og transportmiddelteknologi, IT-baserede læremidler til sprogundervisning og kunstig intelligens.
- Udvalget har endvidere til formål at afklare behovet og perspektiverne for en national termbank (“sprogtermbank”).
Opgave
Udvalget skal med udgangspunkt i et brugerorienteret perspektiv kortlægge de nuværende og fremtidige behov for at benytte dansk og andre sprog samt sproglig viden i forhold til digitale tjenester og applikationer baseret på kunstig intelligens i centrale sektorer af samfundet. Udvalget skal vurdere i hvilket omfang det vil være muligt at imødekomme disse behov under inddragelse af de relevante spillere i erhvervslivet, den offentlige sektor samt uddannelses- og forskningssektoren.
Udvalget skal afklare behovet og perspektiverne for en national termbank (”sprogtermbank”) og inddrage resultater fra arbejdet med dansk terminologi og danske vidensbaser samt med begrebs- og datamodellering i det fællesoffentlige digitale arkitektursamarbejde.
Udvalget skal inddrage relevante resultater fra arbejdet med sprogteknologi og terminologi i andre lande, herunder EU og Norden, og pege på måder hvorpå en styrkelse af dansk sprogteknologi vil kunne gavne den enkelte borger og bidrage til at skabe vækst og effektivisering i samfundet.
Udvalget får til opgave at
- levere en rapport der udreder behovet for sprogteknologi inden for centrale sektorer. Rapporten skal give svar på følgende hovedspørgsmål:
- Inden for hvilke sektorer og erhverv vil der i de kommende 10 år være størst behov for digitale tjenester og applikationer baseret på kunstig intelligens på dansk og andre sprog?
- Hvilke udfordringer ser virksomheder og offentlige institutioner i forhold til at udvikle disse tjenester og applikationer – og hvilke udfordringer bliver overset?
- På hvilken måde kan sprogteknologi bidrage til at sikre en bedre og billigere offentlig service?
- På hvilken måde kan erfaringer fra andre lande, EU og Norden nyttiggøres?
- Hvilke vækst- og jobmuligheder ligger der i en satsning på dansk sprogteknologi?
- Hvad er den samfundsøkonomiske business case set i forhold til investeringsbehovet?
- Hvilke politiske tiltag kan foreslås for at understøtte virksomheder og offentlige institutioner i at inddrage dansk og andre sprog når der skal udvikles og anvendes nye teknologier baseret på kunstig intelligens?
- Hvilken betydning får en satsning på dansk sprogteknologi for udviklingen af det danske sprog, for samfundets udvikling og for den enkelte?
- Hvordan sikres det at der udvikles dansksproget sprogteknologi?
- Hvad er fordelene og ulemperne ved udvikling af dansk sprogteknologi i Danmark?
- Hvordan kan det sikres at der fortsat uddannes mennesker med tilstrækkelige kompetencer inden for dansk sprogteknologi?
- Hvilket behov er der for udvikling af en dansk termbank, hvilke domæner skal den dække, og hvordan kan den bedst gøres tilgængelig?
- bidrage til oplysning og offentlig debat om sprogets rolle i kunstig intelligens og ny teknologi.
- inddrage offentlige institutioner, virksomheder, brancheforeninger, fagforeninger, fageksperter og borgere med henblik på at sikre at så mange aspekter som muligt bliver belyst.
Udvalgets sammensætning
Udvalget nedsættes som en bredt sammensat arbejdsgruppe bestående af 8-10 medlemmer, en formand og en sekretær. Sekretariatsfunktionen og formandskabet er forankret i Dansk Sprognævn.
Blandt medlemmerne skal være repræsentanter for nuværende og fremtidige udbydere og brugere af applikationer baseret på sprogteknologi og kunstig intelligens i erhvervslivet og den offentlige sektor, repræsentanter for udviklere af sprogteknologi og kunstig intelligens samt repræsentanter for forsknings- og uddannelsessektoren.
Der kan oprettes en række undergrupper for særlige fokusområder, fx social- og sundhedssektoren, uddannelsessektoren, produktionserhverv, serviceerhverv og offentlig administration. Undergrupperne kan hver især supplere med flere medlemmer.
Arbejdsform
Udvalget afholder en række fokusgruppemøder og seminarer hvor brugere og eksperter inviteres til at præsentere cases og synspunkter der kan belyse hovedspørgsmålene.
Udvalget vil endvidere opsøge en række institutioner og virksomheder samt evt. enkelte nøglelande, fx Holland og Letland, der allerede bruger eller udvikler ny teknologi baseret på sprog og kunstig intelligens, for at inddrage praktiske erfaringer.
Der oprettes en hjemmeside hvor udvalgets sammensætning, opgaver og arbejdsplan fremgår, og hvor udvalgets aktiviteter annonceres. Hjemmesiden vil også være et redskab for bred dialog med alle interessenter.
Udvalget vil invitere alle til at tilkendegive og diskutere synspunkter, ideer og ønsker til brugen af sprog i den digitale teknologi via udvalgets hjemmeside og evt. en Facebook-gruppe.
Resultat
Udvalget afslutter arbejdet med en rapport som overleveres til Kulturministeriet.
Resultaterne kommunikeres bredt via medierne og via udvalgets hjemmeside.