Kultur

– Viktig at vi lager maskiner som forstår norsk

TEKST OG TALE: Nasjonalbiblioteket deler kunstig intelligens som skjønner dialekter. Helt nødvendig for fremtiden til norsk språk, mener Aslak Sira Myhre.

– Du kan vel strengt tatt kalle det en dikteringsmaskin, sier nasjonalbibliotekar Aslak Sira Myhre om tjenesten NB Whisper.

Biblioteket har de siste årene arbeidet med å utvikle en tjeneste som kan gjøre norsk tale om til tekst. Denne er nå tilgjengeliggjort for offentligheten gjennom en betaversjon, altså en testversjon.

Den nye tjenesten fungerer ved at man enten laster opp, eller spiller inn lyd direkte på tjenestens hjemmesider. Etter kort tid får man så en transkribert utgave av det man har lastet opp.

Forstår ulike dialekter

Teknologien er på ingen måte ny, heller ikke på norsk. Men den store forskjellen denne gangen, er hvor godt tjenesten fungerer – og da ikke kun for østnorsk språk, ifølge Sira Myhre.

– Den skal forstå meg når jeg prater som dette, sier Sira Myhre først på sitt naturlige stavangermål.

– Og ikke kun når jeg prater som dette, sier han så på imitert østlandsk.

Nasjonalbibliotekaren forteller at modellen er trent opp ved at man har transkribert stortingspolitikere – en gruppe med et stort dialektmangfold – for så å kartlegge ordene disse bruker opp mot en ordbok.

Resultatet skal være en modell som i langt større grad enn tidligere forstår norsk.

– Språkpolitisk betydning

Sira Myhre mener utviklingen av tjenesten er viktig for framtiden til norsk språk og samfunn.

– Det er ekstremt viktig. Vi lever i en tidsalder hvor maskiner har begynt å forstå menneskespråk, og dette språket er engelsk. Derfor er det nødvendig at vi lager noe som gjør at maskinene kan forstå norsk også.

Vi lever i en tidsalder hvor maskiner har begynt å forstå menneskespråk, og dette språket er engelsk

—  Aslak Sira Myhre, nasjonalbibliotekar

Han mener det er naturlig at det er akkurat Nasjonalbiblioteket som tar ansvar for utviklingen av en slik tjeneste.

– Nasjonalbiblioteket har tilgang på alt publisert materiale i Norge, og har som eneste bibliotek i verden også digitalisert alt av tekster. Nettopp det å ha et stort materiale, er nøkkelen i utviklingen av språkmodeller.

---

Whisper NB

  • En tjeneste som kan gjøre norsk tale om til normalisert bokmål eller nynorsk tekst.
  • Springer ut fra at Nasjonalbiblioteket har laget en språkkorpus som gjør at oversettingsprogrammer, talemaskiner og kunstige intelligenser kan skjønne norsk. «Språkkorpus» viser til en samling elektroniske tekster som gjengir muntlig språk.
  • Bygger på det allerede eksisterende maskinlæringsprogrammet Whisper.
  • Blir nå fritt tilgjengelig for uttesting i en liten utgave.

Kilde: Nasjonalbiblioteket

---

Sira Myhre legger vekt på at Nasjonalbiblioteket er en offentlig institusjon, og at dette gjør dem til en del av den nasjonale infrastrukturen: Det de produserer, blir tilgjengeliggjort for alle.

Å være underlagt den norske staten, medfører samtidig visse forpliktelser.

– Vi respekterer opphavsrett og åndsverkloven til punkt og prikke.

peder lofnes hauge

– Kun fantasien setter grenser

Foreløpig fungerer den nye tjenesten best på bokmål, men målet er at den med tiden vil fungere like godt på nynorsk

Det er leder i Noregs Mållag, Peder Lofnes Hauge, glad for:

– Jeg tror det er kjempeviktig for nynorsk som et mindre skriftspråk. Det at teknologien nå kan forstå dialekter og omgjøre dem til nynorsk, er en aldri så liten språkrevolusjon.

Han mener det kun er fantasien som setter grenser for hva en slik type teknologi kan brukes til, og nevner talestyrte hjelpemidler i hjemmet og talekommandoer på telefoner som to konkrete anvendelsesområder.

Mållagets leder er også takknemlig for at Nasjonalbiblioteket går i bresjen for utviklingen av en slik tjeneste.

Det at teknologien nå kan forstå dialekter og omgjøre dem til nynorsk, er en aldri så liten språkrevolusjon

—  Peder Lofnes Hauge, leder i Noregs Mållag

– Jeg er veldig glad for at Nasjonalbiblioteket er på ballen så tidlig og så tungt. De er en seriøs aktør som deler de samme språkpolitiske målene som oss. Jeg håper de fortsetter arbeidet, slik at tjenesten blir like bra på nynorsk som på bokmål.

radio

Norsk som bruksspråk

Jonas Wettre leder Teknologirådets prosjekter om tale- og språkteknologi. I en rapport publisert i desember 2022 kalte de det « … en eksistensiell risiko for nynorsk, dialekter og samisk» om ikke bedre tale-til-tekst-teknologi ble utviklet på norsk.

Også han mener derfor at Nasjonalbibliotekets nylansering et viktig, sett med et språkpolitisk blikk.

– I fravær av velfungerende tjenester på norske språk, risikerer man at mindre språk og dialekter fortrenges, mener Wettre.

Han sier trenden er at taleteknologi anvendes på stadig mer hverdagsteknologi; alt fra kjøleskap til legekontorer blir stemmestyrt. Om de norske alternativene ikke er gode nok, tvinges derfor flere til å bruke engelsk – noe som alt i alt vil ha negative konsekvenser for norsk som bruksspråk, ifølge Wettre.

– For å oppfylle målene i språkpolitikken, trengs derfor taleteknologi som fungerer på norske språk.

– Enormt potensial

Wettre fremhever betydningen en velfungerende taleteknologi kan ha for grupper som i dag har utfordringer knyttet til det å tyde tekst, som svaksynte.

– Ved at man ikke trenger å være avhengig av å klikke, lese og skrive på skjerm kan denne teknologien åpne opp arbeidsmarkedet for veldig mange.

Han trekker også frem hvilken betydning den kan ha for velferdsteknologien.

– Vi har passert en million pensjonister i Norge. Utbedring av slike tjenester kan gjøre hverdagslivet enklere for mange av disse.

I fravær av velfungerende tjenester på norske språk, risikerer man at mindre språk og dialekter fortrenges

—  Jonas Wettre, Teknologirådet

Teknologien er samtidig ikke fullstendig feilfri. I likhet med andre former for kunstig intelligens, er det vanskelig å forutsi nøyaktig hvordan den fungerer, og man løper risikoen for at den transkriberer tale feil, påpeker Wettre.

I tillegg kan man heller ikke være helt sikker på at den ikke diskriminerer, ifølge Wettre. Han sier det derfor er viktig at den trenes opp på taleopptak fra et representativt utvalg mennesker.

– Om en språkmodell kun er trent på voksne menn med oslodialekt, forstår den andre grupper dårligere.

– Samisk må prioriteres

I tillegg til den nye tjenesten som støtter bokmål og nynorsk, har Nasjonalbiblioteket også arbeidet med å utvikle en modell som støtter nordsamisk. Utviklingen av denne har derimot ikke kommet like langt, noe som hovedsakelig skyldes mangel på data.

Emilie Biti-Jessen, leder for Noareh – en samisk ungdomsorganisasjon som arbeider for å utvikle trygge møteplasser for samisk ungdom – mener utviklingen av også samiske tjenester er betydningsfull.

Om samisk språk skal berges, må vi tilpasse oss den teknologiske virkeligheten

—  Emilie Biti-Jessen, leder for Noareh

– Om samisk språk skal berges, må vi tilpasse oss den teknologiske virkeligheten, sier hun.

Hun sier at mangelen på nordsamiske alternativer kan være med å tvinge folk over på norsk eller engelsk. Hun er derfor glad for at Nasjonalbiblioteket også jobber med å trene en slik modell.

Biti-Jessen mener det bør bevilges økonomisk støtte.

– Vil man samle inn data, må det bevilges støtte. Dette gjelder alt som har med språk å gjøre, vil man arbeide med språk må det prioriteres.

Les mer om mer disse temaene:

Vårt Land anbefaler

1

1

Annonse
Annonse

Les dagens papirutgave

e-avisen

Mer fra: Kultur