Takka vere ei gratis uttaleordliste på nynorsk frå Nasjonalbiblioteket, blir det no enkelt og billig å utvikla program der nynorskbrukarar kan styra mobiltelefonen med stemma eller få datamaskina til å lesa høgt på nynorsk.
– Til no har det ikkje vore så mykje taleattkjenning på nynorsk, seier språkteknolog Per Erik Solberg ved Språkbanken til Nynorsk pressekontor.
For å bøta på dette har Nasjonalbiblioteket no gjort tilgjengeleg ei uttaleordliste, som er ein viktig grunnlagsressurs for nynorsk taleteknologi.
Snart kan datamaskina snakka nynorsk
Uttaleordlista er ikkje ei vanleg ordliste som menneske kan slå opp i. Ho er laga spesielt til bruk for datamaskiner. Solberg forklarer at ordlista både vil vera nyttig for taleattkjenning og for såkalla talesyntese.
– Taleattkjenning er det å snakka til datamaskina, og så skriv maskina det du seier, medan talesyntese er ei syntetisk stemme som les opp tekst frå datamaskina. Du kan til dømes få datamaskina til å lesa ein avisartikkel på nynorsk, utdjupar han.
På same måten kan taleattkjenning vera eit nyttig verktøy viss du til dømes har senebetennelse og ikkje kan bruka hendene. Då kan du i staden bruka stemma til å diktera til pc-en.
– Taleattkjenning kan også brukast til automatisk transkripsjon av møte, som til dømes Stortinget held på å utvikla, forklarer språkteknologen.
- Visste du dette? Tale til nynorsk-robot kjem i løpet av 2021
Gratis for alle
Den nyutvikla nynorske uttaleordlista er utvikla av trondheimsfirmaet Lingit og er gratis tilgjengeleg i ressurskatalogen til Språkbanken for alle, både kommersielle – og ikkje-kommersielle utviklarar.
– Å ha ein open lisens er veldig viktig for oss. Språkbanken er til for å tilby ressursar som trengst for å utvikla norsk språkteknologi slik at verken bokmål eller nynorsk taper terreng samanlikna med engelsk og andre større språk, seier Solberg.
Han peikar på at det er svært dyrt å utvikla slik teknologi, og at det for mange føretak ikkje ville vera mogleg eller lønsamt å laga si eiga liste for nynorsk.
– Ved å tilby denne lista med open lisens, gjer vi det billegare og enklare å utvikla taleteknologi for nynorsk, seier han.
570.000 nynorske ord
Ordlista inneheld 570.000 nynorske ord og maskinlesbare, fonetiske transkripsjonar av orda. Den tilsvarande uttalelista på bokmål har oppunder 800.000 ord.
– Forskjellen er likevel ikkje så stor som det i utgangspunktet kanskje høyrest ut som, seier Solberg.
Han forklarer at bokmålsordlista inneheld mange namn som er dei same både på bokmål og nynorsk. Mykje av bokmålsordlista kan ifylgje Solberg difor også brukast på nynorsk.
- Les også om korleis språkforskarane gjekk fram for å sikre truverde i Beforeigners:– Denne typen oppgåve har vore ein gutedraum som har gått i oppfylling
Taleattkjenning på dialekt
Språkbanken vil no gå vidare og utvikla begge ordlistene med fleire dialektversjonar og fleire ord, slik at ordlistene blir endå meir nyttige.
– Vi har akkurat begynt på eit prosjekt der vi skal utvida desse ordlistene med dialektvariasjonar, slik at ein fangar opp ulike dialektar ein har i Noreg, seier Solberg.
Han peikar på at det i dag mellom anna kan vera eit problem for dialektbrukarar at dei ikkje blir så godt forstått når dei snakkar med taleassistenten på mobilen sin.
– Ved å leggja til variasjonar i ei slik ordliste, kan ein forbetra den situasjonen i ein viss grad.
Mållagsleiar jublar
For leiaren i Noregs Mållag, Per Lofnes Hauge, er nyheita frå Nasjonalbiblioteket godt nytt.
– Dette er ei kjempenyheit som eg er svært glad for å høyra, seier Lofnes Hauge og held fram:
– Det å sikra språkteknologi på nynorsk er noko av det Noregs Mållag vil jobba mest med i tida som kjem, fordi utviklinga går svært fort og det tek over fleire og fleire funksjonar både i arbeidslivet og privatlivet. Det å få taleteknologi som forstår nynorsknære dialektar, er difor utruleg viktig.
Les også om SV-politikar Eirik Faret Sakariassen krev å verte referert på nynorsk på talarstolen på Stortinget: – Det er eit viktig signal å senda