Hero
Author
Aleksi Manninen, Samuli Sillanpää, Jyri Kivimäki
22.01.2024
"Nimensä mukaisesti käänteentekevä projekti" – miten Yle onnistui vähemmistökielien hankkeessaan
Miten Yle voisi tuottaa uutisia uusilla kielillä? News Labin muotoilija Aleksi Manninen muistelee Demokratian ja digitalisaation päällikön Aki Kekäläisen, projektipäällikkö Samuli Sillanpään ja erityissisältöjen vastaavan tuottajan Marko Krapun kanssa.

– Tutkikaa, miten Yle voisi alkaa tarjota sisältöjä uusilla kielillä!

Tämä News Labin Demokratia & Digitalisaatio -tiimin päällikkö ja pääsuunnittelija Aki Kekäläisen ystävällinen ja hyvässä, haastavassa hengessä esitetty kehotus helmikuun alussa 2022 saattaa kirjoitettuna vaikuttaa tylyhköltä käskyttämiseltä.

Todellisuudessa läsnäolijat olivat innoissaan päästessään tutkimaan syvällisesti tekoälykäännösteknologian soveltamismahdollisuuksia uutis- ja ajankohtaistoiminnassa. Kohderyhmänä ovat Suomessa asuvat 458 000 ihmistä, joiden äidinkieli on jokin muu kuin suomi, ruotsi tai saame. Kick off -tilaisuus oli lämminhenkinen ja uteliaisuutta kihisevä.

Tuossa tapaamisessa lyötiin alkutahdit Uutisia vähemmistökielille -hankkeelle, mutta sen syntyjuuret olivat alun perin lähtöisin jo aikaisemmasta EBU:n eli Euroopan yleisradiounionin hankkeesta, jossa rakennettiin uutissisältöjen jakamista eri maiden välille konekäännösten avulla.

– Konekääntäminen oli kehittynyt viime vuosina merkittävästi ja halusimme selvittää onko teknologia hyödyllistä myös meidän kotimaisilla kielillä omissa hankkeissamme, Kekäläinen muistelee.

Helmikuussa 2022 News Labin monialainen tiimi alkoi järjestäytyä. Reilu kolmekymmenhenkisestä News Labista projektia alkoi tehdä kymmenkunta – kukaan ei täyspäiväisesti, mutta sopivasti muiden projektien aikatauluihin sovitellen.

Tässä vaiheessa takana oli juuri iso ponnistus vuoden 2022 aluevaalien tiimoilta, ja menossa oli valmistautuminen eduskuntavaaleihin. News Labin vastuulla on mm. Ylen vaalikoneen kehitys, ja uusia ominaisuuksia oli tulossa.

Taustoitus ja järjestäytyminen

Tech lead Samuli Sillanpää aloitti hankkeen projektipäällikkönä. Samulin pitkä ja laaja-alainen ymmärrys ja osaaminen humaanista tavasta hyödyntää teknologiaa sopi rooliin kuin nakutettu.

– Uutisia vähemmistökielille osoittautui todella mielenkiintoiseksi projektiksi. Tiimille oli alusta asti selvää, että nyt ollaan tekemässä jotain todella tärkeää ja juuri sellaista, mitä Ylen kuuluukin tehdä, Sillanpää kertaa.

News Labin työryhmään kuului Suomen luovimpia ohjelmistokehittäjiä ja tekoälyasiantuntijoita, joten tekoälyn ja teknologian mahdollisuuksista oli jo lähtökohtaisesti olemassa hyvä kuva. Laaja teknologinen selvittely oli silti alusta lähtien avainasemassa, jotta hankkeella pystyttäisiin vastaamaan yhtiön korkeaan journalistisen tason vaatimukseen.

Tiimi tiesi, että eri palveluiden käännöksissä on eroja ja että käännösten julkaisukuntoon saattaminen vaatii ihmistyötä. Mutta kuinka paljon? Ja miten käännösten laatua olisi mielekästä vertailla?

Selvityksessä päästiin nopeasti liikkeelle EBU:n tarjoaman konekäännösrajapinnan avulla. Sen kautta tiimi sai käyttöönsä eri palveluiden käännökset (mm. Google, Azure, DeepL). Käännösten vertailussa hyödynnettiin niin ammattilaiskääntäjiä ja toimittajia kuin loppukäyttäjiäkin. Ammattilaisten tehtävä oli arvioida paljonko työtä raakakäännöksen korjaaminen vaatii. Lopullisen käännösten laadun arviointi tehtiin käyttäjätutkimuksilla.

Opimme, että konekäännöksissä on suuria eroja paitsi palveluiden myös käännettävien kielten välillä. Käännösten keskinäinen vertailu ja “riittävän” laadun määrittäminen ei ole aivan yksinkertaista.

Heti alussa alkoi myös aktiivinen yhteistyö Ylen sisällä. Kevään mittaan mm. Ylen erityissisältöjen vastaava tuottaja Marko Krapu, kääntäjä Sampsa Peltonen, saavutettavuusvastaava Minna Pöntys, suoratekstittäjä Kaisa Vitikainen sekä monimuotoisuusasiantuntijat Wali Hashi ja Ujuni Ahmed osallistuivat keskusteluihin ja antoivat korvaamattoman arvokasta tietoa ja näkemystä projektiryhmälle.

Ennen ratkaisuja oli määritettävä ratkaistavia ongelmia

Alustavan selvityksen jälkeen työstettäväksi kieliksi valikoituivat Suomen yleisimmät vähemmistökielet, joille Ylellä ei vielä ollut tarjontaa: arabia, somali, kurdi ja persia. Myöhemmin käyttäjähaastatteluita valmistellessa persia tarkentui dariksi.

Ylessä tehdään paljon käyttäjä- ja asiakastutkimusta, ja myös monikulttuurisuuskontekstia oli sivuttu jo aiemmin. Erityisen arvokkaaksi osoittautui vuotta aiemmin tehty Kahden kulttuurin välissä -tutkimus, jota hyödynnettiin tarkasti. Näin hankkeen oman tutkimus alkoi valmiimmalta pöydältä.

Käyttäjätutkimuksen suunnittelu ja valmistelu sujui muuten tavanomaisesti, mutta valittujen kielten puhujien löytäminen osoittautui vaikeaksi normaalin rekrytointikumppanimme kautta. Vaihdoimme metodia puskaradio-tyyppiseksi verkoston kautta eteneväksi sanomaksi, ja se tuotti tuloksia: saimme järjestymään ryhmähaastattelut haluamiemme kieliryhmien edustajien kanssa.

Jalkauduimme ympäri Helsinkiä ja pääsimme mukaan erilaisiin tilanteisiin, mm. Suomi-Syyria -seuran iftariin, eli ramadanin aikana tapahtuvaan auringonlaskun jälkeiseen yhteiseen ateriointiin.

Iftar

Projektin aikana sain todella konkreettisesti omin silmin nähdä ja korvin kuulla kokemuksia sellaisista elinympäristöistä, joihin ei aiemmin ole ollut kontaktia. Valkoisena suomalaisena miehenä eläminen on monin tavoin etuoikeutettua, ja oikeudet ovat niin syvällä yhteiskunnan rakenteissa, että monesti niiden huomaaminenkin voi olla hankalaa.

En osallistunut pitkään aikaan varsinaisten ratkaisujen ideointiin, vaan keskitin huomioni sellaisen kysymyspatteriston suunnitteluun, jolla saisimme haastateltavat kertomaan elämästään mahdollisimman monipuolisesti.

Tavatessamme monenlaisten ihmisryhmien edustajia saimme kuulla arjen esimerkkejä heidän kokemuksistaan. Haastatteluryhmien dynamiikan havainnointi oli myös antoisaa, vaikka tästä ei tehtykään varsinaisia johtopäätöksiä.

Haastattelut tehtiin puolistrukturoidusti, tarvittaessa tulkin avustuksella ja ne äänitettiin. Äänite litteroitiin ja olennaiset havainnot purettiin taulukkoon. Taulukkoon lisäsimme hieman yksilöiviä tietoja, kuten sukupuoli, kieli, ikä ja lopuksi kopioimme tiedot Miro-alustalle teemoiteltavaksi. Teemoittelussa yksittäiset sitaatin ja yksilöivän tiedon sisältävät digitaaliset muistilaput yhdisteltiin isommiksi kokonaisuuksiksi.

Haastattelut osoittivat jälleen kerran olevansa palvelumuotoilutyön syvintä ja hedelmällisintä ydintä, jota ilman ei voi löytää oikeita ongelmia ratkaistavaksi. Oli ensiarvoisen tärkeää paneutua tähän vaiheeseen kunnolla.

Venäjän hyökkäys muutti fokusta

Pian projektin aloittamisen jälkeen Venäjä aloitti hyökkäyssodan Ukrainaan. Oli selvää, että sodalla on yhteiskunnallisia vaikutuksia myös Suomeen. Ymmärsimme, että ukrainalaisista tulee uusi suuri vähemmistökieliryhmä, ja ensimmäiseksi julkaistavaksi kieleksi valittiin ukraina.

– Yle päätti keväällä 2022 nopealla aikataululla aloittaa ukrainankielisen uutisoinnin, kun kävi ilmi, että Suomeenkin on tulossa kymmeniä tuhansia pakolaisia. Sain tehtäväkseni suunnitella, millä tavalla Yle Uutiset voisi auttaa näitä pakolaisia integroitumaan ja saamaan heille tärkeää tietoa uudesta kotimaastaan, Marko Krapu kertoo.

Päätös ukrainankielisen uutispalvelun avaamisesta syntyi maaliskuussa ja Krapun yksikkö Yle Erityissisällöt otti palvelun omistukseensa.

– Suunnitteluvaiheessa kuulin, että News Lab on edistänyt tekoälyyn pohjautuvaa käännöstyökalua ja tiemme kohtasivat. Nopealla ja hyvällä yhteistyöllä pystyimme aloittamaan tekoälyavusteiset käännökset jo toukokuussa 2022.

Mitä konkreettisia tuloksia voisimme saada aikaan?

Maalis-huhtikuussa käännöstyökalu alkoi hahmottua. Työkalu tukee kahta erilaista työnkulkua: on mahdollista tuoda jo julkaistu artikkeli Ylen julkaisujärjestelmästä, ja sitten vertailla kohdekielestä riippuen 3-5 konekäännettyä vaihtoehtoa. On myös mahdollista aloittaa työ tyhjältä pöydältä, syöttäen tekstiä suoraan työkaluun ja sitten vertailla sen käännöksiä samaan tapaan.

Kääntelijä-työkalu avattiin testikäyttöön huhtikuussa. Oli kiehtovaa nähdä miten uusi palvelu pääsi käyttöön Ylen sisällä ja millaisia käyttötapoja käyttäjät keksivät ehdottamiemme lisäksi. Reilun vuoden päästä kirjattavia Ylen tekoälyperiaatteita enteiltiin jo tässä vaiheessa: työkalu ei korvannut ihmiskääntäjää, vaan alkoi toimia käännöstyön apurina ja työn tehostajana.

Huhtikuussa tapasimme myös Yle-palvelun kehittäjätiimin, ja kävimme läpi vaihtoehtoja uuden palvelun julkaisemiselle. Ylen laajuisessa verkkopalvelussa on useita eri tarkoituksiin kehitettyjä julkaisutyönkulkuja ja alasivustotyyppejä ominaispiirteineen. Kävimme läpi mitä design-muutoksia tarvitaan, millaista sisältöä on odotettavissa, mitä sisältötyyppejä tarvitaan, mitä asiasanoja tarvitaan ja niin edelleen.

Sopivat tavat löytyivätkin pian ja palvelu-tiimin ison ponnistuksen jälkeen Yle Novyny avattiin toukokuussa 2022. Kääntelijä-työkalun avulla käännetyt uutisjutut muodostivat palvelun pääasiallisen sisällön.

Novyny-kuvakaappaus

– Uutisia vähemmistökielille -projekti on ollut kehittämänsä työkalun mukaisesti käänteentekevä. Yle Novyny on toiminut pilottina ja luonut pohjaa muille kielille. Kääntelijää ovat sittemmin käyttäneet arjessaan myös Yle Novosti, Yle News ja Svenska Yle. Tekoäly mahdollistaa uusien kielten mukaan ottamisen aiempaa pienemmillä resursseilla, Krapu toteaa.

Käyttäjätutkimuksen viimeiset haastattelut tehtiin kesällä 2022 ja tulokset julkaistiin alkusyksystä 2022. Tulokset kertovat maahanmuuttajataustaisten ihmisten elämästä Suomessa heidän omalla äänellään ja avaa heidän toiveitaan ja käsityksiään mediasta. Tulokset esiteltiin talon tapaan presentoiden eri tilaisuuksissa, mutta julkaisimme myös julkisesti saatavilla olevan version Miro-teemoittelutyöskentelymme tuloksista. Haastateltavien kommentteja pääsee selaamaan täällä.

Kääntelijä-teemoittelu

Voisimmeko hyödyntää tekoälyä tekstittämisessä?

News Labin ohjelmistokehittäjät olivat projektin aikana selvitelleet tekstitykseen liittyviä mahdollisuuksia ja talven 2022-23 aikana edettiin tekemään kokeiluja. Pohdinnoissa huomattiin, että suomenkieliset selkokieliset uutiset tekstitetään ihmis-ammattilaisten toimesta, ja tämä tekstitys olisi paitsi hyvää kieltä, myös sopivan selkeää materiaalia konekäännettäväksi.

Käyttäjätutkimuksessa oli noussut esiin löydös, että Telegram on ukrainalaisten keskuudessa suosittu kanava, joten ilmeinen askel oli avata sinne Novyny-kanava. Teimme nopeasti kokeiluja, kuinka sitä voisi hyödyntää ja kanava avattiin kesällä 2022. Aluksi kanavalla jaettiin Yle Novonyn ukrainankielisiä uutisjuttuja.

Selvitys- ja testausvaiheen jälkeen syksyllä 2023 otimme seuraavan askeleen, kun aloimme julkaista kanavalla ukrainaksi tekstitettyjä selkokielisiä tv-uutisia. Näin tuemme integroitumista suomalaiseen yhteiskuntaan, kun suomen kielen oppiminen sujuvoituu ukrainankielisen tekstityksen ansiosta.

– Palaute on ollut toistaiseksi erittäin hyvää. Telegramin jälkeen seuraava askel on tuoda videot myös Ylen uutispalveluun (yle.fi, Yle-sovellus) ja Areenaan. Formaattia testataan myös muilla kielillä, Krapu valottaa seuraavia etenemisvaiheita.

Projekti jatkuu

Uutisia vähemmistökielille jatkuu projektina edelleen. Tutkimus avasi monenlaisia näkymiä maahanmuuttajataustaisten yleisöjen tavoittamiseen. Tulevaisuudessa Yle laajentaa kokeiluja muihin kieliin ja pyrkii vakiinnuttamaan 1-2 uutta kieltä vuosittain.

Yhtiössä on meneillään laaja, monikielisyyteen liittyvä muutosprojekti, jonka yhtenä tavoitteena on pyrkiä mahdollisimman kattavaan kielipalveluun ja -valikoimaan.

– Osana tätä isoa projektia haluamme laajentaa kielivalikoimaamme. Alamme tuottaa uutisia uudella vieraalla kielellä – tai kielillä – vuonna 2024, näillä näkymin viimeistään alkusyksystä. Vaihtoehdot ovat parhaillaan pohdinnassa ja teen paljon taustatyötä (haastatteluja, selvityksiä) selvittääkseni, mikä vieras kieli hyötyisi eniten omakielisestä uutisoinnista juuri nyt, Krapu puntaroi.

Tutkimuksen vaikutus näkyy monimuotoisuuden lisääntymisenä ja parempana hahmottamisena ja jatkuu muun muassa monimuotoisuusmittaustyökalun kehittämistyössä. Projektissa otetut teknologiset kehitysaskeleet ovat vieneet yhtiön osaamista reippaasti eteenpäin ja lisännyt ymmärrystä tekoälyn mahdollisuuksista journalistisen työn osana.

Kehitetty käännöstyökalu on koko ajan laajenevassa käytössä kaikkien käännösapua tarvitsevien yleläisten keskuudessa. Novynyn sivusto ja Telegram-kanava tavoittavat valtaosan Suomeen tulleista ukrainalaisista.

– Konekääntämisen avulla voimme tehdä sisältöjä aiempaa helpommin yhä useammalle kielelle. Helpommin tarkoittaa myös kustannustehokkuutta. Eri kielien tukeminen on tärkeää sekä yhteiskunnan että yksilöiden näkökulmasta. Huomasimme esimerkiksi korona-pandemian aikaan sekä uudelleen Venäjän hyökätessä Ukrainaan, että väärä tieto voi levitä niissä kielivähemmistöissä helpommin, joille ei ole tarjolla oikeaa tietoa heidän omalla äidinkielellään, pohtii Aki Kekäläinen.

Aleksi Manninen Yle News Lab, Innovation Designer

Samuli Sillanpää Yle News Lab, Tech Lead, tiiminvetäjä - Tekoäly ja journalismi

Jyri Kivimäki Yle News Lab, projektipäällikkö - Yhteistyö ja kokeilut


PS. Ketkä "me"? Yle News Labin Demokratia ja digitalisaatio -tiimissä seuraamme aktiivisesti, mitä uusia teknologioita ja trendejä kehityshorisontissa näkyy. Haluamme olla ensimmäisinä omaksumassa niiden käyttöä ja soveltamista, sillä niiden siirtäminen Ylen journalistisen työn tueksi on tärkeää, jotta pysymme mukana ajassa ja voimme palvella asiakkaitamme entistä paremmin. Me emme kuitenkaan kehitä uusia palveluita tai työkaluja yksin, vaan kehitystä tehdään yhdessä toimitusten ja loppukäyttäjien kanssa. Kaikessa kehittämisessä meillä on aina takana Ylen arvot ja strategia, jota kohti kehitystä ohjataan.