Yritäpä kirjoittaa vihapuhetta, tekoäly karsii sen pois

Kuva: Teemu Kiviniemi

Tuomo Björksten

4.10.2018

Yritäpä kirjoittaa vihapuhetta, tekoäly karsii sen pois

Tekoäly on siistinyt Yle.fi:n kommenttikenttiä keväästä asti. Automaattimoderointi on jo nyt parantanut keskustelun laatua, kirjoittaa toimittaja Tuomo Björksten.

Meilläpä on töissä Pasilan paras vihapuhepoliisi. Se on tekoäly, jonka Ylen uutis- ja ajankohtaistoiminta otti käyttöön toukokuun puolivälissä. Tekoäly on väsymätön, ehtiväinen ja tarkka siivotessaan Yle.fi:n keskusteluista asiattomuuksia.

Tämä tekoäly-moderaattori on yksi välineistä, joilla pyrimme lisäämään vuorovaikutusta journalismissa. Haluamme edistää sellaista keskustelua, jolla rakennetaan parempaa suomalaista yhteiskuntaa. Haluamme tietää, mitä ihmisten mielessä on, mitä he pitävät tärkeänä.

Mistä toimittaja voi kovaäänisensä kanssa tietää, kuuluttaako hän oikeita asioita? Keskustelemalla ihmisten kanssa.

Minulta kysyttiin hiljattain, mitä hyötyä keskustelusta uutissivuilla on. Ajattelen, että vastaus on vertauskuvassa: Kuvitellaan, että yhteiskunta on iso tori. Me kaikki olemme siellä omilla asioillamme. Kuka myy, kuka ostaa, kuka vain katselee. Toimittajat kulkevat megafoneilla ympäri toria ja kuuluttavat uutisia. Vanhassa maailmassa kaikki katsoivat megafonin kantajaa hiljaisina ja kunnioittaen.

Nykyään ihmiset haluavat kertoa toimittajalle, mistä hänen pitäisi huutaa. Moni suhtautuu kuulemaansa entistä kriittisemmin. Mistä toimittaja voi kovaäänisensä kanssa tietää, kuuluttaako hän oikeita asioita? Keskustelemalla ihmisten kanssa.

Avasimme juttumme kommentoinnille ennen kesälomia. Emme olisi ryhtyneet operaatioon, ellei tietotekniikka olisi kehittynyt valtavasti viime vuosina. Ihminen ei ehdi tai varsinkaan jaksa siivota tauotta sitä määrää kommentteja, joka Yle.fi:n juttuihin nyt tulee. Hulluksihan siinä tulisi. Kone ei valita.

Päätös avata jutut kommentoinnille on osoittautunut hyväksi ajatukseksi. Keskustelu on pääosin asiallisempaa kuin moni meistä uskalsi odottaa. Kirjoittajat kiroilevat vähemmän kuin Suomi24:ssä, tuohtuvat harvemmin kuin Facebookissa ja ovat ystävällisempiä kuin Twitterissä.

Totta kai mukaan mahtuu aina mätiä omenia. Meillä ne siivotaan pois kahdella tavalla. Ensin kone arvioi, onko kommentti asiallinen vai asiaton. Sen jälkeen ihminen voi katsoa läpi ne tapaukset, joissa kone ei osannut tehdä päätöstä tai joissa se teki virheen.

Kukaan ei ole koodannut tekoälyyn sääntöä, että v**** on sana, jota keskustelussa ei saa esiintyä, se on päätellyt tämän itse.

Koneen tekemä ratkaisu perustuu matematiikkaan, sillä eihän kone suomen kieltä ymmärrä. Pohjalla on vanhaa aineistoa.

Keskustelut olivat auki Ylen sivuilla vuosia sitten, kun toimituksessa oli vielä kokopäivätyökseen keskusteluja moderoivia ihmisiä. Tältä ajalta on jäänyt talteen esimerkkiaineistoa, siis aitoja kommentteja, joista tiedetään, olivatko ne silloin julkaisukelpoisia.

Nämä kommentit on syötetty tekoälylle. Kone on analysoinut kommentteja ja oppinut itsenäisesti, mitkä asiat yhdistyvät asiallisessa tekstissä. Kukaan ei ole koodannut tekoälyyn sääntöä, että v**** on sana, jota keskustelussa ei saa esiintyä, se on päätellyt tämän itse. Kone oppii myös koko ajan lennossa, kun ihminen korjaa sen tekemiä ratkaisuja.

Teoriassa koneen pitäisi pystyä tekemään aina päätös puoleen tai toiseen. Todellisuudessa se päätyy usein heittämään kolikkoa: tekstissä on vähän asiattomuuksia, mutta myös paljon hyvää argumentointia.

Kirosanat ovat meillä tosiaan pannassa. Jos kone törmää sellaiseen, kommentti päätyy roskikseen. Kone osaa myös tunnistaa varsin hyvin tekstistä haistattelun tai ihmisryhmien halventamisen. Kaikkein vaikeinta koneelle on suodattaa pois kommentteja, joissa ivataan älykkäästi tai hienovaraisesti mutta silti tyylittömästi jotain henkilöä tai ihmisryhmää. Näihin tapauksiin ihmistoimittajat puuttuvat, kun he valvovat koneen toimintaa.

Päädymmekin usein sulkemaan keskustelulta kokonaan juttuja, joiden keskustelu ajautuu herkästi väärään suuntaan. Tällaisia ovat esimerkiksi onnettomuusuutiset.

Teoriassa koneen pitäisi pystyä tekemään aina päätös puoleen tai toiseen. Todellisuudessa se päätyy usein heittämään kolikkoa: tekstissä on vähän asiattomuuksia, mutta myös paljon hyvää argumentointia. Mitä pitäisi tehdä? Myös näitä epävarmoja tapauksia ihmistoimittajat käyvät läpi.

Keskustelujen laadun takeena on ollut myös Yle Tunnus. Kun käyttäjän pitää rekisteröityä ja kirjautua palveluun, näyttää se hillitsevän pahimpia mörrimöykkyjä ilmestymästä mukaan keskusteluun.

Saamme tällä hetkellä noin 20 000 kommenttia kuukaudessa. Niistä noin 90 prosenttia on hyväksyttyjä, kaksi prosenttia hylättyjä ja vajaat 10 prosenttia epävarmoja, jotka ihminen käy ratkaisemassa omalla ammattitaidollaan.

Kun otimme tekoälyn avuksi kommenttien moderoinnissa, hoksasimme nopeasti, että tämä ei ole mitään rakettitiedettä. Useimmilla uutissivustoilla on ollut keskustelupalsta jo iät ja ajat. Muuallakin hyödynnetään tekoälyä. Siksi meidän pitääkin miettiä, mikä on seuraava askel.

Siitä on nähty jo merkkejä. Luitko Ylen sote-toimittajan Tiina Merikannon jutun itsemurhan tehneestä miehestä? Sen perässä on vajaan 200 kommentin asiallinen keskustelu itsemurhista, johon Merikanto osallistuu asiantuntijoiden kanssa. Perinteinen tapa tehdä juttu olisi ollut antaa sen olla, kun teksti on julkaistu. Uusi tapa on jatkaa juttua keskustelussa.

Kirjoittaja on Yle News Labin toimittaja.

Read this blog post in English here.