Tag Archives: konekääntäminen

Käännösteknologisen murroksen hallintaa

Kielenkääntäjien toimenkuva, työympäristö, työkalut ja niiden mukana koulutus ovat kokeneet kansainvälisesti rajun muutoksen vuosituhannen vaihtumisen jälkeen. Kääntäjien virkoja on yhä vähemmän, ala on yksityistynyt, sitä hallitsevat freelancerit ja suuret kansainväliset käännöstoimistot, ja itse kääntäminen on digitalisoitunut. Samoja muutoksia ovat kokeneet monet toimialat, ja koulutuksen pitäisi pysyä mullistusten perässä.

Maallikoiden silmissä suurin uhkakuva kääntäjien ammattikunnalle kai on kehittyvä konekääntäminen – mielikuva lienee, että kääntäjät käyvät kokonaan tarpeettomiksi, kun mobiiliversiot Tähtien sota -elokuvasta tutusta C3P0:sta alkavat tulkata arkipäiväisesti kaikilla kielillä – , vaikka itse kääntäjille konekääntäminen on lähinnä yksi digitaalisista työkaluista.

Euroopan Unionin käännöstoiminnasta huolehtivassa DGT:ssä konekäännösohjelma Moses on ollut käytössä vuodesta 2012. Se nopeuttaa käännöstyön prosessia siellä, missä se on mahdollista: usein konekääntäminen vaatii alkuperäistekstiltä automaattista esiprosessointia eli niin sanottua kielen kontrollointia, eräänlaista selkokielistämistä, ja aina tuotetulta käännökseltä ihmisen jälkieditointia.

Moses on eurooppalaisten yliopistojen yhteistyönä kehitetty avoimen lähdekoodin ohjelmisto. Se perustuu tilastolliseen konekääntämiseen – samaan, jota Googlekin soveltaa – , eli ohjelma hakee jo käännetyistä lähtö- ja kohdetekstien pareista tilastollisesti parhaat vastinesegmentit sana-, lauseke- ja lausetasolla. Ohjelmisto vaatii siis jo käännettyjä tekstejä toimiakseen ollenkaan ja valtavia tekstimassoja toimiakseen edes jotenkin tyydyttävästi.

Lisäksi tekstimassojen on oltava samaa tekstilajia kuin käännettävä teksti. Hallintokielisistä teksteistä ei juuri ole apua, kun käännetään televisioon ruututekstejä eli tekstityksiä.

Mutta aina konekääntäminen ei ole mahdollista. Hieman yllättäen yksi rajoittavimmista tekijöistä on käytetty kielipari. Vaikka DGT:ssä on samalla tavoin tekstimassoja eli korpuksia kaikilla EU:n kielillä, niin juuri suomalais-ugrilaiset unkari, viro ja suomi tuottavat Mosekselle ongelmia, kun niille käännetään Euroopan valtakielistä.

Kieliopilliselta rakenteeltaan suomi poikkeaa rankasti germaanisista, romaanisista ja slaavilaisistakin kielistä, jotka kaikki ovat indoeurooppalaisia sukukieliä keskenään: automaattinen tilastollinen vastinesegmenttien muodostuminen vaikeutuu.

Itä-Suomen yliopiston käännöstieteen ja -teknologian kansainvälinen maisteriohjelma valmistaakin kääntäjistä ensisijaisesti kääntämisen ongelmiin perehtyneitä käännösteknologisen ympäristön osaajia.

Jukka Mäkisalo

Professori, käännöstiede