Tarton yliopiston karjalan kielen konekäännin

Tarton yliopistossa on kehitteillä suomalais-ugrilaisiin kieliin erikoistuva konekäännin. Viimeisimmässä päivityksessä konekääntimeen on lisätty 17 uutta kieltä, joiden joukossa on myös karjala. Karjalan kielen elvytyshanke on avustanut konekääntimen työryhmää karjalan kielen eri murteiden lisäämisessä saataville.

Konekäännin tukee nyt suomea, viroa, unkaria, liiviä, võroa, vienankarjalaa, livvinkarjalaa, lyydiä, vepsää, pohjoissaamea, eteläsaamea, inarinsaamea, koltansaamea, luulajansaamea, komia, komipermjakkia, udmurttia, vuorimaria, niittymaria, ersää, mokšaa, mansia ja hantia. Lisäksi kone tukee englantia, venäjää, latviaa, liettuaa ja saksaa. Kieliparin käyttäjä voi vapaasti valita kaikista saatavilla olevista kielistä.

Konekäännin on vielä varsin varhaisessa vaiheessa ja tekee etenkin uhanalaiselta kieleltä toiselle käännettäessä paljon virheitä. Parhaiten käännin suoriutuu arkipäiväisistä ja yksinkertaisista teksteistä. Monimutkaiset ja tulkinnanvaraiset kokonaisuudet kääntyvät heikommin. Välillä käännin myös käyttää sekaisin vienan- ja livvinkarjalan rakenteita ja sanoja, vaikka käyttäjä olisi valinnut murteista vain yhden.

Konekäännintä kehittävä työryhmä toivoo englanninkielisessä tiedotteessaan, että vastikään lisättyjen kielten osaajat kokeilisivat käännintä ja kommentoisivat sen tuottamia käännöksiä. Virheellisiä käännösehdotuksia voi korjata käyttämällä konekääntimen edit-toimintoa. Lisäksi työryhmä pyytää kieliyhteisöjen jäseniä lähettämään heille sähköpostitse (ping@tartunlp.ai) tekstiaineistoja. Käännösvirheiden korjaukset ja tekstiaineistot auttavat konekääntimen kehittämisessä ja parantavat käännösten laatua.

Linkki konekääntimeen.

Linkki konekäännintä koskevaan tiedotteeseen.

Tarton yliopistolta lisätietoja antavat Elizaveta Yankovskaya (lisa.yankovskaya@ut.ee) ja Maali Tars (maali.tars@ut.ee).