Valeuutiset, trollit ja humanistinen tutkimus

Tutkimuksen maailma voi joskus olla hyvin kummallinen, ja tämä pätee varsinkin humanistiseen tutkimukseen. Tutkimusaiheet voivat kuulostaa erikoisilta, ja harvoin tiedetään etukäteen, mitä tietoa yhteiskunta tarvitsee. Tästä hyvä esimerkki on vaikkapa assyrologian ja Arabian ja Persian kielten ja kulttuurien tutkimus. Tämän alan tutkimus nousi yhteiskunnallisen keskustelun keskiöön yhden päivän aikana noin kaksi vuosikymmentä sitten. Ennen syyskuun 11. päivän tapahtumia vuonna 2001 hyvin harva yliopistomaailman ulkopuolella edes tiesi tämän alan olemassaolosta. Toinen esimerkki löytyy tuttavapiiristäni, johon kuuluu vaihtoehtolääketieteen historiasta väitöskirjaansa tekevä henkilö. Tähän mennessä tutkimukseen on kuulemma ollut melko vaikea saada rahoitusta, koska aihe ei ole aivan osunut yhteiskunnallisen innovaatiopuheen terävimpään ytimeen. No, koronarokotusten ja niihin liittyvän laajemman keskustelun myötä tämä väitöskirjatutkija on aiheineen yhtäkkiä aivan kansallisen keskustelun ytimessä. Yhteiskunta tarvitsee tutkittua tietoa tästä vähän tutkitusta ilmiöstä, jotta pystyisimme ymmärtämään paremmin rokotuksiin liittyvää keskustelua.

Nämä molemmat esimerkit osoittavat, että on hyvin vaikea ennustaa, mitä tietoa tarvitsemme tulevaisuudessa. On ylläpidettävä mahdollisimman laaja-alaista yliopistoa ja vaalittava tutkimuksen vapautta. Kun tietoa sitten tarvitaan, ei sen luomiseen tarkoitettua järjestelmää saa nopeasti pistettyä pystyyn. Tiedon on annettava kasvaa rauhassa omassa elinpiirissään. No, miten tämä kaikki sitten liittyy valeuutisiin ja trolleihin?

(Parempi) some tarvitsee kielentutkimusta

Yksi esimerkki tutkimusalasta, jonka tuottamaa tietoa tarvitaan enenevässä määrin, on kielentutkimus. Luonnollisen kielen nousu keskiöön liittyy sosiaaliseen mediaan. Viimeiset 15 vuotta ovat olleet somen kulta-aikaa, jolloin siitä on tullut ei vain olennainen osa monien päivittäistä elämää, mutta myös kanava poliittiseen ja taloudelliseen vaikuttamiseen. Yhdysvaltojen edellinen presidentti käytti sosiaalisen median viestintävaltaa taitavasti, ja samalla somesta kuoriutui hirviö, jossa kaikenkarvaiset salaliittoteoriat liikkuivat yhteiskunnan marginaalista kohti keskiötä. Muutama viikko sitten kohua aiheutti sijoittajien käymä keskustelu WallStreetBets-sivustolla. Kun valtava määrä sijoittamisesta kiinnostuneita ihmisiä kohtaa keskustelupalstalla, on viesteillä taipumus polarisoitua. Tämä ilmiö on johtanut joidenkin osakkeiden kohdalla valtaviin arvonnousuihin ja myös -laskuihin.

Lähes kaikki somessa tapahtuva toiminta liittyy luonnolliseen kieleen. Eräs ulkomainen kollegani totesi osuvasti, että nk. big tech (eli isot some- ja ohjelmistoyhtiöt) ei liity vain ohjelmointiin, vaan digitaalisen maailman vallankumous on itse asiassa olennaisesti yhteydessä luonnollisen ihmiskielen käyttöön. Monien somemaailman analyysityökalujen pohjana on ihmistieteiden perustutkimuksessa tehty työ vaikkapa siitä, miten sana tai lauseke rakentuu, miten lause jäsentyy tai miten sanan merkitys muodostuu ja muuttuu suhteessa ympäröivään tekstiin.

Ymmärtääksemme sosiaalisen median keskusteluja paremmin tarvitsemme kielentutkijan perustutkimuksessa tuottamaa tietoa. Ilman kielentutkimuksen työkaluja on vaikea ymmärtää sitä, miten valeuutiset rakentuvat, ja miten pahantahtoisia uutisia levittävät trollit luovat vaihtoehtoisia todellisuuksia. Kielentutkimuksen osaamista tarvitaan rakentamaan parempia järjestelmiä, jotta valeuutisten leviämisreittejä pystytään mallintamaan paremmin ja bottien tunnistaminen mahdollistuu. Tämä työ vaatii sekä syvää ymmärrystä ihmiskielestä, että kykyä toimia yhteistyössä teknologioista kiinnostuneiden osaajien kanssa.

Digitaalisena syntynyt data laajentaa humanistin roolia työelämässä

Digitaalisena syntynyt data (siis sinun ja minun someapplikaatioihin tai päätteille näpyttelemä kieli) on tärkeässä osassa uutta kansallista digitaalisten ja laskennallisten ihmistieteiden verkostoa, jossa UEFin humanistinen osasto on mukana. Verkoston tavoitteena on luoda suomalaista huippututkimusta mahdollistavaa tutkimusinfrastruktuuria – siis ympäristöjä, joihin osaaminen keskittyy ja joissa pystytään kehittämään digitaalisia työkaluja digitaalisena syntyneen datan analysointiin. Tämä kansallinen FIN-CLARIAH-infrastruktuuri tuo yhteen lähes kaikki suomalaiset yliopistot ja niiden digitaalisten ihmis- ja yhteiskunta-alan tutkimuksen. Verkosto koostuu ihmistieteiden tutkijoista ja digitaalisuuden huippuosaajista, jotka luovat työkaluja tutkimuksen tarpeisiin.

Tavoitteena on, että tulevaisuudessa humanistisen alan tutkijoilla olisi entistä paremmat kieliaineistot niin isoissa maailmankielissä kuin pienemmissä alueellisissa kielissä ja murteissa. Vaikka valeuutiset ja trollit saattavat olla ohimenevä ilmiö, ne havainnollistavat kuitenkin digitaalisesti syntyneen kielidatan mahdollisuuksia. Valeuutiset eivät katso kieltä vaan voisivat yhtä hyvin olla karjalan kielellä kuin englanniksikin. Laajemmat ja paremmin saatavilla olevat aineistot mahdollistavat laajan perustutkimuksen sekä tarjoavat mahdollisuuksia digitaalisten ja laskennallisten menetelmien kehittämiseen. Humanistisella osastolla tehtävä laaja-alainen perustutkimus puheentunnistuksen, suomen murteiden vaihtelun, vähemmistökielten, englannin alueellisten varieteettien tai kielten ja kulttuurien kohtaamisten parissa antaa meille hyvän pohjan toimia tässä kansallisessa infrastruktuurissa. Samalla meidän on vaalittava tämän(kin) alan tutkimusta ja pidettävä huolta siitä, että kun tietoa ja osaamista tarvitaan, sitä on myös oltava saatavilla.

Koko digitaalinen vallankumous ja digitaalisena syntynyt data laajentavat humanistien roolia työelämässä. Hyvien perinteisten humanistien työelämäpolkujen rinnalle (opettajat, kääntäjät, asiantuntijat) noussee tulevaisuudessa tarve integroida kielen alan perustutkimus ja kielen alan osaaminen yhä vahvemmin osaksi ohjelmoinnin ja laskennallisten alojen opintoja. On olemassa selviä merkkejä siitä, että kielentutkijoille ja varsinkin sellaisille, jotka ymmärtävät jonkun verran teknologiaa, on kasvavaa kysyntää työmarkkinoilla.

Mikko Laitinen
Professori, englannin kieli ja kulttuuri, digitaaliset ihmistieteet