Tekoäly tiedonhaussa

Tekoälyä on käytetty hakukoneiden ja tietokantojen toimintaa ohjaavissa algoritmeissä jo pitkään, mutta viimeaikainen kehitys generatiivisen tekoälyn ja laajojen kielimallien käyttöönotossa on ollut nopeaa.
Tiedonhaun näkökulmasta tekoälyn potentiaali on suurten tietomäärien tiivistämisessä ja jäsentelyssä, tekoäly auttaa hahmottamaan aihetta ja käsitteitä. Ideoita hakusanoiksikin niillä voi saada.

Kielimalli ei ole hakukone

Tällä hetkellä pinnalla ovat erityisesti generativiinen, vuorovaikutteinen tekoäly ja suurilla datamassoilla koulutetut kielimallit, Large Language Models LLM, joita hyödyntävät esimerkiksi ChatGPT (OpenAI), Microsoftin BingGooglen Bard.

Kielimallit eivät hae tietoa netistä tai tietokannoista, vaan ne perustuvat sanojen peräkkäisen esiintymisen todennäköisyyksiin. Siksi ne eivät sellaisenaan sovellu tieteellisen tiedon hakuun.

Tekstin paikkansapitävyys on aina tarkistettava jostain muualta.

Jos kielimallia käyttävä chattibotti antaa lähdeviitteitä, on aina tarkistettava, ovatko ne aitoja lähteitä vai onko ohjelma vain ”hallusinoinut” lähteitä, joita ei ole olemassakaan.

Lue ChatGPT-testauksesta Tekoäly ei vieläkään tee töitämme -blogitekstimme.

Hakusanojen ideointiin

Kielimalleja voi käyttää apuna esimerkiksi aiheeseen tutustumisessa tai hakusanojen hahmottelussa. Erityisesti uuden ja itselle vieraan aiheen analysoinnissa voi tekoälystä olla paljonkin apua.

Tekoäly myös kääntää melko hyvin hakusanoja suomesta englanniksi.

Ehdotettuihin hakusanoihin/fraaseihin ei kuitenkaan pidä luottaa ilman kritiikkiä.
Sinällään niillä on helppo kokeilla hakua jostain oman alan tieteellisestä tietokannasta tai Google Scholarista. Yleensä ehdotuksista joutuu ryhmittelemään toisilleen vaihtoehtoisia käsitteitä ja rajaavia käsitteitä, sekä pilkkomaan ne hakusanoiksi ja niiden yhdistelmiksi.

Tekoäly tiivistää laajat asiakokonaisuudet

Tiedonhaun tarkoituksena ei aina ole löytää kaikkea aiheeseen liittyvää, vaan koneen voi antaa valikoida relevanteimmat tulokset. Näin pyritään tehostamaan tiedonhakijan jatkotyöskentelyä vähentämällä aikaa vievää hakutulosten selailua.

Tulokset voidaan esittää esimerkiksi visuaalisessa muodossa käsiteryppäinä tai erilaisina verkostoina. Connected Papers, Open Knowledge Maps ja Research Rabbit -visuaalisten välineiden kokeilusta.

Näiden hakuvälineiden ongelmana on ennen kaikkea hakuprosessin läpinäkymättömyys. Hakujen tulosjoukot ovat yleensä suurehkoja eikä ole mitään keinoa varmistaa, miten lajittelu toimii ja jääkö relevanttia aineistoa mahdollisesti pois tuloksesta.

Koko ajan ilmestyy lisää välineitä myös artikkelien sisällön/asiakokonaisuuksien tiivistämiseen, yhteenvetojen tekemiseen tai tekstin oikolukuun ym. Artikkelihakuihin voi kokeilla myös esimerkiksi näitä: Elicit, Scite, Consensus, Keenious

Vaikka välineet tarjoavat uusia mahdollisuuksia ja niitä voi ja kannattaa hyödyntää, systemaattisemmassa ja laajemmassa tiedonhaussa (esim. opinnäytettävä varten tehtävä haku) ne eivät kuitenkaan yksinomaan riitä.

Muista

  • Useimpiin tekoälyvälinesiin pitää kirjautua, on luotava oma käyttäjätili. Tätä ei keneltäkään kuitenkaan voida vaatia.
  • Tekoäly ei vapauta kirjoittajaa tiedon todenperäisyyden, luotettavuuden tai tieteellisyyden arvioinnista eikä lähteiden tarkistamisesta.
  • Edelleen kirjoittaja on itse vastuussa tekstistään.
  • Kerro, jos olet käyttänyt tekoälyä työssäsi sekä mitä ja missä vaiheessa.
  • Älä jaa yksityistä tietoa!
  • Muutokset ja kehitys ovat nopeita.

Lisälukemista: