Tekoäly tiedonhaussa

Tekoälyä on käytetty hakukoneiden ja tietokantojen toimintaa ohjaavissa algoritmeissä jo pitkään, mutta viimeaikainen kehitys generatiivisen tekoälyn ja laajojen kielimallien käyttöönotossa on ollut nopeaa. Tiedonhaun näkökulmasta tekoälyn potentiaali on suurten tietomäärien tiivistämisessä ja jäsentelyssä, tekoäly auttaa hahmottamaan aihetta ja käsitteitä. Ideoita hakusanoiksikin niillä voi saada.

Kielimalli ei ole hakukone

Tällä hetkellä pinnalla ovat erityisesti generativiinen, vuorovaikutteinen tekoäly ja suurilla datamassoilla koulutetut kielimallit, Large Language Models LLM, joita hyödyntävät esimerkiksi ChatGPT (OpenAI), Microsoftin Bing, Googlen Bard.

Kielimallit eivät hae tietoa netistä tai tietokannoista, vaan ne perustuvat sanojen peräkkäisen esiintymisen todennäköisyyksiin. Siksi ne eivät sellaisenaan sovellu tieteellisen tiedon hakuun.

Tekstin paikkansapitävyys on aina tarkistettava jostain muualta.

Jos kielimallia käyttävä chattibotti antaa lähdeviitteitä, on aina tarkistettava, ovatko ne aitoja lähteitä vai onko ohjelma vain ”hallusinoinut” lähteitä, joita ei ole olemassakaan.

Lue ChatGPT-testauksesta Tekoäly ei vieläkään tee töitämme -blogitekstimme.

Hakusanojen ideointi

    Kielimalleja voi käyttää apuna esimerkiksi aiheeseen tutustumisessa tai hakusanojen hahmottelussa. Erityisesti uuden ja itselle vieraan aiheen analysoinnissa tekoälystä voi olla apua, kun tekoälylle voi esittää kysymyksiä ja ’keskustella’ sen kanssa.

    Tekoäly myös kääntää melko hyvin hakusanoja suomesta englanniksi.

    Ehdotettuihin hakusanoihin/fraaseihin ei kuitenkaan pidä luottaa ilman kritiikkiä. Niillä on kuitenkin helppo kokeilla hakua oman alan tieteellisestä tietokannasta tai Google Scholarista. Yleensä ehdotuksista joutuu ryhmittelemään toisilleen vaihtoehtoisia käsitteitä ja rajaavia käsitteitä, sekä pilkkomaan ne hakusanoiksi ja niiden yhdistelmiksi.

    Tekoäly tiivistää laajat asiakokonaisuudet

    Tiedonhaun tarkoituksena ei aina ole löytää kaikkea aiheeseen liittyvää, vaan koneen voi antaa valikoida relevanteimmat tulokset. Näin pyritään tehostamaan tiedonhakijan jatkotyöskentelyä vähentämällä aikaa vievää hakutulosten selailua.

    Tulokset voidaan esittää esimerkiksi visuaalisessa muodossa käsiteryppäinä tai erilaisina verkostoina. Lue Connected Papers, Open Knowledge Maps ja Research Rabbit -visuaalisten välineiden kokeilustamme.

    Näiden hakuvälineiden ongelmana on ennen kaikkea hakuprosessin läpinäkymättömyys. Hakujen tulosjoukot ovat yleensä suurehkoja eikä ole mitään keinoa varmistaa, miten lajittelu toimii ja jääkö relevanttia aineistoa mahdollisesti pois tuloksesta.

    Koko ajan ilmestyy lisää välineitä myös artikkelien sisällön/asiakokonaisuuksien tiivistämiseen, yhteenvetojen tekemiseen tai tekstin oikolukuun yms. Artikkelihakuihin voi kokeilla myös esimerkiksi näitä: Elicit, Scite, Consensus, Keenious

    Vaikka välineet tarjoavat uusia mahdollisuuksia ja niitä voi ja kannattaa hyödyntää, systemaattisemmassa ja laajemmassa tiedonhaussa (esim. opinnäytettävä varten tehtävä haku) ne eivät kuitenkaan yksinomaan riitä.

    Muista

    • Useimpiin tekoälyvälinesiin pitää kirjautua, eli on luotava oma käyttäjätili. Tätä ei keneltäkään kuitenkaan voida vaatia.
    • Tekoäly ei vapauta kirjoittajaa tiedon todenperäisyyden, luotettavuuden tai tieteellisyyden arvioinnista eikä lähteiden tarkistamisesta.
    • Kirjoittaja on itse vastuussa tekstistään.
    • Kerro, jos olet käyttänyt tekoälyä työssäsi sekä mitä ja missä vaiheessa.
    • Älä jaa yksityistä tietoa!
    • Muutokset ja kehitys ovat nopeita.

    Lisälukemista: