Tekoäly tiedonhaun apuna

Tekoälyä on käytetty taustalla apuvälineenä tietokannoissa ja hakukoneissa sekä niiden toimintaa ohjaavissa algoritmeissä jo pitkään. Kehitys on edennyt harppauksittain; välillä on edetty ripeästi, välillä on hiljaisempaa. Epäonnistumisiakin sattuu aika ajoin – jokin tuote ei vain saavuta käyttäjien luottamusta. Nyt tekoäly on taas näkyvästi esillä.

Kielimallit käyttävät tilastollisia todennäköisyyksiä

Tällä hetkellä pinnalla ovat erityisesti tekoälyn avulla koulutetut laajat kielimallit, Large Language Models, LLM, joita hyödyntää mm. ChatGPT. Kielimallin tukema geneerinen tekoäly sallii käyttäjän itse ohjata toimintaa luonnollista kieltä käyttäen.

Kielimallien tukemat tekoälysovellukset eivät hae tietoa netistä tai tietokannoista, vaan ne perustuvat sanojen peräkkäisen esiintymisen todennäköisyyksiin. Siksi ne eivät sellaisenaan sovellu tiedonhakuun. Tämä koskee sekä yksittäisiä faktoja että kirjallisuuslähteiden hakemista. Faktat on aina tarkistettava jostain muualta ja lähdeviitteitä ChatGPT ei pysty antamaan lainkaan. Jos se tivattaessa sellaisia tekee, ne ovat täysin tuulesta temmattuja. Ohjelma ns. hallusinoi.

Kielimalleja voi kuitenkin käyttää apuna tiedonhaussa: sen avulla voi tutustua haettavaan aiheeseen ja siltä voi kysyä apua sopiviksi hakusanoiksi. Välillä ohjelma onnistuu tässä paremmin, välillä huonommin. Lopullinen vastuu jää aina käyttäjälle. Tekoälyllä ei itsellään ole tiedon sisältöön liittyvää ymmärtämystä.

Ole tarkkana tietosuojan ja tietoturvan kanssa! Generatiivisiin tekoälysovelluksiin ei pidä syöttää sensitiivisiä tai salassa pidettäviä asioita.

Generatiivinen tekoäly osaa ehdottaa hakusanoja

Voit siis kysyä esimerkiksi ChatGPT:ltä sopivia hakusanoja aiheestasi. Kysy sanoja sekä suomeksi että englanniksi. Jos hakusanaehdotukset näyttävät hyvin yleisluontoisilta tai itsestään selviltä, kysy uudestaan tarkempia sanoja.

Vastauksena saat usein yksittäisten sanojen sijaan pidempiä fraaseja. Kun muokkaat sanoista hakulauseita, pilko ilmaukset lyhyemmiksi ja lisää väleihin operaattorit.

Tiedonhaun ja -kuvailun apuväline Finto AI

Erityisesti tiedonhaun ja -tallennuksen apuvälineeksi on kehitetty suomalainen työkalu, jonka avulla voidaan automaattisesti kuvailla julkaisun sisältö muutamalla keskeisellä termillä, asiasanalla. Asiasanoista on puhuttu jo aiemmin tällä kurssilla.

Finto AI toimii myöskin toisin päin: sen avulla voidaan miettiä sopivia hakusanoja tiedonhakua varten. Tähän kuitenkin tarvitaan jo jonkinlainen näkemys siitä, mitä ollaan etsimässä. Esimerkiksi tutkimussuunnitelma tai tiivistelmä aiheesta on sopiva lähtökohta.

Tekoäly tietokannoissa

Tietokannat käyttävät erilaisia algoritmejä ja kone-oppimisen keinoja mm. hakutulosten keräämiseen, esittämiseen ja uusien tulosten suositteluun.

Uutena perinteisiin tietokantoihin on tulossa nyt myös kielimalleihin perustuvia generatiivisiä toimintoja. Scopus-tietokannan työkalu ScopusAI on ollut koekäytössä kevään 2024 ajan. Tämä työkalu käyttää lähteinään oikeita artikkeleita, jotka se itse hakee Scopus-tietokannasta. Artikkeleiden pohjalta ohjelma tekee aiheesta tiivistelmän. Haku ja sen tuloksena syntynyt tiivistelmä on kuitenkin vain nopea katsaus aiheeseen, ei perusteellinen eikä tyhjentävä vastaus. ScopusAI:ssa hakua on helppo jatkaa tarkentavien kysymysten avulla.

On myös muita hakukoneita, joihin haku tehdään luonnollisella kielellä, kysymyksen muodossa. Tällainen hakukone on esimerkiksi Elicit (linkki aukeaa uuteen ikkunaan). Elicitin käyttö edellyttää käyttäjätunnuksen luomista. Elicitissa jokainen haku on itsenäinen ja erillinen.

Esimerkki hakukoneesta, joka käyttää tekoälyä tulosten esittämiseen visuaalisesti on vaikkapa Open Knowledge Maps (linkki aukeaa uuteen ikkunaan). Se ryhmittelee mielestään osuvimmat 100 hakutulosta teemoittain, ikään kuin yhdeksi kuvaksi tai kartaksi, josta voi edetä tarkastelemaan julkaisuja tarkemmin. Voit siis näin löytää sekä tarkempia aiheita, hakusanoja että yksittäisiä artikkeleita. Haku Open Knowledge Mapsiin tehdään käyttäen yksittäisiä hakusanoja, ei luonnollista kieltä.

Seuraava sivu: Onko lähde luotettava