3.4 Tekoäly tiedonhaun apuna

Tekoälyä on käytetty taustalla apuvälineenä tietokannoissa ja hakukoneissa sekä niiden toimintaa ohjaavissa algoritmeissä jo pitkään. Kehitys on edennyt harppauksittain; välillä on edetty ripeästi, välillä on hiljaisempaa. Nyt tekoäly on taas näkyvästi esillä.

Kielimallit käyttävät tilastollisia todennäköisyyksiä

Tällä hetkellä pinnalla ovat erityisesti tekoälyn avulla koulutetut laajat kielimallit, Large Language Models, LLM, joita hyödyntää mm. ChatGPT. Kielimallin tukema geneerinen tekoäly sallii käyttäjän itse ohjata toimintaa luonnollista kieltä käyttäen. Kielimalli tuottaa vastauksen perustuen mm. sanojen peräkkäisen esiintymisen todennäköisyyksiin.

Kielimalleja voi käyttää apuna tiedonhaussa: sen avulla voi tutustua haettavaan aiheeseen ja siltä voi kysyä apua sopiviksi hakusanoiksi ja jopa hakulauseiksi. Myös varsinaista tiedonhakua voi tehdä. Välillä ohjelma onnistuu tässä paremmin, välillä huonommin. Vastaus ei myöskään aina ole sama, vaikka asiaa asiaa kysyttäisiin samalla tavalla. Lopullinen vastuu jää aina käyttäjälle. Tekoälyllä ei itsellään ole tiedon sisältöön liittyvää ymmärtämystä.

Ole tarkkana tietosuojan ja tietoturvan kanssa! Generatiivisiin tekoälysovelluksiin ei pidä syöttää sensitiivisiä tai salassa pidettäviä asioita.

Generatiivinen tekoäly osaa ehdottaa hakusanoja

Voit siis kysyä tekoälyltä sopivia hakusanoja aiheestasi. Kysy sanoja sekä suomeksi että englanniksi. Jos hakusanaehdotukset näyttävät hyvin yleisluontoisilta tai itsestään selviltä, kysy uudestaan tarkempia sanoja.

Vastauksena saat usein yksittäisten sanojen sijaan pidempiä fraaseja. Kun muokkaat sanoista hakulauseita, pilko ilmaukset lyhyemmiksi ja lisää väleihin operaattorit.

Hakulauseiden muotoilu onnistuu osittain

Jotkin sovellukset osaavat muotoilla kysytäessä myös tietokantoihin sopivia hakulauseita. Operaattorit ja fraasit menevät useimmiten kohdilleen (ei aina!), mutta sanankatkaisu jää usein puuttumaan, ellei sitä erikseen kysy. Lisäksi usein yksittäisetkin hakusanat on merkitty lainausmerkkeihin, mikä yleensä heikentää automaattisten sanamuotojen löytymistä.

Tekoäly saattaa ehdottaa hakuun sanoja, jotka ovat liian yleisluontoisia. Tarkenna hakulausetta laajemmalla aihealueella tai poista termit, jotka tuovat tulokseen vääränlaisia osumia.

Tekoäly ehdottaa hakusanoiksi usein fraaseja. Pyydettäessä se saattaa osata purkaa fraasit, eli poistaa lainausmerkit, mutta se ei osaa järjestellä sanoja uudelleen operaattoreiden avulla.

Tekoäly tietokannoissa ja tiedonhaussa

Tietokannat käyttävät erilaisia algoritmejä ja kone-oppimisen keinoja mm. hakutulosten keräämiseen, esittämiseen ja uusien tulosten suositteluun.

Perinteisiin tietokantoihin on uutena tullut nyt myös kielimalleihin perustuvia generatiivisiä toimintoja. Web of Science -tietokannassa tekoälytoiminto on nimellä Research Assistant. UEF-Primon kansainvälisten artikkeleiden haku hyödyntää samaa ohjelmistoa, nimellä Primo tekoälyavustaja. Scopuksen tekoälytyökalu on nimeltään Scopus AI. Myöhemmin hankittaneen tekoälytoimitoja myös muihin tietokantoihin. Tietokannan tekoälytyökalu käyttää lähteinään oikeita artikkeleita, jotka se itse hakee tietokannasta. Artikkeleiden pohjalta ohjelma tekee aiheesta tiivistelmän. Haku ja sen tuloksena syntynyt tiivistelmä on kuitenkin vain nopea katsaus aiheeseen, ei perusteellinen eikä tyhjentävä vastaus. Hakua on kuitenkin helppo jatkaa tarkentavien kysymysten avulla.

Monet erilliset tekoälysovellukset osaavat jo hakea oikeita lähteitä, joihin ne perustavat vastauksensa. Haku voi kohidstua avoimeen verkkoon tai kohdennetusti vain avoimesti julkaistuihin tieteellisiin artikkeleihin, esimerkiksi.

Lue lisää aiheesta kirjaston kotisivulta: Tekoäly tiedonhaussa. Sivulla kerrotaan tarkemmin mitä sovelluksia ja miten kannattaa tiedonhaussa käyttää.

Seuraava sivu: Aineiston luotettavuuden arviointi.