Tekoäly tiedonhaun apuna

Tekoälyä on käytetty taustalla apuvälineenä tietokannoissa ja hakukoneissa sekä niiden toimintaa ohjaavissa algoritmeissä jo pitkään. Kielimallien käyttöönotto on kuitenkin tuonut tekoälyn näkyväksi osaksi perinteisiäkin tietokantoja.

Kielimallit käyttävät tilastollisia todennäköisyyksiä

Laajat kielimallit, Large language models, on koulutettu valtavan laajojen tekstimateriaalien avulla. Itse kielimallia hyödyntävä tekoälysovellus ei kuitenkaan ole hakukone, vaan vastaus tuotetaan mm. sanojen peräkkäisen esiintymisen todennäköisyyksiin perustuen.

Yhdistetty kielimalli ja haku on luotettavampi

Useimmat generatiiviset tekoälysovellukset osaavat jo hyödyntää aitoja lähteitä vastauksissaan. Retrieval-augmented generation (RAG) on tekniikka, joka yhdistää kielimallin ja ulkoisesta lähteestä haetun tiedon. Haku voidaan tehdä vapaasti internetistä, tietystä tietokannasta tai vaikkapa organisaation omista dokumenteista.

Vastaus on siis yhdistelmä ennalta koulutetun kielimallin tuottamaa tekstiä ja muualta haetun aineiston tietoja.

Kielimalleja voi käyttää apuna tiedonhaussa

Kielimalleja hyödyntäviä generatiivisia tekoälysovelluksia voi hyödyntää tiedonhaussa. Niiden avulla voi tutustua haettavaan aiheeseen ja siltä voi kysyä apua sopiviksi hakusanoiksi ja jopa hakulauseiksi. Myös varsinaista tiedonhakua voi tehdä käyttäen luonnollista kieltä, ilman hakulauseita ja niiden sääntöjä. Välillä ohjelma onnistuu vastauksissaan paremmin, välillä huonommin. Vastaus ei myöskään aina ole sama, vaikka asiaa kysyttäisiin samalla tavalla. Lopullinen vastuu jää aina käyttäjälle. Tekoälyllä ei itsellään ole tiedon sisältöön liittyvää ymmärtämystä.

Ole tarkkana tietosuojan ja tietoturvan kanssa! Generatiivisiin tekoälysovelluksiin ei pidä syöttää sensitiivisiä tai salassa pidettäviä asioita.

Generatiivinen tekoäly osaa ehdottaa hakusanoja

Voit siis kysyä tekoälyltä sopivia hakusanoja aiheestasi. Kysy sanoja sekä suomeksi että englanniksi. Jos hakusanaehdotukset näyttävät hyvin yleisluontoisilta tai itsestään selviltä, kysy uudestaan tarkempia sanoja.

Vastauksena saat usein yksittäisten sanojen sijaan pidempiä fraaseja. Kun muokkaat sanoista hakulauseita, pilko ilmaukset lyhyemmiksi ja lisää väleihin operaattorit.

Hakulauseiden muotoilu onnistuu osittain

Jotkin sovellukset osaavat muotoilla kysyttäessä myös tietokantoihin sopivia hakulauseita. Operaattorit ja fraasit menevät useimmiten kohdilleen (ei aina!), mutta sanankatkaisu jää usein puuttumaan, ellei sitä erikseen kysy. Lisäksi usein yksittäisetkin hakusanat on merkitty lainausmerkkeihin, mikä yleensä heikentää automaattisten sanamuotojen löytymistä.

Tekoäly saattaa ehdottaa hakuun sanoja, jotka ovat liian yleisluontoisia. Tarkenna hakulausetta laajemmalla aihealueella tai poista termit, jotka tuovat tulokseen vääränlaisia osumia.

Tekoäly ehdottaa hakusanoiksi usein fraaseja. Pyydettäessä se saattaa osata purkaa fraasit, eli poistaa lainausmerkit, mutta se ei osaa järjestellä sanoja uudelleen operaattoreiden avulla.

Tekoäly tietokannoissa ja tiedonhaussa

Perinteisiin tietokantoihin on lisätty uusia kielimalleihin perustuvia generatiivisiä toimintoja.

  • Web of Science -tietokannassa tekoälytoiminto on nimellä Research Assistant.
  • UEF-Primon kansainvälisten artikkeleiden haku hyödyntää samaa ohjelmistoa, nimellä Primo tekoälyavustaja.
  • Scopuksen tekoälytyökalu on nimeltään Scopus AI.

Tietokannan tekoälytyökalu käyttää lähteinään oikeita artikkeleita, jotka se itse hakee tietokannasta. Artikkeleista on käytettävissä vain tiivistelmät, joten niiden tietosisältö on rajallinen. Kielimallia ja artikkeleiden tiivistelmiä hyödyntäen ohjelma tekee aiheesta koosteen.

Haku ja sen tuloksena syntynyt kooste on kuitenkin vain nopea katsaus aiheeseen, ei perusteellinen eikä tyhjentävä vastaus. Hakua on kuitenkin helppo jatkaa tarkentavien kysymysten avulla.

Useimmat erilliset tekoälysovellukset osaavat jo hakea oikeita lähteitä, joihin ne perustavat vastauksensa. Haku voi kohdistua avoimeen verkkoon tai kohdennetusti vain avoimesti julkaistuihin tieteellisiin artikkeleihin, esimerkiksi.

Kaikkiin kysymyksiin ei välttämättä löydy hyvää vastausta lähteidenkään avulla. Tekoälysovellus saattaa silti kielimallia apuna käyttäen muotoilla vastauksen ja viitata lähteisiin. Lähteet pitää aina tarkistaa, jotta näkee, mikä tieto on peräisin aidosta lähteestä, mikä on kielimallin tuottamaa vastausta.

Lue lisää aiheesta kirjaston kotisivulta: Tekoäly tiedonhaussa. Sivulla kerrotaan tarkemmin mitä sovelluksia ja miten kannattaa tiedonhaussa käyttää.

Seuraava sivu: Onko lähde luotettava