2.2 Hakusanat

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Hakusanat ovat hakukoneelle lähinnä merkkijonoja ja hakijan pitää itse määrittää merkkijonot, joita haetaan.

Vaihtoehtoisia hakutermejä voi kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: sienijuuri – mykorritsa
  • vastakkainen käsite voi olla hyödyksi: peto -saalis
  • laajempi kokonaisuus, johon käsite liittyy: metsäkasvillisuus – lehto
  • tarkempi osa-alue, jonka käsite sisältää: eoseeni – tertiäärikausi
  • lähikäsite: aarnimetsät – luonnonmetsät
  • kirjoitusmuodon vaihtelu: color – colour;  neandertalin ihminen – neandertalinihminen – neandertalilainen
  • lyhenteet: REDD – Reducing Emissions from Deforestation and Forest Degradation
Tekstiä. Pakkaskestävyys: liittyvät sanat: pakkasenkestävyys, kylmänkestävyys, talvenkestävyys. Lisäksi liittyvät sanat: pakkanen + kestävyys. Pakkanen: liittyvät sanat: kylmyys, talvi, englanniksi: frost, cold, winter. Kestävyys: liittyvät sanat englanniksi: hardiness, tolerance, resistance.
Esimerkki erilaisista sanoista, jotka kuitenkin viittaavat samaan asiaan.

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne ALS tarkoittaa ainakin käsitteitä “Airborne Laser Scanning”, ”Amyotrofinen lateraaliskleroosi”, “Angular Leaf Spot” ja “Acetolactate synthase”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Tekstiä. Artikkelin otsikko: Target-site point mutation conferring resistance to ALS herbicides in italian ryegrass (Lolium multiflorum L.).
Otsikossa esiintyvä lyhenne ALS tarkoittaa tässä acetolactate synthase’a.

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjasto), käsikirjat, hakuteokset (esim. Wikipedia)
  • Tekoälysovellukset (esim. Copilot)
  • Oppikirjat
  • Sisällysluettelot ja lähdeluettelot jo löydetyistä julkaisuista
  • Asiasanastot
  • Asiasanat (aihetta kuvaavat sanat) ja muut tiedot tietokannoissa jo löytyneiden julkaisujen tiedoissa
Kuvakaappaus tietokannan viitteestä. Korostettuna otsikon sanan ’metsätuotteista’. Aiheet: metsäntuotteet, keräilytuotteet, erikoispuulajit, joulukuuset, polttopuu, luontomatkailu, metsät, elämysmatkailu, sivuansiot, metsätalous, sivutuotteet, puuntuotanto, monikäyttö.
Kuva UEF-Primon tietueesta.

Hakusanoja kertyy ajan kanssa

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja vaikkapa taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii kuten yksinkertainen merkkijono. Tiedonhakijan täytyy itse määritellä ne merkkijonot, joita tietokannasta haetaan. Esimerkiksi jos julkaisuissa puhutaan vain geenitekniikasta, hakusana geeniteknologia ei löydä julkaisua.

Tiedon löytyminen perustuu siis tiettyjen merkkijonojen esiintymiseen dokumenteissa tai niitä kuvailevissa tietokannan tiedoissa (metatiedoissa). Kääntäen, dokumentin sisältö voi olla aiheenmukainen, mutta jos käytettyä hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Hakusana voi joissakin hakujärjestelmissä olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Järjestelmä ei kuitenkaan silloinkaan varsinaisesti ymmärrä tai hae käsitteitä. Tämän johdosta hakutuloksiin tulee myös aiheeseen liittymättömiä osumia, jos haettu merkkijono täsmää.

Seuraava sivu: Asiasanahaku