Sanojen keksiminen

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Vaihtoehtoisia hakutermejä voit kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: measurement – metering – gauging
  • vastakkainen käsite voi olla hyödyksi: strength – weakness
  • laajempi kokonaisuus, johon käsite liittyy: fissio – ydinreaktio
  • tarkempi osa-alue, jonka käsite sisältää: alkeishiukkaset – fotonit
  • merkitsemistavan vaihtelu esim. luokituskoodi: 87.85.J (PACS-koodi aiheelle Biomaterials)
  • kirjoitusmuodon vaihtelu: color – colour; magneettinen kenttä – magneettikenttä
  • lyhenteet: VOC – volatile ogranic compound
Tekstiä. Vedenhylkivyys - vettähylkivyys - hydrofobisuus - hydrophobicity. Vesi + hylkiminen - water + repellance / repellence.
Esimerkki erilaisista sanoista, jotka kuitenkin viittaavat samaan asiaan.

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne API tarkoittaa mm. käsitteitä ”application programming interface”, ”american petroleum institute” ja ”academic programs international”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä:

Kuvakaappaus artikkelin tiedoista. Otsikko: Ground-based demonstration of imaging SWIR-FTS for space-based detection of air pollution and greenhouse gases.
SWIR = short wave infrared, FTS=Fourier Transform Spectroscopy

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjat – linkki aukeaa uuteen välilehteen), käsikirjat, hakuteokset (esim. Wikipedia)
  • Tekoälysovellukset (esim. Copilot)
  • Oppikirjat
  • Sisällysluettelot ja lähdeluettelot jo löydetyistä julkaisuista
  • Asiasanastot
  • Asiasanat (aihetta kuvaavat sanat) ja muut tiedot tietokannoissa jo löytyneiden julkaisujen tiedoissa
Kuvakaappaus tietokannan viitteestä. Korostettuna otsikon sana: radiotekniikan. Aiheet-kentästä korostettuna sanat: radioaallot, sähkömagneettiset kentät, radionavigointi, tutkat, antennit.
Kuva UEF-Primon tietueesta.

Hakusanoja kertyy pitkin matkaa

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kaaviokuva, tekstiä: Aihe -> toiminto: analysoi, pilko, pelkistä -> tulos: ydinkäsitteet = ensimmäiset hakusanat. Toiminto: asiasanat, lähdeluettelot -> tulos: vaihtoehtoisia hakusanoja. Toiminto: Konteksti, laajempi kuva, tarkennus -> tulos: lisää hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii kuten yksinkertainen merkkijono. Tiedonhakijan on itse määrättävä kaikki merkkijonot, joita haetaan.

Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos annettua hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.

Seuraava sivu: Sanaliitot