Sanojen keksiminen

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Hakusanat ovat hakukoneelle lähinnä merkkijonoja ja hakijan pitää itse määrittää merkkijonot, joita haetaan.

Vaihtoehtoisia hakutermejä voit kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: measurement – metering – gauging
  • vastakkainen käsite voi olla hyödyksi: strength – weakness
  • laajempi kokonaisuus, johon käsite liittyy: fissio – ydinreaktio
  • tarkempi osa-alue, jonka käsite sisältää: alkeishiukkaset – fotonit
  • merkitsemistavan vaihtelu esim. luokituskoodi: 87.85.J (PACS-koodi aiheelle Biomaterials)
  • kirjoitusmuodon vaihtelu: color – colour; magneettinen kenttä – magneettikenttä
  • lyhenteet: VOC – volatile ogranic compound
Tekstiä. Vedenhylkivyys - vettähylkivyys - hydrofobisuus - hydrophobicity. Vesi + hylkiminen - water + repellance / repellence.
Esimerkki erilaisista sanoista, jotka kuitenkin viittaavat samaan asiaan.

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne API tarkoittaa mm. käsitteitä ”application programming interface”, ”american petroleum institute” ja ”academic programs international”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä:

Kuvakaappaus artikkelin tiedoista. Otsikko: Ground-based demonstration of imaging SWIR-FTS for space-based detection of air pollution and greenhouse gases.
SWIR = short wave infrared, FTS=Fourier Transform Spectroscopy

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjat – linkki aukeaa uuteen välilehteen), käsikirjat, hakuteokset (esim. Wikipedia)
  • Oppikirjat
    Taustatietoa ja alan käsitteistöä löytyy alan oppikirjoista, tietosanakirjoista ja muista hakuteoksista. Ne auttavat keskeisten käsitteiden ja niiden synonyymien pohtimisessa. Samalla on hyvä selvittää termien laajemmat ja suppeammat käsitteet sekä vaihtoehtoiset ilmaisut.
  • Jo löydettyjen julkaisujen sisällysluettelot ja lähdeluettelot
  • Asiasanastot
  • Jo löytyneiden julkaisujen tiedot tietokannoissa, erityisesti aihetta kuvaavat sanat (asiasanat, subject)
Kuvakaappaus tietokannan viitteestä. Korostettuna otsikon sana: radiotekniikan. Aiheet-kentästä korostettuna sanat: radioaallot, sähkömagneettiset kentät, radionavigointi, tutkat, antennit.
Kuva UEF-Primon tietueesta.

Hakusanoja kertyy pitkin matkaa

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kaaviokuva, tekstiä: Aihe -> toiminto: analysoi, pilko, pelkistä -> tulos: ydinkäsitteet = ensimmäiset hakusanat. Toiminto: asiasanat, lähdeluettelot -> tulos: vaihtoehtoisia hakusanoja. Toiminto: Konteksti, laajempi kuva, tarkennus -> tulos: lisää hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii kuten yksinkertainen merkkijono. Tiedonhakijan on itse määrättävä kaikki merkkijonot, joita haetaan.

Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos annettua hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.

Seuraava sivu: Sanaliitot