Sanojen keksiminen

Hakusanojen keksiminen

Tiedonhakijan pitää kääntää omat ajatuksensa, käsitteet, kielellisiksi ilmauksiksi ja sitä kautta hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Vaihtoehtoisia hakutermejä voi kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: lineaarinen ohjelmointi – optimointi, kryptologia – salaus
  • vastakkainen käsite voi olla hyödyksi: strength – weakness
  • laajempi kokonaisuus, johon käsite liittyy: monisto – topologinen avaruus
  • tarkempi osa-alue, jonka käsite sisältää: reaaliluku – rationaaliluku
  • merkitsemistavan vaihtelu esim. luokituskoodi: 30G25 (MSCkoodi aiheelle Discrete analytic functions)
  • kirjoitusmuodon vaihtelu: color – colour; dynamical/dynamic systems, number theory – theory of numbers
  • lyhenteet: CFL – Courant-Friedrichs-Lewy number

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne API tarkoittaa ainakin käsitteitä ”application programming interface”, ”american petroleum institute” ja ”academic programs international”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjasto), käsikirjat, hakuteokset (esim. Wikipedia)
  • Oppikirjat
    Taustatietoa ja alan käsitteistöä löytyy alan oppikirjoista, tietosanakirjoista ja muista hakuteoksista. Ne auttavat keskeisten käsitteiden ja niiden synonyymien pohtimisessa. Samalla on hyvä selvittää termien laajemmat ja suppeammat käsitteet sekä vaihtoehtoiset ilmaisut.
  • Jo löydettyjen julkaisujen sisällysluettelot ja lähdeluettelot
  • Asiasanastot
  • Jo löytyneiden julkaisujen tiedot tietokannoissa, erityisesti aihetta kuvaavat sanat (asiasanat, subject)
mattietue
Tietue Finnasta.

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii kuten yksinkertainen merkkijono. Tiedonhakijan on itse määrättävä kaikki merkkijonot, joita haetaan.

Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.

Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.