Sanojen keksiminen

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Hakusanat ovat hakukoneelle lähinnä merkkijonoja ja hakijan pitää itse määrittää merkkijonot, joita haetaan.

Vaihtoehtoisia hakutermejä voi kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: lineaarinen ohjelmointi – optimointi, kryptologia – salaus
  • vastakkainen käsite voi olla hyödyksi: strength – weakness
  • laajempi kokonaisuus, johon käsite liittyy: monisto – topologinen avaruus
  • tarkempi osa-alue, jonka käsite sisältää: reaaliluku – rationaaliluku
  • merkitsemistavan vaihtelu esim. luokituskoodi: 30G25 (MSCkoodi aiheelle Discrete analytic functions)
  • kirjoitusmuodon vaihtelu: color – colour; dynamical/dynamic systems, number theory – theory of numbers
  • lyhenteet: CFL – Courant-Friedrichs-Lewy number

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne API tarkoittaa ainakin käsitteitä ”application programming interface”, ”american petroleum institute” ja ”academic programs international”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjasto), käsikirjat, hakuteokset (esim. Wikipedia)
  • Oppikirjat
    Taustatietoa ja alan käsitteistöä löytyy alan oppikirjoista, tietosanakirjoista ja muista hakuteoksista. Ne auttavat keskeisten käsitteiden ja niiden synonyymien pohtimisessa. Samalla on hyvä selvittää termien laajemmat ja suppeammat käsitteet sekä vaihtoehtoiset ilmaisut.
  • Jo löydettyjen julkaisujen sisällysluettelot ja lähdeluettelot
  • Asiasanastot
  • Jo löytyneiden julkaisujen tiedot tietokannoissa, erityisesti aihetta kuvaavat sanat (asiasanat, subject)
Kuvakaappaus tietokannan viitteestä. Kirjan kansikuva ja tekstiä. Kirjan nimi: Ratkaisemisen taito, kuinka lähestyä matemaattisia ongelmia. Aiheet: ongelmanratkaisu, matematiikka, oppiminen, opetus, päättely, ainedidaktiikka, heuristiikka, metodologia.
Tietue Finnasta. Ongelmanratkaisuun liittyviä sanoja ovat päättely ja heuristiikka, opetukseen liittyviä sanoja oppiminen ja ainedidaktiikka.

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kaaviokuva, tekstiä: Aihe - toiminto: analysoi, pilko, pelkistä - tulos: ydinkäsitteet = ensimmäiset hakusanat. Toiminto: asiasanat, lähdeluettelot - tulos: vaihtoehtoisia hakusanoja. Toiminto: Konteksti, laajempi kuva, tarkennus - tulos: lisää hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii useimmiten kuten yksinkertainen merkkijono. Tiedonhakijan on itse määrättävä kaikki merkkijonot, joita haetaan.

Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.

 Seuraava sivu: Sanaliitot