Sanojen keksiminen
Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.
Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.
Hakusanat ovat hakukoneelle lähinnä merkkijonoja ja hakijan pitää itse määrittää merkkijonot, joita haetaan.
Vaihtoehtoisia hakutermejä voi kartoittaa systemaattisesti:
- kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
- synonyymi ja muu läheinen ilmaus: lineaarinen ohjelmointi – optimointi, kryptologia – salaus
- vastakkainen käsite voi olla hyödyksi: strength – weakness
- laajempi kokonaisuus, johon käsite liittyy: monisto – topologinen avaruus
- tarkempi osa-alue, jonka käsite sisältää: reaaliluku – rationaaliluku
- merkitsemistavan vaihtelu esim. luokituskoodi: 30G25 (MSC–koodi aiheelle Discrete analytic functions)
- kirjoitusmuodon vaihtelu: color – colour; dynamical/dynamic systems, number theory – theory of numbers
- lyhenteet: CFL – Courant-Friedrichs-Lewy number
HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne API tarkoittaa ainakin käsitteitä ”application programming interface”, ”american petroleum institute” ja ”academic programs international”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.
Apuneuvoja hakusanojen määrittelyyn
- Sanakirjat (esim. MOT sanakirjasto), käsikirjat, hakuteokset (esim. Wikipedia)
- Tekoälysovellukset (esim. Copilot)
- Oppikirjat
- Sisällysluettelot ja lähdeluettelot jo löydetyistä julkaisuista
- Asiasanastot
- Asiasanat (aihetta kuvaavat sanat) ja muut tiedot tietokannoissa jo löytyneiden julkaisujen tiedoissa
Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.
Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.
Miksi erilaisia hakusanoja tarvitaan?
Hakujärjestelmässä hakusana toimii useimmiten kuten yksinkertainen merkkijono. Tiedonhakijan on itse määrättävä kaikki merkkijonot, joita haetaan.
Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.
Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.
Seuraava sivu: Sanaliitot