Sanojen keksiminen

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Käsite itsessään on usein ensimmäinen hyvä hakusana. Ei silti kannata tyytyä vain siihen, paljon olennaista tietoa voi mennä ohi, jos hakee vain yhdellä sanalla.

Hakusanat ovat hakukoneelle lähinnä merkkijonoja ja hakijan pitää itse määrittää merkkijonot, joita haetaan.

Vaihtoehtoisia hakutermejä voi kartoittaa systemaattisesti:

  • kieli on ensimmäinen kysymys: englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus:
    measurement – metering – gauging
  • vastakkainen käsite voi olla hyödyksi: strength – weakness
  • laajempi kokonaisuus, johon käsite liittyy:
    oligosakkaradit – sokerit
  • tarkempi osa-alue, jonka käsite sisältää:
    sterolit – kasvisterolit
  • merkitsemistavan vaihtelu esim. cesium – cs
  • kirjoitusmuodon vaihtelu: color – colour; supramolekulaarinen kemia – supramolekyylikemia
  • lyhenteet: PAH – polycyclic aromatic hydrocarbons
Tekstiä: vedenhylkivyys - vettähylkivyys - hydrofobisuus - hydrophobicity. Vesi + hylkiminen - water + repellance / repellence.
Esimerkki erilaisista sanoista, jotka kuitenkin viittaavat samaan asiaan.

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne PAH tarkoittaa suomeksi ainakin käsitteitä ’polyaromaattinen hiilivety’, ja ’pulmonaaliarteriahypertensio’).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä:

Julkaisu: Assessment of carbonyl and PAH (teksti korostettu keltaisella) emissions in an automotive diesel engine fueled with butanol and renewable diesel fuel blends.
Polyaromaattisiin hiilivetyihin viitataan tässä otsikossa vain lyhenteellä.

Apuneuvoja hakusanojen määrittelyyn

  • Sanakirjat (esim. MOT sanakirjat, linkki aukeaa uuteen ikkunaan), käsikirjat, hakuteokset (esim. Wikipedia)
  • Tekoälysovellukset (esim. Copilot)
  • Oppikirjat
  • Sisällysluettelot ja lähdeluettelot jo löydetyistä julkaisuista
  • Asiasanastot
  • Asiasanat (aihetta kuvaavat sanat) ja muut tiedot tietokannoissa jo löytyneiden julkaisujen tiedoissa
Kuvakaappaus tietokannan viitteestä. Julkaisun otsikko: Uudet jätteenkäsittelykeskusten vesienhallintatekniikat. Aiheet-kentästä korostettuna sanat vedenkäsittely, vedenpuhdistus, jäteveden käsittely.
Kirjan tiedot UEF-Primossa.

Hakusanoja kertyy pitkin matkaa

Potentiaalisia hakusanoja kertyy sitä mukaa kun tiedonhaku etenee. Kun uusia hyviä tuloksia löytyy, löytyy usein myös uusia hakusanoja.

Kaaviokuva, tekstiä: Aihe -> toiminto: analysoi, pilko, pelkistä -> tulos: ydinkäsitteet = ensimmäiset hakusanat. Toiminto: asiasanat, lähdeluettelot -> tulos: vaihtoehtoisia hakusanoja. Toiminto: Konteksti, laajempi kuva, tarkennus -> tulos: lisää hakusanoja.

Kun termejä alkaa kertyä enemmän, on hyvä idea koota sanoja taulukkoon, jotta kokonaisuus – pääkäsitteet ja niihin liittyvät termit – pysyy hallinnassa.

Miksi erilaisia hakusanoja tarvitaan?

Hakujärjestelmässä hakusana toimii kuten yksinkertainen merkkijono.

Tiedon löytyvyys perustuu siis tiettyjen merkkijonojen esiintyvyyteen dokumenteissa tai niiden (meta)tiedoissa. Kääntäen, dokumentin aihe voi olla sisällöltään aiheenmukainen, mutta jos annettua hakusanaa ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Hakusana voi olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Varsinaisesti järjestelmä ei kuitenkaan ymmärrä eikä hae käsitteitä tai merkityksiä (hs.fi:fingerpori). Tämä tuo tulokseen myös aiheeseen liittymättömiä osumia.

Seuraava sivu: Sanaliitot eli fraasit