2.2 Hakusanat

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Hakujärjestelmässä hakusana toimii merkkijonona. Tiedonhakijan täytyy itse määritellä ne merkkijonot, joita tietokannasta haetaan.

Hakusana voi joissakin hakujärjestelmissä olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Järjestelmä ei kuitenkaan silloinkaan varsinaisesti ymmärrä tai hae käsitteitä. Tämän johdosta hakutuloksiin tulee myös aiheeseen liittymättömiä osumia, jos haettu merkkijono täsmää.

Tiedon löytyminen perustuu siis tiettyjen merkkijonojen esiintymiseen dokumenteissa tai niitä kuvailevissa tietokannan tiedoissa (metatiedoissa). Kääntäen, dokumentin sisältö voi olla aiheenmukainen, mutta jos käytettyä hakusanaan ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Käsite itsessään on usein ensimmäinen hyvä hakusana. On mietittävä, mitkä kaikki käsitteet ovat tärkeitä haussa.

Vaihtoehtoiset hakusanat ovat kuitenkin lähes aina välttämättömiä:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: sienijuuri – mykorritsa
  • vastakkainen käsite voi olla hyödyksi: peto -saalis
  • laajempi kokonaisuus, johon käsite liittyy: metsäkasvillisuus – lehto
  • tarkempi osa-alue, jonka käsite sisältää: eoseeni – tertiäärikausi
  • lähikäsite: aarnimetsät – luonnonmetsät
  • kirjoitusmuodon vaihtelu: color – colour;  neandertalin ihminen – neandertalinihminen – neandertalilainen
  • lyhenteet: REDD – Reducing Emissions from Deforestation and Forest Degradation

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne ALS tarkoittaa ainakin käsitteitä “Airborne Laser Scanning”, ”Amyotrofinen lateraaliskleroosi”, “Angular Leaf Spot” ja “Acetolactate synthase”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Mistä löytää lisää hakusanoja:

  • sanakirjoista (esim. UEF-Finnan kautta löytyvä MOT-sanakirjasto sisältää sekä eri kielten että eri alojen sanakirjoja)
  • alan oppikirjoista ja käsikirjoista voi selvittää keskeisiä käsitteitä
  • asiasanastoista, jotka ovat johonkin tiettyyn tietokantaan liittyviä (esim. CAB-tesaurus ) tai ontologioista (esim. Yleinen suomalainen ontologia YSO , joka pohjautuu Yleiseen suomalaiseen asiasanastoon YSA)
  • jo löydettyjen julkaisujen aihetta kuvaavista sanoista (subject, keyword) sekä niiden sisällys- ja lähdeluetteloista

 

HAKUSANAESIMERKKI

Miten pakkaskestävyys periytyy pajuilla,  mahdollisia hakusanoja voisivat olla esimerkiksi seuraavat:

pakkaskestävyys,   pakkasen kesto,   pakkasen sieto,   kylmänkestävyys,   kylmänkesto,   hallanarkuus,   frost hardiness,   frost hardy,   frost resistance,   frost resistant,   resistant to frost,   frost proof,   cold,   coldness,   temperature,   low temperature,   lämpötila,   kylmään sopeutuminen,   adaptaatio,   periytyminen,   periytyvyys,   perinnöllisyys,   perinnöllinen,   geneettinen,   heritability,   genetic,   Salix,   willow,   paju,  pajut 

 

SANAHAKU JA ASIASANAHAKU, MITÄ EROA?

SANAHAKU (vapaateksti, keyword, free text..) hakee sanaa

  • kaikkialta julkaisujen tiedoista:
    • tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista, kustantajan nimestä jne.
  • täsmälleen annetussa muodossa, joten mieti sanan taipumiset yms. ja käytä katkaisumerkkiä.
  • on oletushakuna tietokannoissa yleensä

Mitä tahansa luonnollisen kielen sanoja tai fraaseja voi käyttää.

  • Aiheen kannalta merkityksettömiä sanoja (stop words, esim. a, an, the, in, on) ei käytetä haussa, ei yksinään eikä sanaliittojen osina.
  • Kannattaa kysyä myös työn ohjaajalta, millä sanoilla aiheesta voisi hakea.
  • Synonyymit pitää miettiä ja hakea erikseen.
  • Homonyymit tulevat mukaan – tietokone ei erota merkityksiä

Vapaasanahaku toimii hyvin silloin, kun haettava aihe on yksityiskohtainen ja tarkasti rajattu, tai kun käsitteistö ja sanasto kyseisellä alalla on vakiintunutta.

 

ASIASANAHAKU (AIHE, SUBJECT TERMS/HEADINGS, DESCRIPTORS)

Tallennettaessa julkaisun tietoja tietokantoihin käytetään ennalta määrättyjä asiasanoja kuvailemaan niiden aihetta/sisältöä, jotta tieto löytyisi paremmin.
Asiasanahaku kohdistuu vain asiasanoihin, jotka on tallennettu erilliseen asiasanakenttään.

  • Useimmissa tietokannoissa asiasanahakuun päästään tarkennetun haun (advanced search) puolelta (ja siellä yleensä valitaan pudotusvalikosta hakukentäksi esim. subject terms tai asiasana)
  • Hakusanoiksi pitää tällöin valita ao. tietokannan käyttämän asiasanaston tai tesauruksen termejä, asiasanoja.
  • Eri tietokannat käyttävät eri sanastoja. Sama sana ei toimi eri tietokannoissa samalla tavalla.
  • Jos rajaat hakusi kohdistumaan asiasanakenttään, et voi käyttää mitä tahansa luonnollisen kielen sanaa (tai ainakaan et niillä välttämättä saa tulosta).

 

Esimerkkinä tietue UEF-Finnassa:

sanaasiasana

Asiasanahaku toimii hyvin silloin, kun aihe on laaja-alainen tai hankalasti määriteltävä.

Jos käytetään samaa hakusanaa sekä sanahaussa että asiasanahaussa, sanahaku löytää enemmän tuloksia, varsinkin silloin, jos on käytetty sanankatkaisua. Katso esimerkki (haut tehty 30.10.2015).

asiasanahaku; lehtikuusi, 84 tulosta Melindassa

sanahaku: lehtikuusi, 93 tulosta Melindassa (huomaa, että myös kaikki edellisellä haulla löytyneet sisältyvät tähän, lisäksi on tullut jotain uutta)

sanahaku: lehtikuus*, 144 tulosta Melindassa (huomaa, että myös kaikki edellisellä haulla löytyneet sisältyvät tähän, lisäksi on tullut jotain uutta)

Paljon riippuu kuitenkin sanavalinnasta: asiasana voi hyvinkin antaa enemmän tuloksia kuin jokin toinen, samaan asiaan liittyvä muu hakusana.

vapaasanahaku: vuosirenk* 38 tulosta

asiasanahaku: vuosilustot 69 tulosta

Rajaus asiasanaan / asiasanahaku kohdentaa hakua, parantaa usein relevanssia ja aiheen osuvuutta, mutta pienentää hakutulosta. Kaikille haettaville asioille ei välttämättä ole olemassa sopivaa asiasanaa.