2.2 Hakusanat

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Hakujärjestelmässä hakusana toimii merkkijonona. Tiedonhakijan täytyy itse määritellä ne merkkijonot, joita tietokannasta haetaan.

Hakusana voi joissakin hakujärjestelmissä olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Järjestelmä ei kuitenkaan silloinkaan varsinaisesti ymmärrä tai hae käsitteitä. Tämän johdosta hakutuloksiin tulee myös aiheeseen liittymättömiä osumia, jos haettu merkkijono täsmää.

Tiedon löytyminen perustuu siis tiettyjen merkkijonojen esiintymiseen dokumenteissa tai niitä kuvailevissa tietokannan tiedoissa (metatiedoissa). Kääntäen, dokumentin sisältö voi olla aiheenmukainen, mutta jos käytettyä hakusanaan ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Mitä kuuluu? puolikuuLuu

Kone siis hakee merkkijonoja ymmärtämättä, mitä ne tarkoittavat. Jos julkaisuissa esimerkiksi puhutaan vain lapsista, hakusana päiväkoti-ikäiset ei löydä julkaisua. Tai puhutaan vauvoista, jolloin hakusanat imeväisikäiset tai pikkulapset ei sitä löydä.

Käsite itsessään on usein ensimmäinen hyvä hakusana. On mietittävä, mitkä kaikki käsitteet ovat tärkeitä haussa.

Vaihtoehtoiset hakusanat ovat kuitenkin lähes aina välttämättömiä:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: lapanen – kinnas
  • vastakkainen käsite voi olla hyödyksi: puhdas – likainen
  • laajempi kokonaisuus, johon käsite liittyy: leikit – hippa
  • tarkempi osa-alue, jonka käsite sisältää: lounas – ateriat
  • lähikäsite: opiskelutekniikka – opiskelutaito
  • kirjoitusmuodon vaihtelu: color – colour; behavior – behaviour;  neandertalin ihminen – neandertalinihminen – neandertalilainen
  • lyhenteet: luomu – luonnonmukainen

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne ALS tarkoittaa ainakin käsitteitä “Airborne Laser Scanning”, ”Amyotrofinen lateraaliskleroosi”, “Angular Leaf Spot” ja “Acetolactate synthase”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Mistä löytää lisää hakusanoja:

  • sanakirjoista (esim. UEF-Finnan kautta löytyvä MOT-sanakirjasto sisältää sekä eri kielten että eri alojen sanakirjoja)
  • alan oppikirjoista ja käsikirjoista voi selvittää keskeisiä käsitteitä
  • asiasanastoista, jotka ovat johonkin tiettyyn tietokantaan liittyviä (esim. ERIC-tesaurus) tai ontologioista (esim. Yleinen suomalainen ontologia YSO)
  • jo löydettyjen julkaisujen aihetta kuvaavista sanoista (subject, keyword) sekä niiden sisällys- ja lähdeluetteloista

 

Kasvatusalan ERIC-tietokannassa on tietokannan oma asiasanasto eli tesaurus. Tietokantaan pääsee kirjautumalla UEF-Finnan kautta.

ericthesaurus

 

YSO löytyy vapaasti verkosta.

yso

Hakusanaesimerkki

”Tablettien käyttö osana esikouluikäisten mediakasvatusta”,  mahdollisia hakusanoja voisivat olla esimerkiksi seuraavat:

tabletit, mobiililaitteet, esikouluikäiset, esikoululaiset, esikoulu, esikoulukasvatus, esikouluopetus, mediakasvatus, medialukutaito, mediataidot, viestintäkasvatus,

tablets, pre-school, pre-schoolers, infants, media education, media literacy

jne.

Missä muodossa sanat tarjotaan hakuun, mietitään erikseen, myös tietokannasta riippuen.

 

Sanahaku ja asiasanahaku, mitä eroa?

SANAHAKU (vapaateksti, keyword, free text..) hakee sanaa

  • kaikkialta julkaisujen tiedoista:
    • tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista, kustantajan nimestä jne.
  • täsmälleen annetussa muodossa, joten mieti sanan taipumiset yms. ja käytä katkaisumerkkiä.
  • on oletushakuna tietokannoissa yleensä

Mitä tahansa luonnollisen kielen sanoja tai fraaseja voi käyttää.

  • Aiheen kannalta merkityksettömiä sanoja (stop words, esim. a, an, the, in, on) ei käytetä haussa, ei yksinään eikä sanaliittojen osina.
  • Kannattaa kysyä myös työn ohjaajalta, millä sanoilla aiheesta voisi hakea.
  • Synonyymit pitää miettiä ja hakea erikseen.
  • Homonyymit tulevat mukaan – tietokone ei erota merkityksiä Vapaasanahaku toimii hyvin silloin, kun haettava aihe on yksityiskohtainen ja tarkasti rajattu, tai kun käsitteistö ja sanasto kyseisellä alalla on vakiintunutta.

kuusikuusi

ASIASANAHAKU (AIHE, SUBJECT TERMS/HEADINGS, DESCRIPTORS)

Tallennettaessa julkaisun tietoja tietokantoihin käytetään määrämuotoisia asiasanoja kuvailemaan niiden aihetta/sisältöä, jotta tieto löytyisi paremmin.
Asiasanahaku kohdistuu vain asiasanoihin, jotka on tallennettu erilliseen asiasanakenttään.

  • Useimmissa tietokannoissa asiasanahakuun päästään tarkennetun haun (advanced search) puolelta (ja siellä yleensä valitaan pudotusvalikosta hakukentäksi esim. subject terms tai asiasana)
  • Hakusanoiksi pitää tällöin valita ao. tietokannan käyttämän asiasanaston tai tesauruksen termejä, asiasanoja.
  • Eri tietokannat käyttävät eri sanastoja. Sama sana ei toimi eri tietokannoissa samalla tavalla.
  • Jos rajaat hakusi kohdistumaan asiasanakenttään, et voi käyttää mitä tahansa luonnollisen kielen sanaa (tai ainakaan et niillä välttämättä saa tulosta).

Esimerkkinä tietue UEF-Finnassa:

siskuvailtukirjaselitetty

sisluetteloselitetty

Asiasanahaku toimii hyvin silloin, kun aihe on laaja-alainen tai hankalasti määriteltävä.

Jos käytetään samaa hakusanaa sekä sanahaussa että asiasanahaussa, sanahaku löytää enemmän tuloksia, varsinkin silloin, jos on käytetty sanankatkaisua.

 

Katso esimerkit (haut tehty 24.1.2018):

UEF-Finnassa haku ”aihe”, käytännössä asiasanahaku musiikkikasvatus  tuottaa 504 tulosta

UEF-Finnassa haku ”kaikki osumat”, käytännössä sanahaku musiikkikasvatus 676 tulosta, näihin sisältyvät kaikki edellisen haun viitteet , lisäksi 72 uutta.

Paljon riippuu kuitenkin sanavalinnasta: asiasana voi hyvinkin antaa enemmän tuloksia kuin jokin toinen, samaan asiaan liittyvä muu hakusana.

UEF-Finnasta hakien hakusana musiikinopetus ”aihe” löytää 74 viitettä,

haku musiikinopetus ”kaikki osumat” 140.

Erikseen kirjoitettuna UEF-Finnasta löytyy ”aihe”-haulla musiikin opetus 378 tulosta,

ja ”kaikki osumat” –haulla musiikin opetus 520 tulosta.

 

asiasanahaku: musiikkikasvatus, 2765 tulosta Melindassa

sanahaku: musiikkikasvatus, 3270 tulosta Melindassa (huomaa, että myös kaikki edellisellä haulla löytyneet sisältyvät tähän, lisäksi on tullut jotain uutta)

Jos vielä käytetään Melindassa sanankatkaisua sanahaussa, musiikkikasvatu* saadaan lisäksi mukaan taipuneita muotoja, ja tuloksia 4139.

 

 

Rajaus asiasanaan / asiasanahaku kohdentaa hakua, parantaa usein relevanssia ja aiheen osuvuutta, mutta pienentää hakutulosta. Mutta kaikille haettaville asioille ei välttämättä ole olemassa sopivaa asiasanaa.