Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.
Hakujärjestelmässä hakusana toimii merkkijonona. Tiedonhakijan täytyy itse määritellä ne merkkijonot, joita tietokannasta haetaan.
Hakusana voi joissakin hakujärjestelmissä olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Järjestelmä ei kuitenkaan silloinkaan varsinaisesti ymmärrä tai hae käsitteitä. Tämän johdosta hakutuloksiin tulee myös aiheeseen liittymättömiä osumia, jos haettu merkkijono täsmää.
Tiedon löytyminen perustuu siis tiettyjen merkkijonojen esiintymiseen dokumenteissa tai niitä kuvailevissa tietokannan tiedoissa (metatiedoissa). Kääntäen, dokumentin sisältö voi olla aiheenmukainen, mutta jos käytettyä hakusanaan ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.
Mitä kuuluu?
Kone siis hakee merkkijonoja ymmärtämättä, mitä ne tarkoittavat. Jos julkaisuissa esimerkiksi puhutaan vain lapsista, hakusana päiväkoti-ikäiset ei löydä julkaisua. Tai puhutaan vauvoista, jolloin hakusanat imeväisikäiset tai pikkulapset ei sitä löydä.
Käsite itsessään on usein ensimmäinen hyvä hakusana. On mietittävä, mitkä kaikki käsitteet ovat tärkeitä haussa.
Vaihtoehtoiset hakusanat ovat kuitenkin lähes aina välttämättömiä:
- kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
- synonyymi ja muu läheinen ilmaus: lapanen – kinnas
- vastakkainen käsite voi olla hyödyksi: puhdas – likainen
- laajempi kokonaisuus, johon käsite liittyy: leikit – hippa
- tarkempi osa-alue, jonka käsite sisältää: lounas – ateriat
- lähikäsite: opiskelutekniikka – opiskelutaito
- kirjoitusmuodon vaihtelu: color – colour; behavior – behaviour; neandertalin ihminen – neandertalinihminen – neandertalilainen
- lyhenteet: luomu – luonnonmukainen
HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne ALS tarkoittaa ainakin käsitteitä “Airborne Laser Scanning”, ”Amyotrofinen lateraaliskleroosi”, “Angular Leaf Spot” ja “Acetolactate synthase”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.
Mistä löytää lisää hakusanoja:
- sanakirjoista (esim. UEF-Primon kautta löytyvä MOT-sanakirjasto sisältää sekä eri kielten että eri alojen sanakirjoja)
- alan oppikirjoista ja käsikirjoista voi selvittää keskeisiä käsitteitä
- asiasanastoista, jotka ovat johonkin tiettyyn tietokantaan liittyviä (esim. ERIC-tesaurus) tai ontologioista (esim. Yleinen suomalainen ontologia YSO)
- jo löydettyjen julkaisujen aihetta kuvaavista sanoista (subject, keyword) sekä niiden sisällys- ja lähdeluetteloista
Kasvatusalan ERIC-tietokannassa on tietokannan oma asiasanasto eli tesaurus. Tietokantaan pääsee kirjautumalla UEF-Primon kautta.
YSO löytyy vapaasti verkosta.
Hakusanaesimerkki
”Tablettien käyttö osana esikouluikäisten mediakasvatusta”, mahdollisia hakusanoja voisivat olla esimerkiksi seuraavat:
tabletit, mobiililaitteet, esikouluikäiset, esikoululaiset, esikoulu, esikoulukasvatus, esikouluopetus, mediakasvatus, medialukutaito, mediataidot, viestintäkasvatus,
tablets, pre-school, pre-schoolers, infants, media education, media literacy
jne.
Missä muodossa sanat tarjotaan hakuun, mietitään erikseen, myös tietokannasta riippuen.
Sanahaku ja asiasanahaku, mitä eroa?
SANAHAKU (vapaateksti, keyword, free text..) hakee sanaa
- kaikkialta julkaisujen tiedoista:
- tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista, kustantajan nimestä jne.
- täsmälleen annetussa muodossa, joten mieti sanan taipumiset yms. ja käytä katkaisumerkkiä.
- on oletushakuna tietokannoissa yleensä
Mitä tahansa luonnollisen kielen sanoja tai fraaseja voi käyttää.
- Aiheen kannalta merkityksettömiä sanoja (stop words, esim. a, an, the, in, on) ei käytetä haussa, ei yksinään eikä sanaliittojen osina.
- Kannattaa kysyä myös työn ohjaajalta, millä sanoilla aiheesta voisi hakea.
- Synonyymit pitää miettiä ja hakea erikseen.
- Homonyymit tulevat mukaan – tietokone ei erota merkityksiä Vapaasanahaku toimii hyvin silloin, kun haettava aihe on yksityiskohtainen ja tarkasti rajattu, tai kun käsitteistö ja sanasto kyseisellä alalla on vakiintunutta.
ASIASANAHAKU (AIHE, SUBJECT TERMS/HEADINGS, DESCRIPTORS)
Tallennettaessa julkaisun tietoja tietokantoihin käytetään määrämuotoisia asiasanoja kuvailemaan niiden aihetta/sisältöä, jotta tieto löytyisi paremmin.
Asiasanahaku kohdistuu vain asiasanoihin, jotka on tallennettu erilliseen asiasanakenttään.
- Useimmissa tietokannoissa asiasanahakuun päästään tarkennetun haun (advanced search) puolelta (ja siellä yleensä valitaan pudotusvalikosta hakukentäksi esim. subject terms tai asiasana)
- Hakusanoiksi pitää tällöin valita ao. tietokannan käyttämän asiasanaston tai tesauruksen termejä, asiasanoja.
- Eri tietokannat käyttävät eri sanastoja. Sama sana ei toimi eri tietokannoissa samalla tavalla.
- Jos rajaat hakusi kohdistumaan asiasanakenttään, et voi käyttää mitä tahansa luonnollisen kielen sanaa (tai ainakaan et niillä välttämättä saa tulosta).
Esimerkkinä kirjan tietue UEF-Primossa:
UEF-Primosta nähdään tarkemmat tiedot kirjasta. Ne sisältävät tietueeseen liitetyt asiasanat, ja tässä myös kirjan sisällysluettelon.
Asiasanahaku toimii hyvin silloin, kun aihe on laaja-alainen tai hankalasti määriteltävä.
Jos käytetään samaa hakusanaa sekä sanahaussa että asiasanahaussa, sanahaku löytää enemmän tuloksia, varsinkin silloin, jos on käytetty sanankatkaisua.
Katso esimerkit (haut tehty 14.1.2020):
UEF-Primossa haku ”aihe”, käytännössä asiasanahaku musiikkikasvatus tuottaa 385 tulosta
UEF-Primossa haku ilman sen kohdentamista mihinkään kenttiin, käytännössä sanahaku musiikkikasvatus tuottaa 392 tulosta, näihin sisältyvät kaikki edellisen haun viitteet , lisäksi 7 uutta.
Jos vielä tehdään UEF-Primossa sama kohdentamaton haku niin, että katkaistaan hakusana musiikkikasvatu* saadaan 422 viitettä. Kun nyt taipuneetkin muodot ovat mukana, viitemäärä suureni.
Rajaus asiasanaan / asiasanahaku kohdentaa hakua, parantaa usein relevanssia ja aiheen osuvuutta, mutta pienentää hakutulosta. Mutta kaikille haettaville asioille ei välttämättä ole olemassa sopivaa asiasanaa.