2.2 Hakusanat

Tiedonhakua varten aiheen keskeiset käsitteet tulee kääntää tai muokata hakusanoiksi.

Hakujärjestelmässä hakusana toimii merkkijonona. Tiedonhakijan täytyy itse määritellä ne merkkijonot, joita tietokannasta haetaan.

Hakusana voi joissakin hakujärjestelmissä olla myös lähtökohta, jonka avulla järjestelmä löytää sanasta erilaisia taivutusmuotoja ja johdannaisia. Järjestelmä ei kuitenkaan silloinkaan varsinaisesti ymmärrä tai hae käsitteitä. Tämän johdosta hakutuloksiin tulee myös aiheeseen liittymättömiä osumia, jos haettu merkkijono täsmää.

Tiedon löytyminen perustuu siis tiettyjen merkkijonojen esiintymiseen dokumenteissa tai niitä kuvailevissa tietokannan tiedoissa (metatiedoissa). Kääntäen, dokumentin sisältö voi olla aiheenmukainen, mutta jos käytettyä hakusanaan ei sen tiedoista löydy, itse dokumenttikin jää löytymättä.

Mitä kuuluu?

Kone siis hakee merkkijonoja ymmärtämättä, mitä ne tarkoittavat. Jos julkaisuissa esimerkiksi puhutaan vain nuorista, hakusana murrosikäiset ei löydä julkaisua. Tai puhutaan vauvoista, jolloin hakusanat imeväisikäiset tai pikkulapset ei sitä löydä.

Käsite itsessään on usein ensimmäinen hyvä hakusana. On mietittävä, mitkä kaikki käsitteet ovat tärkeitä haussa.

Vaihtoehtoiset hakusanat ovat kuitenkin lähes aina välttämättömiä:

  • kieli on ensimmäinen kysymys. Englantia ja suomea ainakin tarvitaan
  • synonyymi ja muu läheinen ilmaus: burnout – työuupumus
  • vastakkainen käsite voi olla hyödyksi: sympatia – antipatia
  • laajempi kokonaisuus, johon käsite liittyy: leikkiterapia – psykoterapia
  • tarkempi osa-alue, jonka käsite sisältää: syvyyspsykologia – piilotajunta
  • lähikäsite: analyyttinen psykologia – psykoanalyysi
  • kirjoitusmuodon vaihtelu: color – colour; behavior – behaviour; neandertalin ihminen – neandertalinihminen – neandertalilainen
  • lyhenteet: luomu – luonnonmukainen

HUOM. Lyhenteiden käyttöä kannattaa välttää, jos ne ovat moniselitteisiä (esim. lyhenne ALS tarkoittaa ainakin käsitteitä “Airborne Laser Scanning”, ”Amyotrofinen lateraaliskleroosi”, “Angular Leaf Spot” ja “Acetolactate synthase”).
Pidemmän tekstin joukosta aukikirjoitettu muoto yleensä löytyy. Mutta jos haku kohdistuu vain otsikkoon, voi olla tarpeen kokeilla myös lyhenteellä.

Mistä löytää lisää hakusanoja:

  • sanakirjoista (esim. UEF-Finnan kautta löytyvä MOT-sanakirjasto sisältää sekä eri kielten että eri alojen sanakirjoja)
  • hakemalla aihetta Google Scholarista löytää helposti artikkeleita, ja näistä uusia hakusanoja
  • alan oppikirjoista ja käsikirjoista voi selvittää keskeisiä käsitteitä
  • asiasanastoista eli tesauruksista,  esimerkkejä:

PsycInfo-tietokannassa käytettävä APA:n (American Psychological Association) ylläpitämä Thesaurus of Psychological Index Terms. PsycInfo-tietokannassa voi kokeilla erilaisia hakusanoja, ja ohjelma etsii niitä myös asiasanastosta

PubMed-tietokannassa käytettävä NLM:n (National Library of Medicine) MeSH l. Medical Subject Headings.

Kasvatusalan ERIC-tesaurus

PsycInfo-, PubMed- ja Eric -tietokantoihin pääsee kirjautumalla UEF-Finnan kautta.

Yleinen Suomalainen Ontologia YSO löytyy osoitteesta https://finto.fi/yso/fi/  . Yleinen suomalainen ontologia YSO on kolmikielinen, etupäässä yleiskäsitteistä koostuva ontologia.

https://finto.fi/yso/fi/

 

  • jo löydettyjen julkaisujen aihetta kuvaavista sanoista (subject, keyword) sekä niiden sisällys- ja lähdeluetteloista

Hakusanaesimerkki

”Tablettien käyttö osana esikouluikäisten mediakasvatusta”, mahdollisia hakusanoja voisivat olla esimerkiksi seuraavat:

tabletit, mobiililaitteet, esikouluikäiset, esikoululaiset, esikoulu, esikoulukasvatus, esikouluopetus, mediakasvatus, medialukutaito, mediataidot, viestintäkasvatus,

tablets, pre-school, pre-schoolers, infants, media education, media literacy

jne.

Missä muodossa sanat tarjotaan hakuun, mietitään erikseen, myös tietokannasta riippuen.

 

Sanahaku ja asiasanahaku, mitä eroa?

SANAHAKU (vapaateksti, keyword, free text..) hakee sanaa

  • kaikkialta julkaisujen tiedoista:
    • tekijän ja julkaisun nimestä, tiivistelmästä, asiasanoista, kustantajan nimestä jne.
  • täsmälleen annetussa muodossa, joten mieti sanan taipumiset yms. ja käytä katkaisumerkkiä.
  • on oletushakuna tietokannoissa yleensä

Mitä tahansa luonnollisen kielen sanoja tai fraaseja voi käyttää.

  • Aiheen kannalta merkityksettömiä sanoja (stop words, esim. a, an, the, in, on) ei käytetä haussa, ei yksinään eikä sanaliittojen osina.
  • Kannattaa kysyä myös työn ohjaajalta, millä sanoilla aiheesta voisi hakea.
  • Synonyymit pitää miettiä ja hakea erikseen.
  • Homonyymit tulevat mukaan – tietokone ei erota merkityksiä.                                        Vapaasanahaku toimii hyvin silloin, kun haettava aihe on yksityiskohtainen ja tarkasti rajattu, tai kun käsitteistö ja sanasto kyseisellä alalla on vakiintunutta.

ASIASANAHAKU (AIHE, SUBJECT TERMS/HEADINGS, DESCRIPTORS)

Tallennettaessa julkaisun tietoja tietokantoihin käytetään ennalta määrättyjä asiasanoja kuvailemaan niiden aihetta/sisältöä, jotta tieto löytyisi paremmin.
Asiasanahaku kohdistuu vain asiasanoihin, jotka on tallennettu erilliseen asiasanakenttään.

  • Useimmissa tietokannoissa asiasanahakuun päästään tarkennetun haun (advanced search) puolelta (ja siellä yleensä valitaan pudotusvalikosta hakukentäksi esim. subject terms tai asiasana)
  • Hakusanoiksi pitää tällöin valita ao. tietokannan käyttämän asiasanaston tai tesauruksen termejä, asiasanoja.
  • Eri tietokannat käyttävät eri sanastoja (ks. esimerkit edellä). Sama sana ei toimi eri tietokannoissa samalla tavalla.
  • Jos rajaat hakusi kohdistumaan asiasanakenttään, et voi käyttää mitä tahansa luonnollisen kielen sanaa (tai ainakaan et niillä välttämättä saa tulosta).

Esimerkkinä tietue UEF-Finnassa:

Kohdassa ”Aiheet” ovat julkaisua kuvaamaan lisätyt asiasanat. Suomenkieliset ovat YSA:n mukaisia, englanninkieliset Yhdysvaltain kongressin kirjaston asiasanaston (LCSH) mukaisia. Jos tehdään asiasanahaku, se kohdistuu näihin sanoihin.

Monista julkaisuista, ei kuitenkaan kaikista, on UEF-Finnassa myös sisällysluettelo, josta tietenkin löytyy laaja joukko julkaisun sisällöstä kertovia sanoja. (Vapaa)sanahaku kohdistuu myös sisällysluettelon sanoihin.

Kuva esimerkkikirjan sisällysluettelosta UEF-Finnassa:

Asiasanahaku toimii hyvin silloin, kun aihe on laaja-alainen tai hankalasti määriteltävä.

Jos käytetään samaa hakusanaa sekä sanahaussa että asiasanahaussa, sanahaku löytää enemmän tuloksia, varsinkin silloin, jos on käytetty sanankatkaisua.

 

Katso esimerkit (haut tehty 20.6.2018):

UEF-Finnassa haku ”aihe”, käytännössä asiasanahaku itsetunto  tuottaa 403 tulosta

UEF-Finnassa haku ”kaikki osumat”, käytännössä sanahaku itsetunto 478 tulosta, näihin sisältyvät siis kaikki edellisen haun viitteet , lisäksi 75 uutta.

Paljon riippuu kuitenkin sanavalinnasta: asiasana voi hyvinkin antaa enemmän tuloksia kuin jokin toinen, samaan asiaan liittyvä muu hakusana.

Melinda on kirjastojen yhteistietokanta, ja sen haku poikkeaa teknisesti UEF-Finnan hausta.

asiasanahaku: itsetunto, 2177 tulosta Melinda-tietokannasta

sanahaku: itsetunto, 2332 tulosta Melindassa (huomaa, että myös kaikki edellisellä haulla löytyneet sisältyvät tähän, lisäksi on tullut jotain uutta)

Jos vielä käytetään Melindassa sanankatkaisua sanahaussa, itsetun* saadaan lisäksi mukaan taipuneita muotoja, ja tuloksia 4355. Kaikki löydökset eivät välttämättä liity tarkalleen itsetunto-sanaan, vaan mukana voi olla esim. itsetuntemus.

 

Rajaus asiasanaan / asiasanahaku kohdentaa hakua, parantaa usein relevanssia ja aiheen osuvuutta, mutta pienentää hakutulosta. Mutta kaikille haettaville asioille ei välttämättä ole olemassa sopivaa asiasanaa.