Hakusanojen yhdistäminen ja muoto

Hakusanojen yhdistäminen ja muoto

Yksi hakusana riittää harvoin aiheen kuvaamiseen. Kattavaan hakutulokseen tarvitaan useampia sanoja.

  • Tietokanta ei ymmärrä sanojen välisiä yhteyksiä, ellei sille kerro miten sanat halutaan yhdistää.
  • Hakusanat ja niitä yhdistävät operaattorit muodostavat hakulauseen: esim. (aged OR aging OR elderly OR ”older people”) AND depress*
  • * (asteriski) on yleisimmin käytetty katkaisumerkki

Yllä olevan hakulauseen rakentamiseen on käytetty apuna Boolen logiikkaa (AND/OR/NOT), katkaisu- ja lainausmerkkejä sekä sulkuja. Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.

Miten hakusanoja yhdistellään?

AND/OR/NOT – operaattoreiden avulla tietokoneelle annetaan käsky siitä, millä tavoin hakusanoja etsitään

  • Toisiaan rajaavat hakutermit: AND
    • Kun halutaan, että kaikki hakutermit) esiintyvät hakutuloksessa yhtäaikaa (all of the words). Esim. nuorten päihteidenkäyttö: nuor* AND päih*
  • Toisilleen vaihtoehtoiset hakutermit: OR
    • Kun halutaan, että jokin tai kaikki hakutermeistä esiintyy hakutuloksessa (any of the words). Esim. päihteet, päihteidenkäyttö, alkoholi, huumeet:  päih* OR alkoholi* OR huum*

ORilla yhdistettyjen hakusanojen tulosmäärää on yleensä syytä rajata ja tarkentaa ANDilla yhdistettävillä hakusanoilla.
Jotta hakusanat yhdistyvät loogisesti oikein, tarvitset ORilla yhdistettyjen hakusanojen ympärille sulut. Jos kirjoitat kaiken samalle riville, kirjoita myös sulut > esim. (päih* OR alkohol* OR huum*) AND tupak*

Yllä olevia sanoja on katkaistu, koska sanat taipuvat. Katkaisun avulla saadaan eri taivutus-/sanamuodot mukaan > päih* hakee sanoja  päihde, päihteet, päihteidenkäyttö, päihdyttävä, …

  • Yleisin katkaisumerkki on *(asteriski/tähti). Toimii mm. UEF-Primossa, Medicissä ja PubMedissä.
  • Mieti mistä kohtaa sana taipuu ja laita siihen katkaisumerkki. Huomioi varsinkin suomenkielellä hakiessa:
    • potila* > potilas, potilaat, potilaan, potilaiden, mutta myös potilasohjaus, potilastyytyväisyys, potilastyö…
    • alcohol* -> alcohol, alcoholism, alcoholics…
  • Mutta: Liian lyhyttä sananvartaloa ei kannata jättää. Esim. lapsi ja kipu > haettava laps* OR last*, kipu* OR kivu*

Fraasit, sanaliitot

  • Jos käsite muodostuu useammasta sanasta, se on kerrottava hakujärjestelmälle lainausmerkkejä käyttäen. Lainausmerkkien avulla tietokanta ymmärtää, että sanojen on oltava tietueessa peräkkäin eikä erikseen missä tahansa kohtaa tietuetta. Esimerkiksi:
    • ”Alzheimerin tauti”, ”metabolinen oireyhtymä”, ”potilaan oikeudet”, ”occupational health”, ”drug therapy”, ”knee injuries” ”
    • Huomioi termi-/tapauskohtaisesti myös, voisiko sanan katkaisusta olla apua; esim. ”sosioekonomiset tekijät”, ”sosioekonominen asema” -> sosioekonom* hakee molemmat
    • Huom. Jos et muista Medicissä lainausmerkkejä, tietokanta luulee, että sanat ovat vaihtoehtoisia (hakee termit OR-operaattorilla). Medicissä et voi katkaista fraasia, vaan sana on haettava ’kokonaisena’.
  • Poissuljettavat käsitteet: NOT
    Esim. tupakkaa ei haluta mukaan päihteisiin: päih* NOT tupak* (huom. jättää hakutuloksesta pois kaiken, missä esiintyy ao. sana/merkkijono.)

Miten tietokanta ymmärtää haun?

AND: Hakusanojen tulee esiintyä tietueessa (hakutuloksissa) yhtä aikaa, esim. masennus AND vanhukset

  • AND-operaattori rajaa ja supistaa hakua (yleisimmin tarvittu operaattori): kaikki hakusanat (sekä että) esiintyvät hakutuloksessa (all of the words).
  • Mitä enemmän rajaavia käsitteittä haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi (ainakin teoriassa) on tulosjoukon koko.
  • ANDilla voit yhdistää yleensä niin monta hakusanaa kuin tahdot.

OR: Hakutuloksessa on vähintään jompi kumpi sanoista, esim. vanhukset OR ikääntyneet

  • OR-operaattorilla haetaan synonyymit ja rinnakkaiset (vaihtoehtoiset) hakusanat. Tietueessa esiintyy vähintään jompi kumpi hakusanoista (any of the words) tai molemmat sanat.
  • OR-operaattori laajentaa hakua. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.

NOT: Kun halutaan sulkea termi pois kaikista hakutuloksista,
esim. masennus NOT lapset

  • Operaattorin käytössä pitää olla varovainen, ettei rajaa vahingossa pois hakutuloksesta hyödyllisiä tietueita. Näkökulmaa harvoin pystyy rajaamaan sulkemalla sanoja pois. (Vältä tämän käyttöä.)

Käytännössä kotimaisissa  tietokannoissa kannattaa tehdä hakuja laajemmilla käsitteillä, kun taas ulkomaisissa tietokannoissa hakua voi ja kannattaakin usein rajata tarkemmin (niissä on aineistoa runsaammin).