2.5 Hakusanoista hakulausekkeiksi: operaattorit ja hakukentät

Hakusanat yhdistetään toisiinsa Boolen operaattoreilla

Operaattoreita eli Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.

AND, OR ja NOT

Hakusanoja yhdistäviä Boolen operaattoreita on käytössä kolme: AND, OR ja NOT

AND-operaattori yhdistää käsitteet

AND-operaattori edellyttää, että hakusanojen tulee esiintyä tietueessa yhtä aikaa. (Tietue = yhden kirjan/artikkelin jne. tiedot tietokannassa.)

AND-operaattorilla yhdistetään hakuun eri käsitteet. Mitä enemmän eri rajaavia käsitteittä haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi (ainakin teoriassa) on tulosjoukon koko.

johtaminen AND työhyvinvointi

OR-operaattori yhdistää vaihtoehtoiset sanat

OR-operaattori hyväksyy lopputulokseen ne tietueet, joissa on vähintään jompikumpi hakusanoista.
Myös ne tietueet, joissa molemmat sanat esiintyvät yhtä aikaa, tulevat mukaan.

OR-operaattorilla yhdistetään samaa (ylä)käsitettä kuvaavat vaihtoehtoiset hakusanat. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.

johtaminen OR työnjohto

Huomaa, että OR-operaattorin käyttö on turhaa silloin, kun vaihtoehtoinen sana kattaa myös tarkemman termin, joka usein on sanaliitto.

Eli esimerkiksi haussa ”defence mechanism” OR defence, riittää sana defence yksinkin löytämään myös ilmauksen defence mechanism.

NOT-operaattori sulkee pois

NOT-operaatiossa edellytetään, että tietty sana ei saa esiintyä tietueessa lainkaan.

NOT-operaattoria ei käytetä hakulauseessa yhdistämään aiheeseen kuuluvia käsitteitä, vaan sen avulla tarkennetaan hakua jonkin tietyn ’apusanan’ avulla.

lahjakkuus NOT kielellinen

Not-operaatiota tarvitaan harvemmin ja sitä kannattaakin käyttää harkiten, koska se voi sulkea hakutuloksesta pois myös hyödyllisiä tietueita.

Katso video (n. 2,5 min) operaattoreista:

Hakulauseessa on tavallisesti useita operaattoreita

Samaan hakulauseeseen voi yhdistää useita operaatioita. Jos hakulauseessa on yhtä aikaa AND- ja OR-operaattori, haun loogisuus pitää aina varmistaa. Haussa tavoitellaan kuvan kaltaista tilannetta.

Olennaista on, että OR-operaatiot tapahtuvat ennen AND- ja NOT-opraatioita.

Kuitenkin lähes aina AND-operaatio suoritetaan tietokannoissa ennen OR-operaatiota kirjoitusjärjestyksestä riippumatta. OR-operaatio nostetaan ensimmäiseksi joko käyttämällä sulkumerkkejä (1) tai sanojen oikealla ryhmittelyllä Advanced-tyyppisessä haussa (2).

(1):
(johtaminen OR työnjohto) AND työhyvinvointi

(2):
johtaminen OR työnjohto
AND
työhyvinvointi

Esimerkissä 1 kaikki kirjoitetaan hakuun yhdelle riville. Hakusanat, operaattorit ja sulkumerkit pitää kirjoittaa itse.

Esimerkissä 2 on käytetty kahta hakuriviä. OR-operaattori kirjoitetaan itse hakusanojen väliin, mutta AND-operaattori valitaan valmiista valikosta. OR-operaatiota ei jaeta usealle riville, vaan samaan käsitteeseen viittavat sanat tulevat aina samalle riville.

Jos sulkuja tai ryhmittelyä ei ole, käy siten, että saadaan tietoa työnjohdon ja työhyvinvoinnin yhteydestä (tämä on ok!) sekä kaikkea mahdollista tietoa johtamisesta. Tällöin hakulause “vuotaa”.

johtaminen OR työnjohto AND työhyvinvointi

Operaattorit eivät ole luonnollista kieltä

Vaikka operaattorit kääntyvät suomeksi: ja, tai, ei; eivät ne tarkoita täysin samaa kuin luonollisen kielen sanat. Itse asiassa luonnollisen kielen ja-sana saattaa indikoida OR-operaattorin tarvetta tiedonhaussa. Esimerkiksi aihe ’ Mielenterveyskuntoutujan voimavaratekijät ja haasteet’ purkautuu operaatioksi siten, että ’mielenterveyskuntoutujaan’ yhdistetään AND-operaaatorilla ’voimavaratekijät OR haasteet’. Ei ole välttämätöntä, että voimavaratekijät ja haasteet käsitellään samassa julkaisussa, vaan tietoja yhdistellään useammasta julkaisusta: yhdessä kerrotaan erityisesti haasteista ja toisessa voimavaroista. Yleensä tällaisessa tilanteessa OR-operaattorilla yhdistettävillä käsitteillä on jokin yhteinen yläkäsite, kuten tässä ’jaksamiseen vaikuttavat tekijät’.

Perusmalli tietokantahakuihin

Kaikissa tietokannoissa on mahdollista koostaa hakulause samalla tavalla käyttäen ns. Tarkennettua hakua (malli 2 ylempänä). Kukin käsite kirjoitetaan aina omalle rivilleen. Rivejä käytetään siis yhtä monta kuin haussa on käsitteitä.

OR-operaattori kirjoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori. AND on oletusarvona rivien välillä kaikissa tietokannoissa.

Hakukentät vaikuttavat löytyvyyteen

Tietokannassa yksittäinen tietue koostuu kentistä. Tiedonhaussa hakusanoja etsitään kentistä, joita tietokantaan on tallennettu.

Hakukentän voi valita

Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.

Mitä vähemmän kenttiä on mukana haun piirissä, sen vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).

Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.

Tarkastele hakutulosten määrä eri kentistä haettuna. Huomaa että asiasanakentästä hakuun vaikuttaa paljon se, onko sana virallinen asiasana vai ei. Obsessions on asiasana, ”falling in love” ei ole.

Kirja- ja artikkelitietokannoissa kenttiä ovat:

  • otsikko = nimeke = title
  • tekijä = author
  • asiasanat = aihe = subject = keyword
  • julkaisutiedot

Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:

  • tiivistelmä = abstract
  • sisällysluettelo = contents
  • lähdeluettelo = references
  • kokoteksti = julkaisu kokonaisuudessaan = full text

Otsikko ja asiasanat kertovat olennaisimman

Otsikko- ja Asiasana- eli Aihekentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.

Tiivistelmä täydentää

Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.

Kokoteksti on todella laaja hakukohteena

Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.

Hakukenttien käyttö tietokannoissa

Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.

Kuvakappaukset UEF-Primosta. Toisessa Perushakuun on kirjoitettu hakusana etnopsykologia*. Hakurivin alla on alasvetovalikko, josta Kaikki kentät valinnan sijaan voi valita otsikon, tekijän, aiheen tai ISBN-tunnuksen haun kohteeksi. Toisessa kuvassa on Tarkennettu haku. Hakuun on kirjoitettu ensimmäiselle riville hakusanaksi ethnopsycholog*. Hakurivin edestä on valittu haun kohteeksi kaikki kentät. Toisella rivillä on hakusana: identity. Haun kohde on Aihe. Rivit on yhdistetty toisiinsa AND-operaattorilla.
Esimerkki hakukenttien valinnasta UEF-Primossa.

Hakulauseen kirjoitustapa hakulomakkeelle ratkaisee haun onnistumisen

Kun kirjoitat hakuun useampia sanoja, tiedätkö, mitä itse asiassa olet käsket ohjelman hakea?

  • Onko kyseessä fraasi vai and-operaatio?
  • Missä järjestyksessä operaatiot toteutuvat, toimiiko haun logiikka?
  • Tulevatko sanan taivutusmuodot mukaan automaattisesti, mikä on katkaisumerkki?
  • Mistä kentistä hakusanoja haetaan?

Perusasiat eri tietokannoissa voivat selvitä jo hakunäytön ohjeita seuraamalla. Kunkin tietokannan Help-osiosta löytyy lisää vinkkejä