2.5 Hakusanoista hakulausekkeiksi: operaattorit ja hakukentät

Hakusanat yhdistetään toisiinsa Boolen operaattoreilla

Operaattoreita eli Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.

Hakusanoja yhdistäviä Boolen operaattoreita on käytössä kolme: AND, OR ja NOT.

AND-operaattori yhdistää käsitteet

  • AND edellyttää, että hakusanojen tulee esiintyä tietueessa yhtä aikaa. (Tietue = yhden kirjan/artikkelin jne. tiedot tietokannassa.)
  • AND yhdistää hakuun eri käsitteet. Mitä enemmän eri käsitteitä eli AND-operaatioita haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi, ainakin teoriassa, on tulosjoukon koko.

OR-operaattori yhdistää vaihtoehtoiset sanat

  • OR hyväksyy lopputulokseen ne tietueet, joissa on vähintään jompi kumpi hakusanoista, joskin myös ne tietueet, joissa molemmat sanat esiintyvät yhtä aikaa, ovat käypäisiä
  • OR yhdistää samaa (ylä)käsitettä kuvaavat vaihtoehtoiset hakusanat. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.

Huomaa, että OR-operaattorin käyttö on turhaa silloin, kun vaihtoehtoinen sana kattaa myös tarkemman termin, joka usein on sanaliitto.

Eli esimerkiksi haussa ”defence mechanism” OR defence, riittää sana defence yksinkin löytämään myös ilmauksen defence mechanism.

NOT-operaattori sulkee pois

  • NOT edellyttää, että tietty sana ei saa esiintyä tietueessa lainkaan.
  • NOT-operaattoria ei käytetä hakulauseessa yhdistämään aiheeseen kuuluvia käsitteitä, vaan sen avulla tarkennetaan hakua jonkin tietyn ’apusanan’ avulla.

Not-operaatiota tarvitaan harvemmin ja sitä kannattaakin käyttää harkiten, koska se voi sulkea hakutuloksesta pois myös hyödyllisiä tietueita.

Operaattoreiden toiminta kuvana:

Kaksi toisiaan leikkaavaa valkoista ympyrää. Päällekkäin menevä osio on värjätty vihreäksi.

johtaminen AND työhyvinvointi

Kaksi toisiaan leikkaavaa ympyrää. Molemmat ympyrät, myös niiden toisiinsa limittyvä osa, ovat vihreitä.

johtaminen OR työnjohto

Kaksi toisiaan leikkaavaa ympyrää. Toinen ympyrä on kokonaan valkoinen, toisesta se osa, joka ei leikkaa toista ympyrää, on vihreä.

lahjakkuus NOT kielellinen

Katso video (n. 2,5 min) operaattoreista:

Hakulauseessa on tavallisesti useita operaattoreita

Samaan hakulauseeseen voi yhdistää useita operaatioita. Jos hakulauseessa on yhtä aikaa AND- ja OR-operaattori, haun loogisuus pitää aina varmistaa. Haussa tavoitellaan kuvan kaltaista tilannetta.

Kolme toisiaan leikkaavaa ympyrää, joista kaksi on vierekkäin ylhäällä, yksi niiden alla. Se osa, jossa alempi ympyrää leikkaa toista tai molempia ylemmistä ympyröistä, on värjätty vihreäksi.
johtaminen OR työnjohto
AND hyvinvointi

Operaattoreiden järjestys

Olennaista on, että OR-operaatiot tapahtuvat ennen AND- ja NOT-operaatioita.

Kuitenkin lähes aina AND-operaatio suoritetaan tietokannoissa ennen OR-operaatiota kirjoitusjärjestyksestä riippumatta. OR-operaatio nostetaan ensimmäiseksi joko käyttämällä sulkumerkkejä (1) tai sanojen oikealla ryhmittelyllä Advanced-tyyppisessä haussa (2).

  • 1: (johtaminen OR työnjohto) AND työhyvinvointi
  • 2: johtaminen OR työnjohto
    AND
    työhyvinvointi

Esimerkissä 1 kaikki kirjoitetaan hakuun yhdelle riville. Hakusanat, operaattorit ja sulkumerkit pitää kirjoittaa itse.

Esimerkissä 2 on käytetty kahta hakuriviä. OR-operaattori kirjoitetaan itse hakusanojen väliin, mutta AND-operaattori valitaan valmiista valikosta. OR-operaatiota ei jaeta usealle riville, vaan samaan käsitteeseen viittavat sanat tulevat aina samalle riville.

Jos sulkuja tai ryhmittelyä ei ole, käy siten, että saadaan tietoa työnjohdon ja työhyvinvoinnin yhteydestä (tämä on ok!) sekä kaikkea mahdollista tietoa johtamisesta. Tällöin hakulause “vuotaa”.

Kolme toisiaan leikkaavaa ympyrää, joista kaksi on vierekkäin ylhäällä, yksi niiden alla. Se osa, jossa alempi ympyrää leikkaa toista tai molempia ylemmistä ympyröistä, on värjätty vihreäksi. Vasemmanpuoleinen ympyrä ylhäällä on kokonaan vihreä.
johtaminen OR
työnjohto AND työhyvinvointi

Operaattorit eivät ole luonnollista kieltä

Vaikka operaattorit kääntyvät suomeksi: ja, tai, ei; eivät ne tarkoita täysin samaa kuin luonollisen kielen sanat. Itse asiassa luonnollisen kielen ja-sana saattaa indikoida OR-operaattorin tarvetta tiedonhaussa. Esimerkiksi aihe ’ Mielenterveyskuntoutujan voimavaratekijät ja haasteet’ purkautuu operaatioksi siten, että ’mielenterveyskuntoutujaan’ yhdistetään AND-operaaatorilla ’voimavaratekijät OR haasteet’.

  • mielenterveyskuntoutujat AND voimavaratekijät OR haasteet

Ei ole välttämätöntä, että voimavaratekijät ja haasteet käsitellään samassa julkaisussa, vaan tietoja yhdistellään useammasta julkaisusta: yhdessä kerrotaan erityisesti haasteista ja toisessa voimavaroista. Yleensä tällaisessa tilanteessa OR-operaattorilla yhdistettävillä käsitteillä on jokin yhteinen yläkäsite, kuten tässä ’jaksamiseen vaikuttavat tekijät’.

Perusmalli tietokantahakuihin

Kaikissa tietokannoissa on mahdollista koostaa hakulause samalla tavalla käyttäen ns. Tarkennettua hakua (malli 2 ylempänä). Kukin käsite kirjoitetaan aina omalle rivilleen. Rivejä käytetään siis yhtä monta kuin haussa on käsitteitä.

OR-operaattori kirjoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori. AND on oletusarvona rivien välillä kaikissa tietokannoissa.

Yleisluontoinen kuva tarkennetun haun mallista. Ylimmällä rivillä lukee: empathy OR compassion. Perässä selitys: käsite 1. Toisella rivillä lukee: stress OR overstraining. Perässä selitys: käsite 2. Kolmannella rivillä ei hakusanoja, mutta OR kirjoitettu osoittamaan tapaa esittää mahdollisten sanojen yhdistäminen. Perässä selite: käsite n.

Hakukentät vaikuttavat löytyvyyteen

Tietokannassa yksittäinen tietue koostuu kentistä. Tiedonhaussa hakusanoja etsitään kentistä, joita tietokantaan on tallennettu.

Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.

Mitä vähemmän kenttiä on mukana haun piirissä, sen vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).

Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Vasemmalla sana: obsessions. Hakukenttä Title: 796. Hakukenttä Subject: 2 315. Hakukenttä Abstract: 4 343. Hakukenttä All text: 6 030. Oikealla sana: ”falling in love”. Hakukenttä Subject: 30. Hakukenttä Title: 57. Hakukenttä Abstract: 269. Hakukenttä All text: 325.
Tarkastele hakutulosten määrä eri kentistä haettuna. Huomaa että asiasanakentästä hakuun vaikuttaa paljon se, onko sana virallinen asiasana vai ei. Obsessions on asiasana, ”falling in love” ei ole.

Kirja- ja artikkelitietokannoissa kenttiä ovat:

  • otsikko = nimeke = title
  • tekijä = author
  • asiasanat = aihe = subject = keyword
  • julkaisutiedot

Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:

  • tiivistelmä = abstract
  • sisällysluettelo = contents
  • lähdeluettelo = references
  • kokoteksti = julkaisu kokonaisuudessaan = full text

Otsikko ja asiasanat kertovat olennaisimman

Otsikko- ja Asiasana- eli Aihekentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.

Tiivistelmä täydentää

Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.

Kokoteksti on todella laaja hakukohteena

Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.

Hakukenttien käyttö tietokannoissa

Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.

Kuvakappaukset UEF-Primosta. Toisessa Perushakuun on kirjoitettu hakusana etnopsykologia*. Hakurivin alla on alasvetovalikko, josta Kaikki kentät valinnan sijaan voi valita otsikon, tekijän, aiheen tai ISBN-tunnuksen haun kohteeksi. Toisessa kuvassa on Tarkennettu haku. Hakuun on kirjoitettu ensimmäiselle riville hakusanaksi ethnopsycholog*. Hakurivin edestä on valittu haun kohteeksi kaikki kentät. Toisella rivillä on hakusana: identity. Haun kohde on Aihe. Rivit on yhdistetty toisiinsa AND-operaattorilla.
Esimerkki hakukenttien valinnasta UEF-Primossa.

Hakulauseen kirjoitustapa hakulomakkeelle ratkaisee haun onnistumisen

Kun kirjoitat hakuun useampia sanoja, tiedätkö, mitä itse asiassa olet käsket ohjelman hakea?

  • Onko kyseessä fraasi vai and-operaatio?
  • Missä järjestyksessä operaatiot toteutuvat, toimiiko haun logiikka?
  • Tulevatko sanan taivutusmuodot mukaan automaattisesti, mikä on katkaisumerkki?
  • Mistä kentistä hakusanoja haetaan?

Perusasiat eri tietokannoissa voivat selvitä jo hakunäytön ohjeita seuraamalla. Kunkin tietokannan Help-osiosta löytyy lisää vinkkejä.

Seuraava sivu: Erilaisia hakutapoja