2.5 Hakusanoista hakulausekkeiksi

Hakusanat ja niitä yhdistävät operaattorit muodostavat hakulauseen. Operaattoreita eli Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.

Hakusanoja yhdistäviä Boolen operaattoreita on käytössä kolme: AND, OR ja NOT.

AND-operaattori yhdistää käsitteet

AND-operaattori edellyttää, että hakusanojen tulee esiintyä tietueessa yhtä aikaa. (Tietue = yhden kirjan/artikkelin jne. tiedot tietokannassa.)

AND-operaattorilla yhdistetään hakuun eri käsitteet. Mitä enemmän eri rajaavia käsitteittä haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi (ainakin teoriassa) on tulosjoukon koko.

OR-operaattori yhdistää vaihtoehtoiset sanat

OR-operaattori hyväksyy lopputulokseen ne tietueet, joissa on vähintään jompikumpi hakusanoista.
Myös ne tietueet, joissa molemmat sanat esiintyvät yhtä aikaa, tulevat mukaan.

OR-operaattorilla yhdistetään samaa (ylä)käsitettä kuvaavat vaihtoehtoiset hakusanat. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.

Huomaa, että OR-operaattorin käyttö on turhaa silloin, kun vaihtoehtoinen sana kattaa myös tarkemman termin, joka usein on sanaliitto.

  • Esimerkiksi haussa ”defence mechanism” OR defence, riittää sana defence yksinkin löytämään myös ilmauksen defence mechanism.

NOT-operaattori sulkee pois

NOT-operaatiossa edellytetään, että tietty sana ei saa esiintyä tietueessa lainkaan.

NOT-operaattoria ei käytetä hakulauseessa yhdistämään aiheeseen kuuluvia käsitteitä, vaan sen avulla tarkennetaan hakua jonkin tietyn ’apusanan’ avulla.

Not-operaatiota tarvitaan harvemmin ja sitä kannattaakin käyttää harkiten, koska se voi sulkea hakutuloksesta pois myös hyödyllisiä tietueita.

Operaattoreiden toiminta kuvana:

Kaksi toisiaan leikkaavaa valkoista ympyrää. Päällekkäin menevä osio on värjätty vihreäksi.

levät AND yhteyttäminen

Kaksi toisiaan leikkaavaa ympyrää. Molemmat ympyrät, myös niiden toisiinsa limittyvä osa, ovat vihreitä.

yhteyttäminen OR fotosynteesi

Kaksi toisiaan leikkaavaa ympyrää. Toinen ympyrä on kokonaan valkoinen, toisesta se osa, joka ei leikkaa toista ympyrää, on vihreä.

yhteyttäminen NOT levät

Katso video (n. 2,5 min) operaattoreista:

Hakulauseessa on tavallisesti useita operaattoreita

Samaan hakulauseeseen voi yhdistää useita operaatioita. Jos hakulauseessa on yhtä aikaa AND- ja OR-operaattori, haun loogisuus pitää aina varmistaa. Haussa tavoitellaan kuvan kaltaista tilannetta.

Kolme toisiaan leikkaavaa ympyrää, joista kaksi on vierekkäin ylhäällä, yksi niiden alla. Se osa, jossa alempi ympyrää leikkaa toista tai molempia ylemmistä ympyröistä, on värjätty vihreäksi.
(yhteyttäminen OR fotosynteesi)
AND levät

Operaattoreiden järjestys

Useimmiten AND-operaatio suoritetaan hakukoneissa ennen OR-operaatiota kirjoitusjärjestyksestä riippumatta. Haussa, jossa on sekä AND- että OR-operaatio, on kuitenkin hakutuloksen loogisuuden kannalta tärkeää, että OR-operaatio toteutuu ensin. Tämän saa aikaiseksi sulkumerkeillä (1) tai sanojen oikealla ryhmittelyllä, ns. Advanced-haku (2).

  • 1: (yhteyttäminen OR fotosynteesi) AND levät
  • 2: yhteyttäminen OR fotosynteesi
    AND
    levät

Esimerkissä 1 kaikki kirjoitetaan hakuun yhdelle riville. Hakusanat, operaattorit ja sulkumerkit pitää kirjoittaa itse.

Esimerkissä 2 on käytetty kahta hakuriviä. OR-operaattori kirjoitetaan itse hakusanojen väliin, mutta AND-operaattori valitaan valmiista valikosta. OR-operaatiota ei jaeta usealle riville, vaan samaan käsitteeseen viittavat sanat tulevat aina samalle riville.

Jos sulkuja ei ole, käy siten, että saadaan tietoa levien fotosynteesistä (tämä on ok!) sekä kaikkea mahdollista tietoa yhteyttämisestä. Tällöin hakulause “vuotaa”.

Kolme toisiaan leikkaavaa ympyrää, joista kaksi on vierekkäin ylhäällä, yksi niiden alla. Se osa, jossa alempi ympyrää leikkaa toista tai molempia ylemmistä ympyröistä, on värjätty vihreäksi. Vasemmanpuoleinen ympyrä ylhäällä on kokonaan vihreä.
yhteyttäminen OR fotosynteesi AND levät

Operaattorit eivät ole luonnollista kieltä

Vaikka operaattorit kääntyvät suomeksi: ja, tai, ei; eivät ne tarkoita täysin samaa kuin luonollisen kielen sanat. Itse asiassa luonnollisen kielen ja-sana saattaa indikoida OR-operaattorin tarvetta tiedonhaussa.

Esimerkiksi aihe ’Susien kuulo- ja hajuaisti’ purkautuu operaatioksi siten, että ’susiin’ yhdistetään AND-operaatorilla ’kuuloaisti OR hajuaisti’. Ei ole välttämätöntä, että kuulo- ja hajuaisti käsitellään samassa julkaisussa, vaan tietoja yhdistellään useammasta julkaisusta: yhdessä kerrotaan erityisesti kuulosta ja toisessa hajuaistista. Yleensä tällaisessa tilanteessa OR-operaattorilla yhdistettävillä käsitteillä on jokin yhteinen yläkäsite, kuten tässä ’aistit’.

Perusmalli tietokantahakuihin

Kaikissa tietokannoissa on mahdollista koostaa hakulause samalla tavalla käyttäen ns. Tarkennettua hakua (malli 2 ylempänä). Kukin käsite kirjoitetaan aina omalle rivilleen. Rivejä käytetään siis yhtä monta kuin haussa on käsitteitä.

OR-operaattori kirjoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori. AND on oletusarvona rivien välillä kaikissa tietokannoissa.

Hakukentät vaikuttavat löytyvyyteen

Tietokannassa yksittäinen tietue koostuu kentistä. Tiedonhaussa hakusanoja etsitään kentistä, joita tietokantaan on tallennettu.

Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.

Mitä vähemmän kenttiä on mukana haun piirissä, sen vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).

Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Vasemmalla sana: lignocellulose. Hakukenttä Title: 2 468. Hakukenttä Abstract: 8 074. Hakukenttä Subject: 10 454. Hakukenttä All fields: 56 075. Oikealla sana: single-tree. Hakukenttä Subject: 310. Hakukenttä Title: 360. Hakukenttä Abstract: 3 241. Hakukenttä All fields: 10 394.
Huomaa että asiasanakentästä hakuun vaikuttaa paljon se, onko sana virallinen asiasana vai ei. Lignocellulose on asiasana, single-tree ei ole.

Kirja- ja artikkelitietokannoissa kenttiä ovat:

  • otsikko = nimeke = title
  • tekijä = author
  • asiasanat = aihe = subject = keyword
  • julkaisutiedot

Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:

  • tiivistelmä = abstract
  • sisällysluettelo = contents
  • lähdeluettelo = references
  • kokoteksti = julkaisu kokonaisuudessaan = full text

Otsikko ja asiasanat kertovat olennaisimman

Otsikko- ja Asiasana- eli Aihekentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.

Tiivistelmä täydentää

Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.

Kokoteksti on todella laaja hakukohteena

Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.

Hakukenttien käyttö tietokannoissa

Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.

Kuvakaappaus 1: Perushaku UEF_primossa. Hakuriville kirjoitettu: uhanalaisuu*, korotettuna valintaikoni: Nimeke/Otsikko. Kuvakaappaus 2: Tarkennettu haku UEF-Primossa. Ylemällä hakurivillä sanat: luontotyyp* OR habitaat* OR elinympäristö*; korostettuna kenttävalinta Nimeke/Otsikko. Toisella hakurivillä hakusanana uhanalaisuu*; hakukenttänä Kaikki kentät. Rivien välillä AND-operaattpori.
Esimerkki hakukenttien valinnasta UEF-Primossa.

Hakulauseen kirjoitustapa hakulomakkeelle ratkaisee haun onnistumisen

Kun kirjoitat hakuun useampia sanoja, tiedätkö, mitä itse asiassa olet käsket ohjelman hakea?

  • Onko kyseessä fraasi vai and-operaatio?
  • Missä järjestyksessä operaatiot toteutuvat, toimiiko haun logiikka?
  • Tulevatko sanan taivutusmuodot mukaan automaattisesti, mikä on katkaisumerkki?
  • Mistä kentistä hakusanoja haetaan?

Perusasiat eri tietokannoissa voivat selvitä jo hakunäytön ohjeita seuraamalla. Kunkin tietokannan Help-osiosta löytyy lisää vinkkejä.

Seuraava sivu: Erilaisia hakutapoja