2.5 Hakusanoista hakulausekkeiksi: operaattorit ja hakukentät
Hakusanat yhdistetään toisiinsa Boolen operaattoreilla
Operaattoreita eli Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.
Hakusanoja yhdistäviä Boolen operaattoreita on käytössä kolme: AND, OR ja NOT.
AND-operaattori yhdistää käsitteet
- AND edellyttää, että hakusanojen tulee esiintyä tietueessa yhtä aikaa. (Tietue = yhden kirjan/artikkelin jne. tiedot tietokannassa.)
- AND yhdistää hakuun eri käsitteet. Mitä enemmän eri käsitteitä eli AND-operaatioita haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi, ainakin teoriassa, on tulosjoukon koko.
OR-operaattori yhdistää vaihtoehtoiset sanat
- OR hyväksyy lopputulokseen ne tietueet, joissa on vähintään jompi kumpi hakusanoista, joskin myös ne tietueet, joissa molemmat sanat esiintyvät yhtä aikaa, ovat käypäisiä
- OR yhdistää samaa (ylä)käsitettä kuvaavat vaihtoehtoiset hakusanat. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.
Huomaa, että OR-operaattorin käyttö on turhaa silloin, kun vaihtoehtoinen sana kattaa myös tarkemman termin, joka usein on sanaliitto.
Eli esimerkiksi haussa ”defence mechanism” OR defence, riittää sana defence yksinkin löytämään myös ilmauksen defence mechanism.
NOT-operaattori sulkee pois
- NOT edellyttää, että tietty sana ei saa esiintyä tietueessa lainkaan.
- NOT-operaattoria ei käytetä hakulauseessa yhdistämään aiheeseen kuuluvia käsitteitä, vaan sen avulla tarkennetaan hakua jonkin tietyn ’apusanan’ avulla.
Not-operaatiota tarvitaan harvemmin ja sitä kannattaakin käyttää harkiten, koska se voi sulkea hakutuloksesta pois myös hyödyllisiä tietueita.
Operaattoreiden toiminta kuvana:
johtaminen AND työhyvinvointi
johtaminen OR työnjohto
lahjakkuus NOT kielellinen
Katso video (n. 2,5 min) operaattoreista:
Hakulauseessa on tavallisesti useita operaattoreita
Samaan hakulauseeseen voi yhdistää useita operaatioita. Jos hakulauseessa on yhtä aikaa AND- ja OR-operaattori, haun loogisuus pitää aina varmistaa. Haussa tavoitellaan kuvan kaltaista tilannetta.
Operaattoreiden järjestys
Olennaista on, että OR-operaatiot tapahtuvat ennen AND- ja NOT-operaatioita.
Kuitenkin lähes aina AND-operaatio suoritetaan tietokannoissa ennen OR-operaatiota kirjoitusjärjestyksestä riippumatta. OR-operaatio nostetaan ensimmäiseksi joko käyttämällä sulkumerkkejä (1) tai sanojen oikealla ryhmittelyllä Advanced-tyyppisessä haussa (2).
- 1: (johtaminen OR työnjohto) AND työhyvinvointi
- 2: johtaminen OR työnjohto
AND
työhyvinvointi
Esimerkissä 1 kaikki kirjoitetaan hakuun yhdelle riville. Hakusanat, operaattorit ja sulkumerkit pitää kirjoittaa itse.
Esimerkissä 2 on käytetty kahta hakuriviä. OR-operaattori kirjoitetaan itse hakusanojen väliin, mutta AND-operaattori valitaan valmiista valikosta. OR-operaatiota ei jaeta usealle riville, vaan samaan käsitteeseen viittavat sanat tulevat aina samalle riville.
Jos sulkuja tai ryhmittelyä ei ole, käy siten, että saadaan tietoa työnjohdon ja työhyvinvoinnin yhteydestä (tämä on ok!) sekä kaikkea mahdollista tietoa johtamisesta. Tällöin hakulause “vuotaa”.
Operaattorit eivät ole luonnollista kieltä
Vaikka operaattorit kääntyvät suomeksi: ja, tai, ei; eivät ne tarkoita täysin samaa kuin luonollisen kielen sanat. Itse asiassa luonnollisen kielen ja-sana saattaa indikoida OR-operaattorin tarvetta tiedonhaussa. Esimerkiksi aihe ’ Mielenterveyskuntoutujan voimavaratekijät ja haasteet’ purkautuu operaatioksi siten, että ’mielenterveyskuntoutujaan’ yhdistetään AND-operaaatorilla ’voimavaratekijät OR haasteet’.
- mielenterveyskuntoutujat AND voimavaratekijät OR haasteet
Ei ole välttämätöntä, että voimavaratekijät ja haasteet käsitellään samassa julkaisussa, vaan tietoja yhdistellään useammasta julkaisusta: yhdessä kerrotaan erityisesti haasteista ja toisessa voimavaroista. Yleensä tällaisessa tilanteessa OR-operaattorilla yhdistettävillä käsitteillä on jokin yhteinen yläkäsite, kuten tässä ’jaksamiseen vaikuttavat tekijät’.
Perusmalli tietokantahakuihin
Kaikissa tietokannoissa on mahdollista koostaa hakulause samalla tavalla käyttäen ns. Tarkennettua hakua (malli 2 ylempänä). Kukin käsite kirjoitetaan aina omalle rivilleen. Rivejä käytetään siis yhtä monta kuin haussa on käsitteitä.
OR-operaattori kirjoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori. AND on oletusarvona rivien välillä kaikissa tietokannoissa.
Hakukentät vaikuttavat löytyvyyteen
Tietokannassa yksittäinen tietue koostuu kentistä. Tiedonhaussa hakusanoja etsitään kentistä, joita tietokantaan on tallennettu.
Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.
Mitä vähemmän kenttiä on mukana haun piirissä, sen vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).
Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.
Kirja- ja artikkelitietokannoissa kenttiä ovat:
- otsikko = nimeke = title
- tekijä = author
- asiasanat = aihe = subject = keyword
- julkaisutiedot
Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:
- tiivistelmä = abstract
- sisällysluettelo = contents
- lähdeluettelo = references
- kokoteksti = julkaisu kokonaisuudessaan = full text
Otsikko ja asiasanat kertovat olennaisimman
Otsikko- ja Asiasana- eli Aihekentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.
Tiivistelmä täydentää
Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.
Kokoteksti on todella laaja hakukohteena
Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.
Hakukenttien käyttö tietokannoissa
Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.
Hakulauseen kirjoitustapa hakulomakkeelle ratkaisee haun onnistumisen
Kun kirjoitat hakuun useampia sanoja, tiedätkö, mitä itse asiassa olet käsket ohjelman hakea?
- Onko kyseessä fraasi vai and-operaatio?
- Missä järjestyksessä operaatiot toteutuvat, toimiiko haun logiikka?
- Tulevatko sanan taivutusmuodot mukaan automaattisesti, mikä on katkaisumerkki?
- Mistä kentistä hakusanoja haetaan?
Perusasiat eri tietokannoissa voivat selvitä jo hakunäytön ohjeita seuraamalla. Kunkin tietokannan Help-osiosta löytyy lisää vinkkejä.
Seuraava sivu: Erilaisia hakutapoja