2.5 Hakusanoista hakulausekkeiksi
Hakusanat ja niitä yhdistävät operaattorit muodostavat hakulauseen. Operaattoreita eli Boolen logiikkaa käytetään kaikissa tietokannoissa, joten sen osaaminen on yksi tiedonhaun perustaidoista.
Hakusanoja yhdistäviä Boolen operaattoreita on käytössä kolme: AND, OR ja NOT.
AND-operaattori yhdistää käsitteet
AND-operaattori edellyttää, että hakusanojen tulee esiintyä tietueessa yhtä aikaa. (Tietue = yhden kirjan/artikkelin jne. tiedot tietokannassa.)
AND-operaattorilla yhdistetään hakuun eri käsitteet. Mitä enemmän eri rajaavia käsitteittä haussa käytetään, sen tarkempaa hakua ollaan tekemässä ja sitä pienempi (ainakin teoriassa) on tulosjoukon koko.
OR-operaattori yhdistää vaihtoehtoiset sanat
OR-operaattori hyväksyy lopputulokseen ne tietueet, joissa on vähintään jompikumpi hakusanoista.
Myös ne tietueet, joissa molemmat sanat esiintyvät yhtä aikaa, tulevat mukaan.
OR-operaattorilla yhdistetään samaa (ylä)käsitettä kuvaavat vaihtoehtoiset hakusanat. Mitä useampia vaihtoehtoisia ilmaisumuotoja otetaan mukaan, sen laajempi on haun tulos.
Huomaa, että OR-operaattorin käyttö on turhaa silloin, kun vaihtoehtoinen sana kattaa myös tarkemman termin, joka usein on sanaliitto.
- Esimerkiksi haussa ”defence mechanism” OR defence, riittää sana defence yksinkin löytämään myös ilmauksen defence mechanism.
NOT-operaattori sulkee pois
NOT-operaatiossa edellytetään, että tietty sana ei saa esiintyä tietueessa lainkaan.
NOT-operaattoria ei käytetä hakulauseessa yhdistämään aiheeseen kuuluvia käsitteitä, vaan sen avulla tarkennetaan hakua jonkin tietyn ’apusanan’ avulla.
Not-operaatiota tarvitaan harvemmin ja sitä kannattaakin käyttää harkiten, koska se voi sulkea hakutuloksesta pois myös hyödyllisiä tietueita.
Operaattoreiden toiminta kuvana:
levät AND yhteyttäminen
yhteyttäminen OR fotosynteesi
yhteyttäminen NOT levät
Katso video (n. 2,5 min) operaattoreista:
Hakulauseessa on tavallisesti useita operaattoreita
Samaan hakulauseeseen voi yhdistää useita operaatioita. Jos hakulauseessa on yhtä aikaa AND- ja OR-operaattori, haun loogisuus pitää aina varmistaa. Haussa tavoitellaan kuvan kaltaista tilannetta.
Operaattoreiden järjestys
Useimmiten AND-operaatio suoritetaan hakukoneissa ennen OR-operaatiota kirjoitusjärjestyksestä riippumatta. Haussa, jossa on sekä AND- että OR-operaatio, on kuitenkin hakutuloksen loogisuuden kannalta tärkeää, että OR-operaatio toteutuu ensin. Tämän saa aikaiseksi sulkumerkeillä (1) tai sanojen oikealla ryhmittelyllä, ns. Advanced-haku (2).
- 1: (yhteyttäminen OR fotosynteesi) AND levät
- 2: yhteyttäminen OR fotosynteesi
AND
levät
Esimerkissä 1 kaikki kirjoitetaan hakuun yhdelle riville. Hakusanat, operaattorit ja sulkumerkit pitää kirjoittaa itse.
Esimerkissä 2 on käytetty kahta hakuriviä. OR-operaattori kirjoitetaan itse hakusanojen väliin, mutta AND-operaattori valitaan valmiista valikosta. OR-operaatiota ei jaeta usealle riville, vaan samaan käsitteeseen viittavat sanat tulevat aina samalle riville.
Jos sulkuja ei ole, käy siten, että saadaan tietoa levien fotosynteesistä (tämä on ok!) sekä kaikkea mahdollista tietoa yhteyttämisestä. Tällöin hakulause “vuotaa”.
Operaattorit eivät ole luonnollista kieltä
Vaikka operaattorit kääntyvät suomeksi: ja, tai, ei; eivät ne tarkoita täysin samaa kuin luonollisen kielen sanat. Itse asiassa luonnollisen kielen ja-sana saattaa indikoida OR-operaattorin tarvetta tiedonhaussa.
Esimerkiksi aihe ’Susien kuulo- ja hajuaisti’ purkautuu operaatioksi siten, että ’susiin’ yhdistetään AND-operaatorilla ’kuuloaisti OR hajuaisti’. Ei ole välttämätöntä, että kuulo- ja hajuaisti käsitellään samassa julkaisussa, vaan tietoja yhdistellään useammasta julkaisusta: yhdessä kerrotaan erityisesti kuulosta ja toisessa hajuaistista. Yleensä tällaisessa tilanteessa OR-operaattorilla yhdistettävillä käsitteillä on jokin yhteinen yläkäsite, kuten tässä ’aistit’.
Perusmalli tietokantahakuihin
Kaikissa tietokannoissa on mahdollista koostaa hakulause samalla tavalla käyttäen ns. Tarkennettua hakua (malli 2 ylempänä). Kukin käsite kirjoitetaan aina omalle rivilleen. Rivejä käytetään siis yhtä monta kuin haussa on käsitteitä.
OR-operaattori kirjoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori. AND on oletusarvona rivien välillä kaikissa tietokannoissa.
Hakukentät vaikuttavat löytyvyyteen
Tietokannassa yksittäinen tietue koostuu kentistä. Tiedonhaussa hakusanoja etsitään kentistä, joita tietokantaan on tallennettu.
Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.
Mitä vähemmän kenttiä on mukana haun piirissä, sen vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).
Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.
Kirja- ja artikkelitietokannoissa kenttiä ovat:
- otsikko = nimeke = title
- tekijä = author
- asiasanat = aihe = subject = keyword
- julkaisutiedot
Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:
- tiivistelmä = abstract
- sisällysluettelo = contents
- lähdeluettelo = references
- kokoteksti = julkaisu kokonaisuudessaan = full text
Otsikko ja asiasanat kertovat olennaisimman
Otsikko- ja Asiasana- eli Aihekentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.
Tiivistelmä täydentää
Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.
Kokoteksti on todella laaja hakukohteena
Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.
Hakukenttien käyttö tietokannoissa
Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.
Hakulauseen kirjoitustapa hakulomakkeelle ratkaisee haun onnistumisen
Kun kirjoitat hakuun useampia sanoja, tiedätkö, mitä itse asiassa olet käsket ohjelman hakea?
- Onko kyseessä fraasi vai and-operaatio?
- Missä järjestyksessä operaatiot toteutuvat, toimiiko haun logiikka?
- Tulevatko sanan taivutusmuodot mukaan automaattisesti, mikä on katkaisumerkki?
- Mistä kentistä hakusanoja haetaan?
Perusasiat eri tietokannoissa voivat selvitä jo hakunäytön ohjeita seuraamalla. Kunkin tietokannan Help-osiosta löytyy lisää vinkkejä.
Seuraava sivu: Erilaisia hakutapoja