Hakulauseen kirjoittaminen

Kun hakulause eli hakusanat ja niitä yhdistävät operaattorit on mietitty, pitää hakulause sovittaa kuhunkin tietokantaan sopivaksi. Hakulauseen viimeistelee hakukenttien valinta: mistä tietueen osista hakusanoja haetaan.

Hakulogiikka tietokantojen käyttöliittymissä

Käyttöliittymiä eli hakulomakkeita on tietokannoissa useampia, ja niiden nimitykset ja tarkemmat toimintatavat ovat tietokantakohtaisia. Perusidea on kuitenkin lähes kaikissa samanlainen.

  • SciFinder-tietokanta, joka on tärkein hakukone kemian alalla, toimii eri tavoin kuin muut tietokannat! Siksi alla olevat periaatteet eivät sellaisenaan sovellu siihen. Katso tarkemmat ohjeet SciFinderin käytöstä luvusta Artikkelien haku.

Tärkeitä seikkoja hakulogiikan kannalta:

  • hakulogiikka pitää osua kohdilleen: OR-operaatiot pitää suorittaa ensin
  • hakusanat pitää sijoittaa hakulomakkeelle siten, että em. sääntö toteutuu

Pika- eli perushaku ei aina ole helpoin

Tutuin versio on pikahakuun viittaava “yhden rivin” hakulomake. Se muistuttaa ulkoisesti Google-hakua, mutta on kuitenkin erilainen!

Pikahaku haku sopii kokeilevaan tiedonhakuun yhdellä tai kahdella sanalla. Monimuotoisempiakin hakuja voi tehdä, mutta se vaatii huolellisuutta. Älä käytä luonnollista kieltä, vaan yksittäisiä termejä, jotka yhdistetään operaattorein.

Jotta OR-operaatio toeutuisi ensin, pitää se kertoa hakujärjestelmälle sijoittamalla OR-operaatio sulkujen sisään. Operaattorit ja sulut OR-operaation ympärille pitää kirjoittaa itse. Muista myös katkaisumerkin käyttö sekä fraasin ympärille lainausmerkit.

Kuvakaappaus. Hakuriville on kirjoitettu hakulause: (pollut* OR contamin*) AND "wood preservation" AND chemicals. OR-operaation ympärillä on sulut. Fraasi on lainausmerkeissä.
Esimerkki pikahausta.

Jos sanojen väliin ei kirjoita operaattoria tai käytä lainausmerkkejä, on kyseessä automaattisesti AND-operaatio.

  • ”wood preservation” ≠ wood preservation
  • wood preservation = wood AND preservation

Myös SciFinder-tietokannan perushaku toimii samaan tapaan.

Tarkennettu haku ohjaa kirjoittamaan haun oikein

Vaikka tarkennetun haun hakulomake saattaa näyttää työläämmältä, se on itse asiassa näppärä apuväline.

Ohjaaville/tarkentaville hakulomakkeille on helpompi muodostaa loogisia hakuja, jos hakulause sisältää muitakin kuin AND-operaatioita. Operaattoreita ja hakukenttiä on helppo valita valmiista valikoista.

Ohjaavillakin lomakkeilla voi sattua logiikkavirheitä. Varminta on kirjoittaa samaan käsitteeseen viittaavat vaihtoehtoiset sanat (OR-operaatiot) aina samalle riville. Sanojen väliin kirjoitetaan itse OR-sana. Rivien välillä on AND-operaattori.

Kuvakaappaus hakulomakkeesta. Ylimmällä rivillä lukee hakusana: chemicals. Seuraavalla rivillä lukee hakusanat: pollut* OR contamin*. Sitä seuraavalla hakurivillä lukee: ”wood preservation”, joka on kirjoitettu lainausmerkkien sisään. Rivien välillä on valittuna operaattori AND.
Esimerkki tarkennetusta hausta.

SciFinder-tietokannassa Tarkennetu (Advanced) haku toimii osittain samoin: eri käsitteet voi laittaa eri riveille. Suuri ero on se, että OR-operaatiota ei voi kirjoittaa rivin sisälle, vaan se kirjoitetaan rivien välille. Tarkennettua hakua tarvitaan SciFinderissä lähinnä siihen, että sen avulla voi kohdistaa hakusanoja tiettyihin kenttiin.

Kuvakaappaus hakulomakkeesta. Ylimmällä rivillä lukee hakusana: "wood preservation", joka on kirjoitettu lainausmerkkien sisään. . Seuraavalla rivillä lukee hakusanat: pollut*, sitä seuraavalla contamin*. Alimmalla hakurivillä lukee: chemicals. Rivien välillä on valittuna operaattori AND, paitsi pollut* ja contamin* rivien välillä on OR.
SciFinder-tietokannan tarkennettu haku.

Yhteinen malli sopii lähes kaikkiin tietokantoihin

Perusidea on siis aina sama palvelusta riippumatta (poislukien Scifinder).Kukin käsite kirjoitetaan omalle rivilleen, rivejä tarvitaan yhtä monta kuin haussa on käsitteitä. OR-operaattori sijoitetaan saman käsitteen eri vaihtoehtoisten ilmaisujen välille. Rivien välillä säilyy AND-operaattori.

Yleinen kuva tarkennetun haun mallista. Ylimmällä rivillä lukee: air OR atmospheric OR hygroscopic. Perässä selitys: 1. käsite. Toisella rivillä lukee: moisture OR humidity. Perässä selitys: 2. käsite. Kolmannella rivillä ei hakusanoja, mutta OR kirjoitettu osoittamaan tapaa esittää mahdollisten sanojen yhdistäminen. Perässä selite: n. käsite.

Hakukentät auttavat tuloksen kohdentamisessa

Tietokannassa julkaisua kuvaava yksittäinen tietue koostuu kentistä. Hakusanoja voi haussa kohdistaa erilaisiin kenttiin ja tällä on vaikutusta sekä tuloksen määrään että aiheenmukaisuuteen.

Mitä vähemmän kenttiä on mukana haun piirissä, sitä vähemmän tulee tuloksia. Laajin tulos tulee silloin, kun mitään erityista kenttää ei valita, vaan sanan voi löytyä mistä tahansa kentästä (kaikki kentät, all fields).

Myös itse kentän ominaisuuksilla on vaikutusta tulosten määrään. Tyypillisesti asiasanat ja otsikko sisältävät vähemmän tekstiä, jolloin myös hakuosuman todennäköisyys on pienempi. Tällä on kuitenkin kääntäen positiivinen vaikutus tuloksen tarkkuuteen.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Vasemmalla sana: lignocellulose. Hakukenttä Title: 2 468. Hakukenttä Abstract: 8 074. Hakukenttä Subject: 10 454. Hakukenttä All fields: 56 075. Oikealla sana: ”side stream”. Hakukenttä Title: 459. Hakukenttä Subject: 699. Hakukenttä Abstract: 2 058. Hakukenttä All fields: 6 822.
Huomaa että asiasanakentästä hakuun vaikuttaa paljon se, onko sana virallinen sanaston mukainen asiasana vai ei. ’Lignocellulose ’on virallinen asiasana, ”side stream” ei ole. Tässä esimerkissä Subject-kenttä on sisältänyt muitakin aihetta kuvaavia sanoja kuin asiasanastojen sanat. Tällaisia ovat esimerkiksi kirjoittajan itsensä julkaisulle antamat avainsanat.

Kirja- ja artikkelitietokannoissa kenttiä ovat:

  • otsikko = nimeke = title
  • tekijä = author
  • asiasanat = aihe = subject = keyword = concept
  • julkaisutiedot

Lisäksi tietokannasta rippuen on tallennettu esimerkiksi seuraavia kenttiä:

  • tiivistelmä = abstract
  • sisällysluettelo = contents
  • lähdeluettelo = references
  • kokoteksti = julkaisu kokonaisuudessaan = full text

Otsikko ja asiasanat kertovat olennaisimman

Otsikko- ja Asiasanakentistä hakeminen aiheenmukaisessa haussa antaa kaikista tarkimman tuloksen. Kumpikin kenttä sisältää sanoja, jotka ovat keskeisiä myös julkaisun sisällössä. Hakusanojen kohdistaminen näihin kenttiin on erityisen hyödyllistä silloin, kun haussa muutoin tulee paljon ja/tai epätarkkoja tuloksia.

Tiivistelmä täydentää

Tiivistelmässä esiintyvä sana voi olla keskeinen koko sisällön kannalta tai sitten ei – paljon riippuu hakuaiheesta. Tällöin useampien hakusanojen käyttö auttaa tarkentamaan aihetta.

Kokoteksti on todella laaja hakukohteena

Kokotekstistä tai julkaisun kaikista tiedoista hakeminen on tarpeellista ainakin silloin, kun hakuaihe (ja -termi) on hyvin harvinainen.

Hakukenttien käyttö tietokannoissa

Hakukentän pääsee valitsemaan ainakin tarkennetussa haussa (Advanced search), joskus myös perushaussa.

UEF-Primon Perushakuun on kirjoitettu hakusana cataly*. Hakurivin alla on alasvetovalikko, josta Kaikki kentät valinnan sijaan voi valita jonkin muun kentän kohteeksi.
Toisessa kuvassa Tarkennettuun hakuun on kirjoitettu ensimmäiselle riville hakusanaksi cataly*. Hakurivin edestä on valittu haun kohteeksi Nimeke/Otsikko. Toisella rivillä on hakusana: oxidation. Haun kohde on Kaikki kentät. Rivit on yhdistetty toisiinsa AND-operaattorilla.
UEF-Primossa on mahdollista valita kenttä jo perushaussa (vasemmalla) ja rivikohtaisesti tarkennnetussa haussa (oikealla).

Seuraava sivu: Hakutapoja