Sanankatkaisu

Sanat taipuvat tai esiintyvät yhdyssanojen osina. Sanoista saa muokattua erilaisia johdannaisia. Kun halutaan hakea kaikkia erilaisia sanamuotoja, on se ilmaistava hakusanan muodossa.

  • computer, computers, computerised, computerized, computation, computational …

Katkaise sana asteriskin avulla

Erilaiset sanamuodot voi hakea sanankatkaisun (truncation) avulla. Sanankatkaisu tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Katkaisumerkkinä käytetään asteriskia (tähtimerkki): comput*

Yleissääntö on, että käyttämällä sanankatkaisua saadaan lisää hakutuloksia. Yhtä hakusanaa käyttämällä haetaan kerralla lukuisia erilaisia taivutusmuotoja ja muita variantteja.

Miten sanat katkaistaan

Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee vääriä osumia. Jos liian myöhään (computer*), osa jää löytymättä.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Hiilinanoputki: 4. Hiilinanoputket: 10. Hiilinanoputket*: 10. Hiilinanoputki*: 13. Hiilinanoputk*: 17. Viimeinen rivi korostettu.
Sopiva katkaisukohta hiilinanoputki-sanalle on hiilinanoputk*.

Sananvartalo on hyvä yleissääntö, mutta ei pidä paikkaansa aina, esim. jos vartalo on hyvin lyhyt, kuten sanassa työ.

Sana voidaan katkaista ainakin lopusta, mutta usein myös alusta tai keskeltä.

Esimerkkejä:

  • kvantti*teoria = kvanttiteoria, kvanttikenttäteoria
  • *tomografia* = tomografia, tomografian, infrapunatomografiassa jne.

Milloin sanat pitää katkaista

Kansainväliset hakukoneet huomioivat sanojen taipumisen osittain automaatisesti. Lähes aina yksikkömuotoisena haettu sana löytää myös monikon – ja päinvastoin.

  • photon: hakee photon ja photons, ei hae photonic

Sanankatkaisua tarvitaan aina vähintään sanojen johdannaisia varten. Myös lainausmerkkien eli fraasien käyttö lisää katkaisun tarvetta.

Erilaiset sananhakuautomatiikat eivät siis aina päde, jos hakusana on kirjoitettu lainausmerkkien sisään (fraasihaku).

  • ”black hole”: hakee ”black hole”, ei hae ”black holes”

Muita sanamuotoja hakukoneet osaavat hakea vaihtelevasti. Web of Science löytää automaattisesti verbien eri taivutusmuotoja. Finna.fi osaa hakea suomen kielen taivutusta automaattisesti. Tämä automatiikka tuottaa joskus yllättäviä tuloksia. Katso video (kesto 6:57); kannattaa suurentaa koko ruudun kokoiseksi alalaidasta.

Videossa käytetään esimerkkinä UEF-Finna -hakukonetta. UEF-Finnaa ei enää ole, mutta kansallinen Finna.fi toimii kuten videolla. Videon loppupuolella Web of Science -tietokanta toimii myöskin samoin kuin videolla, vaikka käyttöliittymä onkin hieman erinäköinen.

Korvausmerkkejä voi käyttää katkaisun sijasta

Jos sanankatkaisu antaa liian laajan tuloksen, voi katkaisun sijaan korvata yksittäisiä merkkejä sanasta korvausmerkkien (wildcards) avulla.

Korvausmerkkejä (wildcards) voi käyttää esimerkiksi hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. Tähänkin on poikkeus fraasihaku (lainausmerkkien käyttö), joka hävittää hakusanoihin liittyvän automatiikan.

  • color: hakee sekä color että colour
  • ”wood color”: hakee ”wood color”; ei hae ”wood colour”
  • ”wood colo*r”: hakee sekä ”wood color” että ”wood colour”

Fraasia voi näissä tapauksissa hakea myös toisella tavoin OR-operaattorin avulla.

  • ”wood color” OR ”wood colour”

Korvausmerkkejä on kahdenlaisia

1) merkki korvaa sanasta täsmälleen yhden merkin

  • organi_ation

2) merkki korvaa sanasta yhden tai nolla merkkiä

  • colo_r = color tai colour

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä. Tietokannan käyttöohjeesta (Help, Tips) korvausmerkit voi tarkistaa helposti.

Seuraava sivu: Asiasanahaku