Sanankatkaisu

Sanat taipuvat tai esiintyvät yhdyssanojen osina. Sanoista saa muokattua erilaisia johdannaisia. Kun halutaan hakea kaikkia erilaisia sanamuotoja, on se ilmaistava hakusanan muodossa.

  • computer, computers, computerised, computerized, computation, computational …

Katkaise sana asteriskin avulla

Erilaiset sanamuodot voi hakea sanankatkaisun (truncation) avulla. Sanankatkaisu tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Katkaisumerkkinä käytetään asteriskia (tähtimerkki): comput*

Yleissääntö on, että käyttämällä sanankatkaisua saadaan lisää hakutuloksia: yhtä hakusanaa käyttämällä haetaan kerralla lukuisia erilaisia taivutusmuotoja ja muita variantteja.

Miten sanat katkaistaan

Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee vääriä osumia. Jos liian myöhään (computer*), osa jää löytymättä.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Polymeeri, 228. Polymeerit 241. Polymeerit* 250. Polymeeri* 318. Polymeer* 322. *polymeer* 361. polyme* 2 777.
Polymeeri-sanan taipumaton vartalo on polymeer, mikä on siis sopiva katkaisukohta. Lisää tuloksia tässä tapauksessa saa käyttämällä katkaisua myös sanan alussa, *polymeer*, mikä ottaa huomioon yhdyssanat, kuten biopolymeeri. Alimmalla rivillä on otettu huomioon, että suomen- ja englanninkielinen sana ovat melko lähellä toisiaan ja haettu molemmat versiot yhden sanankatkaisun avulla.

Sananvartalo on hyvä yleissääntö, mutta ei pidä paikkaansa aina, esim. jos vartalo on hyvin lyhyt, kuten sanassa työ.

Sana voidaan katkaista ainakin lopusta, mutta usein myös alusta tai keskeltä.

  • nano*tekniikka = nanotekniikka, nanobiotekniikka
  • *kromatografia* = kromatografia, kromatografian, kaasukromatografia, nestekromatogragiassa jne.

Milloin sanat pitää katkaista

Kansainväliset hakukoneet huomioivat sanojen taipumisen osittain automaatisesti. Lähes aina yksikkömuotoisena haettu sana löytää myös monikon – ja päinvastoin.

  • acid : hakee acid ja acids, ei hae acidity

Sanankatkaisua tarvitaan aina vähintään sanojen johdannaisia varten. Myös lainausmerkkien eli fraasien käyttö lisää katkaisun tarvetta.

Erilaiset sananhakuautomatiikat eivät siis aina päde, jos hakusanat on kirjoitettu lainausmerkkien sisään.

  • ”amino acid” : hakee ”amino acid”, ei hae ”amino acids”

Muita sanamuotoja hakukoneet osaavat hakea vaihtelevasti. Kemian alan oma tietokanta SciFinder hakee eri sanamuotoja hyvin joustavasti. Web of Science löytää automaattisesti verbien eri taivutusmuotoja. Finna.fi osaa hakea suomen kielen taivutusta automaattisesti. Tämä automatiikka tuottaa joskus yllättäviä tuloksia.

Katso video (kesto 6:57).
Videolla käytetään esimerkkinä UEF-Finna -hakukonetta. UEF-Finnaa ei enää ole, mutta kansallinen Finna.fi toimii kuten videolla.
Videon loppupuolella Web of Science -tietokanta (kohdasta 4:20 alkaen) on edelleen käytössä, vaikka käyttöliittymä onkin hieman erinäköinen.

Korvausmerkkejä voi käyttää katkaisun sijasta

Jos sanankatkaisu antaa liian laajan tuloksen, voi katkaisun sijaan korvata yksittäisiä merkkejä sanasta korvausmerkkien (wildcards) avulla.

Korvausmerkkejä (wildcards) voi käyttää esimerkiksi hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. Tähänkin on poikkeus fraasihaku (lainausmerkkien käyttö), joka hävittää hakusanoihin liittyvän automatiikan.

Esimerkki:

  • color : hakee sekä color että colour
  • ”wood color” : hakee ”wood color”; ei hae ”wood colour”
  • ”wood colo*r” : hakee sekä ”wood color” että ”wood colour”

Fraasia voi näissä tapauksissa hakea myös toisella tavoin OR-operaattorin avulla.

  • ”wood color” OR ”wood colour”

Korvausmerkkejä on kahdenlaisia:

1) merkki korvaa sanasta täsmälleen yhden merkin

  • organi_ation = organisation tai organization

2) merkki korvaa sanasta yhden tai nolla merkkiä

  • colo_r = color tai colour

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä. Tietokannan käyttöohjeesta (Help, Tips) korvausmerkit voi tarkistaa helposti.

Seuraava sivu: Asiasanahaku