Sanankatkaisu

Sanankatkaisu

Sanat taipuvat tai esiintyvät yhdyssanojen alkuosina. Sanoista saa muokattua erilaisia johdannaisia. Esim.

computer, computers, computerised, computerized, computation, computational …

Kun halutaan hakea erilaisia taivutusmuotoja, on se ilmaistava hakusanan muodossa.
Tämä tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Yleisimmin sana voidaan katkaista ainakin lopusta, mutta joskus myös alusta tai keskeltä.

Katkaisumerkkinä käytetään asteriskia (tähtimerkki): *

katkaisuKatkaistaan siis: comput*

Huom. Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee vääriä osumia. Jos liian myöhään (computer*), osa jää löytymättä.
Sananvartalo on hyvä yleissääntö, mutta ei pidä paikkaansa aina, esim. jos vartalo on hyvin lyhyt.

HUOM! Osa kansainvälisistä hakukoneista huomioi sanojen taipumisen automaatisesti. Tämä automatiikka tuottaa joskus yllättäviä tuloksia. Sanankatkaisulla on silti merkitystä tiedonhaussa edelleenkin, erityisesti on huomioit5a suomen kielen taipuminen haettaessa UEF-Primosta.
Usein sanankatkaisun avulla laajentaan hakutulostatulosta, joissakin tilanteissa sitä voi käyttää tarkentavana keinona. Katso video (noin 7 minuuttia), kannattaa suurentaa koko ruudun kokoiseksi alalaidasta!

Videossa käytetään esimerkkinä UEF-Finna -hakukonetta. UEF-Finnaa ei enää ole, mutta kansallinen Finna.fi toimii kuten videolla. Videon loppupuolella esiintyvä Web of Science -tietokanta toimii edellen samoin.

Korvausmerkit (wildcards)

Korvausmerkkejä tarvitaan useimmiten hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Korvausmerkkejä on kahdenlaisia:
1) merkki korvaa sanasta täsmälleen yhden merkin

organi_ation

2) merkki korvaa sanasta yhden tai nolla merkkiä

favo_rite = favorite tai favourite

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. UEF-Primossa tätä automatiikkaa ei ole, joten siellä voi käyttää katkaisumerkkiä *.

wom*n = woman, women
colo*r = color, colour