Sanankatkaisu

Hakusanat: Sanankatkaisu

Sanat taipuvat tai esiintyvät yhdyssanojen osina. Sanoista saa muokattua erilaisia johdannaisia.

Esimerkiksi: computer, computers, computerised, computerized, computation, computational …

Kun halutaan hakea kaikkia erilaisia taivutusmuotoja, on se ilmaistava hakusanan muodossa. Tämä tehdään käyttämällä sanankatkaisua.

Katkaisumerkki

Sanankatkaisu tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Katkaisumerkkinä käytetään asteriskia (tähtimerkki): *

Katkaistaan siis: comput*

Yleissääntö on, että käyttämällä sanankatkaisua saadaan lisää hakutuloksia. Yhtä hakusanaa käyttämällä haetaan kerralla lukuisia erilaisia taivutusmuotoja ja muita variantteja.

Miten sanat katkaistaan

Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee myös vääriä osumia.
Jos katkaisee liian myöhään (computer*), osa jää löytymättä.

Tekstiä sekä tulosmääriä symboloivat kirjapinokuvat. Hakusanat ja niiden tulosmäärät allekkain. Hakkuutähde: 53. Hakuutähde* 62. Hakkuutähteet 69. Hakkuutähteet* 69. Hakkuutäht* 88. Hakkuutäh* 96. Viimeinen rivi korostettu.
Kuvassa on esitetty, kuinka katkaisukohdan valinta vaikuttaa tulosmääriin.

Sananvartalo on hyvä yleissääntö katkaisukohdaksi, mutta ei pidä paikkaansa aina, esimerkiksi jos vartalo on hyvin lyhyt, kuten sanassa työ.

Sana voidaan katkaista ainakin lopusta, mutta usein myös alusta tai keskeltä.

Esimerkkejä:
*koivu = koivu, hieskoivu, rauduskoivu
*koivu* = koivu, koivun, rauduskoivun jne.
vesi*alueet = vesialueet, vesistöalueet

Käytäntö tietokannoissa

Kansainväliset hakukoneet huomioivat sanojen taipumisen osittain automaatisesti. Lähes aina yksikkömuotoisena haettu sana löytää myös monikon – ja päinvastoin. Poikkeus tästä on CAB Abstracts -tietokanta, jossa sana kannattaa aina katkaista.

forest: hakee forest ja forests, ei hae forestry

Huomaa, että erilaiset sananhakuautomatiikat eivät yleensä päde, jos hakusana on kirjoitettu lainausmerkkien sisään (fraasihaku).

”old forest”: hakee ”old forest”, ei hae ”old forests”

Muita sanamuotoja hakukoneet osaavat hakea vaihtelevasti. Web of Science löytää automaattisesti verbien eri taivutusmuotoja. Finna.fi osaa hakea suomen kielen taivutusta automaattisesti. Tämä automatiikka tuottaa joskus yllättäviä tuloksia. Katso video (kesto 6:57); kannattaa suurentaa koko ruudun kokoiseksi alalaidasta!

Videossa käytetään esimerkkinä UEF-Finna -hakukonetta. UEF-Finnaa ei enää ole, mutta kansallinen Finna.fi toimii kuten videolla. Videon loppupuolella Web of Science -tietokanta toimii kuten ennenkin, vaikka käyttöliittymä on hieman erinäköinen.

UEF-Primo ei osaa taivuttaa suomen kieltä. Siksi UEF-Primossa pitää aina muistaa käyttää sanakatkaisua.

Korvausmerkit

Korvausmerkkejä (wildcards) tarvitaan useimmiten hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Korvausmerkkejä on kahdenlaisia:
1) merkki korvaa sanasta täsmälleen yhden merkin

organi_ation = organisation, organization

2) merkki korvaa sanasta yhden tai nolla merkkiä

favo_rite = favorite tai favourite

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä. Tietokannan käyttöohjeesta (Help, Tips) korvausmerkit voi tarkistaa helposti.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. Tähän on poikkeus fraasihaku (lainausmerkkien käyttö), joka hävittää hakusanoihin liittyvän automatiikan.

color: hakee sekä color että colour

”wood color”: hakee ”wood color”; ei hae ”wood colour”

”wood colo*r”: hakee sekä ”wood color” että ”wood colour”

Fraasia voi näissä tapauksissa hakea myös toisella tavoin OR-operaattorin avulla.

”wood color” OR ”wood colour”