2.3 Sanankatkaisu, korvausmerkit ja sanaliitot

Sanankatkaisu

Sanat taipuvat, tai esiintyvät yhdyssanojen alkuosina. Taivutusmuodot ovat tärkeitä erityisesti suomen kielessä.

Muissakin kielissä esimerkiksi yksikkö ja monikko erottuvat toisistaan. Kaikissa kielissä löytyy sanojen johdannaisia. Esim.

book, bookable, booking, bookbinding, bookcase, bookkeeper, bookkeeping, booklet, bookmaking, bookmark, bookshelf, bookstore…

computer, computers, computerised, computerized, computation, computational …

Kun halutaan hakea erilaisia taivutusmuotoja, on se ilmaistava hakusanan muodossa.
Tämä tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Katkaisumerkillä saadaan kaikki taivutusmuodot ja mahdolliset yhdyssanat mukaan hakuun. Yleisimmin sana voidaan katkaista ainakin lopusta, mutta joskus myös alusta tai keskeltä.

Katkaisumerkkinä käytetään yleisimmin tähteä (asterisk): *

Katkaistaan siis: comput*

Huom. Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee vääriä osumia. Jos liian myöhään (computer*), osa jää löytymättä.
Sananvartalo on hyvä yleissääntö, mutta ei pidä paikkaansa aina, esim. jos vartalo on hyvin lyhyt. Haun kannalta ongelmallisesti taipuu esim. sana  lapset -> lasten.

 

Korvausmerkit (wildcards)

Korvausmerkkejä tarvitaan useimmiten hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Korvausmerkkejä on kahdenlaisia:
1) merkki korvaa sanasta täsmälleen yhden merkin

organi_ation

2) merkki korvaa sanasta yhden tai nolla merkkiä

favo_rite = favorite tai favourite

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita.

 

Sanaliitot eli fraasit

Sanaliitto on sanapari tai -ryhmä, jonka merkitysseikat sitovat yhteen.

Esimerkki:  Sanaliitto vs. yksittäiset sanat:

Seuraavassa on haettu sanaliitolla ”special education”. Ne ovat yhdessä, peräkkäin, annetussa järjestyksessä, ja muodostavat käsitteen.

Seuraavassa on haettu sanoilla special ja education. Haku löytää kaikki viitteet, joissa molemmat sanat esiintyvät, yhdessä tai erikseen. Kaikki eivät välttämättä ole siitä aiheesta, josta oli tarkoitus.

Jotta fraasin eli sanaliiton sanat pysyisivät yhdessä ja peräkkäin, halutussa järjestyksessä, joissakin hakujärjestelmissä on käytettävä tiettyjä hakuominaisuuksia. Muutamat kansainväliset tietokannat kuitenkin ymmärtävät fraasit automaattisesti, mutta usein ei ole näin.
Yleisimmin käytetään lainausmerkkejä ”” pakottamaan sanat yhteen, esim. ”julkinen talous”, ”kestävä kehitys”,  ”Baby Shower”.  Myös Google ymmärtää niitä.

Fraasien käytössä sattuu virheitä eri hakujärjestelmissä.

Tässä oikeita malleja:

Tässä haetaan UEF-Finnasta kirjaston kokoelmasta viitteitä, joiden nimessä esiintyy fraasi ”special education”.

Tässä haetaan UEF-Finnasta kirjastoon tilatuista kansainvälisistä e-aineistoista viitteitä, joiden nimessä esiintyy fraasi ”special education”. Lainausmerkkien sijaan valikosta on otettu käyttöön kohta ”on täsmälleen”.

Tässä haetaan fraasilla ERIC-tietokannasta.