2.4 Sanankatkaisu, korvausmerkit ja sanaliitot

Sanankatkaisu

 

Sanat taipuvat tai esiintyvät yhdyssanojen osina. Sanoista saa muokattua erilaisia johdannaisia.

Esimerkiksi: computer, computers, computerised, computerized, computation, computational …

Kun halutaan hakea kaikkia erilaisia taivutusmuotoja, on se ilmaistava hakusanan muodossa. Tämä tehdään käyttämällä sanankatkaisua.

Katkaisumerkki

Sanankatkaisu tapahtuu käyttämällä hakusanana sanan taipumatonta vartaloa, johon liitetään katkaisumerkki (truncation mark).

Katkaisumerkkinä käytetään asteriskia (tähtimerkki): *

Katkaistaan siis: comput*

Yleissääntö on, että käyttämällä sanankatkaisua saadaan lisää hakutuloksia. Yhtä hakusanaa käyttämällä haetaan kerralla lukuisia erilaisia taivutusmuotoja ja muita variantteja.

Miten sanat katkaistaan

Katkaisukohdan kanssa pitää olla tarkkana. Jos katkaisee liian aikaisin (comp*), tulee myös vääriä osumia. Jos katkaisee liian myöhään (computer*), osa jää löytymättä.

Sananvartalo on hyvä yleissääntö, mutta ei pidä paikkaansa aina, esim. jos vartalo on hyvin lyhyt, kuten sanassa työ. Haun kannalta ongelmallisesti taipuu myös esim. sana  lapset -> lasten.

Sana voidaan katkaista ainakin lopusta, mutta usein myös alusta tai keskeltä.

Esimerkkejä:
*koivu = koivu, hieskoivu, rauduskoivu
*koivu* = koivu, koivun, rauduskoivun jne.
vesi*alueet = vesialueet, vesistöalueet

Korvausmerkit (wildcards)

Korvausmerkkejä tarvitaan useimmiten hakusanoissa, joiden kirjoitusasu vaihtelee, esim. brittiläinen englanti vs. amerikanenglanti: organisation – organization. Ongelmallisen merkin kohdalle hakusanaan voi sijoittaa korvausmerkin.

Korvausmerkkejä on kahdenlaisia:
1) merkki korvaa sanasta täsmälleen yhden merkin

rgani_ation

2) merkki korvaa sanasta yhden tai nolla merkkiä

favo_rite = favorite tai favourite

Korvausmerkkien symbolit vaihtelevat tietokannasta toiseen, eikä niitä aivan kaikkialla ole edes käytössä.

Monet kansainväliset tietokannat ottavat tällaiset kirjoitusmuotovariantit huomioon automaattisesti, eikä korvausmerkkiä tarvita. Lähes aina yksikkömuotoisena haettu sana löytää myös monikon – ja päinvastoin.

UEF-Primo ei osaa taivuttaa suomen kieltä. Siksi UEF-Primossa pitää aina muistaa käyttää sanakatkaisua.

Huomaa, että erilaiset sananhakuautomatiikat eivät yleensä päde, jos hakusana on kirjoitettu lainausmerkkien sisään (fraasihaku).

”old forest”: hakee ”old forest”, ei hae ”old forests”

Sanaliitot eli fraasit

Sanaliitto on sanapari tai -ryhmä, jonka merkitysseikat sitovat yhteen.

Jotta sanaliiton eli fraasin (phrase) sanat pysyisivät haussa peräkkäin ja halutussa järjestyksessä, pitää tämä ilmaista hakukoneelle erikseen.

Fraasin merkitys tiedonhaussa on se, että fraasin avulla hakua saadaan aiheeltaan tarkemmaksi. Samalla myös hakutulosten määrä pienenee.

Fraasin merkkinä tiedonhaussa käytetään lainausmerkkejä  ”   ”

”forest soil”

Ilman lainausmerkkejä kahden sanan välillä on AND-operaattori, vaikka sitä ei näkyville kirjoittaisikaan (lisää operaattoreista kerrotaan seuraavassa luvussa).

Ilman fraasia hakusanat voivat esiintyä missä tahansa tekstin joukossa: eri kentissä tai lähellä tai kaukana toisistaan.

Kaksi tekstinpätkää, joissa korostettuna sanat forest ja soil. Ensimmäisessä tekstissä: further decline of forest and soil. Toisessa tekstissä: continuously measured in a temperate forest soil.
Sanaliitto vs. yksittäiset sanat. Sanaliitolla on yksi, tietty merkitys, yksittäiset sanat edustavat erillisiä käsitteitä.

 

Katso video (n. 3min). Videolla esiintyy hakukone UEF-Finna, jota ei enää ole olemassa. Haun periaate kuitenkin pätee edelleen. Video kannattaa suurentaa koko näytölle, jotta esimerkit näkyvät kunnolla.

Fraasin merkitseminen tietokannassa

Kirjoita itse lainausmerkit sanaliiton ympärille. Lainausmerkki tarkoittaa tässä 2-näppäimen yläpuolista tuplaheittomerkkiä.

Esimerkkejä:

UEF-Primo:
Haetaan UEF-Primosta "forest soil" lainausmerkeissä.

Scopus (sama Web of Sciencessa ja ProQuestissa):

Kuvakaappaus. Hakutermi "forest soil" Scopus-tietokannan hakurivillä. Hakutermiin kuuluvat lainausmerkit korostettu keltaisella värillä.

 

Poikkeuksen yleisestä säännöstä tekee CAB-tietokanta. Siellä voi käyttää lainausmerkkejäkin, mutta opetuksena kaksi tai useampia sanoja on fraasihaku. Siten AND-operaattori on muistettava kirjoittaa aina itse, jos ei halua hakea fraasia.
 Kuvakaappaus. CAB-tietokannan Advanced search -haku, jossa Keyword-haku: forest soil, ilman lainusmerkkejä.

Google Scholarissa voi käyttää lainausmerkkejä tai tarkennettua hakua:

Kuvakaappaus. Google Scholarin tarkennetussa haussa sanat forest soil kirjoitettu riville: sisältäen tarkan ilmauksen.