Frequently asked questions 2 – Truncation

Questions about truncating search terms when searching databases:

  • Why is it necessary to truncate search terms?
  • How should I truncate my term?
  • What truncation mark should be used?

You do not always have to truncate your search terms but…

  • robots (search engines) only search for character strings, not for meanings
  • most terms have singular and plural forms, and also genetives

Examples:

  • truncated patient* retrieves all these: patient, patients, patient’s
  • not truncated patient retrieves only patient
  • truncated child* retrieves child, children, child’s children’s
  • not truncated child retrieves only child

Different databases use different truncation marks. The most common are asterisk * and question mark ?. Check the database’s manual/FAQ if * does not seem to work. In PubMed, Cochrane Library and Scopus truncate using *. In Josku truncate using ?.

truncation marks

There are also irregular plurals so that the singular and plural forms are different in a way that truncation does not work.

For example:

  • foot/feet
  • mouse/mice
  • tooth/teeth
  • woman/women

In some databases it is possible to use so called wild cards and search for e.g. wom*n, but in many databases you have to search singular and plural combined with OR.

For example:

  • foot OR feet
  • mouse OR mice
  • tooth OR teeth
  • woman OR women

There are also irregular plurals that can be search by truncating.

For example:

  • criteri* retrieves singular criterion and pluralcriteria
  • nucle* retrieves singular nucleus and plural nuclei (and also nuclear, nucleic, nucleoid, nucleon…)
  • analys* retrieves singular analysis and plural analyses (and also analysand and analyst)
  • phenomen* retrieves singular phenomenon and plural phenomena (and also e.g. phenomenology)

Watch a video in YouTube about truncation.

By: Tuulevi Ovaska, Head of Services, Kuopio University Hospital Medical Library, University of Eastern Finland Library

Share

Frequently asked questions 1 – What is the difference between MEDLINE and PubMed?

Question:

  • What is the difference between MEDLINE and PubMed?

There is a fact sheet of NLM (National Library of Medicine, USA) called MEDLINE, PubMed, and PMC (PubMed Central): How are they different?  that explains the difference in detail.

Shortly:

MEDLINE is the National Library of Medicine (NLM) journal citation database.

MEDLINE database is searchable from NLM as a subset of the PubMed database but also other search services that license the data.

PubMed includes MEDLINE plus the following types of citations:

  • in-process citations (records for articles before quality control and indexing)
  • citations to articles that are out-of-scope ahead of print citations (preceding article’s final publication)
  • pre-1966 citations that have not yet been updated with current MeSH (Medical Subject Headings)
  • citations to some additional life sciences journals that submit full text to PubMed Central and receive a qualitative review by NLM
  • citations to manuscripts of articles published by NIH-funded researchers
  • citations for the majority of books available on the NCBI Bookshelf

If you want to search only MEDLINE in PubMed, use the Journal Categories filter MEDLINE.

pubmedlogo

By: Tuulevi Ovaska, Head of Services, Kuopio University Hospital Medical Library, University of Eastern Finland Library

Share

Erasmus-matka Saksaan, osa III. Frankfurtin kirjamessut

Messualueen keskusaukio
Messualueen keskusaukio

Frankfurtin kirjamessut järjestettiin 21. kerran 2013. Kyseessä on maailman suurimmat yleiset kirjamessut. Paikallinen messukeskus on arviolta ainakin 10 kertaa suurempi kuin Helsingissä.

Huhut painettujen kirjojen kuolemasta ovat ennenaikaisia. Silti elektroninen julkaiseminen kasvaa noin 4% ja painettu vähenee noin 19% vuodessa. Painettuja kirjoja julkaistaan silti ylivoimaisesti e-kirjoja enemmän vielä pitkään. Yksin Saksassa kustannetaan 74.000 uutta kirjaa vuodessa. Kaikki maailman kielialueet ovat edustettuina Frakfurtissa. Suurilla on tietenkin suuremmat osastot, Suomella vastaavasti vaatimattomampi. Mutta kaikissa kulttuurissa julkaistaan kirjoja, katalaaneista kazakstanilaisiin.

Kustantajat reagoivat kilpailuun muuttuvaan tilanteeseen muun muassa digitaalisella painatuksella (print on demand). Säästöt kuljetuksissa, varastoinnissa ja varastotappioissa ovat selvät. Kirjojen myynti arvioidaan ennakkoon usein pieleen. Osa jää vuosikausiksi varastoon, osasta myydään painos loppuun arvioitua nopeammin. Digitaalinen painatus tasaa heittoja kumpaankin suuntaan. Aikaisemmin loppuun myydyn painoksen pitkä häntä myy digitaalisessa painatuksessa yhä. Painattamisen automatisointi, standardisointi ja organisointi tehostuvat edelleenkin. Samalla voi huomauttaa siitä, että messuilla oli suuri määrä kiinalaisten kirjapainojen edustajia. Voi olla että länsimaista offsetpainot siirtyvät Aasiaan, ja omat painot toimivat enää digitaalisesti. Myös vanhempia painettuja aineistoja digitoidaan kiihtyvällä vauhdilla takautuvasti. Kuvassa vertailun vuoksi analoginen painokone.

Reaaliajassa tulostava painokone
Reaaliajassa tulostava painokone

Tutkimusinfra ja tiedon käyttäminen kehittyvät

Yksi messulla esillä olleista trendeistä on big data. Saksassa on meneillään Jurion-projekti, jossa tavoitteena on oppia kaivamaan suuresta datamäärästä uusia innovaatioita ja julkaisuja muun muassa semanttista hakua hyväksi käyttäen. Dataa on maailmassa paljon, ja hyvin erimuotoista ja sisältöistä. Yksittäisen julkaisun tai tiedon merkitys vähenee, kun suurista tietomassoista louhitaan uusia näkökulmia ja merkityksiä niitä analysoimalla. Tämä edellyttää myös metatiedon ja indeksoinnin päivittämistä. Sisällönkuvailu pitäisi itse asiassa tehdä määräajoin uusiksi vanhaankin aineistoon, koska maailma ympärillä muuttuu. Kuvaillaanko meilläkin Joskun aineisto jonain päivänä takautuvasti uudestaan, uusilla tavoilla, tai vaikkapa semanttisilla sanastoilla? Metadata on tullut big datan myötä tärkeämmäksi kuin itse yksittäiset ‘tekstit’. Informaatiota voidaan käyttää uudestaan eri tavalla kuin pelkän yhden julkaisun sisältöä. Suuret projektit kuten Jurion vaativat laajaa yhteistyötä eri toimijoiden, kustantajien ja kirjastojen välillä. Projekti valmistuu 2014, kuulemme siitä varmasti lisää.

WP_20131012 16
Välillä on mukava levähtää kirjatuolissa

Muuta sekalaista tarjontaa ja pohdittavaa

Metadatan merkitys korostui myös Ebscon Euroopan myynnin varajohtaja Paul Donovanin puheenvuorossa. Hakupalvelu, joka ei löydä relevantteja viitteitä on tutkimusten mukaan huonompi kuin että ei olisi hakupalvelua ollenkaan. Hakupalvelulla tarkoitetaan tässä hakuportaalia, jolla voidaan hakea suurta aineistomassaa yhdellä haulla formaatista välittämättä, vähän Nellin tai tulevan Finnan tapaan.

Amerikkalaisen tutkimuksen mukaan kirjastojen tietokannat palauttavat relevantteja viitteitä hakijalle paremmin kuin Google. Tämä ei varmaan tule kirjastolaisille yllätyksenä. Mutta Ebscon Discovery Service (EDS) oli silti parempi kuin kumpikaan näistä. Discovery-palvelulla opiskelijat löysivät relevantit verrokkiviitteet nopeammin ja vähemmillä hauilla kuin ilman sitä.  Jospa Finnakin pystyy valmistuttuaan samaan. Haun onnistumisen kannalta metadatan rikkaus on ensiarvoisen tärkeää. Relevanssijärjestykseen Ebscon algoritmeissä vaikuttavat asiasanoituksesta ja abstrakteista löytyneiden sanojen lisäksi myös artikkelia viitanneiden julkaisujen määrä, artikkelin ‘laatu’ ja sen pituus. Verrokkikirjastoissa e-aineistojen käyttö oli kasvanut vuodessa 250% ja jopa 500% vuodessa discovery-palvelun käyttöönoton jälkeen. Kuulostaisi uskomattomalta UEFissa, jossa käyttöluvut ovat ihan hyvät jo nytkin.  Mutta totta on sekin, että hakusivujen tuloksia ei toisen tai kolmannen sivun jälkeen enää jakseta selata.

E-julkaisemisen kasvu on synnyttänyt suuren määrän asian liepellä kehittyviä innovaatioita ja liiketoimintaa. Tälläinen on esimerkiksi Acapela-yhtiön myymä synteettisten äänien paketti kustantajille. Yhtiö on digitoinut muun muassa lasten, vanhusten ja julkkisten puheääniä, joita laitevalmistajat ja kustantajat voivat käyttää puhesovelluksissa. On tietysti niin, että kyseessä ei ole paras mahdollinen kuuntelunautinto kun sama synteettinen ääni lukee sekä lastenkirjoja että dekkareita. Jatkossa kuulemme värikkäämpiä tulkintoja koneellisestikin. Tarjolla on mm. neljä englannin murretta, ja yli sata muuta kieltä. Kannattaa kokeilla hauskaa demoa Acapelan sivuilla!

Kustantajat ovat ainakin osittain siirtymässä loppukäyttäjälle kömpelöstä DRM-suojauksesta digitaalisiin vesileimoihin. Tälläinen vesileima digitaalisessa julkaisussa voi olla käyttäjälle näkymätön tai näkyvä. Vesileima voi olla kirjassa, artikkelissa tai vaikkapa kuvassa, äänitiedostossa tai videoklipissä. Tekniikka mahdollistaa vesileiman halvan ja nopean laittamisen vaikkapa epub2 ja epub3 -formaatteihin sekä pdf-tiedostoon muutamassa kymmenessä sekunnissa, kun ohjelmistot ja virittelyt ovat kohdallaan. Loppukäyttäjälle digitaallinen vesileima on huomaamaton ja harmiton, jollei sorru loukkaamaan tekijänoikeuksia. Tarkoituksena on kuitenkin estää piratismia. Toisaalta kirjaston leima tai alaviite tulostetussa artikkelissa muistuttaa käyttäjää siitä, että tämä on käyttänyt kirjaston mahdollistamaa palvelua.

Yksi esityksistä koski mahdollisuutta luoda malli, jossa kustantajat, kirjoittajat, kirjastot ja loppukäyttäjät voisivat toimia e-kirjojen parissa ilman kolmansia osapuolia, siis välittäjiä tai vastaavia. Esityksen tekijänä oli Odilo TID-niminen firma, joka samalla kauppasi omaa sovellustaan. Messuilla pitää olla tarkkana eikä sortua kaikkien helppoheikkien tarjouksiin.  Ranskalainen Artelittera esitteli kirjojen levitystapaa, jossa kustantajat voivat myydä e-kirjoja luku kerrallaan. Perusteena on etenkin kovien tieteiden parissa vakiintunut artikkeleiden käyttötapa, joka on levinnyt kirjojenkin käyttöön. Koko kirjaa ei lueta kannesta kanteen, ainoastaan itselle relevantit luvut tai kappaleet. Tarjolla on nyt 5000 lukua noin 1000 kirjasta, pääsääntöisesti ranskan ja englannin kielillä. Kokoelma tuplaantuu vielä tulevan vuoden aikana. Yhden luvun hinta on vain 2 euroa.  Joissakin tapauksissa voi olla järkevää maksaa vain todella käytetystä osasta.

Teemamaat: Brasilia nyt, ensi vuonna Suomi

Tänä vuonna teemamaana esiteltiin Brasilian kirjallisuutta. Näyttelytila oli avara, valoista ja vaalea. Tilassa oli riippumattoja ja lattioilla tyynyjä, jossa saattoi loikoilla kuuntelemassa tai katsomassa esityksiä ja kirjailijavierailuja. Hieno rento meininki, sopii hyvin brasilialaisille. Ja asettaa paineita, ensi vuonna teemamaana on Suomi. Nähdäänköhän joulupukki, poroja ja lohikääryleitä?

WP_20131012 4
Brasilian kirjaosasto oli rento ja mukava

Peruskirjojen lisäksi messuilla kaupataan myös kirjakauppojen oheistuotteita ja muuta sälää. Mutta myös käsintehtyjä uniikkeja taidekirjoja. karttoja ja kartastoja, matkakirjoja, sarjakuvia, lastenkirjoja ja nuotteja. Messuilla oli myös laadukas antikvariaattinen osasto. Pitelin käsissäni Danten vanhaa painosta, hinta 700 euroa. Ja kallein kirja jota kosketin (luvallisesti) oli Liber scivias vuodelta 1175. Hintapyyntö rapiat 7950 euroa. Tästä on onneksi tehty myös faksimile-näköispainos. Metrin korkuisen kartaston 1600-luvulta olisi saanut kolmella tonnilla. En hankkinut kokoelmiin, edes kirjaston. Odotan digitoitua vapaassa käytössä olevaa versiota nettiin.

WP_20131012 15
Oikeita ja kunnollisia kirjoja

 

Palvelupäällikkö Jukka Kananen, Verkkoresurssipalvelut

 

Share