Tutkimusdatapalveluista

Research data and services workshop during the EGI Community Forum 2014, 20.5.2014
Kansainvälisessä tunnelmassa käsiteltiin erilaisia tutkimusdata-hankkeita ja niiden tuottamia tuloksia. Useimmat esitykset käsittelivät sekä tekniikkaa että poliittista kenttää tutkimusaineistojen ja –datan halliinan osalta.

RDA:n (Research Data Alliance) Peter Wittenburgin esityksessä korostui tutkimusdatan jakaminen ilman rajoja ja esitys lähtikin mukavasti liikkeelle Euroopan komission varapuheenjohtajan Neelie Kroesin sanoin: “Knowledge is the engine of our economy. And data is its fuel.” Nykyään tietoa tuotetaan ja analysoidaan paljon, tarvitaan tieteiden välisiä harmonisoituja ratkaisuja datan hallintaan, koko elinkaaren ajalle. Käytössä voi olla tieteenalakohtaisia, kansallisia tai organisaatiokohtaisia ratkaisuja. RDA-verkoston tavoitteena on ylittää raja-aitoja helpottamalla yhteistyötä ja datan jakamista ja saatavuutta kansainvälisesti asiantuntijoiden, erilaisten tieteenalojen ja erilaisten yksiköiden välillä. Taustarahoittajina toimii euroopan komissio, Australian National Data Service ja US National Science Foundation. Jatkossa mukaan on tulossa muitakin toimijoita. Toimintaediana on että asiantuntijoista koostetaan työ ja kiinnostusryhmiä konkretisoimaan erilaisia ongemia, joita ryhdytään ratkomaan. Eräänä esimerkkinä nostettiin esille PID-tunnus (Persistent Identifiers), jossa ajatuksena on että dataobjekteilla olisi oma tunnistusnumero samalla tavoin kuin IP-numerot tietoverkoissa.

EUDAT:n Damien Lecarpentier esitteli eurooppalaista konsortiohanketta, jossa mm. CSC on mukana. Hankkeen tausta-ajatus on luoda tiede- ja tutkimusyhteisöille kestävä Euroopan kattava datainfrastruktuuri, jonka avulla tiedeyhteisöjen tuottama tieto on paremmin saatavissa. Työskentely on käyttäjälähtoistä ja haasteet kasvavat tieteenalojen lisääntyessä. EUDAT on tuotteistanut toimintoja ja tarjolla on tiedonhaku, replikointi, tallennus ja jakaminen sekä tieteelliset laskentapalvelut. Jatkosuunnitelmissa ovat erilaiset pilvipalvelut, semantiikan hyödyntäminen ja mahdollisesti dynaaminen data. Hankkeen tavoitteena on rakentaa integroitu ratkaisu palveluille – yhden luukun peritaatteella. Tämä varmaan helpottaisi tutkijoiden työtä tulevaisuudessa. Toiminnan taustalla on kansainvälinen jaettu data. Kansalliset tai tieteenalakohtaiset ratkaisut eivät välltämättä palvele tutkimusta tai datan tallennusratkaisut eivät ole riittäviä tai ne ovat kalliita. Tämän vuoksi on tärkeää olla mukana kansainvälisessä yhteistyössä ja hyödyntää kansainvälisiä ratkaisuja, koska tutkimustyön ja tutkimusryhmien kansainvälistyessä tallennusratkaisujen ja –palveluiden tulee olla samalla tasolla. Hankkeella on kumppanuuksia myös RDA:han ja ATT-palveluihin.

OKM:n Sami Niinimäki toi kansallisen kuvan tieteen ja tutkimuksen avoimuuden tavoitteista. Samassa yhteydessä esille tuli Euroopan komission tavoitteet, jotka ohjaavat kansallista päätöksentekoa ja ovat taustana suunnittelutyölle. Esimerkiksi Horizon 2020-ohjelman kaikki tieteelliset julkaisut pyritään saamaan vapaasti julkaistuksi.

OpenAIRE on Euroopan komission rahoittama hanke, jonka tarkoituksena on kehittää tiatoaineistoinfrastruktuureita Euroopan unionissa, kokoamalla Euroopan komission rahoittamien projektien tutkimustuloksia ja asettamalla ne saataville keskitetyn portaalin kautta. Kimmo Koskinen ja Antonis Lempesis esittelivät palvelua hiukan eri näkökannoista. Palvelut kattavat tekstilouhinnan, tilastoinnin, raportointityökalut sekä neuvonnan. Zenodo on julkaisuarkisto tutkimusdatalle ja –artikkeleille, joita ei voi tallentaa organisaatio- tai alakohtaisiin arkistoihin. Zenodoon on mahdollisuus tallentaa julkaisuja, postereita, esityksiä, datajoukkoja, kuvia, videoita ja ohjelmia. Hankkeessa on tuotettu ohjeita sekä data-arkistojen että CRIS-ylläpitäjille.

ATT (Avoin tiede ja tutkimus) palveluista kertoi Tuija Raaska. Kyseessä on OKM:n rahoittama hankekokonaisuus, jossa koordinoidusti tuotetaan palveluita avoimen tieteen käyttöön. Tietojen tallunnuspalvelut, suomalaisen tutkimusjulkaisemisen portaali, metadatapalvelut tutkimusdatalle, avoimen julkaisemisen alusta. Viesti oli että palveluiden käyttäjiä on vähän. Käytäväkeskusteluissa nousi esille se, että kuinka tutkijat tietävät tarjolla olevista palveluista. Pitäisikö markkinointiviestintää tehostaa vai onko tiedottamisen kohteena väärä kohderyhmä. Pitäisikö kirjaston ottaa roolia erilaisten tutkimuksen tukipalveluiden tiedottajana.

Ivo Grigorov piti elähdyttävän esityksen avoimen tieteen oikeutuksista ja siitä mitä näkökulmaa asioihin otetaan eli katsotaanko asiaa hallinnon vai tutkijan näkökulmasta. Esityksen kannanottona oli, että avoimuudesta tulisi tehdä osa meritoitumista.

Ari Asmi käsitteli tutkimusdataan viittaamisen periaatteita. Esimerkkitapauksen valossa hän toi esille samalla erään RDA working group:n toimintaa.

Paneelikeskusteluissa nousivat esille er toimijoiden roolit ja vastuut. Rahoittajat vaativat tiettyä raportointia, johon hallinto pyrkii vastaamaan. Vastaavasti julkaisuprosessit ja tutkimusaineistojen saatavuus kiinnostavat kirjastosektoria. Laitokset markkinoivat itseään tuottamillaan projekteilla ja niiden tutkimustuloksilla. Toimijoiden verkosto on laaja ja kokonaisuutta tulisi katsella laajemmasta näkökulmasta kuin omasta. Rajapintojen hyödyntäminen tietojärjestelmien välillä voi tuoda helpotusta. Kansainvälistyvässä maailmassa ei voida pysytellä kotimaan rajojen sisäpuolella, vaan on katsottava myös aidan toiselle puolelle. Tieteellisessä koulutuksessa tulisi nostaa keskiöön avoin tiede ja opastaa opiskelijoita avoimeen toimintaperiaatteeseen jo ensi metreiltä. Meritoitumisessa tulisi huomioida paremmin myös avoimesti julkaistut tutkimusaineistot ja avoimen tieteen edistämistä tulisi edesauttaa mieluummin porkkanalla kuin kepillä. Loppuun heitettiin haaste myös kirjastoille: Kirjastojen pitäisi ryhtyä tekemään datalle samaa kuin ne tekevät tällä hetkellä kirjoille.

Tomi Rosti, tietoasiantuntija

 

Altmetriikka – bibliometriikkaa verkkoympäristössä

Seminaari
Sateista seminaaripäivää värittivät monet esitykset. Paikkana Tieteiden talo Helsingissä.

Työntäyteistä syksyä virkisti marraskuun alussa järjestetty Suomen Tieteellisen Kirjastoseuran Tutkijapalvelut näkyviksi – tutkimusaineistot ja kirjaston rooli -seminaari, jossa kuulimme pohdintaa kirjaston roolista tutkijapalveluihin liittyen. Meidän kirjastostamme seminaarivierailuun osallistui kolme henkilöä, ja tietoasiantuntija Maarit Putouksen kirjoitus samasta seminaarista on luettavissa myös tästä blogista. Tuossa postauksessa käsitellään laajemmin päivän antia, mutta me päätimme keksittyä altmetriikkaan.

Mitä se sitten on? Kyseessä on bibliometriikan uusin tutkimussuuntaus, ja se on vaihtoehtoista bibliometriikkaa tai artikkelitason bibliometriikkaa. Verkkomaailmassa toki voidaan puhua pelkästä metriikastakin, mutta yhtä kaikki, kyseessä on kuitenkin asioiden mittaamiseen liittyvä käsite. Altmetriikan syntymiseen on vaikuttanut vanhahtavan tutkimuskulttuurin kritiikki: vertaisarviointia pidetään hitaana, viittauskäytännöt vaihtelevat tieteenaloittain ja bibliometriikan (eli varsinaisen viittausanalyysin) nähdään tutkailevan jo aikapäiviä sitten tapahtuneita asioita. Verkkoympäristössä askartelemaan tottuneet X- ja Y-sukupolvet haluavat tietää mitä tieteessä tapahtuu nyt ja mitkä ovat ajankohtaisia keskusteluaiheita. Tarkemmin tästä seminaaripäivässä pidetystä johtavien tietoasiantuntijoiden Maria Forsmanin ja Jukka Englundin esityksistä voi lukea Suomen yliopistokirjastojen neuvoston blogista.

Webnatiivi-sukupolvi hyödyntää uusia viestintävälineitä tehokkaasti, joten heidän mukanaan tieteellinen keskustelu siirtyy vaivattomasti myös verkkoon. Sosiaalisen median eri palvelut, kuten Twitter, Facebook ja LinkedIn tarjoavat keskustelulle puitteet. Lisäksi keskustelua käydään myös muualla avoimessa verkossa, esimerkkeinä tästä kustantajien kirja-arvostelumahdollisuudet, sanomalehtiartikkeleiden kommentointi, sekä blogi- ja wikikirjoitukset.

Tässä yhteydessä perinteiseksi mielletty bibliometriikka on suuntautunut lehtien vaikuttavuuden mittaamiseen, kun taas altmetriikka pyrkii vaikuttavuuden mittaamiseen yksittäisen julkaisun, eli lehtiartikkelin tai kirjan, tasolla. Altmetriikan avulla pyritään tieteen avoimuuteen ja tutkimustulosten tunnetuksi tekemiseen, niin kansallisesti kuin kansainvälisestikin. Tämä tarjoaa väylän yhteiskunnalliseen vuorovaikutukseen, ja samalla yliopistojen kolmas tehtävä toteutuu verkossa. Tähän pyrkimyksen saavuttamiseen yhden apuvälineen tarjoavat näkyvyyspalvelut. Yhden esimerkin altmetriikan hyödyntämisestä tarjoaa Terkon metriikkaprojekti lääketieteen alalla.

Altmetriikka on siis enemmän kuin tutkimuksen julkaisemista, sillä sen pyrkimyksenä on tuottaa lisäarvoa tutkimusjulkaisemiselle, sekä saada tutkimustyö laajemmin tunnetuksi. Olisiko tutkimuspalveluiden brändäys kirjaston näkökulmasta mahdollinen tie tuoda tutkimuspalveluita näkyväksi tiedeyhteisössä?

 

tietoasiantuntija Tomi Rosti ja tietopalveluneuvoja Taina Sahlman

Kirjaston rooli tutkimusdata-asioissa

Mitä on tutkimusdata (tutkimusaineisto)?
Tietyn tutkimusongelman selvittämiseksi koottu data/aineisto, johon tutkimuksen löydökset ja tulokset perustuvat. Data on erilaista eri tieteenaloilla, se voi olla numeroita, tekstiä, ääntä, kuvia (haastatteluja, kyselyitä, fysikaalisia mittaustuloksia…).

Kirjaston roolit tutkimusdatan hallinnassa ja löytymisessä

  • tutkimusdatan dokumentointi ja metadata
  • tutkimusdatan hallintataidot
  • tutkimusdatan avoimen julkaisemisen tuki
  • tiedonhaun koulutus tutkimusdatatietokannoista
  • tutkimusdataan viittaaminen
  • tutkimusdata-arkistot
  • tutkimusdatan tekijänoikeuskysymykset
  • tutkimusjulkaisun ja -datan linkittäminen

Tuollaisia tehtäviä tuli esiin 4.11.2013 STKS:n Tutkijapalvelut näkyviksi – tutkimusaineistot ja kirjaston rooli –seminaarissa.

Tieteellisten kirjastojen merkitys tutkimusdataa koskevissa tutkimuspalveluissa kasvaa  esim. Yhteiskuntatieteellisen tietoarkiston (FSD) johtajan Sami Borgin mielestä. Borg uskoo, että sekä keskitetyissä palveluissa (esim. FSD) että tieteellisissä kirjastoissa työskentelevien datapalveluammattilaisten lukumäärä tulee kasvamaan. Koulutusta on järjestettävä valtakunnallisesti ja asia on kiireellinen. Kirjastojen on lisättävä asiantuntemustaan jonkinasteisten datapalvelujen tuottajina. Jyväskylän yliopiston kirjaston julkaisukoordinaattori Pekka Olsbo totesi kirjastoilla olevan “edessään mielenkiintoinen ja vaativa oppimisprosessi ja uusi tehtävä”. Datainformaatikolle riittäisi kysyntää.

Helsingin yliopiston kirjaston henkilöstökoulutusprojektissa huomattiin, että kirjastolla on valtavasti potentiaalia datan hallinnan tukipalveluiden ja koulutuksen tuottamiseen, vaikkei sitä alunperin tajuttukaan. Informaatikko Mari Elisa Kuusniemen mukaan kannattaa miettiä, mitä kirjasto voi tehdä vasta sitten, kun tietää tarpeeksi, mitä tutkimusdatan hallinta oikeasti tarkoittaa.

Mikä olisi Itä-Suomen yliopiston kirjaston datapalveluvalikko?
(hotellitermirinnastuksista kiitos Sami Borgille)

  • ei aamiaista, ei datapalveluja (“ei kuulu meille”)
  • aamiainen, keskeisiä tutkimusdatoja ja datapalveluja koskeva tietopalvelu (= tieto siitä, mitä on saatavilla ja mistä)
  • puolihoito, myös tutkimusdatan käyttöön ja saatavuuteen liittyvät yksityiskohtaiset asiantuntijapalvelut (= edellisen lisäksi myös käyttöehtoihin ja käyttöön liittyvä sisällöllinen ja tekninen tuki)
  • täysihoito, tutkimusdatan elinkaaripalvelut = keruun tuki, datan dokumentointi ja arkistointi, muut “hoivapalvelut”, pitkäaikaissäilytys, jakelu, käyttöön liittyvä neuvonta

Mitä tällä hetkellä voisi tehdä?

Fiilis päivän jälkeen oli melko infoähkyinen. Mitä kaikkea pitäisikään tehdä ja tietää? Millä ajalla? Kuka/ketkä? Millaisilla yhteistyötahoilla? Syyskuun artikkelilukupiirissämme samoista asioista sentään keskusteltiin.

Miten tutkimusdata-asiat mukaan tiedonhakuopetuksiimme? Moodlen kurssimateriaaleihin? Ainakin jatko-opiskelijoille? Data-arkistot, rekisterit…?
– Miten viitataan dataan? Data Refworksissa?
– Viitetietokannoista tarkistettava, tarjoavatko linkkejä artikkeleissa käytettyyn tutkimusdataan
– Elektronisten lehtien kohdalla tiedekustantajien toimivia ratkaisuja artikkelin ja datan yhdistelemisestä?

Maarit Putous, Itä-Suomen yliopiston kirjasto