Tutkimusdatapalveluista

Research data and services workshop during the EGI Community Forum 2014, 20.5.2014
Kansainvälisessä tunnelmassa käsiteltiin erilaisia tutkimusdata-hankkeita ja niiden tuottamia tuloksia. Useimmat esitykset käsittelivät sekä tekniikkaa että poliittista kenttää tutkimusaineistojen ja –datan halliinan osalta.

RDA:n (Research Data Alliance) Peter Wittenburgin esityksessä korostui tutkimusdatan jakaminen ilman rajoja ja esitys lähtikin mukavasti liikkeelle Euroopan komission varapuheenjohtajan Neelie Kroesin sanoin: “Knowledge is the engine of our economy. And data is its fuel.” Nykyään tietoa tuotetaan ja analysoidaan paljon, tarvitaan tieteiden välisiä harmonisoituja ratkaisuja datan hallintaan, koko elinkaaren ajalle. Käytössä voi olla tieteenalakohtaisia, kansallisia tai organisaatiokohtaisia ratkaisuja. RDA-verkoston tavoitteena on ylittää raja-aitoja helpottamalla yhteistyötä ja datan jakamista ja saatavuutta kansainvälisesti asiantuntijoiden, erilaisten tieteenalojen ja erilaisten yksiköiden välillä. Taustarahoittajina toimii euroopan komissio, Australian National Data Service ja US National Science Foundation. Jatkossa mukaan on tulossa muitakin toimijoita. Toimintaediana on että asiantuntijoista koostetaan työ ja kiinnostusryhmiä konkretisoimaan erilaisia ongemia, joita ryhdytään ratkomaan. Eräänä esimerkkinä nostettiin esille PID-tunnus (Persistent Identifiers), jossa ajatuksena on että dataobjekteilla olisi oma tunnistusnumero samalla tavoin kuin IP-numerot tietoverkoissa.

EUDAT:n Damien Lecarpentier esitteli eurooppalaista konsortiohanketta, jossa mm. CSC on mukana. Hankkeen tausta-ajatus on luoda tiede- ja tutkimusyhteisöille kestävä Euroopan kattava datainfrastruktuuri, jonka avulla tiedeyhteisöjen tuottama tieto on paremmin saatavissa. Työskentely on käyttäjälähtoistä ja haasteet kasvavat tieteenalojen lisääntyessä. EUDAT on tuotteistanut toimintoja ja tarjolla on tiedonhaku, replikointi, tallennus ja jakaminen sekä tieteelliset laskentapalvelut. Jatkosuunnitelmissa ovat erilaiset pilvipalvelut, semantiikan hyödyntäminen ja mahdollisesti dynaaminen data. Hankkeen tavoitteena on rakentaa integroitu ratkaisu palveluille – yhden luukun peritaatteella. Tämä varmaan helpottaisi tutkijoiden työtä tulevaisuudessa. Toiminnan taustalla on kansainvälinen jaettu data. Kansalliset tai tieteenalakohtaiset ratkaisut eivät välltämättä palvele tutkimusta tai datan tallennusratkaisut eivät ole riittäviä tai ne ovat kalliita. Tämän vuoksi on tärkeää olla mukana kansainvälisessä yhteistyössä ja hyödyntää kansainvälisiä ratkaisuja, koska tutkimustyön ja tutkimusryhmien kansainvälistyessä tallennusratkaisujen ja –palveluiden tulee olla samalla tasolla. Hankkeella on kumppanuuksia myös RDA:han ja ATT-palveluihin.

OKM:n Sami Niinimäki toi kansallisen kuvan tieteen ja tutkimuksen avoimuuden tavoitteista. Samassa yhteydessä esille tuli Euroopan komission tavoitteet, jotka ohjaavat kansallista päätöksentekoa ja ovat taustana suunnittelutyölle. Esimerkiksi Horizon 2020-ohjelman kaikki tieteelliset julkaisut pyritään saamaan vapaasti julkaistuksi.

OpenAIRE on Euroopan komission rahoittama hanke, jonka tarkoituksena on kehittää tiatoaineistoinfrastruktuureita Euroopan unionissa, kokoamalla Euroopan komission rahoittamien projektien tutkimustuloksia ja asettamalla ne saataville keskitetyn portaalin kautta. Kimmo Koskinen ja Antonis Lempesis esittelivät palvelua hiukan eri näkökannoista. Palvelut kattavat tekstilouhinnan, tilastoinnin, raportointityökalut sekä neuvonnan. Zenodo on julkaisuarkisto tutkimusdatalle ja –artikkeleille, joita ei voi tallentaa organisaatio- tai alakohtaisiin arkistoihin. Zenodoon on mahdollisuus tallentaa julkaisuja, postereita, esityksiä, datajoukkoja, kuvia, videoita ja ohjelmia. Hankkeessa on tuotettu ohjeita sekä data-arkistojen että CRIS-ylläpitäjille.

ATT (Avoin tiede ja tutkimus) palveluista kertoi Tuija Raaska. Kyseessä on OKM:n rahoittama hankekokonaisuus, jossa koordinoidusti tuotetaan palveluita avoimen tieteen käyttöön. Tietojen tallunnuspalvelut, suomalaisen tutkimusjulkaisemisen portaali, metadatapalvelut tutkimusdatalle, avoimen julkaisemisen alusta. Viesti oli että palveluiden käyttäjiä on vähän. Käytäväkeskusteluissa nousi esille se, että kuinka tutkijat tietävät tarjolla olevista palveluista. Pitäisikö markkinointiviestintää tehostaa vai onko tiedottamisen kohteena väärä kohderyhmä. Pitäisikö kirjaston ottaa roolia erilaisten tutkimuksen tukipalveluiden tiedottajana.

Ivo Grigorov piti elähdyttävän esityksen avoimen tieteen oikeutuksista ja siitä mitä näkökulmaa asioihin otetaan eli katsotaanko asiaa hallinnon vai tutkijan näkökulmasta. Esityksen kannanottona oli, että avoimuudesta tulisi tehdä osa meritoitumista.

Ari Asmi käsitteli tutkimusdataan viittaamisen periaatteita. Esimerkkitapauksen valossa hän toi esille samalla erään RDA working group:n toimintaa.

Paneelikeskusteluissa nousivat esille er toimijoiden roolit ja vastuut. Rahoittajat vaativat tiettyä raportointia, johon hallinto pyrkii vastaamaan. Vastaavasti julkaisuprosessit ja tutkimusaineistojen saatavuus kiinnostavat kirjastosektoria. Laitokset markkinoivat itseään tuottamillaan projekteilla ja niiden tutkimustuloksilla. Toimijoiden verkosto on laaja ja kokonaisuutta tulisi katsella laajemmasta näkökulmasta kuin omasta. Rajapintojen hyödyntäminen tietojärjestelmien välillä voi tuoda helpotusta. Kansainvälistyvässä maailmassa ei voida pysytellä kotimaan rajojen sisäpuolella, vaan on katsottava myös aidan toiselle puolelle. Tieteellisessä koulutuksessa tulisi nostaa keskiöön avoin tiede ja opastaa opiskelijoita avoimeen toimintaperiaatteeseen jo ensi metreiltä. Meritoitumisessa tulisi huomioida paremmin myös avoimesti julkaistut tutkimusaineistot ja avoimen tieteen edistämistä tulisi edesauttaa mieluummin porkkanalla kuin kepillä. Loppuun heitettiin haaste myös kirjastoille: Kirjastojen pitäisi ryhtyä tekemään datalle samaa kuin ne tekevät tällä hetkellä kirjoille.

Tomi Rosti, tietoasiantuntija