Kohteena avoimet julkaisuarkistot

Open Repositories in Helsinki, 9.-13.6.2014
Ensimmäisenä päivänä oli tarjolla aihepiiriin johdattavia esikonfferensseja. Otin läpileikkauksen eri aiheista, aloittaen altmetriikasta ja päättäen rahoittajien mandaatteihin. Altmetriikka osiossa esiteltiin altmetric.com–palvelua sen tarjoamien palveluiden välityksellä. Välineitä voi saada ei-kaupalliseen käyttöön ilmaiseksi. Altmetriikka tarjoaa artikkelitasoista, eri lähteistä jalostettua, näkyvyyttä ja laajentaa perinteistä tieteellistä mittaamista. Kotiläksyksi jäi myös luettavaa ja tutustumista: Altmetrics: a manifestoGlasgown yliopiston arkisto ja altmetriikan hyödyntäminen, Altmetrics in libraries and institutional repositories –blogikirjoitus. Keskustelussa nousi eteen mahdollinen hyödyntäminen CRIS-sovelluksissa. Hyödyntämisessä käytetään pääasiassa DOI-tai Pubmed Id-tunnisteita. Iltapäivän toisessa sessiossa tarjoiltiin näkymää erilaisista ja eritieteenalojen julkaisutietokannoista ja niiden toiminnasta. Lisäksi oli tarjolla rahoittajan näkökulmaa ERC-hankkeisiin, joissa rahoittajilla on vahva suositus Open Access –julkaisemiseen, he jopa suosittelevat käyttämään Europe PubMed Central –arkistoa biotieteisiin ja ArXiv-arkistoa fysiikan ja tekniikan alan palveluihin. Erityisiä suosituksia ei ole yhteiskuntatieteisiin eikä humanistisiin tieteisiin. Vaihtoehtoisina tallennuspaikkoina voidaan käyttää organisaatiokohtaisia tai keskitettyjä arkistoja, kuten Zenodo. Suosituksissa nostetaan yhä selkeämmin esille, että tutkimusdata tulisi myös pyrkiä julkaisemaan aina silloin kun se on mahdollista. Rahoittajilla on myös toiveita embargoaikoihin, eli julkaisut pitäisi saada avoimen saatavuuden piiriin kuuden kuukausen sisällä, myöhempää aikaa eli vuotta on mahdollista käyttää yhteiskuntatieteellisillä ja humanistisilla aloilla. Päivän päätteeksi oli vuorossa vielä keskustelusessio, joka alkoi alustuksilla eri rahoittajien Open Access-politiikoista. Tilaisuudessa esiteltiin REF (Reseach Excellence Framework)-mallia, joka on RAE (Research Assessment Exercicise)-mallin jatkaja. Hyviä kysymyksiä: Organisaation Open Access vaatimukset?, Onko kyseessä mandaatti vai politiikka?, Kohdistetaanko kiinostus kultaiseen (Gold) vai vihreään (Green) Open Accessiin? Onko jotakin aikarajoja?, Kuinka alakohtaiset arkistot sopivat kuvaan? Ja tosiasiahan on, että resurssointiin on kiinnitettävä huomiota. Tärkein viesti oli kuitenkin, että tutkijoiden toimintamallia on saatava muuttumaan avoimen tieteen suuntaan. Tauolla tuli käytyä keskustelua suomalaisista CRIS-järjestelmistä ja niiden rajapinnoista julkaisuarkistoihin. Joihinkin arkistoihin on tulossa apusovelluksia, joilla kaksi tietojärjestelmää voivat kommunikoida keskenään.

Toisen päivän avajaissessiossa ilmoitettiin, että konfferenssiin on tullut osallistujia yli 500 ja 38 eri maasta. Päivän Keynote-puhuja Erin C. McKiernan oli avoimen tieteellisen julkaisemisen ja avoimen tieteen puolestapuhuja. Avoimuus lisää enemmän näkyvyyttä, käyttäjiä ja keskustelua. Avoimuudella voidaan vähentää aineistojen käytettävyysesteitä. Tutkijoilla voi syntyä ajatus, mutta sen jalostaminen saattaa pysähtyä puutteelliseen aineistojen hyödyntämiseen. Aineistojen hankkiminen on osittain kustannuskysymys. Open Access ideaa voi viedä eteenpäin boikotoimalla ”suljettuja” lehtiä, käymällä keskustelua blogeissa ja toimittaa preprinttejä jos mahdollista, julkaista vain open access –lehdissä. Toki näissä piilee uran kannalta riski erityisesti nuorelle tutkijalle. Tieteelliset arviointivälineet valitettavasti huomioitavat arvioinneissa korkeiden impact factorin omaavat lehdet ja open access lehdillä ei välttämättä ole korkeitä impact factor-arvoja – toki poikkeuksiakin on. Erityisesti kirjoittajien tulisi kiinnittä huomiota tekijänoikeuksiin ja muuttaa toimintaansa enemmäin avoimuutta sallivaksi. Open access –lehdissä piilee vielä myytti huonosta vertaisarvioinnista, useimmissa lehdissä on tarjolla mahdollisuus tutustua arviointihistoriaan, joten sitäkin myyttiä ollaan purkamassa. Muissa sessioissa kiinnitettiin huomiota saatavuuteen, jos julkaisuita tai artikkelikopioita oli tallennettu projektien verkkosivuille tai muihin vastaaviin viritelmiin, niitä ei ole välttämättä myöhemmin saatavissa. Tämä puoltaa hoidettujen arkistojen olemassaoloa ja resurssointia. Iltapäivän puolella käsiteltiin eri tuotteilla toteutettuja arkistoja, tietojen siirtoa arkistojen välillä, pilvipalveluiden soveltuvuutta ja arkistojen välistä yhteistyötä, jonka kehittymistä tulee seurata tieteen ja tieteenalojen kansainvälistyessä. Päivän viimeisenä sessiona oli Posterikavalkadi.

Keskiviikkona käytiin läpi käsitteistöä: repository, archive. Miten huolehditaan saatavuudesta, entä pitkäaikaissäilytyksestä? Arkistojen tallennuskohteiden monimuotoisuus asettaa haasteita myös järjestelmille. Artikkelit, tutkimusdata, oppimateriaali, verkkokurssit, videolähetykset (kokoukset, video-opetukset…) Onko kaikki tarpeen tallentaa, riittääkö otanta? Metatiedon saatavuus ja erilaiset rajapinnat? Entä metatiedon rikastaminen? Pitäisi päästä eroon fyysisistä opuksista ja katsoa mieluummin objekteja. Suuntana tulisi olla palvelukokonaisuus, jossa kaikki palvelut olisivat saatavilla yhden luukun periaatteella. Tämä olisi varmaan tutkijoille mielekkäämpää, kuin haravoida organisaatiosta mitä kenellekin tulee tarjota. Miten CRIS-järjestelmät voitaisiin liittää osaksi kokonaisuutta? Voidaanko käyttäjä pakottaa käyttämään kontrolloituja asiasanastoja metatiedon syöttämisessä? Miten organisaation eri tietovarantoja voidaan hyödyntää, ettei samaa tietoa tarvitsisi tallentaa moneen paikkaan? ORCID, PubMed ID, Handle Id, DOI, URN, ResearcherID, ScopusID, Google ID – jokaisella järjestelmällä omia tunnisteita, tuleeko tästä upottava suo? Mitä internetissä tapahtuu minuutissa? Päivän aikana tuli ehkä enemmän kysymyksiä kuin vastauksia.

Viimeiseen päivään osuikin sittan ajatukset palvelukulttuurista. Kirjastot ovat tietokokoelmia. Kirjastolaisilla on palveluasenne. Kirjastoa pidetään luotettavana, sailyttävänä ja pysyvänä organisaationa. Kirjoja pyydetään ja annetaan toisille kokoelmille. Kirjasolla on eettiset perinteet. Kuinka nämä sopivat digitaaliseen maailmaan, tarvitseeko kaikkien palveluiden olla yksi yhteen? Muuttuvatko tehtävät: kannustaminen, sisältöjen markkinointi, lisenssointityö, vaikuttavuuden mittaaminen, strategia ja politiikkatyö.

Tomi Rosti, tietoasiantuntija

 

Share

Tutkimusdatapalveluista

Research data and services workshop during the EGI Community Forum 2014, 20.5.2014
Kansainvälisessä tunnelmassa käsiteltiin erilaisia tutkimusdata-hankkeita ja niiden tuottamia tuloksia. Useimmat esitykset käsittelivät sekä tekniikkaa että poliittista kenttää tutkimusaineistojen ja –datan halliinan osalta.

RDA:n (Research Data Alliance) Peter Wittenburgin esityksessä korostui tutkimusdatan jakaminen ilman rajoja ja esitys lähtikin mukavasti liikkeelle Euroopan komission varapuheenjohtajan Neelie Kroesin sanoin: “Knowledge is the engine of our economy. And data is its fuel.” Nykyään tietoa tuotetaan ja analysoidaan paljon, tarvitaan tieteiden välisiä harmonisoituja ratkaisuja datan hallintaan, koko elinkaaren ajalle. Käytössä voi olla tieteenalakohtaisia, kansallisia tai organisaatiokohtaisia ratkaisuja. RDA-verkoston tavoitteena on ylittää raja-aitoja helpottamalla yhteistyötä ja datan jakamista ja saatavuutta kansainvälisesti asiantuntijoiden, erilaisten tieteenalojen ja erilaisten yksiköiden välillä. Taustarahoittajina toimii euroopan komissio, Australian National Data Service ja US National Science Foundation. Jatkossa mukaan on tulossa muitakin toimijoita. Toimintaediana on että asiantuntijoista koostetaan työ ja kiinnostusryhmiä konkretisoimaan erilaisia ongemia, joita ryhdytään ratkomaan. Eräänä esimerkkinä nostettiin esille PID-tunnus (Persistent Identifiers), jossa ajatuksena on että dataobjekteilla olisi oma tunnistusnumero samalla tavoin kuin IP-numerot tietoverkoissa.

EUDAT:n Damien Lecarpentier esitteli eurooppalaista konsortiohanketta, jossa mm. CSC on mukana. Hankkeen tausta-ajatus on luoda tiede- ja tutkimusyhteisöille kestävä Euroopan kattava datainfrastruktuuri, jonka avulla tiedeyhteisöjen tuottama tieto on paremmin saatavissa. Työskentely on käyttäjälähtoistä ja haasteet kasvavat tieteenalojen lisääntyessä. EUDAT on tuotteistanut toimintoja ja tarjolla on tiedonhaku, replikointi, tallennus ja jakaminen sekä tieteelliset laskentapalvelut. Jatkosuunnitelmissa ovat erilaiset pilvipalvelut, semantiikan hyödyntäminen ja mahdollisesti dynaaminen data. Hankkeen tavoitteena on rakentaa integroitu ratkaisu palveluille – yhden luukun peritaatteella. Tämä varmaan helpottaisi tutkijoiden työtä tulevaisuudessa. Toiminnan taustalla on kansainvälinen jaettu data. Kansalliset tai tieteenalakohtaiset ratkaisut eivät välltämättä palvele tutkimusta tai datan tallennusratkaisut eivät ole riittäviä tai ne ovat kalliita. Tämän vuoksi on tärkeää olla mukana kansainvälisessä yhteistyössä ja hyödyntää kansainvälisiä ratkaisuja, koska tutkimustyön ja tutkimusryhmien kansainvälistyessä tallennusratkaisujen ja –palveluiden tulee olla samalla tasolla. Hankkeella on kumppanuuksia myös RDA:han ja ATT-palveluihin.

OKM:n Sami Niinimäki toi kansallisen kuvan tieteen ja tutkimuksen avoimuuden tavoitteista. Samassa yhteydessä esille tuli Euroopan komission tavoitteet, jotka ohjaavat kansallista päätöksentekoa ja ovat taustana suunnittelutyölle. Esimerkiksi Horizon 2020-ohjelman kaikki tieteelliset julkaisut pyritään saamaan vapaasti julkaistuksi.

OpenAIRE on Euroopan komission rahoittama hanke, jonka tarkoituksena on kehittää tiatoaineistoinfrastruktuureita Euroopan unionissa, kokoamalla Euroopan komission rahoittamien projektien tutkimustuloksia ja asettamalla ne saataville keskitetyn portaalin kautta. Kimmo Koskinen ja Antonis Lempesis esittelivät palvelua hiukan eri näkökannoista. Palvelut kattavat tekstilouhinnan, tilastoinnin, raportointityökalut sekä neuvonnan. Zenodo on julkaisuarkisto tutkimusdatalle ja –artikkeleille, joita ei voi tallentaa organisaatio- tai alakohtaisiin arkistoihin. Zenodoon on mahdollisuus tallentaa julkaisuja, postereita, esityksiä, datajoukkoja, kuvia, videoita ja ohjelmia. Hankkeessa on tuotettu ohjeita sekä data-arkistojen että CRIS-ylläpitäjille.

ATT (Avoin tiede ja tutkimus) palveluista kertoi Tuija Raaska. Kyseessä on OKM:n rahoittama hankekokonaisuus, jossa koordinoidusti tuotetaan palveluita avoimen tieteen käyttöön. Tietojen tallunnuspalvelut, suomalaisen tutkimusjulkaisemisen portaali, metadatapalvelut tutkimusdatalle, avoimen julkaisemisen alusta. Viesti oli että palveluiden käyttäjiä on vähän. Käytäväkeskusteluissa nousi esille se, että kuinka tutkijat tietävät tarjolla olevista palveluista. Pitäisikö markkinointiviestintää tehostaa vai onko tiedottamisen kohteena väärä kohderyhmä. Pitäisikö kirjaston ottaa roolia erilaisten tutkimuksen tukipalveluiden tiedottajana.

Ivo Grigorov piti elähdyttävän esityksen avoimen tieteen oikeutuksista ja siitä mitä näkökulmaa asioihin otetaan eli katsotaanko asiaa hallinnon vai tutkijan näkökulmasta. Esityksen kannanottona oli, että avoimuudesta tulisi tehdä osa meritoitumista.

Ari Asmi käsitteli tutkimusdataan viittaamisen periaatteita. Esimerkkitapauksen valossa hän toi esille samalla erään RDA working group:n toimintaa.

Paneelikeskusteluissa nousivat esille er toimijoiden roolit ja vastuut. Rahoittajat vaativat tiettyä raportointia, johon hallinto pyrkii vastaamaan. Vastaavasti julkaisuprosessit ja tutkimusaineistojen saatavuus kiinnostavat kirjastosektoria. Laitokset markkinoivat itseään tuottamillaan projekteilla ja niiden tutkimustuloksilla. Toimijoiden verkosto on laaja ja kokonaisuutta tulisi katsella laajemmasta näkökulmasta kuin omasta. Rajapintojen hyödyntäminen tietojärjestelmien välillä voi tuoda helpotusta. Kansainvälistyvässä maailmassa ei voida pysytellä kotimaan rajojen sisäpuolella, vaan on katsottava myös aidan toiselle puolelle. Tieteellisessä koulutuksessa tulisi nostaa keskiöön avoin tiede ja opastaa opiskelijoita avoimeen toimintaperiaatteeseen jo ensi metreiltä. Meritoitumisessa tulisi huomioida paremmin myös avoimesti julkaistut tutkimusaineistot ja avoimen tieteen edistämistä tulisi edesauttaa mieluummin porkkanalla kuin kepillä. Loppuun heitettiin haaste myös kirjastoille: Kirjastojen pitäisi ryhtyä tekemään datalle samaa kuin ne tekevät tällä hetkellä kirjoille.

Tomi Rosti, tietoasiantuntija

 

Share