Avoimia tietoaineistoja: Mitä ja kenelle? / Open research data materials: what and for whom?

(To read in English, please, scroll down.)

Tutkimuksen avoimuuteen kuuluu keskeisenä osana aineistojen avoin saatavuus. Tutkimusaineistojen avoimella saatavuudella edistetään tutkimuksen saavutettavuutta sekä aineistojen ja tutkimustulosten jatkokäyttöä. Avoimet aineistot pitävät sisällään monenlaista tietoa: ne voivat koostua julkaisuista, metatiedoista, dataseteistä tai vaikkapa postereista tai PowerPoint-esityksistä. Olennaista on, että aineistot ovat maksuttomasti muiden löydettävissä ja hyödynnettävissä.

Olen aivot hiessä perehtynyt käytössä oleviin avoimiin tietoaineistopalveluihin ja niiden tarjoamiin mahdollisuuksiin. Tarjolla on sekä suomalaisia että kansainvälisiä palveluita, joista useimmat toimivat paitsi tutkimustiedon lähteinä, myös omien tutkimustulosten jakelu- ja tallennuspaikkana.

Suomalaisia avoimia tutkimusaineistojen hakupalveluita ovat mm. Etsin, AVAA, Aila, Doria ja Theseus. Etsimestä haetaan ja sinne tallennetaan metadataa eli tutkimusaineistoja kuvailevia tietoja eri tieteenaloilta. Tutkija tallentaa aineistonsa valitsemaansa tieteenalakohtaiseen tai yleiseen tietoarkistoon, josta metatiedot lisätään Etsimeen. Näin tutkimustulokset ovat laajemman yleisön haettavissa ja käytettävissä. AVAA on aineistojen avaajille ja avointen aineistojen jatkohyödyntäjille suunnattu tutkimusaineistojen julkaisualusta. AVAA sisältää tällä hetkellä pääasiassa luonnontieteiden ja kielitieteiden paikkatietoaineistoja. Palveluportaali Ailasta löytyy yhteiskuntatieteelliseen tietoarkistoon arkistoituja, yhteiskunnallisten alojen tutkimusaineistoja metatietoineen. Aineistojen selaaminen ja hakeminen on vapaata ja aineistot ovat hyödynnettävissä aineistojen luovuttajan käyttöehtojen mukaisesti. Ladatut aineistot saa avattua esim. SPSS-ohjelmalla. Itä-Suomen yliopiston sähköiset opinnäytteet ja sarjat löytyvät tällä hetkellä UEF Electronic Publications -palvelusta. Suuri osa julkaisuista on avoimesti saatavilla. Doria on Kansalliskirjaston ylläpitämä julkaisuarkisto, josta löytyy usean viranomaistahon tai muun julkisen organisaation (esim. ELY-keskus, Liikennevirasto ja Tilastokeskus) tuottamia julkaisuja. Theseuksesta voi hakea avoimesti saatavilla olevia ammattikorkeakoulujen opinnäytetöitä ja muita julkaisuja. Kielipankissa on laaja valikoima teksti- ja puheaineistoja hyödynnettäväksi. Avoindata.fi-palvelusta löytyy mm. kuntien avoimia aineistoja. Vilkaise myös kansalliskirjaston julkaisuarkistopalvelua!

Eurooppalainen Zenodo on tutkimustulosten jakamiseen ja tallentamiseen keskittyvä, OpenAIRE-hankkeen ja CERN:n kehittämä palvelu. Zenodoon voi tallentaa aineistoja kaikilta tieteenaloilta. Palvelussa on avoimesti saatavissa mm. postereita, datasettejä, esityksiä, konferenssijulkaisuja, kuvia ja artikkeleita. EU-komission tukema, tutkimuksen avoimuutta edistävä OpenAIRE -portaali haravoi eurooppalaisia ja kansainvälisiä julkaisuarkistoja, ja sisältää tällä hetkellä noin 10 miljoonaa avointa julkaisua tai data-aineistoa. Portaali myös opastaa tutkijoita löytämään omaan tarpeeseen sopivan julkaisu- tai data-arkiston. CESSDA on eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama palvelukokonaisuus, jonka suomalainen palveluntuottaja on yhteiskuntatieteellinen tietoarkisto Aila. CESSDA:n sivuille on koottu eurooppalaisia tietoarkistoja ja -palveluita valtioittain. European Data Portal haravoi metadataa julkisen sektorin informaatiosta. Euroopan tasolla portaali kokoaa kansallista avointa aineistoa yhteen paikkaan muiden hyödynnettäväksi. Myös European Union Open Data Portal tarjoaa keskitetyn pääsyn EU:n toimielinten ja laitosten tuottamiin aineistoihin. Piipahda EUDAT:n sivuilla katsastamassa heidän tietoaineistopalveluitansa.

DOAJ on hakemisto verkossa vapaasti saatavana olevista kansainvälisistä tieteellisistä aikakauslehdistä. Palvelun tavoitteena on kattaa kaikki tieteenalat. Europe PMC puolestaan kokoaa avoinna olevia PubMed:n ja PubMed Central:n kokotekstejä ja abstrakteja. Pangaea:sta voi etsiä geo- ja ympäristötieteiden datasettejä. ArXiv-arkisto on tuttu etenkin matemaatikoille ja fyysikoille, sillä näillä aloilla tieteellisten tutkimusten ennakkojulkaisut on jo vuosia rinnakkaistallennettu ArXiv:iin.

Palveluita avoimen datan etsimiseen ja julkaisemiseen on jo olemassa, hankalinta lienee valita itselleen ja omalle työlleen käyttökelpoisimmat vaihtoehdot. Yleensä omien töiden julkaisemiseen suositellaan oman tieteenalan tietoarkistoa, jotta tutkimusaineistot saavuttavat oikean lukija- ja käyttäjäkunnan. UEF:n tulevan rinnakkaistallennuspalvelun, UEF//eRepositoryn, avulla voimme lähitulevaisuudessa saada UEF-julkaisut tallennettua avoimeen julkaisuarkistoon. Tämän tieteen avoimuutta ja näkyvyyttä aimoharppauksin parantavan rinnakkaistallennuspalvelun käyttöönottoa vielä pari kuukautta odotellessa… Sillä välin rohkeasti tutustumaan ja kokeilemaan näitä muita!

oa_data

 

Lisätietoja:

Open UEF

Avoin tiede ja tutkimus

Kaisa Hartikainen, tietoasiantuntija, opetus- ja tietopalvelut, Kuopion kampuskirjasto

 

Open research data materials: what and for whom?

An essential part of open science is open access to research data.

Open access to data promotes the accessibility to research and the follow-up application of research data and results. Open access data features many sorts of information: publications, metadata, data sets or even posters or PowerPoint presentations. The main idea is that the data can be accessed and utilised by others – free of charge.

My brain has been set to get acquainted with open access data material services that would already be in use and the possibilities they could offer. There are both Finnish and international services available, and most of them work not only as sources for research information but also as places of storing and distributing your own research results.

Finnish open access data material search services include Etsin, AVAA, Aila, Doria and Theseus. In Etsin, you can search for and save metadata, i.e. descriptive information regarding research data from different fields of science. Researchers choose into which discipline-specific or general data archive they store their data. Metadata is retrieved from there and added to Etsin. This allows research results to be retrievable and usable for a larger audience.

AVAA is an open data publishing platform designed for researchers who use and further refine data material. At the moment AVAA contains mainly georeferenced data and information of natural sciences and linguistics. Service portal Aila has research data archived in the sociological data archive with their metadata. Browsing and searching the material is free of charge and the materials can be utilised according to terms and conditions defined by the data provider. The uploaded materials can be opened with software such as SPSS.

The electronic theses and series publications of the University of Eastern Finland can be found in the UEF Electronic Publications service at the moment. Many of the publications are openly accessible. Doria is a publication archive maintained by the National Library of Finland. In Doria you can find publications of several authorities or other public organisations (for example, Centre for Economic Development, Transport and the Environment, Finnish Transport Agency, Statistics Finland). You can use Theseus to search openly available theses and other publications of universities of applied sciences and polytechnics. The Language Bank of Finland has a wide variety of written and spoken material to be utilised, while Avoindata.fi contains, for instance, open material concerning municipalities, towns and cities in Finland. Take also a look at the National Library’s publication archive service!

The European Zenodo is a service developed by the OpenAIRE project and CERN, focusing on distribution and storage of research results. You can save materials from all fields of science into Zenodo. The service openly provides posters, data sets, presentations, conference publications, images and articles. The open access-promoting OpenAIRE portal supported by the European Commission gathers material from European and international publishing archives. At the moment it contains approximately ten million open publications and data material files. The portal also guides researchers to find a suitable publication or data archive for their needs.

CESSDA is a service consortium comprised by European sociological data archives. Its Finnish service provider is the aforementioned Aila, and its European data archives and services have been gathered from different nations, while European Data Portal gathers metadata from public sector information. On the European level, the portal collects national open data material into one place to be utilised by others. In addition, European Union Open Data Portal offers a concentrated access to material produced by the institutions and departments of the European Union. Visit also the EUDAT’s website to check out their data material services.

DOAJ is an index of all international scientific journals openly accessible online. The goal of the service is to cover all fields of science. On the other hand, Europe PMC gathers open full text and abstract material of the PubMed and PubMed Central databases. Pangaea can be used to search data sets of geological and environmental sciences. The ArXiv archive might be familiar to mathematicians and physicists, for practitioners of these fields of science have been self-archiving preprints of scientific research projects for years in ArXiv.

Services for open data searching and publishing do already exist, but the most difficult thing may be to choose the most suitable options for you and your work. Usually it is recommended to use a data archive of your own field of science, so that your research data materials reach the right readers and users. An upcoming self-archiving service brought to you by UEF, the UEF//eRepository, will help us to store UEF publications into an open publication archive in the near future. A service that will promote the openness and visibility of science in leaps and bounds is coming, so stay tuned. Meanwhile, go ahead and have a go at the ones mentioned above!

For more information:

Open UEF

Open Science and Research

Kaisa Hartikainen & Urho Heinonen, Kuopio Campus Library