Aineistonhallintaa jo perusopinnoissako? Kyllä, mutta miten? | Data management training during master’s studies? Yes please, but how?

(Please, scroll down to read in English.)

Kirjasto toteutti ohjaajille ja opettajille loppukeväästä kyselyn opinnäytetöiden tutkimusdatan hallinnasta. Kyselyyn saatiin 130 vastausta lyhyessä ajassa ja keskellä kevään kiireitä – kiitos siis teille vastaajille! Ilahduttavasti vastauksia tuli jokaisesta tiedekunnasta ja lukuisista oppiaineista. Emme ole vielä kerenneet analysoimaan kyselyn tuloksia perusteellisesti, mutta halusimme kuitenkin tuoreeltaan kertoa ensituntemuksia. Tästä on sitten hyvä jatkaa perusteellisemmin kesän jälkeen ja uusin voimin.

Aineistonhallintasuunnitelma ja datanhallinnan taidot

Kyselyn taustalla on osaltaan kansallinen linjaus tutkimusaineistojen ja -menetelmien avoimuudesta, jossa yhtenä tavoitteena on opiskelijan aineistonhallintasuunnitelman eli DMP:n (Data Management Plan) arviointi ja kommentointi osana opinnäytetyön ohjaajan ohjaustyötä. Tämän pitäisi tapahtua vuoteen 2024 mennessä. Tällä hetkellä perusopiskelijoiltahan ei edellytetä aineistonhallintasuunnitelmaa, joten linjaus asettaa korkeakouluille uusia tavoitteita.

Kansallinen linjaus ei ole tietenkään ainoa syy nostaa esiin tutkimusdatanhallinnan taitoja. Tutkimusdatan hyvän hallinnan taidot tulevat tarpeeseen kenelle tahansa tiedon parissa työskentelevälle ihmiselle, sillä tiedon- tai datanhallinta on osa työelämän perustaitoja. Korkeakoulujen tehtävä on huolehtia siitä, että opiskelijoille on tarjolla tutkimusdatanhallinnan opetusta ja että ohjaajilla on riittävä tuki, jotta he pystyvät arvioimaan opiskelijoiden aineistonhallintasuunnitelmia. Tässäkin yhteydessä yliopiston eri asiantuntijoiden osaaminen kohtaa yli yksikkörajojen.

Taustoitimme kyselyä toteamalla, että tutkimusdatan hyvässä hallinnassa noudatetaan sellaisia datan käsittelyn ja tallennuksen toimia, jotka varmistavat tutkimustulosten toistettavuuden ja todennettavuuden sekä tutkimusdatan avaamisen ja uudelleen käytön lainsäädännön sallimin rajoin. Hyvä datanhallinta noudattaa siten FAIR-periaatteita eli data on löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimivaa (Interoperable) ja uudellenkäytettävissä (Re-usable).

Taidot ja tuen tarpeet tutkimusdatanhallinnassa

Kyselyssä kartoitimme datanhallinnan teemojen käsittelyä perusopintojen eri vaiheessa sekä ohjaajien omaa osaamista ja tuen tarvetta mm. FAIR-periaatteista, datan omistajuudesta ja tietosuojasta, metadatasta sekä datan säilyttämisestä tutkimuksen aikana ja sen jälkeen. Datan säilyttämiseen tutkimuksen aikana olimme tässä kyselyssä sisällyttäneet mm. tietoturvallisen tallentamisen, käyttöoikeudet, varmuuskopioinnin ja tiedostomuodot.

Ensisilmäyksellä näyttäisi siltä, että datan säilyttämiseen liittyvät seikat ja tietosuoja-asiat ovat muita osa-alueita paremmin hallussa. Näitä myös usein opetetaan perusopinnoissa jollain tavoin. Tämä kertoo varmastikin osaltaan siitä, että niillä aloilla, joissa henkilötietojen käsittely on keskeistä, asiaan osataan kiinnittää ja kiinnitetään huomioita. Kaikki tutkimusdata ei luonnollisestikaan sisällä henkilötietoja, eikä tietosuoja nouse tuolloin esiin. Sen sijaan tutkimuksen toistettavuus tai vaikkapa datan kaupallinen potentiaali saattavat motivoida datanhallinnan taitojen huomioimista opetuksessa ja ohjauksessa.

Tutkimuksenaikaisen datan säilyttämiseen ja jakamiseen liittyvät käytännöt ovat nekin ohjauksen ja tutkimuksen arkea ja solahtavat luontevasti opetukseen ainakin joidenkin aineistotyyppien kohdalla. Aineistojen omistajuutta sekä avointa dataa ja sen saatavuutta käsitellään jonkin verran, mutta metadata ja FAIR-periaatteet tuntuvat jäävän hieman syrjään. Näihin teemoihin opinnäytetyön ohjaajat kaipaavat myös enemmän tukea.

Datanhallinnan opetus sopii vastaajien mielestä esimerkiksi tutkimusmenetelmäopintoihin, gradujen suunnitelma- ja tulosseminaareihin ja ennen kaikkea opinnäytetyöohjaukseen. Näissä datanhallinnan teema osuukin eittämättä otolliseen kohtaan opintoja. Vastauksista käy ilmi myös tutkimusaineistojen moninaisuus: toisaalla tarvitaan vahvaa tietosuojaosaamista, toisaalla suurten datamassojen käsittelyä ja joskus koko datanhallinta saattaa tuntua melko marginaaliselta.

Kesä saa kypsytellä kyselyn satoa. Tästä on hyvä lähteä yhdessä suunnittelemaan tutkimusdatanhallinnan osaamisen integrointia perusopintoihin ja pohtimaan, millä tavoin kirjasto voi ohjaajia tuossa työssä tukea.

Kuva | Image Harish Sharma (Pixabay).

UEF Library made a survey about research data management training during studies and master thesis supervision in late spring. Despite the hectic spring and short answering period, the survey received 130 answers –thank you responders! Delightfully, answers came from all faculties and several study subjects. We have not yet had time to thoroughly investigate the answers, but we would like to share our initial feelings about the responses. It will be easy to continue with a more profound analysis after the summer holidays have refreshed our thoughts.

Data management plan and data management skills

The motivation for the survey partially came from the national open science policy, where one goal is that all supervisors can evaluate and comment data management plans (DMPs) as a part of the thesis supervision. This should actualize by 2024 for Finnish higher education institutions, which is quite ambitious because currently the requirement to prepare DMPs as a part of master studies has not yet been implemented at all.

Of course, national policy is not the only reason to promote data management skills, because they are working life skills and relevant for all persons who work with data. It is utmost important for higher education institutions to ensure that students are taught data management skills and that the supervisors receive enough support to be capable of evaluating DMPs. This is where specialists should meet over departmental and administrative boundaries.

Prior to the survey, we informed participants that good data management follows practices that ensure the replicability and verifiability of results and enable opening and re-use of data within legislative boundaries. Good data management follows the FAIR-principles, meaning that data is Findable, Accessible, Interoperable and Re-usable.

Skills and training needs in research data management

We surveyed data management themes at various stages of studies, and supervisors’ skills and training needs regarding FAIR-principles, data ownership, data protection, metadata, and data storage during and after research. We included in the survey questions about safe data storage, user rights, back-ups, and file formats.

Data storage options and data protection issues are best known among supervisors, and they are often taught already during basic studies. This means that in those fields of study where handling personal data is crucial, teachers are also knowledgeable about the matter and pay attention to it. Naturally, not all data contains personal information, and data protection is not as critical in those fields – despite this, replicability of the study and commercial potential may motivate teachers to instruct and supervise data management skills.

Data storage during research and conventions about sharing of data are also part of everyday life in research and are a natural part of teaching regarding certain data types. Data ownership and open data are taught to some extent, whereas metadata and FAIR principles are taught rarely. These are also the themes where supervisors hoped to receive more guidance, according to our survey.

The survey respondents feel that data management skills would be optimally taught during research method courses, thesis seminars and supervision of master’s thesis. Indeed, this would be an ideal time to learn those skills as they can be applied immediately in practice. The responses also reflect the diversity of data types: in some fields data protection is crucial, elsewhere treatment of big data is important and, in another field, the need for data management skills may feel marginal altogether.

We will let summer ripen our harvest. This is good background information to start planning how research data management should be integrated to basic studies and contemplate how library could support supervisors in giving data management guidance to their students.

Vuoristorata | A roller coster

Kuva | Photo Roine Piirainen, CC0 (Kuvalähde | Image source: kuviasuomesta.fi by Markkinointitoimisto Tovari).

Manna Satama, tietoasiantuntija | information specialist
Helena Jäntti, tietoasiantuntija | information specialist
Niina Nurmi, projektisuunnittelija | project planner
Laura Parikka, tietoasiantuntija | information specialist
Taisa Sallinen, tietoasiantuntija | information specialist

Opetus- ja tietopalvelut | Training and information services