Aineistonhallinnan opetukseen kaivataan tukea Itä-Suomen yliopistossa | Support is needed for teaching data management at the University of Eastern Finland

(Please, scroll down to read in English.)

Aineistonhallinta on olennainen osa tutkimus- ja tietotyötä, ja sen laatuun on alettu kiinnittää entistä enemmän huomiota. Aineistonhallinnalla tarkoitetaan toimenpiteitä, joilla kerätään, säilytetään ja käytetään aineistoja — mittaustuloksia, haastatteluja, tekstejä, näytteitä ja niistä kertynyttä dataa — turvallisesti ja tehokkaasti. Tutkimustyössä aineistonhallinnalla huolehditaan, että aineisto pysyy käytettävänä koko tutkimuksen ajan ja myös sen jälkeen. Lisäksi aineistonhallintaan voi kohdistua lainsäädännöllisiä vaatimuksia, kuten esimerkiksi tietosuoja-asetuksen vaatimukset henkilötietojen käsittelyyn. Useimmiten tutkimusaineistojen hallinnan suunnitelmat rajautuvat datan hallintaan.

Tavoitteena systemaattisempi aineistonhallinnan opetus perusopinnoissa

Aineistonhallinta on avoimen tieteen edellytys, minkä edistämiseen suomalaiset korkeakoulut, mukaan lukien Itä-Suomen yliopisto, ovat sitoutuneet. Suomessa tutkimusyhteisö on aktiivisesti mukana linjaamassa avoimen ja vastuullisen tieteen tavoitteita ja toimenpiteitä. Tutkimusaineistojen ja -menetelmien linjaus (1) julkaistiin vuonna 2021, ja yksi sen tavoitteista koskee opinnäytetöiden datanhallintasuunnitelmien opetusta: “Viimeistään vuonna 2024 korkeakoulut huolehtivat, että opinnäytetöiden ohjaajat osaavat osana ohjaustyötään arvioida ja kommentoida datanhallintasuunnitelmia” (s. 14). Aikataulu on tiukka, eikä tavoiteajassa pysymistä helpota se, että aineistonhallinnan opetus perusopiskelijoille on vasta kehittymässä ja sille ollaan vasta luomassa osaamistasoja sekä yhtenäisiä kansallisia käytänteitä.

Aineistonhallintasuunnitelman tekeminen on ollut jo pidemmän aikaa ehtona monien tutkimushankkeiden rahoitukselle, ja tutkijat ovat saaneet ohjeistusta niiden tekemiseen kirjastosta. Lisäksi aineistonhallinnan kurssi on ollut osa UEFin tohtorikoulun vapaavalintaisia opintoja jo useamman vuoden ajan. Sen sijaan aineistonhallinnan opetus perusopiskelijoille on ollut lähinnä laitosten, osastojen ja yksittäisten ohjaajien vastuulla, eikä opetuksen määrä ja laatu koko Itä-Suomen yliopiston tasolla ole ollut tiedossa.

Aineistonhallinnan opetukseen on kuitenkin syytä kiinnittää huomiota, sillä aineistojen ja datan asianmukainen käsittely lisää opinnäytetöiden laatua ja riskinhallintaa monin tavoin. Aineiston keruun ja käsittelyn läpinäkyvyys parantuu, kun toimenpiteet dokumentoidaan ja aineisto kuvaillaan huolellisesti. Asianmukainen tallennus ja jakaminen koko opinnäytetyön elinkaaren ajan ennaltaehkäisee vahingossa tapahtuvan aineiston tuhoutumisen tai sen päätymisen vääriin käsiin Aineistonhallinnan osaamisesta on hyötyä opintojen ja tutkimuksen teon ohella myös työelämässä ylipäätään.

Kysely ja sen tulokset

Aineistonhallinnan opetuksen tilanteen kartoittamiseksi UEF kirjasto teki kyselyn oppiaineiden opettajille ja opinnäytetyön ohjaajille. Kyselyssä keskityttiin datanhallintaan, ei fyysisten aineistojen hallintaan, vaikka fyysisetkin aineistot edellyttävät suunnitelmallista käsittelyä ja hallintaa. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Jakauma: FILO 22 %. LUMET 18 %. TT 43 %. YHKA 17 %.
Kuva 1. Vastaajien määrä tiedekunnittain (n = 130). FILO = Filosofinen tiedekunta. LUMET = Luonnontieteiden ja metsätieteiden tiedekunta. TT = Terveystieteiden tiedekunta. YHKA = Yhteiskunta- ja kauppatieteiden tiedekunta.

Kyselyyn sai vastata suomeksi ja englanniksi. Vastauksista ilmeni, että aineistonhallintaa ei opeteta yksittäisenä kokonaisuutena, vaan se nivoutuu osaksi metodikursseja ja/tai opinnäytetyön ohjausta. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Kyselyn tulokset osoittivat, että FAIR-periaatteet ja metadata tunnetaan heikoimmin opettajien ja ohjaajien keskuudessa. FAIR tulee sanoista Findable (=löydettävä), Accessible (=saavutettava), Interoperable (=yhteentoimiva) ja Re-usable (=uudelleen käytettävä) ja tarkoittaa käytännössä sitä, että aineistoa käsitellään niin, että tutkimuksen tulokset voidaan tarvittaessa verifioida sekä aineistoa on mahdollista jatkokäyttää olemassa olevan tutkimuksen jälkeen.

FAIR-periaatteiden käytännön toteuttaminen edellyttää hyvää tieteenala- ja aineistokohtaista ymmärrystä ja alan tutkimuskäytänteiden tuntemusta, mikä hankaloittaa yksityiskohtaisten yleisohjeiden antamista. Yleisluonteisia ohjeita kuitenkin laaditaan, mutta niiden perusteella FAIR-periaatteiden noudattaminen saattaa olla varsin vaikeaa. Myös metadata eli aineiston kuvailu oli heikommin tunnettua. FAIR-periaatteet ja metadata voivat myös olla termeinä vieraita, mutta monet ohjaat ja opettajat voivat käyttää niiden kuvaamiseen vaikkapa eri termejä ja toteuttaa niitä käytännössä tietämättään. Toisaalta opettajat ja ohjaajat tunsivat hyvin avoimen datan ja sen saatavuuden, mutta sitä ei juuri opeteta opiskelijoille, vaikka se on keskeinen aineistonhallinnan osa-alue.

Graafi. Kuinka hyvin tunnet seuraavat datanhallinnan osa-alueet? FAIR 44 % ei tunne eikä opeta. 7 % opettaa. Datan omistajuus 20 % ei tunne eikä opeta, 20 % opettaa. Avoin data 16 % ei tunne eikä opeta, 13 % opettaa. Datan tallennus tutkimuksen aikana 13 % ei tunne eikä opeta, 28 % opettaa. Metadata 28 % ei tunne eikä opeta, 16 % opettaa. Datan sensitiivisyys ja tietosuoja 10 % ei tunne, 37 % opettaa. Datan säilytys/hävitys tutkimuksen jälkeen 14 & ei tunne, 36 % opettaa.
Kuva 2. Datahallinnan osa-alueiden tuntemus

Vaikka aineistonhallinnan osa-alueet tunnettiin kohtalaisesti, noin puolet opettajista ja ohjaajista koki, että he tarvitsevat tukea aineistonhallinnan opetukseen ja ohjaukseen. Neuvontaa kaivattiin lähes kaikkiin aineistonhallinnan osa-alueisiin. Kun vastauksia tarkasteltiin tiedekuntakohtaisesti, Terveystieteiden tiedekunta (TT) erottui muista tiedekunnista siinä, että TT:ssä tunnetaan melko hyvin henkilötietoja ja arkaluonteisia henkilötietoja sisältävän aineiston käsittely. Toisaalta Terveystieteiden tiedekunnassa kaivattiin neuvontaa henkilö- ja terveystietoa sisältävien aineistojen avaamiseen. Se saattaakin olla usein työlästä ja vaikeaa, sillä avaamisessa tulee kiinnittää erityistä huomiota aineiston avaamisen laajuuteen ja käyttöoikeuksien asianmukaiseen jakeluun.

Graafi. Kaipaan neuvontaa seuraaviin datanhallinnan osa-alueisiin. FAIR-periaatteet 60 % kyllä, 40 % ei. Datan omistajuus 50 % kyllä, 50 % ei. Avoin data ja sen saatavuus 53 % kyllä, 47 % ei. Datan tallennus tutkimuksen aikana 43 % kyllä, 57 % ei. Metadata 49 & kyllä, 51 % ei. Datan sensitiivisyys ja tietosuoja 38 % kyllä, 62 % ei. Datan säilytys/hävitys tutkimuksen jälkeen 39 % kyllä, 61 % ei.
Kuva 3. Tuen tarve aineistonhallinnan eri osa-alueilla.

Missä vaiheessa opintoja? Kuka opettaa?

Aineistonhallinnan opetus nivoutuu useimmiten osaksi pro gradu -tutkielmaa joko osana seminaaria tai varsinaista työnohjausta. Opettajat ja ohjaajat myös kokivat, että tämä olisi luonnollisin ajankohta aineistonhallinnan opetukselle. Kyselyn avovastauksista ilmeni, että aineistonhallinta ylipäätään koetaan tarpeelliseksi ja että sen laadukkaaseen opetukseen ja ohjaukseen on syytä kiinnittää huomiota. Lisäksi kirjastolta toivottiin ohjausta aineistonhallinnan opetukseen ja tiivistä materiaalipakettia aineistonhallinnasta sekä ohjaajille, opettajille että opiskelijoille.

Vastauksena aineistonhallinnan opetuksen tarpeisiin, kirjastossa on suunnitteilla ohjaajan paketti kirjaston verkkosivuille. Lisäksi päivitämme ja pyrimme lisäämään nykyisten perusopiskelijoille suunnattujen aineistonhallinnan verkkosivujen näkyvyyttä. Suunnitelmissa on myös aineistonhallinnan opetuksen kehittäminen ja pilotoiminen yhteistyössä oppiaineiden kanssa.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Tutkimusaineistojen ja -menetelmien avoimuus : korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021-2025. Osalinjaus 1, Tutkimusdatan avoin saatavuus. Helsinki: Tieteellisten seurain valtuuskunta. DOI: https://doi.org/10.23847/isbn.9789525995466 

Support is needed for teaching data management at the University of Eastern Finland

Data management, an essential part of research- and information work, has received increasing attention in recent years. Data management means procedures, which are used to collect, store, and use data safely and efficiently. Data can include measurement results, interviews, texts, samples, or data based on the aforementioned. In scientific research, data management ensures that the data will be usable throughout the research process – from preliminary data to data reposition after research. There can be also legal requirements, such as data privacy issues regulated by the general data protection regulation (GDPR), that mandate the data management procedures. Although data can also include physical samples, data management plans typically only concern data in a digital format.

Goal: Systematic training for data management during master’s studies

Data management is an integral part of Open Science, and Finnish higher education institutions (incl. University of Eastern Finland, UEF) are committed on promoting it. In Finland, the research community is actively developing goals and actions to promote open and responsible science. The National Policy and Executive plan by the higher education and research community (1) was published in 2021 and one of its goals involves teaching of data management during thesis supervision: “No later than 2024, higher education institutions will ensure that thesis supervisors are able to evaluate and comment on data management plans as part of their supervisory work” (pp 13). Because the skill levels and national practices are at the moment still being developed, the schedule is quite ambitious.

Writing data management plans has been a pre-requisite for several research funding instruments for a while and UEF Library has a major role in training researchers to write them. In addition, Library has offered a course on research data management for doctoral students for some years now. However, the training of master’s students for research data management has not been systematic, and instead the training has been organized mainly by departments and individual teachers and thesis supervisors. Therefore, the extent and the quality of the training is not known at the university level.

Nevertheless, it is necessary to pay attention to data management training and appropriate treatment of data because it will increase the quality of theses and it is also part of risk management. Appropriate storing and sharing of data will decrease the risks, such as accidental loss of data or data misuse. Being knowledgeable about data management is also an important general skill that is needed in working life.

Survey and results

The UEF library conducted a survey during May-June 2022 about the teaching of data management by teachers and thesis supervisors. The survey focused on management of digital data, rather than physical samples, although physical samples also need systematic handling and treatment. We received 130 answers, which covered all faculties and most departments.

Distribution. FILO 22%, LUMET 18%, TT 43%, YHKA 17%
Figure 1. Percentage of responses in faculties (n = 130). FILO = Philosophical Faculty. LUMET = Faculty of Science and Forestry. TT = Faculty of Health Sciences. YHKA = Faculty of Social Sciences and Business Studies.

Answers were accepted both in Finnish and English. The results showed that data management is not taught as a separate entity/topic, but instead as part of methodological courses or thesis supervision.

The results also show that the FAIR-principles and metadata are the least known parts of data management. The acronym derives from the words Findable, Accessible, Interoperable and Re-usable. In practice FAIR means that data are treated in a manner that research results can be verified, and the data can be re-used after the current work is completed. Applying FAIR-principles, however, requires good knowledge of data types used in each scientific field. This makes giving detailed, one-size-fits-all instructions difficult. Other less familiar data management topic was metadata, i.e., the description of data. The unfamiliarity with FAIR-principles and metadata could also be unknown as terms; hence, it is possible that many teachers and supervisors practice or work with them without knowing it. On the other hand, teachers and supervisors were familiar with open data, yet it was rarely taught to students despite being a key component of research data management.

Graph. How familiar are you with...? FAIR principles: Do not know 44%, teach 7%.Data ownership Do not know 20%, teach 20%. Open data Do not know 16%, teach 13%.Data storage Do not know 13%, teach 28%.Metadata Do not know 28%, teach 16%.Data sensitivity and data protection Do not know 10%, teach 37%. Data storage/disposal after research Do not know 14%, teach 36%.
Figure 2. Knowledge about areas of data management

Although all the key aspects of data management were known to some extent, almost half of the teachers and supervisors felt that they need support for teaching data management. Guidance was needed in all aspects of data management. When answers were compared between faculties, the knowledge about personal and sensitive data was the best in the Faculty of Health Science. On the other hand, teachers and supervisors in the Faculty of Health Science felt that they need guidance on how to open the data the most. Indeed, opening sensitive data can be difficult because the degree of openness and used rights must be considered carefully.

Graph. I need guidance in: FAIR principles Yes 60%, No 40%. Data ownership Yes 50%, No 50%. Open data Yes 53%, No 47%. Data storage Yes 43%, No 57%. Metadata Yes 49%, No 51%. Data sensitivity and data protection Yes 38%, No 62%. Data storage/disposal after research Yes 39%, No 61%.
Figure 3. Support needed in different areas of research data management

In which part of studies? Who is teaching?

According to the survey results, research data management was mostly taught as a part of thesis work, either as a part of seminar or during the actual thesis supervision. The teachers and supervisors also felt that this is the most suitable timing for the teaching. The open answers of the survey showed that teaching data management is important, and attention should be paid to good quality in teaching it. Respondents wished guidance and compact material bank for students, teachers, and supervisors.

In a response for the need for support in the teaching of data management, the UEF library will prepare a supervisor’s guide in the library website. We will also update and increase the visibility of the existing material for the students. Obviously, the first step is to translate all material in English. We will also possibly pilot the teaching of data management together with the departments.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Open research data and methods National policy and executive plan by the higher education and research community for 2021–2025: Policy component 1: Open access to research data. DOI: https://doi.org/10.23847/isbn.9789525995480

Helena Jäntti, tietoasiantuntija | Information specialist
Taisa Sallinen, tietoasiantuntija | Information specialist
Manna Satama, tietoasiantuntija | Information specialist
Niina Nurmi, tietoasiantuntija | Information specialist
Laura Parikka, tietoasiantuntija | Information specialist
Opetus- ja tietopalvelut | Training and Information Services

 

 

 

Aineistonhallintaa jo perusopinnoissako? Kyllä, mutta miten? | Data management training during master’s studies? Yes please, but how?

(Please, scroll down to read in English.)

Kirjasto toteutti ohjaajille ja opettajille loppukeväästä kyselyn opinnäytetöiden tutkimusdatan hallinnasta. Kyselyyn saatiin 130 vastausta lyhyessä ajassa ja keskellä kevään kiireitä – kiitos siis teille vastaajille! Ilahduttavasti vastauksia tuli jokaisesta tiedekunnasta ja lukuisista oppiaineista. Emme ole vielä kerenneet analysoimaan kyselyn tuloksia perusteellisesti, mutta halusimme kuitenkin tuoreeltaan kertoa ensituntemuksia. Tästä on sitten hyvä jatkaa perusteellisemmin kesän jälkeen ja uusin voimin.

Aineistonhallintasuunnitelma ja datanhallinnan taidot

Kyselyn taustalla on osaltaan kansallinen linjaus tutkimusaineistojen ja -menetelmien avoimuudesta, jossa yhtenä tavoitteena on opiskelijan aineistonhallintasuunnitelman eli DMP:n (Data Management Plan) arviointi ja kommentointi osana opinnäytetyön ohjaajan ohjaustyötä. Tämän pitäisi tapahtua vuoteen 2024 mennessä. Tällä hetkellä perusopiskelijoiltahan ei edellytetä aineistonhallintasuunnitelmaa, joten linjaus asettaa korkeakouluille uusia tavoitteita.

Kansallinen linjaus ei ole tietenkään ainoa syy nostaa esiin tutkimusdatanhallinnan taitoja. Tutkimusdatan hyvän hallinnan taidot tulevat tarpeeseen kenelle tahansa tiedon parissa työskentelevälle ihmiselle, sillä tiedon- tai datanhallinta on osa työelämän perustaitoja. Korkeakoulujen tehtävä on huolehtia siitä, että opiskelijoille on tarjolla tutkimusdatanhallinnan opetusta ja että ohjaajilla on riittävä tuki, jotta he pystyvät arvioimaan opiskelijoiden aineistonhallintasuunnitelmia. Tässäkin yhteydessä yliopiston eri asiantuntijoiden osaaminen kohtaa yli yksikkörajojen.

Taustoitimme kyselyä toteamalla, että tutkimusdatan hyvässä hallinnassa noudatetaan sellaisia datan käsittelyn ja tallennuksen toimia, jotka varmistavat tutkimustulosten toistettavuuden ja todennettavuuden sekä tutkimusdatan avaamisen ja uudelleen käytön lainsäädännön sallimin rajoin. Hyvä datanhallinta noudattaa siten FAIR-periaatteita eli data on löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimivaa (Interoperable) ja uudellenkäytettävissä (Re-usable).

Taidot ja tuen tarpeet tutkimusdatanhallinnassa

Kyselyssä kartoitimme datanhallinnan teemojen käsittelyä perusopintojen eri vaiheessa sekä ohjaajien omaa osaamista ja tuen tarvetta mm. FAIR-periaatteista, datan omistajuudesta ja tietosuojasta, metadatasta sekä datan säilyttämisestä tutkimuksen aikana ja sen jälkeen. Datan säilyttämiseen tutkimuksen aikana olimme tässä kyselyssä sisällyttäneet mm. tietoturvallisen tallentamisen, käyttöoikeudet, varmuuskopioinnin ja tiedostomuodot.

Ensisilmäyksellä näyttäisi siltä, että datan säilyttämiseen liittyvät seikat ja tietosuoja-asiat ovat muita osa-alueita paremmin hallussa. Näitä myös usein opetetaan perusopinnoissa jollain tavoin. Tämä kertoo varmastikin osaltaan siitä, että niillä aloilla, joissa henkilötietojen käsittely on keskeistä, asiaan osataan kiinnittää ja kiinnitetään huomioita. Kaikki tutkimusdata ei luonnollisestikaan sisällä henkilötietoja, eikä tietosuoja nouse tuolloin esiin. Sen sijaan tutkimuksen toistettavuus tai vaikkapa datan kaupallinen potentiaali saattavat motivoida datanhallinnan taitojen huomioimista opetuksessa ja ohjauksessa.

Tutkimuksenaikaisen datan säilyttämiseen ja jakamiseen liittyvät käytännöt ovat nekin ohjauksen ja tutkimuksen arkea ja solahtavat luontevasti opetukseen ainakin joidenkin aineistotyyppien kohdalla. Aineistojen omistajuutta sekä avointa dataa ja sen saatavuutta käsitellään jonkin verran, mutta metadata ja FAIR-periaatteet tuntuvat jäävän hieman syrjään. Näihin teemoihin opinnäytetyön ohjaajat kaipaavat myös enemmän tukea.

Datanhallinnan opetus sopii vastaajien mielestä esimerkiksi tutkimusmenetelmäopintoihin, gradujen suunnitelma- ja tulosseminaareihin ja ennen kaikkea opinnäytetyöohjaukseen. Näissä datanhallinnan teema osuukin eittämättä otolliseen kohtaan opintoja. Vastauksista käy ilmi myös tutkimusaineistojen moninaisuus: toisaalla tarvitaan vahvaa tietosuojaosaamista, toisaalla suurten datamassojen käsittelyä ja joskus koko datanhallinta saattaa tuntua melko marginaaliselta.

Kesä saa kypsytellä kyselyn satoa. Tästä on hyvä lähteä yhdessä suunnittelemaan tutkimusdatanhallinnan osaamisen integrointia perusopintoihin ja pohtimaan, millä tavoin kirjasto voi ohjaajia tuossa työssä tukea.

Kuva | Image Harish Sharma (Pixabay).

UEF Library made a survey about research data management training during studies and master thesis supervision in late spring. Despite the hectic spring and short answering period, the survey received 130 answers –thank you responders! Delightfully, answers came from all faculties and several study subjects. We have not yet had time to thoroughly investigate the answers, but we would like to share our initial feelings about the responses. It will be easy to continue with a more profound analysis after the summer holidays have refreshed our thoughts.

Data management plan and data management skills

The motivation for the survey partially came from the national open science policy, where one goal is that all supervisors can evaluate and comment data management plans (DMPs) as a part of the thesis supervision. This should actualize by 2024 for Finnish higher education institutions, which is quite ambitious because currently the requirement to prepare DMPs as a part of master studies has not yet been implemented at all.

Of course, national policy is not the only reason to promote data management skills, because they are working life skills and relevant for all persons who work with data. It is utmost important for higher education institutions to ensure that students are taught data management skills and that the supervisors receive enough support to be capable of evaluating DMPs. This is where specialists should meet over departmental and administrative boundaries.

Prior to the survey, we informed participants that good data management follows practices that ensure the replicability and verifiability of results and enable opening and re-use of data within legislative boundaries. Good data management follows the FAIR-principles, meaning that data is Findable, Accessible, Interoperable and Re-usable.

Skills and training needs in research data management

We surveyed data management themes at various stages of studies, and supervisors’ skills and training needs regarding FAIR-principles, data ownership, data protection, metadata, and data storage during and after research. We included in the survey questions about safe data storage, user rights, back-ups, and file formats.

Data storage options and data protection issues are best known among supervisors, and they are often taught already during basic studies. This means that in those fields of study where handling personal data is crucial, teachers are also knowledgeable about the matter and pay attention to it. Naturally, not all data contains personal information, and data protection is not as critical in those fields – despite this, replicability of the study and commercial potential may motivate teachers to instruct and supervise data management skills.

Data storage during research and conventions about sharing of data are also part of everyday life in research and are a natural part of teaching regarding certain data types. Data ownership and open data are taught to some extent, whereas metadata and FAIR principles are taught rarely. These are also the themes where supervisors hoped to receive more guidance, according to our survey.

The survey respondents feel that data management skills would be optimally taught during research method courses, thesis seminars and supervision of master’s thesis. Indeed, this would be an ideal time to learn those skills as they can be applied immediately in practice. The responses also reflect the diversity of data types: in some fields data protection is crucial, elsewhere treatment of big data is important and, in another field, the need for data management skills may feel marginal altogether.

We will let summer ripen our harvest. This is good background information to start planning how research data management should be integrated to basic studies and contemplate how library could support supervisors in giving data management guidance to their students.

Vuoristorata | A roller coster
Kuva | Photo Roine Piirainen, CC0 (Kuvalähde | Image source: kuviasuomesta.fi by Markkinointitoimisto Tovari).

Manna Satama, tietoasiantuntija | information specialist
Helena Jäntti, tietoasiantuntija | information specialist
Niina Nurmi, projektisuunnittelija | project planner
Laura Parikka, tietoasiantuntija | information specialist
Taisa Sallinen, tietoasiantuntija | information specialist

Opetus- ja tietopalvelut | Training and information services

Tutkijoiden viesti: Lisää tukea, osaamista ja suunnitelmallisuutta tutkimusdatan hallintaan! | Message from the researchers: More support, skills and planning for research data management, please!

(Please, scroll down to read in English.)

Tutkimusaineistoihin liittyy mitä moninaisempaa tietämystä, osaamista ja toimenpidettä. Jossain kohdin törmää yleensä siihen, että omat taidot eivät riitä tai että asiat olisivat sujuneet paremmin, jos olisi tiennyt, mistä apu on löydettävissä. Tästä aihepiiristä UEFin tutkijat ja kirjaston datatuen väki jakoivat ajatuksiaan ja kokemuksiaan 27.10.2021 pidetyssä työpajassa, jonka otsikkona oli “Tutkijoiden dataosaaminen ja -tarpeet esiin”. Teemaa on sivuttu taannoisessa blogkirjoituksessa, jossa pohdimme tutkimusaineistojen asiantuntijoiden rikasta kenttää. Työpajan teema osui selvästi ajankohtaiseen aiheeseen, sillä samalle päivälle sattuneessa Yhteiskunta- ja kauppatieteiden tiedekunnan strategiapäivässäkin avoin tiede tutkimusaineistoineen keräsi mittavan osallistujajoukon ja herätti vilkasta keskustelua.

Tutkimuksen ja tutkimusaineiston elinkaaret

Tutkimusaineistoa tai -dataa voidaan jäsentää suhteessa tutkimukseen, jonka raaka-aineena se toimii. Tutkimuksen edetessä raakadatasta muokkautuu usein valikoidumpia datasettejä, jotka ovat voineet käydä läpi erilaisia prosesseja ja muokkauksia. Aineistonhallinnan keskustelussa puhutaan usein tutkimuksen ja tutkimusaineistojen elinkaarista. Tutkimuksen elinkaari hahmotetaan kolmeen vaiheeseen: ennen tutkimusta, tutkimuksen aikana ja sen jälkeen. Tutkimusaineistojen elinkaari ulottuu usein tutkimuksen elinkaarta pidemmälle, kun aineistoja hyödynnetään uudelleen.

Työpajassa tunnistettiin tutkimusaineistoihin liittyviä toimenpiteitä ja tietotaitoa erityisesti tutkimuksen aikana. Tällaisina mainittiin vaikkapa datan analysointi, dokumentointi, ohjelmointi, tietokantaosaaminen, sensitiivisen aineiston käsittely ja datan jakaminen tietoturvallisesti yhteistyökumppaninen välillä. Työ on kuitenkin alkanut jo tutkimusta ennen aineiston keruun ja yleisemmin aineistonhallinnan suunnitteluna. Tutkimuksen jälkeen täytyy aineistollekin tehdä jotain: jokin osa aineistosta säilytetään, jokin tuhotaan, ja aineistoa myös avataan tai julkaistaan. Ihannetapauksessa aineisto on uudelleenkäytettävissä jonkin muun tutkimuksen raaka-aineena, jolloin aineiston elinkaari konkretisoi mainiosti asiakirjahallinnan ja arkistotoimen keskustelussa esiintyvää jatkumomallia.

Tutkimusaineiston käsittely edellyttää tutkijoilta usein teknisten taitojen lisäksi yleisiä aineistonhallinnan taitoja vaikkapa terminologian ymmärtämiseen tai tiedon etsimiseen omaan tilanteeseen ja tarkoitukseen sopivista toimenpiteistä ja ratkaisuista. Kaiken pohjana ovat kuitenkin tutkijan perustaidot eli tutkittavan aiheen perustavanlaatuinen tunteminen ja ymmärrys, tutkimusetiikka ja sen käytäntöjen hallinta.

Lisää osaamista ja tukea, kiitos!

UEFin datatuen kehittämisen yksi kulmakivi on yhden luukun palvelun parantaminen, jolloin tutkija pääsisi datasupport@-osoitteen kautta monen eri alan asiantuntijan avulla tuotetun kattavan tuen ja tiedon äärelle. Työpajassa tutkijat saivat vapaat kädet ideoida ja toivoa, mitä palvelua datatuen yhdestä luukusta pitäisi saada ja millainen tuki heitä olisi auttanut eteen tulleissa ongelmatilanteissa ja osaamisen puutteissa. Osa toiveista kohdistui sellaisiin tukipalveluihin, joita on jo nyt tarjolla, mutta joiden olemassaolo ei ole vielä tavoittanut tutkijoita. Esimerkiksi aineistonhallintasuunnitelman (DMP) tukea on saatavilla kommentointipalveluna ja koulutuksina, ja myös kohdennettuna tiettyihin rahoituksiin.

Neuvoja, ohjausta ja koulutusta kaivataan myös datan säilyttämiseen tutkimuksen aikana ja sen jälkeen, datan anonymisointiin, tietokantoihin ja vaikkapa datan käyttämiseen kahden yliopiston yhteisessä hankkeessa eri yliopistojen tunnuksilla. Datanhallinnan ratkaisuihin ja toimintatapoihin toivottiin suunnitelmallisuutta sekä jaettua ymmärrystä ja osaamista vähintäänkin tutkimushankkeiden sisällä. Kokonaisuuden hallinta ei saisi jäädä vain yhden ihmisen varaan.

Yleisemmän aineistonhallinnan tuen rinnalle tunnistettiin tarve aineisto- tai alakohtaisille asiantuntijoille sekä tiedekunnan tasolla oleville tukihenkilöille. Aineistonhallinnan vastuiden konkretian tasot on kuitenkin muistettava: Tukitoimet keskittyvät ohjeistuksiin, koulutuksiin ja neuvoihin, mutta ne eivät pysty vastaamaan varsinaiseen aineistonhallintaan, sillä se on tutkijoiden omalla vastuulla.

Vertaistuesta datatukeen

Vertaistuki on tutkijankin työssä ja aineistonhallinnan asioissa kullan arvoista. Vaikka epäviralliset, usein sattumanvaraiset keskustelut kollegoiden kesken ovat tiedon jakamisen tärkeä kanava, tarvetta on organisoidummalle kollegiaaliselle tuelle. Koulutukset, webinaarit ja oppimisyhteisöt mainittiin hyvinä keinoina jakaa ja saada tietoa. Osastoilla ja laitoksilla voisi olla myös tieteenalakohtaisia datanhallinnan mentoreita, jolloin vertaistukea olisi saatavilla järjestäytyneemmin.

Mikä sitten motivoisi tutkijaa tarjoamaan omaa osaamistaan? Tähänkin kaivataan kannustimia aivan kuten moniin avoimen tieteen käytännön toimiin ylipäätään. Työpajassa mainittiin esimerkkinä koulutuksiin osallistuminen, joka pitäisi pystyä kirjaamaan työraportointeihin. Datanhallinnan taitojen tulisi ylipäätään näkyä selkeämmin tutkijan meritoitumisessa. Tämä antaisi kaivattua nostetta osaamisen kehittämiselle ja lisäisi panostusta tiedekuntien datanhallintaan.

Eräänlaisena yleisenä ohjenuorana ja työpajan kiteytyksenä on suunnitelmallisuus, joka tuli keskustelussa esiin monessa kohdin. Käytännön esimerkkinä mainittiin tutkimushankkeet, joissa datanhallinnan käytänteet pitäisi dokumentoida kunnolla ja joissa niistä pitäisi huolehtia siten, että käytänteet välittyvät myös hankkeisiin tuleville uusille tutkijoille. Tämä saattaa kuulostaa itsestään selvältä, mutta tutkimuksen arjessa ideaalit eivät välttämättä toteudu. Aineistonhallinnan suunnittelun olisi löydettävä paikkansa tutkimussuunnitelman kiistattomana osana. Tässä kohdin tiedekuntien vertaistuki ja yliopiston yleinen datatuki voivat täydentää toisiaan luontevasti ja kaikkien erityisasiantuntemusta tehokkaasti hyödyntäen.

 

Arrows depicting the research data cycle from data collection to analysis and to disseminating results
Työpaja oli osa kirjaston OA-viikon ohjelmaa ja liittyi kirjaston koordinoimaan datatuen kehittämishankkeeseen, jonka kuulumisia on esitelty kirjaston blogissa. Työpajaan osallistui tutkijoita kaikista neljästä tiedekunnista. | The workshop was part of the Library’s OA Week program as well as of the data support project coordinated by the Library (see our project update from an earlier blog article). All four faculties were represented in the workshop. Image by: Patrick Hochstenbach (CC-BY)

Working with research data involves a wide variety of know-how. At some point, you may notice that your skills aren’t enough, or that things would have worked out better if you had known where help was to be found. Researchers and the library’s data support staff shared their thoughts and experiences on this theme in a workshop held on 27 October 2021, with the title “Uncovering the data skills and needs of the researchers”. We handled the same theme in our recent blog, reflecting on the wide variety of expertise in research data.

The life cycles of research and research data

Research data may be perceived in relation to the research for which it serves as the raw material. As research progresses, raw data is often modified to select data sets, which may have gone through various processes. In the context of research data management, the life cycle of both the research and the research data are common concepts. Research life cycle is often divided into three phases: before, during and after the research. The life cycle of research data typically extends beyond the life cycle of research when the data may be reutilized.

In the workshop, we identified measures and know-how related to research data particularly during the research, such as analysing and documenting data, programming and database skills, handling sensitive data and safe data sharing with research partners. The work, however, starts even before the research when data collection and managing data are planned. After the research, the data calls for some actions as well: something will be stored, something destroyed, and some data may be opened or published. Ideally, the data can be reused as raw data for new research. In this case, the life cycle of the data concretizes, in a nice way, the continuum model used in records management.

In addition to technical know-how, data handling requires skills and knowledge of a more general kind, for example, understanding the terminology or finding solutions best suited for one’s needs. However, the basic skills of the researcher, namely fundamental knowledge and understanding of the subject matter, research ethics and its practices, are the basis of everything.

More skills and support – yes, please!

Improving the one-stop-shop for data management support services at UEF is one of the cornerstones of the development project: researchers will be able to access extensive support and information through the datasupport@ service channel produced by different professionals coming together from different fields of expertise. Researchers were able to pitch their ideas and make wishes for the kinds of services the one-stop-shop for data management support should offer and what type of support would have helped them during past problems and lack of skills. Portion of the hopes matched services that had already been implemented but that the researchers were not familiar with yet. As an example of existing services, support for writing a research data management plan (DMP) is already in place in the form of a DMP commenting service and various trainings, including targeted training for specific funding instruments.

Advice, guidance, and training are also needed for storing data during and after research, anonymization of data, research data bases, and using data in a collaborative project between two different universities. Researchers also called for well-planned solutions and procedures for data management, including shared understanding and skills at least within individual research projects as a minimum level.

Managing the big picture should not be left on the shoulders of one person. The importance of experts specific to datatypes and disciplines along with support personnel embedded in faculties was recognized in supplementing general research data management support services. One must bear in mind the concrete levels of data management responsibilities though: support measures focus on guidance, training and advice, while they cannot meet the actual management of research data which remains the responsibility of researchers.

From collegial support to datasupport

Collegial support is valuable not only in matters of data management but more generally in the everyday work of a researcher. Although unofficial, often random conversations with colleagues are important channels of information sharing, there is a recognized need for more organized collegial support. Trainings, webinars and learning communities were mentioned during the workshop as good means of sharing and receiving information. Faculties and departments could also have embedded discipline-specific data management mentors, to make peer support more systematically available.

What would, then, motivate researchers to offer their know-how to others? Incentives may be needed for willingness to mentor others, and this is also recognized more widely in relation to many practical measures in open science. The possibility to record attendance on data management training sessions to work reports was mentioned as one suggestion. Overall, research data management skills should be made more visible in meriting researchers. This would give a much-needed lift to developing skills and add investment by faculties on managing research data.

The importance of planning ahead was raised several times during the conversation and hence it can be summarized here as a kind of general guideline and a take-home message from our workshop. There were practical examples from research projects, where research data management practices should be documented well and thoroughly to make sure that they will be available to new researchers entering the project. Although this may sound self-evident, such ideals do not necessarily actualize during everyday research. Data management planning should find its rightful place as an undisputable part of a research proposal. Moreover, it is one of the many avenues, where collegial support of the departments can complement general data support services, making best use of everyone’s expertise most efficiently.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services