Aineistonhallinnan opetukseen kaivataan tukea Itä-Suomen yliopistossa | Support is needed for teaching data management at the University of Eastern Finland

(Please, scroll down to read in English.)

Aineistonhallinta on olennainen osa tutkimus- ja tietotyötä, ja sen laatuun on alettu kiinnittää entistä enemmän huomiota. Aineistonhallinnalla tarkoitetaan toimenpiteitä, joilla kerätään, säilytetään ja käytetään aineistoja — mittaustuloksia, haastatteluja, tekstejä, näytteitä ja niistä kertynyttä dataa — turvallisesti ja tehokkaasti. Tutkimustyössä aineistonhallinnalla huolehditaan, että aineisto pysyy käytettävänä koko tutkimuksen ajan ja myös sen jälkeen. Lisäksi aineistonhallintaan voi kohdistua lainsäädännöllisiä vaatimuksia, kuten esimerkiksi tietosuoja-asetuksen vaatimukset henkilötietojen käsittelyyn. Useimmiten tutkimusaineistojen hallinnan suunnitelmat rajautuvat datan hallintaan.

Tavoitteena systemaattisempi aineistonhallinnan opetus perusopinnoissa

Aineistonhallinta on avoimen tieteen edellytys, minkä edistämiseen suomalaiset korkeakoulut, mukaan lukien Itä-Suomen yliopisto, ovat sitoutuneet. Suomessa tutkimusyhteisö on aktiivisesti mukana linjaamassa avoimen ja vastuullisen tieteen tavoitteita ja toimenpiteitä. Tutkimusaineistojen ja -menetelmien linjaus (1) julkaistiin vuonna 2021, ja yksi sen tavoitteista koskee opinnäytetöiden datanhallintasuunnitelmien opetusta: “Viimeistään vuonna 2024 korkeakoulut huolehtivat, että opinnäytetöiden ohjaajat osaavat osana ohjaustyötään arvioida ja kommentoida datanhallintasuunnitelmia” (s. 14). Aikataulu on tiukka, eikä tavoiteajassa pysymistä helpota se, että aineistonhallinnan opetus perusopiskelijoille on vasta kehittymässä ja sille ollaan vasta luomassa osaamistasoja sekä yhtenäisiä kansallisia käytänteitä.

Aineistonhallintasuunnitelman tekeminen on ollut jo pidemmän aikaa ehtona monien tutkimushankkeiden rahoitukselle, ja tutkijat ovat saaneet ohjeistusta niiden tekemiseen kirjastosta. Lisäksi aineistonhallinnan kurssi on ollut osa UEFin tohtorikoulun vapaavalintaisia opintoja jo useamman vuoden ajan. Sen sijaan aineistonhallinnan opetus perusopiskelijoille on ollut lähinnä laitosten, osastojen ja yksittäisten ohjaajien vastuulla, eikä opetuksen määrä ja laatu koko Itä-Suomen yliopiston tasolla ole ollut tiedossa.

Aineistonhallinnan opetukseen on kuitenkin syytä kiinnittää huomiota, sillä aineistojen ja datan asianmukainen käsittely lisää opinnäytetöiden laatua ja riskinhallintaa monin tavoin. Aineiston keruun ja käsittelyn läpinäkyvyys parantuu, kun toimenpiteet dokumentoidaan ja aineisto kuvaillaan huolellisesti. Asianmukainen tallennus ja jakaminen koko opinnäytetyön elinkaaren ajan ennaltaehkäisee vahingossa tapahtuvan aineiston tuhoutumisen tai sen päätymisen vääriin käsiin Aineistonhallinnan osaamisesta on hyötyä opintojen ja tutkimuksen teon ohella myös työelämässä ylipäätään.

Kysely ja sen tulokset

Aineistonhallinnan opetuksen tilanteen kartoittamiseksi UEF kirjasto teki kyselyn oppiaineiden opettajille ja opinnäytetyön ohjaajille. Kyselyssä keskityttiin datanhallintaan, ei fyysisten aineistojen hallintaan, vaikka fyysisetkin aineistot edellyttävät suunnitelmallista käsittelyä ja hallintaa. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Jakauma: FILO 22 %. LUMET 18 %. TT 43 %. YHKA 17 %.
Kuva 1. Vastaajien määrä tiedekunnittain (n = 130). FILO = Filosofinen tiedekunta. LUMET = Luonnontieteiden ja metsätieteiden tiedekunta. TT = Terveystieteiden tiedekunta. YHKA = Yhteiskunta- ja kauppatieteiden tiedekunta.

Kyselyyn sai vastata suomeksi ja englanniksi. Vastauksista ilmeni, että aineistonhallintaa ei opeteta yksittäisenä kokonaisuutena, vaan se nivoutuu osaksi metodikursseja ja/tai opinnäytetyön ohjausta. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Kyselyn tulokset osoittivat, että FAIR-periaatteet ja metadata tunnetaan heikoimmin opettajien ja ohjaajien keskuudessa. FAIR tulee sanoista Findable (=löydettävä), Accessible (=saavutettava), Interoperable (=yhteentoimiva) ja Re-usable (=uudelleen käytettävä) ja tarkoittaa käytännössä sitä, että aineistoa käsitellään niin, että tutkimuksen tulokset voidaan tarvittaessa verifioida sekä aineistoa on mahdollista jatkokäyttää olemassa olevan tutkimuksen jälkeen.

FAIR-periaatteiden käytännön toteuttaminen edellyttää hyvää tieteenala- ja aineistokohtaista ymmärrystä ja alan tutkimuskäytänteiden tuntemusta, mikä hankaloittaa yksityiskohtaisten yleisohjeiden antamista. Yleisluonteisia ohjeita kuitenkin laaditaan, mutta niiden perusteella FAIR-periaatteiden noudattaminen saattaa olla varsin vaikeaa. Myös metadata eli aineiston kuvailu oli heikommin tunnettua. FAIR-periaatteet ja metadata voivat myös olla termeinä vieraita, mutta monet ohjaat ja opettajat voivat käyttää niiden kuvaamiseen vaikkapa eri termejä ja toteuttaa niitä käytännössä tietämättään. Toisaalta opettajat ja ohjaajat tunsivat hyvin avoimen datan ja sen saatavuuden, mutta sitä ei juuri opeteta opiskelijoille, vaikka se on keskeinen aineistonhallinnan osa-alue.

Graafi. Kuinka hyvin tunnet seuraavat datanhallinnan osa-alueet? FAIR 44 % ei tunne eikä opeta. 7 % opettaa. Datan omistajuus 20 % ei tunne eikä opeta, 20 % opettaa. Avoin data 16 % ei tunne eikä opeta, 13 % opettaa. Datan tallennus tutkimuksen aikana 13 % ei tunne eikä opeta, 28 % opettaa. Metadata 28 % ei tunne eikä opeta, 16 % opettaa. Datan sensitiivisyys ja tietosuoja 10 % ei tunne, 37 % opettaa. Datan säilytys/hävitys tutkimuksen jälkeen 14 & ei tunne, 36 % opettaa.
Kuva 2. Datahallinnan osa-alueiden tuntemus

Vaikka aineistonhallinnan osa-alueet tunnettiin kohtalaisesti, noin puolet opettajista ja ohjaajista koki, että he tarvitsevat tukea aineistonhallinnan opetukseen ja ohjaukseen. Neuvontaa kaivattiin lähes kaikkiin aineistonhallinnan osa-alueisiin. Kun vastauksia tarkasteltiin tiedekuntakohtaisesti, Terveystieteiden tiedekunta (TT) erottui muista tiedekunnista siinä, että TT:ssä tunnetaan melko hyvin henkilötietoja ja arkaluonteisia henkilötietoja sisältävän aineiston käsittely. Toisaalta Terveystieteiden tiedekunnassa kaivattiin neuvontaa henkilö- ja terveystietoa sisältävien aineistojen avaamiseen. Se saattaakin olla usein työlästä ja vaikeaa, sillä avaamisessa tulee kiinnittää erityistä huomiota aineiston avaamisen laajuuteen ja käyttöoikeuksien asianmukaiseen jakeluun.

Graafi. Kaipaan neuvontaa seuraaviin datanhallinnan osa-alueisiin. FAIR-periaatteet 60 % kyllä, 40 % ei. Datan omistajuus 50 % kyllä, 50 % ei. Avoin data ja sen saatavuus 53 % kyllä, 47 % ei. Datan tallennus tutkimuksen aikana 43 % kyllä, 57 % ei. Metadata 49 & kyllä, 51 % ei. Datan sensitiivisyys ja tietosuoja 38 % kyllä, 62 % ei. Datan säilytys/hävitys tutkimuksen jälkeen 39 % kyllä, 61 % ei.
Kuva 3. Tuen tarve aineistonhallinnan eri osa-alueilla.

Missä vaiheessa opintoja? Kuka opettaa?

Aineistonhallinnan opetus nivoutuu useimmiten osaksi pro gradu -tutkielmaa joko osana seminaaria tai varsinaista työnohjausta. Opettajat ja ohjaajat myös kokivat, että tämä olisi luonnollisin ajankohta aineistonhallinnan opetukselle. Kyselyn avovastauksista ilmeni, että aineistonhallinta ylipäätään koetaan tarpeelliseksi ja että sen laadukkaaseen opetukseen ja ohjaukseen on syytä kiinnittää huomiota. Lisäksi kirjastolta toivottiin ohjausta aineistonhallinnan opetukseen ja tiivistä materiaalipakettia aineistonhallinnasta sekä ohjaajille, opettajille että opiskelijoille.

Vastauksena aineistonhallinnan opetuksen tarpeisiin, kirjastossa on suunnitteilla ohjaajan paketti kirjaston verkkosivuille. Lisäksi päivitämme ja pyrimme lisäämään nykyisten perusopiskelijoille suunnattujen aineistonhallinnan verkkosivujen näkyvyyttä. Suunnitelmissa on myös aineistonhallinnan opetuksen kehittäminen ja pilotoiminen yhteistyössä oppiaineiden kanssa.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Tutkimusaineistojen ja -menetelmien avoimuus : korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021-2025. Osalinjaus 1, Tutkimusdatan avoin saatavuus. Helsinki: Tieteellisten seurain valtuuskunta. DOI: https://doi.org/10.23847/isbn.9789525995466 

Support is needed for teaching data management at the University of Eastern Finland

Data management, an essential part of research- and information work, has received increasing attention in recent years. Data management means procedures, which are used to collect, store, and use data safely and efficiently. Data can include measurement results, interviews, texts, samples, or data based on the aforementioned. In scientific research, data management ensures that the data will be usable throughout the research process – from preliminary data to data reposition after research. There can be also legal requirements, such as data privacy issues regulated by the general data protection regulation (GDPR), that mandate the data management procedures. Although data can also include physical samples, data management plans typically only concern data in a digital format.

Goal: Systematic training for data management during master’s studies

Data management is an integral part of Open Science, and Finnish higher education institutions (incl. University of Eastern Finland, UEF) are committed on promoting it. In Finland, the research community is actively developing goals and actions to promote open and responsible science. The National Policy and Executive plan by the higher education and research community (1) was published in 2021 and one of its goals involves teaching of data management during thesis supervision: “No later than 2024, higher education institutions will ensure that thesis supervisors are able to evaluate and comment on data management plans as part of their supervisory work” (pp 13). Because the skill levels and national practices are at the moment still being developed, the schedule is quite ambitious.

Writing data management plans has been a pre-requisite for several research funding instruments for a while and UEF Library has a major role in training researchers to write them. In addition, Library has offered a course on research data management for doctoral students for some years now. However, the training of master’s students for research data management has not been systematic, and instead the training has been organized mainly by departments and individual teachers and thesis supervisors. Therefore, the extent and the quality of the training is not known at the university level.

Nevertheless, it is necessary to pay attention to data management training and appropriate treatment of data because it will increase the quality of theses and it is also part of risk management. Appropriate storing and sharing of data will decrease the risks, such as accidental loss of data or data misuse. Being knowledgeable about data management is also an important general skill that is needed in working life.

Survey and results

The UEF library conducted a survey during May-June 2022 about the teaching of data management by teachers and thesis supervisors. The survey focused on management of digital data, rather than physical samples, although physical samples also need systematic handling and treatment. We received 130 answers, which covered all faculties and most departments.

Distribution. FILO 22%, LUMET 18%, TT 43%, YHKA 17%
Figure 1. Percentage of responses in faculties (n = 130). FILO = Philosophical Faculty. LUMET = Faculty of Science and Forestry. TT = Faculty of Health Sciences. YHKA = Faculty of Social Sciences and Business Studies.

Answers were accepted both in Finnish and English. The results showed that data management is not taught as a separate entity/topic, but instead as part of methodological courses or thesis supervision.

The results also show that the FAIR-principles and metadata are the least known parts of data management. The acronym derives from the words Findable, Accessible, Interoperable and Re-usable. In practice FAIR means that data are treated in a manner that research results can be verified, and the data can be re-used after the current work is completed. Applying FAIR-principles, however, requires good knowledge of data types used in each scientific field. This makes giving detailed, one-size-fits-all instructions difficult. Other less familiar data management topic was metadata, i.e., the description of data. The unfamiliarity with FAIR-principles and metadata could also be unknown as terms; hence, it is possible that many teachers and supervisors practice or work with them without knowing it. On the other hand, teachers and supervisors were familiar with open data, yet it was rarely taught to students despite being a key component of research data management.

Graph. How familiar are you with...? FAIR principles: Do not know 44%, teach 7%.Data ownership Do not know 20%, teach 20%. Open data Do not know 16%, teach 13%.Data storage Do not know 13%, teach 28%.Metadata Do not know 28%, teach 16%.Data sensitivity and data protection Do not know 10%, teach 37%. Data storage/disposal after research Do not know 14%, teach 36%.
Figure 2. Knowledge about areas of data management

Although all the key aspects of data management were known to some extent, almost half of the teachers and supervisors felt that they need support for teaching data management. Guidance was needed in all aspects of data management. When answers were compared between faculties, the knowledge about personal and sensitive data was the best in the Faculty of Health Science. On the other hand, teachers and supervisors in the Faculty of Health Science felt that they need guidance on how to open the data the most. Indeed, opening sensitive data can be difficult because the degree of openness and used rights must be considered carefully.

Graph. I need guidance in: FAIR principles Yes 60%, No 40%. Data ownership Yes 50%, No 50%. Open data Yes 53%, No 47%. Data storage Yes 43%, No 57%. Metadata Yes 49%, No 51%. Data sensitivity and data protection Yes 38%, No 62%. Data storage/disposal after research Yes 39%, No 61%.
Figure 3. Support needed in different areas of research data management

In which part of studies? Who is teaching?

According to the survey results, research data management was mostly taught as a part of thesis work, either as a part of seminar or during the actual thesis supervision. The teachers and supervisors also felt that this is the most suitable timing for the teaching. The open answers of the survey showed that teaching data management is important, and attention should be paid to good quality in teaching it. Respondents wished guidance and compact material bank for students, teachers, and supervisors.

In a response for the need for support in the teaching of data management, the UEF library will prepare a supervisor’s guide in the library website. We will also update and increase the visibility of the existing material for the students. Obviously, the first step is to translate all material in English. We will also possibly pilot the teaching of data management together with the departments.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Open research data and methods National policy and executive plan by the higher education and research community for 2021–2025: Policy component 1: Open access to research data. DOI: https://doi.org/10.23847/isbn.9789525995480

Helena Jäntti, tietoasiantuntija | Information specialist
Taisa Sallinen, tietoasiantuntija | Information specialist
Manna Satama, tietoasiantuntija | Information specialist
Niina Nurmi, tietoasiantuntija | Information specialist
Laura Parikka, tietoasiantuntija | Information specialist
Opetus- ja tietopalvelut | Training and Information Services

 

 

 

Tutkijoiden viesti: Lisää tukea, osaamista ja suunnitelmallisuutta tutkimusdatan hallintaan! | Message from the researchers: More support, skills and planning for research data management, please!

(Please, scroll down to read in English.)

Tutkimusaineistoihin liittyy mitä moninaisempaa tietämystä, osaamista ja toimenpidettä. Jossain kohdin törmää yleensä siihen, että omat taidot eivät riitä tai että asiat olisivat sujuneet paremmin, jos olisi tiennyt, mistä apu on löydettävissä. Tästä aihepiiristä UEFin tutkijat ja kirjaston datatuen väki jakoivat ajatuksiaan ja kokemuksiaan 27.10.2021 pidetyssä työpajassa, jonka otsikkona oli “Tutkijoiden dataosaaminen ja -tarpeet esiin”. Teemaa on sivuttu taannoisessa blogkirjoituksessa, jossa pohdimme tutkimusaineistojen asiantuntijoiden rikasta kenttää. Työpajan teema osui selvästi ajankohtaiseen aiheeseen, sillä samalle päivälle sattuneessa Yhteiskunta- ja kauppatieteiden tiedekunnan strategiapäivässäkin avoin tiede tutkimusaineistoineen keräsi mittavan osallistujajoukon ja herätti vilkasta keskustelua.

Tutkimuksen ja tutkimusaineiston elinkaaret

Tutkimusaineistoa tai -dataa voidaan jäsentää suhteessa tutkimukseen, jonka raaka-aineena se toimii. Tutkimuksen edetessä raakadatasta muokkautuu usein valikoidumpia datasettejä, jotka ovat voineet käydä läpi erilaisia prosesseja ja muokkauksia. Aineistonhallinnan keskustelussa puhutaan usein tutkimuksen ja tutkimusaineistojen elinkaarista. Tutkimuksen elinkaari hahmotetaan kolmeen vaiheeseen: ennen tutkimusta, tutkimuksen aikana ja sen jälkeen. Tutkimusaineistojen elinkaari ulottuu usein tutkimuksen elinkaarta pidemmälle, kun aineistoja hyödynnetään uudelleen.

Työpajassa tunnistettiin tutkimusaineistoihin liittyviä toimenpiteitä ja tietotaitoa erityisesti tutkimuksen aikana. Tällaisina mainittiin vaikkapa datan analysointi, dokumentointi, ohjelmointi, tietokantaosaaminen, sensitiivisen aineiston käsittely ja datan jakaminen tietoturvallisesti yhteistyökumppaninen välillä. Työ on kuitenkin alkanut jo tutkimusta ennen aineiston keruun ja yleisemmin aineistonhallinnan suunnitteluna. Tutkimuksen jälkeen täytyy aineistollekin tehdä jotain: jokin osa aineistosta säilytetään, jokin tuhotaan, ja aineistoa myös avataan tai julkaistaan. Ihannetapauksessa aineisto on uudelleenkäytettävissä jonkin muun tutkimuksen raaka-aineena, jolloin aineiston elinkaari konkretisoi mainiosti asiakirjahallinnan ja arkistotoimen keskustelussa esiintyvää jatkumomallia.

Tutkimusaineiston käsittely edellyttää tutkijoilta usein teknisten taitojen lisäksi yleisiä aineistonhallinnan taitoja vaikkapa terminologian ymmärtämiseen tai tiedon etsimiseen omaan tilanteeseen ja tarkoitukseen sopivista toimenpiteistä ja ratkaisuista. Kaiken pohjana ovat kuitenkin tutkijan perustaidot eli tutkittavan aiheen perustavanlaatuinen tunteminen ja ymmärrys, tutkimusetiikka ja sen käytäntöjen hallinta.

Lisää osaamista ja tukea, kiitos!

UEFin datatuen kehittämisen yksi kulmakivi on yhden luukun palvelun parantaminen, jolloin tutkija pääsisi datasupport@-osoitteen kautta monen eri alan asiantuntijan avulla tuotetun kattavan tuen ja tiedon äärelle. Työpajassa tutkijat saivat vapaat kädet ideoida ja toivoa, mitä palvelua datatuen yhdestä luukusta pitäisi saada ja millainen tuki heitä olisi auttanut eteen tulleissa ongelmatilanteissa ja osaamisen puutteissa. Osa toiveista kohdistui sellaisiin tukipalveluihin, joita on jo nyt tarjolla, mutta joiden olemassaolo ei ole vielä tavoittanut tutkijoita. Esimerkiksi aineistonhallintasuunnitelman (DMP) tukea on saatavilla kommentointipalveluna ja koulutuksina, ja myös kohdennettuna tiettyihin rahoituksiin.

Neuvoja, ohjausta ja koulutusta kaivataan myös datan säilyttämiseen tutkimuksen aikana ja sen jälkeen, datan anonymisointiin, tietokantoihin ja vaikkapa datan käyttämiseen kahden yliopiston yhteisessä hankkeessa eri yliopistojen tunnuksilla. Datanhallinnan ratkaisuihin ja toimintatapoihin toivottiin suunnitelmallisuutta sekä jaettua ymmärrystä ja osaamista vähintäänkin tutkimushankkeiden sisällä. Kokonaisuuden hallinta ei saisi jäädä vain yhden ihmisen varaan.

Yleisemmän aineistonhallinnan tuen rinnalle tunnistettiin tarve aineisto- tai alakohtaisille asiantuntijoille sekä tiedekunnan tasolla oleville tukihenkilöille. Aineistonhallinnan vastuiden konkretian tasot on kuitenkin muistettava: Tukitoimet keskittyvät ohjeistuksiin, koulutuksiin ja neuvoihin, mutta ne eivät pysty vastaamaan varsinaiseen aineistonhallintaan, sillä se on tutkijoiden omalla vastuulla.

Vertaistuesta datatukeen

Vertaistuki on tutkijankin työssä ja aineistonhallinnan asioissa kullan arvoista. Vaikka epäviralliset, usein sattumanvaraiset keskustelut kollegoiden kesken ovat tiedon jakamisen tärkeä kanava, tarvetta on organisoidummalle kollegiaaliselle tuelle. Koulutukset, webinaarit ja oppimisyhteisöt mainittiin hyvinä keinoina jakaa ja saada tietoa. Osastoilla ja laitoksilla voisi olla myös tieteenalakohtaisia datanhallinnan mentoreita, jolloin vertaistukea olisi saatavilla järjestäytyneemmin.

Mikä sitten motivoisi tutkijaa tarjoamaan omaa osaamistaan? Tähänkin kaivataan kannustimia aivan kuten moniin avoimen tieteen käytännön toimiin ylipäätään. Työpajassa mainittiin esimerkkinä koulutuksiin osallistuminen, joka pitäisi pystyä kirjaamaan työraportointeihin. Datanhallinnan taitojen tulisi ylipäätään näkyä selkeämmin tutkijan meritoitumisessa. Tämä antaisi kaivattua nostetta osaamisen kehittämiselle ja lisäisi panostusta tiedekuntien datanhallintaan.

Eräänlaisena yleisenä ohjenuorana ja työpajan kiteytyksenä on suunnitelmallisuus, joka tuli keskustelussa esiin monessa kohdin. Käytännön esimerkkinä mainittiin tutkimushankkeet, joissa datanhallinnan käytänteet pitäisi dokumentoida kunnolla ja joissa niistä pitäisi huolehtia siten, että käytänteet välittyvät myös hankkeisiin tuleville uusille tutkijoille. Tämä saattaa kuulostaa itsestään selvältä, mutta tutkimuksen arjessa ideaalit eivät välttämättä toteudu. Aineistonhallinnan suunnittelun olisi löydettävä paikkansa tutkimussuunnitelman kiistattomana osana. Tässä kohdin tiedekuntien vertaistuki ja yliopiston yleinen datatuki voivat täydentää toisiaan luontevasti ja kaikkien erityisasiantuntemusta tehokkaasti hyödyntäen.

 

Arrows depicting the research data cycle from data collection to analysis and to disseminating results
Työpaja oli osa kirjaston OA-viikon ohjelmaa ja liittyi kirjaston koordinoimaan datatuen kehittämishankkeeseen, jonka kuulumisia on esitelty kirjaston blogissa. Työpajaan osallistui tutkijoita kaikista neljästä tiedekunnista. | The workshop was part of the Library’s OA Week program as well as of the data support project coordinated by the Library (see our project update from an earlier blog article). All four faculties were represented in the workshop. Image by: Patrick Hochstenbach (CC-BY)

Working with research data involves a wide variety of know-how. At some point, you may notice that your skills aren’t enough, or that things would have worked out better if you had known where help was to be found. Researchers and the library’s data support staff shared their thoughts and experiences on this theme in a workshop held on 27 October 2021, with the title “Uncovering the data skills and needs of the researchers”. We handled the same theme in our recent blog, reflecting on the wide variety of expertise in research data.

The life cycles of research and research data

Research data may be perceived in relation to the research for which it serves as the raw material. As research progresses, raw data is often modified to select data sets, which may have gone through various processes. In the context of research data management, the life cycle of both the research and the research data are common concepts. Research life cycle is often divided into three phases: before, during and after the research. The life cycle of research data typically extends beyond the life cycle of research when the data may be reutilized.

In the workshop, we identified measures and know-how related to research data particularly during the research, such as analysing and documenting data, programming and database skills, handling sensitive data and safe data sharing with research partners. The work, however, starts even before the research when data collection and managing data are planned. After the research, the data calls for some actions as well: something will be stored, something destroyed, and some data may be opened or published. Ideally, the data can be reused as raw data for new research. In this case, the life cycle of the data concretizes, in a nice way, the continuum model used in records management.

In addition to technical know-how, data handling requires skills and knowledge of a more general kind, for example, understanding the terminology or finding solutions best suited for one’s needs. However, the basic skills of the researcher, namely fundamental knowledge and understanding of the subject matter, research ethics and its practices, are the basis of everything.

More skills and support – yes, please!

Improving the one-stop-shop for data management support services at UEF is one of the cornerstones of the development project: researchers will be able to access extensive support and information through the datasupport@ service channel produced by different professionals coming together from different fields of expertise. Researchers were able to pitch their ideas and make wishes for the kinds of services the one-stop-shop for data management support should offer and what type of support would have helped them during past problems and lack of skills. Portion of the hopes matched services that had already been implemented but that the researchers were not familiar with yet. As an example of existing services, support for writing a research data management plan (DMP) is already in place in the form of a DMP commenting service and various trainings, including targeted training for specific funding instruments.

Advice, guidance, and training are also needed for storing data during and after research, anonymization of data, research data bases, and using data in a collaborative project between two different universities. Researchers also called for well-planned solutions and procedures for data management, including shared understanding and skills at least within individual research projects as a minimum level.

Managing the big picture should not be left on the shoulders of one person. The importance of experts specific to datatypes and disciplines along with support personnel embedded in faculties was recognized in supplementing general research data management support services. One must bear in mind the concrete levels of data management responsibilities though: support measures focus on guidance, training and advice, while they cannot meet the actual management of research data which remains the responsibility of researchers.

From collegial support to datasupport

Collegial support is valuable not only in matters of data management but more generally in the everyday work of a researcher. Although unofficial, often random conversations with colleagues are important channels of information sharing, there is a recognized need for more organized collegial support. Trainings, webinars and learning communities were mentioned during the workshop as good means of sharing and receiving information. Faculties and departments could also have embedded discipline-specific data management mentors, to make peer support more systematically available.

What would, then, motivate researchers to offer their know-how to others? Incentives may be needed for willingness to mentor others, and this is also recognized more widely in relation to many practical measures in open science. The possibility to record attendance on data management training sessions to work reports was mentioned as one suggestion. Overall, research data management skills should be made more visible in meriting researchers. This would give a much-needed lift to developing skills and add investment by faculties on managing research data.

The importance of planning ahead was raised several times during the conversation and hence it can be summarized here as a kind of general guideline and a take-home message from our workshop. There were practical examples from research projects, where research data management practices should be documented well and thoroughly to make sure that they will be available to new researchers entering the project. Although this may sound self-evident, such ideals do not necessarily actualize during everyday research. Data management planning should find its rightful place as an undisputable part of a research proposal. Moreover, it is one of the many avenues, where collegial support of the departments can complement general data support services, making best use of everyone’s expertise most efficiently.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Datatuen kehittämishanke kesän kynnyksellä | Data support project on the verge of summer

(Please, scroll down to read in English)

Tiivis kevät on takana. Nyt on hyvä hetki koota tähän asti karttunutta tietoa ja ymmärrystä UEFin tutkimusdatatuen kehittämisestä ja itsellekin muistutella, mitä kaikkea on jo keretty tekemään ja mitä on edessä.

Vaikka fyysisesti olemme enemmän tai vähemmän jämähtäneet etätyöpisteisiimme, virtuaalisesti olemme liikkuneet ahkerasti yliopiston kampuksilla osastoilta ja laitoksilta toisiin ja tutustuneet aikamoiseen asiantuntijajoukkoon. Nimet ja usein myös naamat alkavat olla etenkin kirjastolla tuttuja. Eri asia on, miten hyvin nimet ja naamat sitten yhdistyvät, kun syksyn tullessa siirrytään fyysisestikin Careliaan.

Tiivistimme edellisessä blogitekstissämme hankkeen tavoitteeksi kehittää perusta toimivalle, moniammattilaista osaamista tarvitsevalle ja hyödyntävälle tutkijalähtöiselle datatuelle. Totesimme myös, että hankkeen aikana uudelleen muotoillut datatuen palvelut käynnistetään, niitä testataan ja niistä viestitään. Tavoitteet ovat pysyneet samoina, ja niiden tärkeys on muutaman kuukauden aikana vain vahvistunut. Samalla on todettava, että vaikka tavoite on selkeästi ilmaistu ja ytimekäs, sen vaativuus on tullut selvääkin selvemmäksi.

Kokouksia ja webinaareja

Arjen työvälineet lukuisine tietokanavineen eivät enää aiheuta kovin suurta hämmennystä. Teams ja vähintäänkin oman hankkeen kansiorakenne on siis alkanut tuntua tutulta ja Heimosta osaa jo kaivaa yhtä ja toista tärkeää tietoa. Erityiskiitos kuuluu myös avointa toimintakulttuuria hienosti kunnioittaville kirjaston verkkosivuille. Ne palvelevat sekä henkilökuntaa että UEFin ulkopuolisia.

Hankkeen ohjausryhmä on kokoontunut säännöllisesti kuukausittain ja laajempi datatuen verkosto sekin kerran kuussa. Välillä on jo kerennyt tulla ihmetys, joko nyt taas kokouskutsua ja asialistaa olisi laitettava menemään. Tiivis kokoustaminen on kuitenkin pitänyt meidät itsemmekin hyvin ajan tasalla, mitä on tullut tehtyä ja mihin seuraavaksi pitäisi katse kiinnittää.

Suunnittelijan tehtävänkuva on avannut mahdollisuuksia osallistua henkilöstökoulutukseen ja vilkkaana käyvään keskusteluun tutkimusaineistojen hallinnan ympärillä. Olemme käyneet virtuaalisesti esimerkiksi Kansalliskirjaston, Tietoarkiston, CSC:n ja TSV:n järjestämissä tilaisuuksissa ja perehtyneet aineistojen kuvailun, vastuullisen tieteen, aineistojen uudelleenkäytön ja tieteenalakohtaisten data-asiantuntijoiden työnkuvan kysymyksiin.

Haastatteluja ja työpajoja

UEFin eri yksiköihin kuuluvien ja eri tieteenaloja edustavien henkilöiden haastattelut ovat olleet äärettömän mielenkiintoisia. Parikymmentä tapaamista takanamme voimme sanoa, että olemme saaneet monipuolisen kattauksen tutkimuksen, opetuksen ja hallinnon tutkimusdata-asioiden arkeen. Pakollinen etätyö on luultavasti madaltanut kynnystä haastattelujen järjestämiseen, sillä niihin käytettävä aika on ollut suhteellisen helppo sovittaa töiden lomaan eikä haastateltavien ole tarvinnut valmistautua tapaamisiin ennakolta. Pääsääntöisesti kaikki, joita olemme kysyneet haastateltaviksi, ovat siihen suostuneet ja tapaamisissa on ollut myönteinen ja kiinnostunut vire. Suuret kiitokset tätäkin kautta!

Kevään aikana hankkeen painopiste on ollut datatuen verkoston toimijoissa. Työpajoissa on pohdittu toimijoiden rooleja ja hallinnollisten yksiköiden tehtäviä ja toimintatapoja, jotka liittyvät tutkimusaineistojen hallintaan tutkimuksen eri vaiheissa. Keskustelua on käyty datatuen palvelun näkökulmasta esimerkiksi tutkimusdatan omistajuuden määrittymisestä ja omistajuudesta seuraavista vastuista. Aineiston säilyttäminen tutkimuksen aikana ja sen jälkeen, sekä tähän liittyvä arvonmäärittely, ovat myös herättäneet keskustelua. Aiheet ovat kummunneet datatuen palveluihin tulleista tutkijoiden, ohjaajien ja joskus myös opiskelijoiden kysymyksistä. Työpajat ovat osoittaneet, että datatuen palveluissa tarvitaan yhteisen toiminnan hiomista edelleen ja entistä selkeämpää koordinaatiota. Vaihtelevat palvelupyynnöt määrittävät osaltaan, keiden asiantuntemusta missäkin tapauksessa tarvitaan.

Kevään haastattelukierros valotti datatuessa työskentelevien näkökulmaa. Datatuen tehtävien osuus vaihtelee suuresti työnkuvasta toiseen. Osuudesta riippumatta kunkin erityisosaaminen on välttämätöntä, jotta saadaan tuotettua kattava, vaatimukset täyttävä ja käyttäjien tarpeita vastaava tukipalvelu. Syksyllä mietitään tutkijoiden kanssa, miten heidän aineistonhallinnan osaamistaan saadaan mukaan tukipalveluista tuottavaan verkostoon entistä enemmän. Olemme jo hieman pohjustaneet syksyn toimintaa haastattelemalla eri tiedekuntien ja tieteenalojen tutkimus- ja opetushenkilökuntaa. Osalle kirjaston rooli datatuessa ja aineistonhallinnan kysymyksissä ei ole ennen haastattelua ollut tiedossa. Haastattelut ovat siten toimineet jo itsessään datatuen viestinnän välineenä, vaikkakin satunnaisesti ja pienimuotoisesti. Tutkimusaineistojen hallinnan tukipalveluja ei ylipäätään löydetä kovin helposti – ”Heimosta ei löydy” ja “Tieto hukkuu Yammeriin” -lauseet kaikuivat keskusteluissa. Monet viittasivat myös tutkimusaineistojen hallinnan vaikeisiin käsitteisiin ja hankaliin ohjeistuksiin. Kaivataan selkokielisyyttä, termien avaamista ja yhtä selkeää paikkaa, josta tutkijat löytävät ohjeet kattavasti.

Katse lukukauden vaihtumiseen

Haastattelut, työpajat, kokoukset ja tapaamiset ovat kirkastaneet muutamia asioita. Koordinoivalle työlle on entistäkin suurempi tarve. Tämä työ tulee lisääntymään lähivuosina, mihin vaikuttaa hankkeen tavoitteisiinkin kuuluva tiedekuntien ja laitosten kytkeminen vahvemmin mukaan datatuen palveluverkostoon. Tutkimuksen ytimessä syntyvä tieteenala- ja aineistokohtainen osaaminen kasvattaa yhteistä ymmärrystä datatuen tarpeista ja ratkaisuista puolin ja toisin. Syksyllä pääsemme
tähän teemaan käsiksi toden teolla.

Kevään aikana saimme kuulla, että kirjaston johdossa tapahtuu iso muutos Jarmo Saartin lähtiessä eläkkeelle. Meille hankesuunnittelijoille tämä tuli pienoisena järkytyksenä, sillä aloitimme projektissa Jarmon vetämän ohjausryhmän suojissa. Nyt olemme toipuneet järkytyksestä. Kiitämme Jarmoa lämpimästi näistä yhteisistä kuukausista ja toivotamme yhtä lämpimästi kirjaston uuden johtajan, Ari Muhosen, mukaan jännittävälle hankematkalle.

The spring term was busy and tightly scheduled for us in the research data support project. We have learnt a lot and gained understanding of data support and its development at the UEF. Now is a good time to look back on what we have achieved and what lies ahead.

Although we’ve been stuck more or less at our remote desks, we’ve moved around virtually at the university campuses and departments and got to know quite a lot of experts of different fields. Names and faces at the library are already rather familiar. But let’s see how we manage to connect them when returning to Carelia after the summer.

In our first blog, the goal of the project was condensed into developing the foundations for a functional, researcher-friendly data support service which relies on, and takes advantage of, multiprofessional competence. We also stated that during the project the newly designed data support services will be initiated and tested, and they will be communicated effectively. These goals remain and all the more their importance has strengthened during these past months. At the same time, the degree of complexity of the aim – no matter how concisely and clearly put – has become crystal clear.

Meetings and webinars

The daily working tools, with numerous information channels and platforms, no longer cause too much confusion. Teams and the file structure of at least our own project is rather familiar, and we manage to dig information out from Heimo. A special mention goes to the UEF library home pages, which foster the culture of open access. These pages serve both the personnel of UEF and the external users and visitors.

The project steering group holds monthly meetings. Similarly, the network of stakeholders working in the background to provide services and know-how to data support gathers regularly during monthly meetings. Sometimes the meeting schedule takes us by surprise: “Is it already time to prepare agendas and other documents needed?” The tight schedule has, however, kept us on track of what we have accomplished and what to do next.

Our working position as project planners has opened possibilities to attend personnel training and engage in the intensive and diverse discussions on research data management. We’ve attended webinars organized by, for example, National Library, Finnish Social Science Data Archive, CSC and Finnish Federation of Learned Societies, covering topics ranging from documentation and metadata to research integrity, re-use of research data and the job requirements of data specialists.

Interviews and workshops

Conducting interviews with people who belong to different units of UEF, and represent different academic disciplines, has been very interesting. Having completed 20 virtual meetings, we have garnered a versatile set of viewpoints into the everyday matters of research, teaching and managing research data. The enforced remote work-mode has most likely lowered the threshold to arrange interviews, because the time allocated for them has been relatively easy to fit among other tasks. Moreover, the interviewees were not asked to prepare in advance for the meetings. Notwithstanding a few exceptions, everyone we have requested to interview have agreed and the meetings have had a positive and interested atmosphere. Many thanks (to our participants) via this blog, too!

During the spring, the project focus has been on the people working in the data support network. Operational roles and the tasks as well as best practices linked to research data management in relevant administrative units have been the central themes of workshops. Moreover, we structured the workshops with the aim to cover different stages of the research data lifecycle. The conversations, from the perspective of data support services, have revolved around themes such as defining the ownership of research data and the various responsibilities following data ownership. Storing data during, and after, research, including defining the value of data destined for long term storage, have also been points of conversation. The topics stem
from questions sent to data support services by researchers, tutors, and occasionally by students. The workshops have demonstrated the need for refining the processes of working together to find solutions, and clearer coordination of operations. A wide variety of service requests determines and provides context, whose expertise is needed at different stages and cases.

The round of interviews this spring has shed light on the perspectives of those who work in data support services. The proportion of work tasks relevant directly to research data management vary from specialist to specialist depending on the unit and role. Despite this variation, the expertise of each specialist is crucial for providing a comprehensive support service, which matches policy requirements and needs of its users.

This coming autumn, we will brainstorm with the researchers how to better integrate their expertise as part of the wider network of producing data support services. We have already done some groundwork for the themes of this fall by interviewing research and teaching personnel at different faculties and representing various academic disciplines. The role of the library as a provider of data support and a source of guidance in matters of research data management was not obvious or known to some of our interviewees. In this sense, the interviews also function to spread awareness of the data support services, even if on the grassroot level. The research data support services are not always found easily – “I could not find it in Heimo” and “The information gets lost in Yammer” were some of the comments expressed during the interviews. There were also references to difficult concepts and challenging guides. The need for clearly worded guidance and demystification of terms is obvious, along with a central place for all relevant information, where researchers can easily find and access it.

Setting the stage for the fall term

Interviews, workshops and meetings have made some things crystal clear. The need for coordination is ever greater. This will grow in the near future and is tightly connected with the aim of getting the faculties and departments involved even more in the network of data support services. The know-how of managing research data accumulates during the research process and is shaped by discipline specific challenges. This knowledge boosts the shared understanding of the needs and solutions of data support and serves thus both ways. In the fall term, we’ll deal with this theme more properly.

During the spring we heard of a major change in the management of the library as Jarmo Saarti retires. This came as a bit of a shock to us, the project planners, as our work had started under the steering group lead by him. Now we’ve somewhat got over the news. We thank Jarmo warmly for these past months working together, and welcome the new director of the library, Ari Muhonen, equally warmly to the exciting project journey!

 

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services