UEF Datatuen kehittäminen: projektista pysyvyyteen | The development of UEF Data Support: from a project to permanence

(Please, scroll down to read in English)

Itä-Suomen yliopistossa on paneuduttu viime vuosina tutkimusdatan hallinnan tukipalveluiden kehittämiseen. Tätä työtä ovat tehneet kirjaston tietoasiantuntijat, aluksi muiden tehtäviensä ohella ja sittemmin erillisen projektin turvin. Kaksi vuotta sitten, talvella 2021, käynnistyi kirjaston koordinoima projekti “Datatuen kehittäminen osana tutkimuksen tukea”. Projekti päättyi 31.12.2022. Sen kattotavoitteeksi määriteltiin toimivan palvelun, osaamisen ja asiantuntijaverkoston kehittäminen yliopiston tutkimusdatan tukipalveluun.

Tässä blogissa kerromme, miten projektin tavoitteet ovat toteutuneet ja mitä datatuen perustoiminnassa on työn alla.

Datatuen kehittäminen osana tutkimuksen tukea: projektin alkumetrit ja tavoitteiden täsmentyminen

Viime vuosina tutkimusdatanhallinta on noussut vahvasti esiin avoimen tieteen yhteydessä. Osaltaan tähän on vaikuttanut alati kasvava tutkimusdatan määrä sekä uusien dataformaattien ja -settien monimuotoisuus. Tutkimusdatan avaamisesta on tullut ainakin puheen tasolla yleinen tavoite ja samalla on herätty datanhallinnan toteuttamisen käytäntöihin, jotta dataan liittyvät eettiset ja juridiset seikat voidaan huomioida hallitusti ja riskit ennakoiden. Samalla tutkijoiden tukitarpeet ovat lisääntyneet huomattavasti.

UEFilla on ollut tutkimusdatan hallintaan liittyviä tukipalveluita jo useamman vuoden. Palvelut ovat kuitenkin olleet osin hajallaan, niitä ei tunneta, eikä siten löydetä, mikä kävi ilmi vuosina 2019 ja 2020 UEFin tutkijoille toteutetuissa kyselyissä. Kyselyt vahvistivat myös sen, että käyttäjälähtöisten tukipalveluiden kehittämiselle on kasvava tarve. Tutkijat kaipaavat usein nopean vastauksen johonkin tiettyyn ja vahvasti sidonnaiseen ongelmaan, jolloin yleistason ratkaisut eivät välttämättä sovellu useamman tukipyynnön ratkaisuiksi.

Helmikuun alussa 2021 käynnistyneessä datatuen kehittämishankkeessa  tarkoituksena oli jatkokehittää yliopistossa jo olevia palveluita, ei rakentaa uutta palvelua. Avuksi otettiin käyttäjälähtöisyyttä korostava palvelumuotoilu, jota hyödyntäen datatuen sisäisiä prosesseja pyrittiin selkeyttämään.

Projektiin palkattiin 12 kuukaudeksi kaksi tutkijataustaista suunnittelijaa eri tieteenaloilta. Tämä auttoi erilaisten tutkimusaineistojen tarpeiden ymmärtämistä jo heti projektin alkumetreiltä. Projektille saatiin jatkoa vuoden 2022 loppuun yhden projektisuunnittelijan palkkauksen ja yhden opintovapaan sijaisuuden turvin.

Projektin vetovastuussa oli kirjaston tietoasiantuntija, joka oli jo toiminut useamman vuoden tutkimusdatan hallinnan tukitehtävien parissa UEFissa. Ohjausryhmä tuki projektin etenemistä tarpeen mukaan tarkentaen, mihin seuraavaksi kannattaisi kiinnittää huomioita ja keihin yliopistolla voisi olla yhteydessä. Projektin alku, sen ohjausryhmä ja projektisuunnittelijat on esitelty maaliskuussa 2021 julkaistussa blogissa Datatuen projektisuunnittelijoiden terveiset.

Keväällä 2021 saimme ohjausryhmältä myös tehtäväksi hahmotella datatuen tiekarttaa, joka selventäisi UEFin kannalta akuuteimmat datatuen palvelutavoitteet. Jaottelimme tiekartan neljään keskeiseen teemaan: linjaukset ja strategiatyö, datatuen palvelut, datanhallinnan koulutukset ja datanhallinnan asiantuntijatyö. Linjaus- ja strategiatyössä osallistuminen kansalliseen ja kansainväliseen avoimen tieteen työryhmätoimintaan on tärkeässä roolissa. Tieteellisten seurain valtuuskunnan avoimen tieteen ja tutkimuksen koordinaatiossa tehdään parhaillaan perustavanlaatuista linjaustyötä, ja UEFin datanhallinnan parissa työskentelevät asiantuntijat ovatkin olleet siinä aktiivisesti mukana jo ennen datanhallinnan tukipalveluiden kehittämisprojektia, projektin aikana ja sen jälkeen. Datanhallinnan ja tutkimusaineistojen avoimuuden lisäämisen kannalta on tärkeä saada UEFin datapolitiikka päivitettyä. Sitä edistetään nyt UEFin tasolla kirjaston vetämässä Avoimen tieteen työryhmässä, joka aloitti toimintansa syksyllä 2022.

Kirjaston datatuesta yliopiston datatuen yhden luukun palveluksi

Tiekartan toinen kokonaisuus, datatuen palvelut, olivat kehittämishankkeen keskiössä. Jo ennen projektia toiminut aineistonhallintasuunnitelmien kommentointipalvelu tarjosi hyvän lähtökohdan, josta pystyimme jäsentämään kehittämistarpeita. Tavoitteena oli virtaviivaistaa keskitettyjen datatuen palveluiden tarjoamista yhdestä luukusta. Kommentointipalvelu auttoi myös pohjustamaan uutta tehtävää eli tutkimusinfrastruktuurien aineistonhallintalinjausten (ns. DMPol) kommentointia. Projektin ensimmäisellä kaudella saimme luotua pohjat uudistuville palveluille ja jatkokaudella pääsimme pilotoimaan niitä.

Datatuen palvelut ovat tyypillisesti laaja-alaisia, sillä usein tukipyyntöjen purkaminen vaatii moniammatillista yhteistyötä ja useamman asiantuntijan osaamista. UEFissa datanhallinnan tukipalveluista löytyy asiantuntemusta esimerkiksi avoimesta tieteestä ja sen vaatimuksista, tietosuojasta, tietoturvasta, IT-palveluista, tiedonhallinnasta ja sopimuslaista. Tukipalvelua koordinoi kirjasto. Tutkimusdatanhallinnan tukipalvelut koostuvat yleensä organisaation sisällä kehitettävistä ja tarjottavista palveluista sekä ns. kolmansien osapuolien palveluista, joita organisaatiot voivat hyödyntää, sillä kaikkea ei voi eikä kannata tehdä ja tuottaa itse. UEFissa hyödynnetään ja UEFin tutkijat käyttävät eri tarkoituksiin myös ulkopuolisia palveluita, kuten CSC:n laskentapalveluja, aineistonhallintasuunnitelman laatimiseen DMPTuuli-palvelua ja aineistojen tallentamiseen ja arkistointiin vaikkapa Kielipankkia tai Tietoarkistoa. Tätä osin hajanaista kokonaisuutta halusimme saada paremmin haltuun.

Tutkimusinfrastruktuurit ovat lähellä tutkimusdatanhallinnan teemoja. Tutkimusinfrastruktuurit tuottavat usein suuriakin määriä dataa. Laitteiden lisäksi ne voivat käsittää alustoja tai palveluita, jotka pitävät sisällään esimerkiksi alakohtaisia tietoaineistoja. Siten tutkimusinfrastruktuurit voivat toimia myös erilaisten datanhallinnan teknisten ratkaisujen ajureina. UEFin tutkimusinfrastruktuuriohjelmassa (2021–2024) käynnistyi infrakoordinaattorien toiminta loppuvuodesta 2021. Tämä tarjosi omalle hankkeellemme erinomaisen mahdollisuuden verkostoitua tutkimusinfran osaajien kanssa. Yhytimme myös esimerkiksi tiedekuntien dekaanit ja varadekaanit ja järjestimme tutkijoille suunnattuja työpajoja. Kaikissa tapaamisissa kävi vahvasti ilmi tahto tehdä yhteistyötä levein hartioin, jotta vältettäisiin hajallaan olevan tieto ja päällekkäinen tekeminen.

Palvelumuotoilu kehittämistyön avuksi

Kehittämishankkeessa tavoiteltiin siis aiempaa selkeämpää ja jäsennellympää datatukipalvelua, jossa datanhallintaan liittyvä tieto olisi keskitetysti saatavilla yhden luukun palveluna. Tätä lähdettiin työstämään hankkeelle räätälöidyn palvelumuotoilukoulutuksen avulla. Kouluttajana toimi Sanna Soppela UEFin Jatkuvan oppimisen keskukselta. Koulutus- ja sparrauskerrat kokosivat yhteen datatuessa toimivaa verkostoa. Pääsimme yhdessä määrittelemään keskeisiä kohderyhmiä palvelulle, palvelun tarkoitusta ja käytännön järjestämistä palvelukanavineen. Pitkin matkaa työstimme palvelulupausta eli niitä yhteisen palvelun sisältöjä ja resursseja, joihin datatukea tuottavat yksiköt voivat sitoutua.

Nopeat ja kevyestikin rakennetut palautetoteutukset ovat osa palvelumuotoilun laajaa työkalupakkia. Tapaamiskertojen välillä pääsimmekin myös testaamaan suunnittelemiamme ratkaisuja palvelun keskeisimpien kohderyhmien kanssa. Punaiseksi langaksi yhden luukun palvelulle muodostui melko pian tuen saaminen oikeaan aikaan. Jäsentelimme datanhallintaan liittyviä teemoja tutkimuksen elinkaaren mukaiseksi palveluksi, jolloin tutkija ihannetapauksessa saa tarvitsemansa tuen aina kulloiseenkin tutkimusvaiheeseen selkeästi ja yhdestä paikasta. Palvelumuotoilun yksi konkreettinen tulos näkyy mainiosti UEF Datatuen verkkosivulla, joka myös tutkijoilta saadun palautteen perusteella haluttiin avoimeksi ja melko kattavaksi tietolähteeksi. Painotus ei siten olisi vain lukuisten linkkien tarjoamisessa, vaan keskeistä tietoa olisi avattu myös suoraan verkkosivustolle.

Toinen tärkeä palvelukanava on ollut uuden palvelunhallinta- eli tikettijärjestelmän käyttöönotto myös datatuen palveluissa; Hanketta edeltävällä ajalla datatukeen tulleita palvelupyyntöjä käsiteltiin sähköpostitse. Jos verkkosivut konkretisoivat datatuen palvelua tuen tarvitsijan kannalta, niin tikettijärjestelmä tekee eräällä tapaa sitä samaa tuen tuottajien näkökulmasta. Palvelumuotoilu terävöitti tutkimusaineistojen tuen parissa olevaa verkostoa, joka on nyt selkeämmin jäsennelty niin sanottuihin datatuen ydintoimijoihin ja laajempaan tutkimusaineistojen tuen verkostoon. Prosessi selkeytti myös palvelun brändäystä ja viestintää uudistuneen yhden luukun palvelun nimen vakiintuessa UEF Datatueksi. UEF Datatuen ydintoimijat ovat aktiivisesti mukana esimerkiksi datatuen tukipyyntöjen purkamisessa, ja nämä asiantuntijat kokoontuvat säännöllisesti noin kerran kuussa. Laajemman verkoston kokoonpano on joustava ja jäsenistössä on vaihtuvuutta. Se kokoontuu muutaman kerran lukukaudessa ajankohtaisten asioiden äärelle. Koordinaation ja UEFin datatukipalvelun vetovastuun tärkeys tuli selkeästi esille.

Kokemuksiamme ja ajatuksiamme palvelumuotoilusta datatuen kehittämisessä olemme käsitelleet artikkelissa Palvelumuotoilulla parempaa datatukea (Signum 2/2022).

Osaaminen, kouluttaminen ja asiantuntijuus

Datatuen palveluiden kehittämisen tiekartan kolmantena pääteemana on datanhallinnan koulutus. Vaikka opetus ja koulutus eivät sellaisenaan kuuluneet projektimme alkuperäisiin tavoitteisiin, on niiden merkitys datanhallinnan palveluissa ja niiden jatkuvuuden takaamisessa suuri. Koulutus on osa palvelua ja vastaa osaamistasojen saavuttamisen tavoitteisiin eri vaiheessa opinto- ja tutkimuspolkuja. Osaamistasoista on käyty paljon keskustelua muun muassa kansallisessa avoimen tieteen työryhmätyössä, mihin osallistuimme aktiivisesti. Olimme myös projektilaisina mukana oman kirjastomme aineistonhallinnan opetuksen kehittämisessä.

Aineistonhallinnan jäsentynyttä osaamista peräänkuulutetaan jo perusopintovaiheessa. Kansallisesti on asetettu tavoitteeksi, että vuoteen 2024 mennessä opinnäytetyön ohjaajat pystyvät arviomaan ja kommentoimaan opiskelijoiden aineistonhallintasuunnitelmia osana ohjaustyötään. Datanhallinta sisältyy – tai saattaa sisältyä – jo nyt luonnollisena osana opinnäytetyön ohjaukseen, mutta jatkossa tavoitteena on tarkastella datanhallintaa kokonaisuutena sekä kirkastaa myös opiskelijalle, mistä datanhallinnassa on kyse. Kirjastossa toteutettiin aiheesta kysely oppiaineiden opettajille ja opinnäytetyön ohjaajille loppukeväästä 2022. Siihen saatiin 130 vastausta kaikista tiedekunnista ja useimmilta laitoksilta tai osastoilta. Viesti oli selvä: Aineistonhallinnan opetukseen kaivataan tukea Itä-Suomen yliopistossa (ks. blogikirjoitus tuloksista).

Kouluttamisen teemaan liittyy erottamattomasti myös datatuen kehittämisen tiekartan neljäs kokonaisuus, datanhallinnan ammattilaisuus. Projektin kuvauksessa hankkeen yhdeksi tavoitteeksi oli asetettu tiedekuntien parempi linkittyminen datatukeen. Sitä kautta ryhdyimme pohtimaan datanhallintaan liittyvää osaamista ja osaamistarpeita ja melko pian totesimme, että datanhallinnan asiantuntijuus ja ammattilaisuus ovat erottamattomasti osa datatuen kokonaisvaltaista kehittämistä. Tiedekuntien näkökulmaa huomioiden laadimme sisäiseen käyttöön selvityksen, jonka tavoitteena oli tuottaa suosituksia siitä, millaista tieteenalakohtaista asiantuntijuutta tarvittaisiin täydentämään datatukea. Tässä meille hyödyllistä taustatietoa tarjosi Helsingin yliopiston koordinoima lukupiiri, jossa tutustuttiin erilaisiin eurooppalaisiin toteutuksiin datanhallinnan ammattilaisuuden ja ns. data stewardshipin määrittelyssä ja kehittämisessä. Lukupiiri toimi ponnistuslautana myöhemmin vuonna 2021 aloittaneeseen Avoimen tieteen ja tutkimuksen työryhmään, jossa edistetään datanhallinnan asiantuntijuuden tunnistamista, terävöitetään työrooleja sekä tarkennetaan erilaisia työnimikkeitä ja suunnitellaan alalle kouluttautumista.

Datatuen pysyvyys

Koordinaation merkitys tulee esiin kaikessa tutkimusdatanhallintaan liittyvässä tukityössä. Tutkimusaineistonhallinnan tuen kokonaisuudessa ja asiantuntijuuksia määriteltäessä erityistä huomioita on myös kiinnitettävä siihen, että tutkimusaineistot ovat eri aloilla erilaisia. Aineistojen uudelleenkäytön tarpeet ja tavat vaihtelevat tutkimusalasta toiseen ja niihin kohdistuu valtava toimenpiteiden ja hallinnan käytäntöjen kirjo. Osaamistasot ja -vaatimukset liikkuvat teknisestä datanhallinnasta tutkimusaineistojen hallinnan kokonaiskuvan ymmärtämiseen. Yksi asiantuntija ei pysty vastaamaan kaikkiin vaatimuksiin eivätkä yhden tieteenalan osaamisvaatimukset saa määritellä koko kenttää. Siksi on ehdottoman tärkeää, että jokainen tutkimusala ja -aineistotyyppi saa äänensä kuuluviin ja tarvitsemansa palvelut ja infrat. Sen mahdollistaa pysyvä, yliopiston yhteinen datatuki, joka yhdistää eri asiantuntijat verkostoksi palvelun taustalle. Yliopistossamme ollaankin hyvällä tiellä. Projektin päätyttyä kirjastolle on saatu kaksi uutta työtehtävää, joiden toimenkuva liittyy täysimääräisesti datanhallinnan tukeen ja koulutukseen. Tiedekunnissakin tapahtuu: Yhteiskuntatieteiden ja kauppatieteiden tiedekunnassa aloittaa keväällä tiedekunnan yhteinen datanhallinnan asiantuntija. Tästä on ilo jatkaa yhteisen palvelun ja osaamisen kehittämistä.

Kaksi hahmoa palapelin parissa. | Two figures working on a puzzle.
Kuva | Source: Alexa, Piaxabay (CC0)

 

In recent years, the University of Eastern Finland has focused on the development of research data management support services, initially alongside the other tasks of the library’s information experts and later with the support of a separate project. Two years ago, in the winter of 2021, the project “Development of data support as part of research support” started, coordinated by the library. The project ended on 31 December 2022. Its overarching goal was defined as the development of a functional service, know-how and expert network for the university’s research data support service.

In this blog, we shed light on how the project’s goals have been realized and what is being worked on as part of the daily functions of UEF Data Support.

Development of data support as part of research support: the project’s initial meters and specification of goals

In recent years, research data management has strongly emerged in the context of open science. In part, this has been influenced by the ever-increasing amount of research data and the diversity of new data formats and data sets. Opening of research data has become a general goal, at least at the level of speech. And at the same time, there has been a wake-up call to implement data management practices, so that the ethical and legal issues related to data can be resolved in a controlled manner and in anticipation of risks. This has meant that the support needs of researchers have increased considerably.

UEF has had support services related to research data management for several years. However, the services have been scattered to some extent, they are not well known and thus cannot be found, which was evident in the surveys carried out for UEF researchers in 2019 and 2020. The surveys also confirmed that there is a growing need for developing user driven support services. Researchers often need a quick answer to a specific and very context dependent problem, and in such cases general-level solutions are not necessarily adequate.

The purpose of the “Development of data support as part of research support” project, coordinated by the library, was not to build a new service from scratch but rather to develop the existing support services of the university. With an emphasis on making the services more user driven, service design was utilised in clarifying the internal processes and external service model of data support. Two project planners with a research background from different disciplines were hired for the project for 12 months, which helped to increase understanding about the varying needs of different research disciplines and datatypes from the very beginning of the project. The project was extended for one additional year, until the end of 2022, thanks to the hiring of one project planner and one substitute on study leave.

The project was led by the library’s information specialist, who had already worked for several years in research data management support tasks at UEF. A steering group was set up in support of the project progress, with a task of clarifying what should be paid attention to next and who was the most suitable contact person at the university in various topics. The beginning of the project, its steering group and the project planners are presented in the blog “Greetings from the data support project planners” published in March 2021.

In the spring of 2021, the steering group gave us a task to begin outlinining a road map for data management support services on a longer time span, which would help in delineating the most acute service goals of UEF. We divided the roadmap into four key themes: policies and strategy work, data support services, data management training and data management expert work. Participation in national and international open science working groups plays an important role in the policy and strategy work. Fundamental policy work is currently being conducted in the coordination of open science and research by the Federation of Finnish Learned Societies, and the experts working on data management at UEF have been actively involved in it before, during and after the data support development project. In terms of data management and increasing the transparency of research materials, it is important to have UEF’s data policy updated, and this is now being promoted at UEF level in the Open Science working group led by the library. The working group has started its activities in autumn 2022.

From a library data support to a university one-stop shop data support service

The second entity of the road map, data support services, was also the focus of the development project. Even before the project, a commenting service for data management plans at UEF offered a good starting point from which we could structure the development needs. The goal was to streamline the provisioning of centralised data support services from a one-stop shop. The commenting service also helped to establish a new support task, namely the commenting of research infrastructures’ data management policies (so-called DMPol’s).

In the first season of the project, we were able to lay the foundations of the renewing services, and in the second season we proceeded to piloting them. Data support services are typically wide-ranging, because resolving support requests often requires the involvement and expertise of several professionals from different units. In the data management support services at UEF, you can find expertise in, for example, open science and its requirements, data protection, information security, IT services, information management and contract law. The support service is coordinated by the library.

Besides the services offered and developed within the organisation, there are also so-called third-party data management services that organisations can use, because organisations cannot and should not do everything by themselves. The third-party services utilised by UEF researchers cover various purposes, such as CSC’s computing services, the DMPTuuli service for preparing a data management plan, and the Language Bank of Finland or the Finnish Social Science Data Archive for storing and archiving research data, to name a few. We wanted to get a better hold of this partly fragmented whole.

Research infrastructures are close to the themes of research data management. Research infrastructures often produce large amounts of data, and in addition to equipment, they can also consist of larger entities that contain, for example, discipline-specific databases. Thus, research infrastructures can also act as drivers of various technical solutions for data management. A number of infrastructure coordinators started working at the end of 2021 as part of UEF’s Research infrastructure program (2021-2024). This offered our development project an excellent opportunity to network with experts on research infrastructures. We also brought together, for example, the deans and vice-deans of the faculties and organized workshops for researchers. All the meetings showed a strong will to cooperate with broad shoulders, in order to avoid scattered information and duplication of effort.

Service design to aid the development work

The development project aimed to build a clearer and more structured data support service, where information related to data management would be centrally available as a one-stop shop service. To help in achieving this goal, the project was able to utilise a tailored service design training package. The trainer was Sanna Soppela from UEF’s Continuing Learning Center. The service design training and sparring sessions brought together members of the UEF data support network. Together, we managed to define the key target groups for the service, its purposes, and the practical organisation including the main service channels. Along the way, we worked on a service promise, i.e. the contents and resources of the common service that the units producing data management support can commit to. Fast and light feedback implementations are part of the extensive toolbox of service design. Between the meetings, we were able to test our planned solutions with the most important target groups of the service.

Getting support at the right time soon became a red thread for the one-stop shop service. We organised the various data management themes into a service that aligns accordingly with the research life cycle, so that ideally the researchers get the support they need for each research phase clearly and from one place. One concrete result of the service design process can be seen perfectly on the UEF Data Support website. The construction of the website was influenced by feedback received from the researchers, with an aim to provide an open and a fairly comprehensive source of information. Instead of providing numerous links to other sources, the emphasis was on providing key information directly findable on the website.

Another important development of data support service channels has been the introduction of a new service management (aka ticket) system; During the period preceding the project, service requests that came to data support were handled via e-mail. If the website concretizes the data support service from the point of view of the support user, then the ticket system does the same from the point of view of the support producers. The service design training and process helped to clarify the UEF network involved in supporting research materials and data. The network is now more clearly structured into data support core operators and to a wider research materials and data support network. The process also clarified the branding of and communication about the service, as the name of the renewed one-stop shop service became fixed as UEF Data Support.

UEF Data Support’s core operators are actively involved in e.g. solving data management support requests, and these experts meet regularly about once a month. The composition of the wider network is flexible and there is some turnover in membership. The network meets a few times per semester to discuss current issues in data management. The importance of coordination and the main responsibilities underlying the UEF Data Support service became clearer during the service design process. We have discussed our experiences and thoughts about utilising service design for developing data support services in an article called “Better data support with service design” (Signum 2/2022).

Competence, training and expertise

The third main theme of the data support service development roadmap is data management training. Although teaching and training as such were not parts of the original goals of our project, their importance in data management services and in guaranteeing service continuity is major. Education is part of the service and meets the goals of achieving appropriate data management competence levels at different stages of studies and research career paths. There has been a lot of discussion about data management competence levels and skills, for example in the national open science working group, in which we actively participate in. As project planners, we were also able to take part in developing the UEF Library’s research data management teaching.

Structured expertise in data management is already being called for during the Bachelor degree phase, and a national goal has been set that by the year 2024, all thesis supervisors should be able to evaluate and comment students’ data management plans as part of their supervision work. Data management is already included – or may be included – in varying degrees as a natural part of thesis supervision. However, the future goal is to consider data management as an entity in order to clarify for the student what data management is all about. The library conducted a survey on the topic for subject teachers and thesis supervisors during late spring of 2022. The survey garnered 130 responses from all faculties and most departments. The message was clear: Support is needed for the teaching of data management at the University of Eastern Finland (see the blog post about the results).

The theme of training is also inextricably linked to the fourth entity of the data support development roadmap, the professionalisation of data management expertise. In the project description, one of the goals was to link the faculties to the data support services more efficiently. From this viewpoint, we started to think about the skills and competences needed for data management expertise and pretty soon concluded, that the professionalisation of data management is an inseparable part of the overall development of data support. Taking into account the faculties’ perspective, we prepared a report for internal use, the aim of which was to produce recommendations on the types of discipline-specific expertise and skills needed to supplement the university data support service. In preparation of the report, were gained useful background information by attending a study circle coordinated by the University of Helsinki, where we got to know various European solutions in implementing the professionalisation of data management experts and on defining and developing data stewardship in general. The study circle served as a springboard for the Open Science and Research Working Group, which started later in 2021 and aims to promote the identification of expertise in data management, to sharpen job roles and specify various job titles, and to plan training of professionals in the field.

The continuity of data support services

The importance of coordination emerges in all support work related to research data management. From the perspective of general research data management support and when defining skills and expertise, special attention must also be paid to the fact that, despite the similarities among some disciplines, the research materials and data tend to differ depending on the field of study. Hence the needs and ways of reusing research materials vary from one research field to another and are subject to a huge range of procedures and management practices. Competence levels and requirements move from technical data management to understanding the overall picture. One expert cannot meet all requirements, and the competence requirements of one discipline must not define the entire field. That is why it is absolutely important that each field of research and type of data gets its voice heard and the services and infrastructure it needs.

This is made possible by the university’s permanent and shared data support, which connects different experts into a network behind the one-stop shop service. At our university, we are on the right path. Since the development project has come to an end, the UEF Library has received two new positions, where the job descriptions are specific to data management support and training. Things are also moving forward in the faculties: the Faculty of Social Sciences and Business Studies will have a joint data management expert in the spring. It is a pleasure to continue the development of joint services and to build expertise together.

 

Niina Nurmi, tietoasiantuntija | Information specialist
Manna Satama, tietoasiantuntija | Information specialist
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Aineistonhallinnan opetukseen kaivataan tukea Itä-Suomen yliopistossa | Support is needed for teaching data management at the University of Eastern Finland

(Please, scroll down to read in English.)

Aineistonhallinta on olennainen osa tutkimus- ja tietotyötä, ja sen laatuun on alettu kiinnittää entistä enemmän huomiota. Aineistonhallinnalla tarkoitetaan toimenpiteitä, joilla kerätään, säilytetään ja käytetään aineistoja — mittaustuloksia, haastatteluja, tekstejä, näytteitä ja niistä kertynyttä dataa — turvallisesti ja tehokkaasti. Tutkimustyössä aineistonhallinnalla huolehditaan, että aineisto pysyy käytettävänä koko tutkimuksen ajan ja myös sen jälkeen. Lisäksi aineistonhallintaan voi kohdistua lainsäädännöllisiä vaatimuksia, kuten esimerkiksi tietosuoja-asetuksen vaatimukset henkilötietojen käsittelyyn. Useimmiten tutkimusaineistojen hallinnan suunnitelmat rajautuvat datan hallintaan.

Tavoitteena systemaattisempi aineistonhallinnan opetus perusopinnoissa

Aineistonhallinta on avoimen tieteen edellytys, minkä edistämiseen suomalaiset korkeakoulut, mukaan lukien Itä-Suomen yliopisto, ovat sitoutuneet. Suomessa tutkimusyhteisö on aktiivisesti mukana linjaamassa avoimen ja vastuullisen tieteen tavoitteita ja toimenpiteitä. Tutkimusaineistojen ja -menetelmien linjaus (1) julkaistiin vuonna 2021, ja yksi sen tavoitteista koskee opinnäytetöiden datanhallintasuunnitelmien opetusta: “Viimeistään vuonna 2024 korkeakoulut huolehtivat, että opinnäytetöiden ohjaajat osaavat osana ohjaustyötään arvioida ja kommentoida datanhallintasuunnitelmia” (s. 14). Aikataulu on tiukka, eikä tavoiteajassa pysymistä helpota se, että aineistonhallinnan opetus perusopiskelijoille on vasta kehittymässä ja sille ollaan vasta luomassa osaamistasoja sekä yhtenäisiä kansallisia käytänteitä.

Aineistonhallintasuunnitelman tekeminen on ollut jo pidemmän aikaa ehtona monien tutkimushankkeiden rahoitukselle, ja tutkijat ovat saaneet ohjeistusta niiden tekemiseen kirjastosta. Lisäksi aineistonhallinnan kurssi on ollut osa UEFin tohtorikoulun vapaavalintaisia opintoja jo useamman vuoden ajan. Sen sijaan aineistonhallinnan opetus perusopiskelijoille on ollut lähinnä laitosten, osastojen ja yksittäisten ohjaajien vastuulla, eikä opetuksen määrä ja laatu koko Itä-Suomen yliopiston tasolla ole ollut tiedossa.

Aineistonhallinnan opetukseen on kuitenkin syytä kiinnittää huomiota, sillä aineistojen ja datan asianmukainen käsittely lisää opinnäytetöiden laatua ja riskinhallintaa monin tavoin. Aineiston keruun ja käsittelyn läpinäkyvyys parantuu, kun toimenpiteet dokumentoidaan ja aineisto kuvaillaan huolellisesti. Asianmukainen tallennus ja jakaminen koko opinnäytetyön elinkaaren ajan ennaltaehkäisee vahingossa tapahtuvan aineiston tuhoutumisen tai sen päätymisen vääriin käsiin Aineistonhallinnan osaamisesta on hyötyä opintojen ja tutkimuksen teon ohella myös työelämässä ylipäätään.

Kysely ja sen tulokset

Aineistonhallinnan opetuksen tilanteen kartoittamiseksi UEF kirjasto teki kyselyn oppiaineiden opettajille ja opinnäytetyön ohjaajille. Kyselyssä keskityttiin datanhallintaan, ei fyysisten aineistojen hallintaan, vaikka fyysisetkin aineistot edellyttävät suunnitelmallista käsittelyä ja hallintaa. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Jakauma: FILO 22 %. LUMET 18 %. TT 43 %. YHKA 17 %.
Kuva 1. Vastaajien määrä tiedekunnittain (n = 130). FILO = Filosofinen tiedekunta. LUMET = Luonnontieteiden ja metsätieteiden tiedekunta. TT = Terveystieteiden tiedekunta. YHKA = Yhteiskunta- ja kauppatieteiden tiedekunta.

Kyselyyn sai vastata suomeksi ja englanniksi. Vastauksista ilmeni, että aineistonhallintaa ei opeteta yksittäisenä kokonaisuutena, vaan se nivoutuu osaksi metodikursseja ja/tai opinnäytetyön ohjausta. Kyselyyn saatiin 130 vastausta, ja vastaajia oli kaikista tiedekunnista ja useimmilta laitoksilta/osastoilta.

Kyselyn tulokset osoittivat, että FAIR-periaatteet ja metadata tunnetaan heikoimmin opettajien ja ohjaajien keskuudessa. FAIR tulee sanoista Findable (=löydettävä), Accessible (=saavutettava), Interoperable (=yhteentoimiva) ja Re-usable (=uudelleen käytettävä) ja tarkoittaa käytännössä sitä, että aineistoa käsitellään niin, että tutkimuksen tulokset voidaan tarvittaessa verifioida sekä aineistoa on mahdollista jatkokäyttää olemassa olevan tutkimuksen jälkeen.

FAIR-periaatteiden käytännön toteuttaminen edellyttää hyvää tieteenala- ja aineistokohtaista ymmärrystä ja alan tutkimuskäytänteiden tuntemusta, mikä hankaloittaa yksityiskohtaisten yleisohjeiden antamista. Yleisluonteisia ohjeita kuitenkin laaditaan, mutta niiden perusteella FAIR-periaatteiden noudattaminen saattaa olla varsin vaikeaa. Myös metadata eli aineiston kuvailu oli heikommin tunnettua. FAIR-periaatteet ja metadata voivat myös olla termeinä vieraita, mutta monet ohjaat ja opettajat voivat käyttää niiden kuvaamiseen vaikkapa eri termejä ja toteuttaa niitä käytännössä tietämättään. Toisaalta opettajat ja ohjaajat tunsivat hyvin avoimen datan ja sen saatavuuden, mutta sitä ei juuri opeteta opiskelijoille, vaikka se on keskeinen aineistonhallinnan osa-alue.

Graafi. Kuinka hyvin tunnet seuraavat datanhallinnan osa-alueet? FAIR 44 % ei tunne eikä opeta. 7 % opettaa. Datan omistajuus 20 % ei tunne eikä opeta, 20 % opettaa. Avoin data 16 % ei tunne eikä opeta, 13 % opettaa. Datan tallennus tutkimuksen aikana 13 % ei tunne eikä opeta, 28 % opettaa. Metadata 28 % ei tunne eikä opeta, 16 % opettaa. Datan sensitiivisyys ja tietosuoja 10 % ei tunne, 37 % opettaa. Datan säilytys/hävitys tutkimuksen jälkeen 14 & ei tunne, 36 % opettaa.
Kuva 2. Datahallinnan osa-alueiden tuntemus

Vaikka aineistonhallinnan osa-alueet tunnettiin kohtalaisesti, noin puolet opettajista ja ohjaajista koki, että he tarvitsevat tukea aineistonhallinnan opetukseen ja ohjaukseen. Neuvontaa kaivattiin lähes kaikkiin aineistonhallinnan osa-alueisiin. Kun vastauksia tarkasteltiin tiedekuntakohtaisesti, Terveystieteiden tiedekunta (TT) erottui muista tiedekunnista siinä, että TT:ssä tunnetaan melko hyvin henkilötietoja ja arkaluonteisia henkilötietoja sisältävän aineiston käsittely. Toisaalta Terveystieteiden tiedekunnassa kaivattiin neuvontaa henkilö- ja terveystietoa sisältävien aineistojen avaamiseen. Se saattaakin olla usein työlästä ja vaikeaa, sillä avaamisessa tulee kiinnittää erityistä huomiota aineiston avaamisen laajuuteen ja käyttöoikeuksien asianmukaiseen jakeluun.

Graafi. Kaipaan neuvontaa seuraaviin datanhallinnan osa-alueisiin. FAIR-periaatteet 60 % kyllä, 40 % ei. Datan omistajuus 50 % kyllä, 50 % ei. Avoin data ja sen saatavuus 53 % kyllä, 47 % ei. Datan tallennus tutkimuksen aikana 43 % kyllä, 57 % ei. Metadata 49 & kyllä, 51 % ei. Datan sensitiivisyys ja tietosuoja 38 % kyllä, 62 % ei. Datan säilytys/hävitys tutkimuksen jälkeen 39 % kyllä, 61 % ei.
Kuva 3. Tuen tarve aineistonhallinnan eri osa-alueilla.

Missä vaiheessa opintoja? Kuka opettaa?

Aineistonhallinnan opetus nivoutuu useimmiten osaksi pro gradu -tutkielmaa joko osana seminaaria tai varsinaista työnohjausta. Opettajat ja ohjaajat myös kokivat, että tämä olisi luonnollisin ajankohta aineistonhallinnan opetukselle. Kyselyn avovastauksista ilmeni, että aineistonhallinta ylipäätään koetaan tarpeelliseksi ja että sen laadukkaaseen opetukseen ja ohjaukseen on syytä kiinnittää huomiota. Lisäksi kirjastolta toivottiin ohjausta aineistonhallinnan opetukseen ja tiivistä materiaalipakettia aineistonhallinnasta sekä ohjaajille, opettajille että opiskelijoille.

Vastauksena aineistonhallinnan opetuksen tarpeisiin, kirjastossa on suunnitteilla ohjaajan paketti kirjaston verkkosivuille. Lisäksi päivitämme ja pyrimme lisäämään nykyisten perusopiskelijoille suunnattujen aineistonhallinnan verkkosivujen näkyvyyttä. Suunnitelmissa on myös aineistonhallinnan opetuksen kehittäminen ja pilotoiminen yhteistyössä oppiaineiden kanssa.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Tutkimusaineistojen ja -menetelmien avoimuus : korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021-2025. Osalinjaus 1, Tutkimusdatan avoin saatavuus. Helsinki: Tieteellisten seurain valtuuskunta. DOI: https://doi.org/10.23847/isbn.9789525995466 

Support is needed for teaching data management at the University of Eastern Finland

Data management, an essential part of research- and information work, has received increasing attention in recent years. Data management means procedures, which are used to collect, store, and use data safely and efficiently. Data can include measurement results, interviews, texts, samples, or data based on the aforementioned. In scientific research, data management ensures that the data will be usable throughout the research process – from preliminary data to data reposition after research. There can be also legal requirements, such as data privacy issues regulated by the general data protection regulation (GDPR), that mandate the data management procedures. Although data can also include physical samples, data management plans typically only concern data in a digital format.

Goal: Systematic training for data management during master’s studies

Data management is an integral part of Open Science, and Finnish higher education institutions (incl. University of Eastern Finland, UEF) are committed on promoting it. In Finland, the research community is actively developing goals and actions to promote open and responsible science. The National Policy and Executive plan by the higher education and research community (1) was published in 2021 and one of its goals involves teaching of data management during thesis supervision: “No later than 2024, higher education institutions will ensure that thesis supervisors are able to evaluate and comment on data management plans as part of their supervisory work” (pp 13). Because the skill levels and national practices are at the moment still being developed, the schedule is quite ambitious.

Writing data management plans has been a pre-requisite for several research funding instruments for a while and UEF Library has a major role in training researchers to write them. In addition, Library has offered a course on research data management for doctoral students for some years now. However, the training of master’s students for research data management has not been systematic, and instead the training has been organized mainly by departments and individual teachers and thesis supervisors. Therefore, the extent and the quality of the training is not known at the university level.

Nevertheless, it is necessary to pay attention to data management training and appropriate treatment of data because it will increase the quality of theses and it is also part of risk management. Appropriate storing and sharing of data will decrease the risks, such as accidental loss of data or data misuse. Being knowledgeable about data management is also an important general skill that is needed in working life.

Survey and results

The UEF library conducted a survey during May-June 2022 about the teaching of data management by teachers and thesis supervisors. The survey focused on management of digital data, rather than physical samples, although physical samples also need systematic handling and treatment. We received 130 answers, which covered all faculties and most departments.

Distribution. FILO 22%, LUMET 18%, TT 43%, YHKA 17%
Figure 1. Percentage of responses in faculties (n = 130). FILO = Philosophical Faculty. LUMET = Faculty of Science and Forestry. TT = Faculty of Health Sciences. YHKA = Faculty of Social Sciences and Business Studies.

Answers were accepted both in Finnish and English. The results showed that data management is not taught as a separate entity/topic, but instead as part of methodological courses or thesis supervision.

The results also show that the FAIR-principles and metadata are the least known parts of data management. The acronym derives from the words Findable, Accessible, Interoperable and Re-usable. In practice FAIR means that data are treated in a manner that research results can be verified, and the data can be re-used after the current work is completed. Applying FAIR-principles, however, requires good knowledge of data types used in each scientific field. This makes giving detailed, one-size-fits-all instructions difficult. Other less familiar data management topic was metadata, i.e., the description of data. The unfamiliarity with FAIR-principles and metadata could also be unknown as terms; hence, it is possible that many teachers and supervisors practice or work with them without knowing it. On the other hand, teachers and supervisors were familiar with open data, yet it was rarely taught to students despite being a key component of research data management.

Graph. How familiar are you with...? FAIR principles: Do not know 44%, teach 7%.Data ownership Do not know 20%, teach 20%. Open data Do not know 16%, teach 13%.Data storage Do not know 13%, teach 28%.Metadata Do not know 28%, teach 16%.Data sensitivity and data protection Do not know 10%, teach 37%. Data storage/disposal after research Do not know 14%, teach 36%.
Figure 2. Knowledge about areas of data management

Although all the key aspects of data management were known to some extent, almost half of the teachers and supervisors felt that they need support for teaching data management. Guidance was needed in all aspects of data management. When answers were compared between faculties, the knowledge about personal and sensitive data was the best in the Faculty of Health Science. On the other hand, teachers and supervisors in the Faculty of Health Science felt that they need guidance on how to open the data the most. Indeed, opening sensitive data can be difficult because the degree of openness and used rights must be considered carefully.

Graph. I need guidance in: FAIR principles Yes 60%, No 40%. Data ownership Yes 50%, No 50%. Open data Yes 53%, No 47%. Data storage Yes 43%, No 57%. Metadata Yes 49%, No 51%. Data sensitivity and data protection Yes 38%, No 62%. Data storage/disposal after research Yes 39%, No 61%.
Figure 3. Support needed in different areas of research data management

In which part of studies? Who is teaching?

According to the survey results, research data management was mostly taught as a part of thesis work, either as a part of seminar or during the actual thesis supervision. The teachers and supervisors also felt that this is the most suitable timing for the teaching. The open answers of the survey showed that teaching data management is important, and attention should be paid to good quality in teaching it. Respondents wished guidance and compact material bank for students, teachers, and supervisors.

In a response for the need for support in the teaching of data management, the UEF library will prepare a supervisor’s guide in the library website. We will also update and increase the visibility of the existing material for the students. Obviously, the first step is to translate all material in English. We will also possibly pilot the teaching of data management together with the departments.

(1) Nykyri, S., Päällysaho, S., Rosti, T., Sunikka, A., Neuvonen, A., & Kuusniemi, M. E. (2021). Open research data and methods National policy and executive plan by the higher education and research community for 2021–2025: Policy component 1: Open access to research data. DOI: https://doi.org/10.23847/isbn.9789525995480

Helena Jäntti, tietoasiantuntija | Information specialist
Taisa Sallinen, tietoasiantuntija | Information specialist
Manna Satama, tietoasiantuntija | Information specialist
Niina Nurmi, tietoasiantuntija | Information specialist
Laura Parikka, tietoasiantuntija | Information specialist
Opetus- ja tietopalvelut | Training and Information Services

 

 

 

Tutkijoiden viesti: Lisää tukea, osaamista ja suunnitelmallisuutta tutkimusdatan hallintaan! | Message from the researchers: More support, skills and planning for research data management, please!

(Please, scroll down to read in English.)

Tutkimusaineistoihin liittyy mitä moninaisempaa tietämystä, osaamista ja toimenpidettä. Jossain kohdin törmää yleensä siihen, että omat taidot eivät riitä tai että asiat olisivat sujuneet paremmin, jos olisi tiennyt, mistä apu on löydettävissä. Tästä aihepiiristä UEFin tutkijat ja kirjaston datatuen väki jakoivat ajatuksiaan ja kokemuksiaan 27.10.2021 pidetyssä työpajassa, jonka otsikkona oli “Tutkijoiden dataosaaminen ja -tarpeet esiin”. Teemaa on sivuttu taannoisessa blogkirjoituksessa, jossa pohdimme tutkimusaineistojen asiantuntijoiden rikasta kenttää. Työpajan teema osui selvästi ajankohtaiseen aiheeseen, sillä samalle päivälle sattuneessa Yhteiskunta- ja kauppatieteiden tiedekunnan strategiapäivässäkin avoin tiede tutkimusaineistoineen keräsi mittavan osallistujajoukon ja herätti vilkasta keskustelua.

Tutkimuksen ja tutkimusaineiston elinkaaret

Tutkimusaineistoa tai -dataa voidaan jäsentää suhteessa tutkimukseen, jonka raaka-aineena se toimii. Tutkimuksen edetessä raakadatasta muokkautuu usein valikoidumpia datasettejä, jotka ovat voineet käydä läpi erilaisia prosesseja ja muokkauksia. Aineistonhallinnan keskustelussa puhutaan usein tutkimuksen ja tutkimusaineistojen elinkaarista. Tutkimuksen elinkaari hahmotetaan kolmeen vaiheeseen: ennen tutkimusta, tutkimuksen aikana ja sen jälkeen. Tutkimusaineistojen elinkaari ulottuu usein tutkimuksen elinkaarta pidemmälle, kun aineistoja hyödynnetään uudelleen.

Työpajassa tunnistettiin tutkimusaineistoihin liittyviä toimenpiteitä ja tietotaitoa erityisesti tutkimuksen aikana. Tällaisina mainittiin vaikkapa datan analysointi, dokumentointi, ohjelmointi, tietokantaosaaminen, sensitiivisen aineiston käsittely ja datan jakaminen tietoturvallisesti yhteistyökumppaninen välillä. Työ on kuitenkin alkanut jo tutkimusta ennen aineiston keruun ja yleisemmin aineistonhallinnan suunnitteluna. Tutkimuksen jälkeen täytyy aineistollekin tehdä jotain: jokin osa aineistosta säilytetään, jokin tuhotaan, ja aineistoa myös avataan tai julkaistaan. Ihannetapauksessa aineisto on uudelleenkäytettävissä jonkin muun tutkimuksen raaka-aineena, jolloin aineiston elinkaari konkretisoi mainiosti asiakirjahallinnan ja arkistotoimen keskustelussa esiintyvää jatkumomallia.

Tutkimusaineiston käsittely edellyttää tutkijoilta usein teknisten taitojen lisäksi yleisiä aineistonhallinnan taitoja vaikkapa terminologian ymmärtämiseen tai tiedon etsimiseen omaan tilanteeseen ja tarkoitukseen sopivista toimenpiteistä ja ratkaisuista. Kaiken pohjana ovat kuitenkin tutkijan perustaidot eli tutkittavan aiheen perustavanlaatuinen tunteminen ja ymmärrys, tutkimusetiikka ja sen käytäntöjen hallinta.

Lisää osaamista ja tukea, kiitos!

UEFin datatuen kehittämisen yksi kulmakivi on yhden luukun palvelun parantaminen, jolloin tutkija pääsisi datasupport@-osoitteen kautta monen eri alan asiantuntijan avulla tuotetun kattavan tuen ja tiedon äärelle. Työpajassa tutkijat saivat vapaat kädet ideoida ja toivoa, mitä palvelua datatuen yhdestä luukusta pitäisi saada ja millainen tuki heitä olisi auttanut eteen tulleissa ongelmatilanteissa ja osaamisen puutteissa. Osa toiveista kohdistui sellaisiin tukipalveluihin, joita on jo nyt tarjolla, mutta joiden olemassaolo ei ole vielä tavoittanut tutkijoita. Esimerkiksi aineistonhallintasuunnitelman (DMP) tukea on saatavilla kommentointipalveluna ja koulutuksina, ja myös kohdennettuna tiettyihin rahoituksiin.

Neuvoja, ohjausta ja koulutusta kaivataan myös datan säilyttämiseen tutkimuksen aikana ja sen jälkeen, datan anonymisointiin, tietokantoihin ja vaikkapa datan käyttämiseen kahden yliopiston yhteisessä hankkeessa eri yliopistojen tunnuksilla. Datanhallinnan ratkaisuihin ja toimintatapoihin toivottiin suunnitelmallisuutta sekä jaettua ymmärrystä ja osaamista vähintäänkin tutkimushankkeiden sisällä. Kokonaisuuden hallinta ei saisi jäädä vain yhden ihmisen varaan.

Yleisemmän aineistonhallinnan tuen rinnalle tunnistettiin tarve aineisto- tai alakohtaisille asiantuntijoille sekä tiedekunnan tasolla oleville tukihenkilöille. Aineistonhallinnan vastuiden konkretian tasot on kuitenkin muistettava: Tukitoimet keskittyvät ohjeistuksiin, koulutuksiin ja neuvoihin, mutta ne eivät pysty vastaamaan varsinaiseen aineistonhallintaan, sillä se on tutkijoiden omalla vastuulla.

Vertaistuesta datatukeen

Vertaistuki on tutkijankin työssä ja aineistonhallinnan asioissa kullan arvoista. Vaikka epäviralliset, usein sattumanvaraiset keskustelut kollegoiden kesken ovat tiedon jakamisen tärkeä kanava, tarvetta on organisoidummalle kollegiaaliselle tuelle. Koulutukset, webinaarit ja oppimisyhteisöt mainittiin hyvinä keinoina jakaa ja saada tietoa. Osastoilla ja laitoksilla voisi olla myös tieteenalakohtaisia datanhallinnan mentoreita, jolloin vertaistukea olisi saatavilla järjestäytyneemmin.

Mikä sitten motivoisi tutkijaa tarjoamaan omaa osaamistaan? Tähänkin kaivataan kannustimia aivan kuten moniin avoimen tieteen käytännön toimiin ylipäätään. Työpajassa mainittiin esimerkkinä koulutuksiin osallistuminen, joka pitäisi pystyä kirjaamaan työraportointeihin. Datanhallinnan taitojen tulisi ylipäätään näkyä selkeämmin tutkijan meritoitumisessa. Tämä antaisi kaivattua nostetta osaamisen kehittämiselle ja lisäisi panostusta tiedekuntien datanhallintaan.

Eräänlaisena yleisenä ohjenuorana ja työpajan kiteytyksenä on suunnitelmallisuus, joka tuli keskustelussa esiin monessa kohdin. Käytännön esimerkkinä mainittiin tutkimushankkeet, joissa datanhallinnan käytänteet pitäisi dokumentoida kunnolla ja joissa niistä pitäisi huolehtia siten, että käytänteet välittyvät myös hankkeisiin tuleville uusille tutkijoille. Tämä saattaa kuulostaa itsestään selvältä, mutta tutkimuksen arjessa ideaalit eivät välttämättä toteudu. Aineistonhallinnan suunnittelun olisi löydettävä paikkansa tutkimussuunnitelman kiistattomana osana. Tässä kohdin tiedekuntien vertaistuki ja yliopiston yleinen datatuki voivat täydentää toisiaan luontevasti ja kaikkien erityisasiantuntemusta tehokkaasti hyödyntäen.

 

Arrows depicting the research data cycle from data collection to analysis and to disseminating results
Työpaja oli osa kirjaston OA-viikon ohjelmaa ja liittyi kirjaston koordinoimaan datatuen kehittämishankkeeseen, jonka kuulumisia on esitelty kirjaston blogissa. Työpajaan osallistui tutkijoita kaikista neljästä tiedekunnista. | The workshop was part of the Library’s OA Week program as well as of the data support project coordinated by the Library (see our project update from an earlier blog article). All four faculties were represented in the workshop. Image by: Patrick Hochstenbach (CC-BY)

Working with research data involves a wide variety of know-how. At some point, you may notice that your skills aren’t enough, or that things would have worked out better if you had known where help was to be found. Researchers and the library’s data support staff shared their thoughts and experiences on this theme in a workshop held on 27 October 2021, with the title “Uncovering the data skills and needs of the researchers”. We handled the same theme in our recent blog, reflecting on the wide variety of expertise in research data.

The life cycles of research and research data

Research data may be perceived in relation to the research for which it serves as the raw material. As research progresses, raw data is often modified to select data sets, which may have gone through various processes. In the context of research data management, the life cycle of both the research and the research data are common concepts. Research life cycle is often divided into three phases: before, during and after the research. The life cycle of research data typically extends beyond the life cycle of research when the data may be reutilized.

In the workshop, we identified measures and know-how related to research data particularly during the research, such as analysing and documenting data, programming and database skills, handling sensitive data and safe data sharing with research partners. The work, however, starts even before the research when data collection and managing data are planned. After the research, the data calls for some actions as well: something will be stored, something destroyed, and some data may be opened or published. Ideally, the data can be reused as raw data for new research. In this case, the life cycle of the data concretizes, in a nice way, the continuum model used in records management.

In addition to technical know-how, data handling requires skills and knowledge of a more general kind, for example, understanding the terminology or finding solutions best suited for one’s needs. However, the basic skills of the researcher, namely fundamental knowledge and understanding of the subject matter, research ethics and its practices, are the basis of everything.

More skills and support – yes, please!

Improving the one-stop-shop for data management support services at UEF is one of the cornerstones of the development project: researchers will be able to access extensive support and information through the datasupport@ service channel produced by different professionals coming together from different fields of expertise. Researchers were able to pitch their ideas and make wishes for the kinds of services the one-stop-shop for data management support should offer and what type of support would have helped them during past problems and lack of skills. Portion of the hopes matched services that had already been implemented but that the researchers were not familiar with yet. As an example of existing services, support for writing a research data management plan (DMP) is already in place in the form of a DMP commenting service and various trainings, including targeted training for specific funding instruments.

Advice, guidance, and training are also needed for storing data during and after research, anonymization of data, research data bases, and using data in a collaborative project between two different universities. Researchers also called for well-planned solutions and procedures for data management, including shared understanding and skills at least within individual research projects as a minimum level.

Managing the big picture should not be left on the shoulders of one person. The importance of experts specific to datatypes and disciplines along with support personnel embedded in faculties was recognized in supplementing general research data management support services. One must bear in mind the concrete levels of data management responsibilities though: support measures focus on guidance, training and advice, while they cannot meet the actual management of research data which remains the responsibility of researchers.

From collegial support to datasupport

Collegial support is valuable not only in matters of data management but more generally in the everyday work of a researcher. Although unofficial, often random conversations with colleagues are important channels of information sharing, there is a recognized need for more organized collegial support. Trainings, webinars and learning communities were mentioned during the workshop as good means of sharing and receiving information. Faculties and departments could also have embedded discipline-specific data management mentors, to make peer support more systematically available.

What would, then, motivate researchers to offer their know-how to others? Incentives may be needed for willingness to mentor others, and this is also recognized more widely in relation to many practical measures in open science. The possibility to record attendance on data management training sessions to work reports was mentioned as one suggestion. Overall, research data management skills should be made more visible in meriting researchers. This would give a much-needed lift to developing skills and add investment by faculties on managing research data.

The importance of planning ahead was raised several times during the conversation and hence it can be summarized here as a kind of general guideline and a take-home message from our workshop. There were practical examples from research projects, where research data management practices should be documented well and thoroughly to make sure that they will be available to new researchers entering the project. Although this may sound self-evident, such ideals do not necessarily actualize during everyday research. Data management planning should find its rightful place as an undisputable part of a research proposal. Moreover, it is one of the many avenues, where collegial support of the departments can complement general data support services, making best use of everyone’s expertise most efficiently.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services