UEF Datatuen kehittäminen: projektista pysyvyyteen | The development of UEF Data Support: from a project to permanence

(Please, scroll down to read in English)

Itä-Suomen yliopistossa on paneuduttu viime vuosina tutkimusdatan hallinnan tukipalveluiden kehittämiseen. Tätä työtä ovat tehneet kirjaston tietoasiantuntijat, aluksi muiden tehtäviensä ohella ja sittemmin erillisen projektin turvin. Kaksi vuotta sitten, talvella 2021, käynnistyi kirjaston koordinoima projekti “Datatuen kehittäminen osana tutkimuksen tukea”. Projekti päättyi 31.12.2022. Sen kattotavoitteeksi määriteltiin toimivan palvelun, osaamisen ja asiantuntijaverkoston kehittäminen yliopiston tutkimusdatan tukipalveluun.

Tässä blogissa kerromme, miten projektin tavoitteet ovat toteutuneet ja mitä datatuen perustoiminnassa on työn alla.

Datatuen kehittäminen osana tutkimuksen tukea: projektin alkumetrit ja tavoitteiden täsmentyminen

Viime vuosina tutkimusdatanhallinta on noussut vahvasti esiin avoimen tieteen yhteydessä. Osaltaan tähän on vaikuttanut alati kasvava tutkimusdatan määrä sekä uusien dataformaattien ja -settien monimuotoisuus. Tutkimusdatan avaamisesta on tullut ainakin puheen tasolla yleinen tavoite ja samalla on herätty datanhallinnan toteuttamisen käytäntöihin, jotta dataan liittyvät eettiset ja juridiset seikat voidaan huomioida hallitusti ja riskit ennakoiden. Samalla tutkijoiden tukitarpeet ovat lisääntyneet huomattavasti.

UEFilla on ollut tutkimusdatan hallintaan liittyviä tukipalveluita jo useamman vuoden. Palvelut ovat kuitenkin olleet osin hajallaan, niitä ei tunneta, eikä siten löydetä, mikä kävi ilmi vuosina 2019 ja 2020 UEFin tutkijoille toteutetuissa kyselyissä. Kyselyt vahvistivat myös sen, että käyttäjälähtöisten tukipalveluiden kehittämiselle on kasvava tarve. Tutkijat kaipaavat usein nopean vastauksen johonkin tiettyyn ja vahvasti sidonnaiseen ongelmaan, jolloin yleistason ratkaisut eivät välttämättä sovellu useamman tukipyynnön ratkaisuiksi.

Helmikuun alussa 2021 käynnistyneessä datatuen kehittämishankkeessa  tarkoituksena oli jatkokehittää yliopistossa jo olevia palveluita, ei rakentaa uutta palvelua. Avuksi otettiin käyttäjälähtöisyyttä korostava palvelumuotoilu, jota hyödyntäen datatuen sisäisiä prosesseja pyrittiin selkeyttämään.

Projektiin palkattiin 12 kuukaudeksi kaksi tutkijataustaista suunnittelijaa eri tieteenaloilta. Tämä auttoi erilaisten tutkimusaineistojen tarpeiden ymmärtämistä jo heti projektin alkumetreiltä. Projektille saatiin jatkoa vuoden 2022 loppuun yhden projektisuunnittelijan palkkauksen ja yhden opintovapaan sijaisuuden turvin.

Projektin vetovastuussa oli kirjaston tietoasiantuntija, joka oli jo toiminut useamman vuoden tutkimusdatan hallinnan tukitehtävien parissa UEFissa. Ohjausryhmä tuki projektin etenemistä tarpeen mukaan tarkentaen, mihin seuraavaksi kannattaisi kiinnittää huomioita ja keihin yliopistolla voisi olla yhteydessä. Projektin alku, sen ohjausryhmä ja projektisuunnittelijat on esitelty maaliskuussa 2021 julkaistussa blogissa Datatuen projektisuunnittelijoiden terveiset.

Keväällä 2021 saimme ohjausryhmältä myös tehtäväksi hahmotella datatuen tiekarttaa, joka selventäisi UEFin kannalta akuuteimmat datatuen palvelutavoitteet. Jaottelimme tiekartan neljään keskeiseen teemaan: linjaukset ja strategiatyö, datatuen palvelut, datanhallinnan koulutukset ja datanhallinnan asiantuntijatyö. Linjaus- ja strategiatyössä osallistuminen kansalliseen ja kansainväliseen avoimen tieteen työryhmätoimintaan on tärkeässä roolissa. Tieteellisten seurain valtuuskunnan avoimen tieteen ja tutkimuksen koordinaatiossa tehdään parhaillaan perustavanlaatuista linjaustyötä, ja UEFin datanhallinnan parissa työskentelevät asiantuntijat ovatkin olleet siinä aktiivisesti mukana jo ennen datanhallinnan tukipalveluiden kehittämisprojektia, projektin aikana ja sen jälkeen. Datanhallinnan ja tutkimusaineistojen avoimuuden lisäämisen kannalta on tärkeä saada UEFin datapolitiikka päivitettyä. Sitä edistetään nyt UEFin tasolla kirjaston vetämässä Avoimen tieteen työryhmässä, joka aloitti toimintansa syksyllä 2022.

Kirjaston datatuesta yliopiston datatuen yhden luukun palveluksi

Tiekartan toinen kokonaisuus, datatuen palvelut, olivat kehittämishankkeen keskiössä. Jo ennen projektia toiminut aineistonhallintasuunnitelmien kommentointipalvelu tarjosi hyvän lähtökohdan, josta pystyimme jäsentämään kehittämistarpeita. Tavoitteena oli virtaviivaistaa keskitettyjen datatuen palveluiden tarjoamista yhdestä luukusta. Kommentointipalvelu auttoi myös pohjustamaan uutta tehtävää eli tutkimusinfrastruktuurien aineistonhallintalinjausten (ns. DMPol) kommentointia. Projektin ensimmäisellä kaudella saimme luotua pohjat uudistuville palveluille ja jatkokaudella pääsimme pilotoimaan niitä.

Datatuen palvelut ovat tyypillisesti laaja-alaisia, sillä usein tukipyyntöjen purkaminen vaatii moniammatillista yhteistyötä ja useamman asiantuntijan osaamista. UEFissa datanhallinnan tukipalveluista löytyy asiantuntemusta esimerkiksi avoimesta tieteestä ja sen vaatimuksista, tietosuojasta, tietoturvasta, IT-palveluista, tiedonhallinnasta ja sopimuslaista. Tukipalvelua koordinoi kirjasto. Tutkimusdatanhallinnan tukipalvelut koostuvat yleensä organisaation sisällä kehitettävistä ja tarjottavista palveluista sekä ns. kolmansien osapuolien palveluista, joita organisaatiot voivat hyödyntää, sillä kaikkea ei voi eikä kannata tehdä ja tuottaa itse. UEFissa hyödynnetään ja UEFin tutkijat käyttävät eri tarkoituksiin myös ulkopuolisia palveluita, kuten CSC:n laskentapalveluja, aineistonhallintasuunnitelman laatimiseen DMPTuuli-palvelua ja aineistojen tallentamiseen ja arkistointiin vaikkapa Kielipankkia tai Tietoarkistoa. Tätä osin hajanaista kokonaisuutta halusimme saada paremmin haltuun.

Tutkimusinfrastruktuurit ovat lähellä tutkimusdatanhallinnan teemoja. Tutkimusinfrastruktuurit tuottavat usein suuriakin määriä dataa. Laitteiden lisäksi ne voivat käsittää alustoja tai palveluita, jotka pitävät sisällään esimerkiksi alakohtaisia tietoaineistoja. Siten tutkimusinfrastruktuurit voivat toimia myös erilaisten datanhallinnan teknisten ratkaisujen ajureina. UEFin tutkimusinfrastruktuuriohjelmassa (2021–2024) käynnistyi infrakoordinaattorien toiminta loppuvuodesta 2021. Tämä tarjosi omalle hankkeellemme erinomaisen mahdollisuuden verkostoitua tutkimusinfran osaajien kanssa. Yhytimme myös esimerkiksi tiedekuntien dekaanit ja varadekaanit ja järjestimme tutkijoille suunnattuja työpajoja. Kaikissa tapaamisissa kävi vahvasti ilmi tahto tehdä yhteistyötä levein hartioin, jotta vältettäisiin hajallaan olevan tieto ja päällekkäinen tekeminen.

Palvelumuotoilu kehittämistyön avuksi

Kehittämishankkeessa tavoiteltiin siis aiempaa selkeämpää ja jäsennellympää datatukipalvelua, jossa datanhallintaan liittyvä tieto olisi keskitetysti saatavilla yhden luukun palveluna. Tätä lähdettiin työstämään hankkeelle räätälöidyn palvelumuotoilukoulutuksen avulla. Kouluttajana toimi Sanna Soppela UEFin Jatkuvan oppimisen keskukselta. Koulutus- ja sparrauskerrat kokosivat yhteen datatuessa toimivaa verkostoa. Pääsimme yhdessä määrittelemään keskeisiä kohderyhmiä palvelulle, palvelun tarkoitusta ja käytännön järjestämistä palvelukanavineen. Pitkin matkaa työstimme palvelulupausta eli niitä yhteisen palvelun sisältöjä ja resursseja, joihin datatukea tuottavat yksiköt voivat sitoutua.

Nopeat ja kevyestikin rakennetut palautetoteutukset ovat osa palvelumuotoilun laajaa työkalupakkia. Tapaamiskertojen välillä pääsimmekin myös testaamaan suunnittelemiamme ratkaisuja palvelun keskeisimpien kohderyhmien kanssa. Punaiseksi langaksi yhden luukun palvelulle muodostui melko pian tuen saaminen oikeaan aikaan. Jäsentelimme datanhallintaan liittyviä teemoja tutkimuksen elinkaaren mukaiseksi palveluksi, jolloin tutkija ihannetapauksessa saa tarvitsemansa tuen aina kulloiseenkin tutkimusvaiheeseen selkeästi ja yhdestä paikasta. Palvelumuotoilun yksi konkreettinen tulos näkyy mainiosti UEF Datatuen verkkosivulla, joka myös tutkijoilta saadun palautteen perusteella haluttiin avoimeksi ja melko kattavaksi tietolähteeksi. Painotus ei siten olisi vain lukuisten linkkien tarjoamisessa, vaan keskeistä tietoa olisi avattu myös suoraan verkkosivustolle.

Toinen tärkeä palvelukanava on ollut uuden palvelunhallinta- eli tikettijärjestelmän käyttöönotto myös datatuen palveluissa; Hanketta edeltävällä ajalla datatukeen tulleita palvelupyyntöjä käsiteltiin sähköpostitse. Jos verkkosivut konkretisoivat datatuen palvelua tuen tarvitsijan kannalta, niin tikettijärjestelmä tekee eräällä tapaa sitä samaa tuen tuottajien näkökulmasta. Palvelumuotoilu terävöitti tutkimusaineistojen tuen parissa olevaa verkostoa, joka on nyt selkeämmin jäsennelty niin sanottuihin datatuen ydintoimijoihin ja laajempaan tutkimusaineistojen tuen verkostoon. Prosessi selkeytti myös palvelun brändäystä ja viestintää uudistuneen yhden luukun palvelun nimen vakiintuessa UEF Datatueksi. UEF Datatuen ydintoimijat ovat aktiivisesti mukana esimerkiksi datatuen tukipyyntöjen purkamisessa, ja nämä asiantuntijat kokoontuvat säännöllisesti noin kerran kuussa. Laajemman verkoston kokoonpano on joustava ja jäsenistössä on vaihtuvuutta. Se kokoontuu muutaman kerran lukukaudessa ajankohtaisten asioiden äärelle. Koordinaation ja UEFin datatukipalvelun vetovastuun tärkeys tuli selkeästi esille.

Kokemuksiamme ja ajatuksiamme palvelumuotoilusta datatuen kehittämisessä olemme käsitelleet artikkelissa Palvelumuotoilulla parempaa datatukea (Signum 2/2022).

Osaaminen, kouluttaminen ja asiantuntijuus

Datatuen palveluiden kehittämisen tiekartan kolmantena pääteemana on datanhallinnan koulutus. Vaikka opetus ja koulutus eivät sellaisenaan kuuluneet projektimme alkuperäisiin tavoitteisiin, on niiden merkitys datanhallinnan palveluissa ja niiden jatkuvuuden takaamisessa suuri. Koulutus on osa palvelua ja vastaa osaamistasojen saavuttamisen tavoitteisiin eri vaiheessa opinto- ja tutkimuspolkuja. Osaamistasoista on käyty paljon keskustelua muun muassa kansallisessa avoimen tieteen työryhmätyössä, mihin osallistuimme aktiivisesti. Olimme myös projektilaisina mukana oman kirjastomme aineistonhallinnan opetuksen kehittämisessä.

Aineistonhallinnan jäsentynyttä osaamista peräänkuulutetaan jo perusopintovaiheessa. Kansallisesti on asetettu tavoitteeksi, että vuoteen 2024 mennessä opinnäytetyön ohjaajat pystyvät arviomaan ja kommentoimaan opiskelijoiden aineistonhallintasuunnitelmia osana ohjaustyötään. Datanhallinta sisältyy – tai saattaa sisältyä – jo nyt luonnollisena osana opinnäytetyön ohjaukseen, mutta jatkossa tavoitteena on tarkastella datanhallintaa kokonaisuutena sekä kirkastaa myös opiskelijalle, mistä datanhallinnassa on kyse. Kirjastossa toteutettiin aiheesta kysely oppiaineiden opettajille ja opinnäytetyön ohjaajille loppukeväästä 2022. Siihen saatiin 130 vastausta kaikista tiedekunnista ja useimmilta laitoksilta tai osastoilta. Viesti oli selvä: Aineistonhallinnan opetukseen kaivataan tukea Itä-Suomen yliopistossa (ks. blogikirjoitus tuloksista).

Kouluttamisen teemaan liittyy erottamattomasti myös datatuen kehittämisen tiekartan neljäs kokonaisuus, datanhallinnan ammattilaisuus. Projektin kuvauksessa hankkeen yhdeksi tavoitteeksi oli asetettu tiedekuntien parempi linkittyminen datatukeen. Sitä kautta ryhdyimme pohtimaan datanhallintaan liittyvää osaamista ja osaamistarpeita ja melko pian totesimme, että datanhallinnan asiantuntijuus ja ammattilaisuus ovat erottamattomasti osa datatuen kokonaisvaltaista kehittämistä. Tiedekuntien näkökulmaa huomioiden laadimme sisäiseen käyttöön selvityksen, jonka tavoitteena oli tuottaa suosituksia siitä, millaista tieteenalakohtaista asiantuntijuutta tarvittaisiin täydentämään datatukea. Tässä meille hyödyllistä taustatietoa tarjosi Helsingin yliopiston koordinoima lukupiiri, jossa tutustuttiin erilaisiin eurooppalaisiin toteutuksiin datanhallinnan ammattilaisuuden ja ns. data stewardshipin määrittelyssä ja kehittämisessä. Lukupiiri toimi ponnistuslautana myöhemmin vuonna 2021 aloittaneeseen Avoimen tieteen ja tutkimuksen työryhmään, jossa edistetään datanhallinnan asiantuntijuuden tunnistamista, terävöitetään työrooleja sekä tarkennetaan erilaisia työnimikkeitä ja suunnitellaan alalle kouluttautumista.

Datatuen pysyvyys

Koordinaation merkitys tulee esiin kaikessa tutkimusdatanhallintaan liittyvässä tukityössä. Tutkimusaineistonhallinnan tuen kokonaisuudessa ja asiantuntijuuksia määriteltäessä erityistä huomioita on myös kiinnitettävä siihen, että tutkimusaineistot ovat eri aloilla erilaisia. Aineistojen uudelleenkäytön tarpeet ja tavat vaihtelevat tutkimusalasta toiseen ja niihin kohdistuu valtava toimenpiteiden ja hallinnan käytäntöjen kirjo. Osaamistasot ja -vaatimukset liikkuvat teknisestä datanhallinnasta tutkimusaineistojen hallinnan kokonaiskuvan ymmärtämiseen. Yksi asiantuntija ei pysty vastaamaan kaikkiin vaatimuksiin eivätkä yhden tieteenalan osaamisvaatimukset saa määritellä koko kenttää. Siksi on ehdottoman tärkeää, että jokainen tutkimusala ja -aineistotyyppi saa äänensä kuuluviin ja tarvitsemansa palvelut ja infrat. Sen mahdollistaa pysyvä, yliopiston yhteinen datatuki, joka yhdistää eri asiantuntijat verkostoksi palvelun taustalle. Yliopistossamme ollaankin hyvällä tiellä. Projektin päätyttyä kirjastolle on saatu kaksi uutta työtehtävää, joiden toimenkuva liittyy täysimääräisesti datanhallinnan tukeen ja koulutukseen. Tiedekunnissakin tapahtuu: Yhteiskuntatieteiden ja kauppatieteiden tiedekunnassa aloittaa keväällä tiedekunnan yhteinen datanhallinnan asiantuntija. Tästä on ilo jatkaa yhteisen palvelun ja osaamisen kehittämistä.

Kaksi hahmoa palapelin parissa. | Two figures working on a puzzle.
Kuva | Source: Alexa, Piaxabay (CC0)

 

In recent years, the University of Eastern Finland has focused on the development of research data management support services, initially alongside the other tasks of the library’s information experts and later with the support of a separate project. Two years ago, in the winter of 2021, the project “Development of data support as part of research support” started, coordinated by the library. The project ended on 31 December 2022. Its overarching goal was defined as the development of a functional service, know-how and expert network for the university’s research data support service.

In this blog, we shed light on how the project’s goals have been realized and what is being worked on as part of the daily functions of UEF Data Support.

Development of data support as part of research support: the project’s initial meters and specification of goals

In recent years, research data management has strongly emerged in the context of open science. In part, this has been influenced by the ever-increasing amount of research data and the diversity of new data formats and data sets. Opening of research data has become a general goal, at least at the level of speech. And at the same time, there has been a wake-up call to implement data management practices, so that the ethical and legal issues related to data can be resolved in a controlled manner and in anticipation of risks. This has meant that the support needs of researchers have increased considerably.

UEF has had support services related to research data management for several years. However, the services have been scattered to some extent, they are not well known and thus cannot be found, which was evident in the surveys carried out for UEF researchers in 2019 and 2020. The surveys also confirmed that there is a growing need for developing user driven support services. Researchers often need a quick answer to a specific and very context dependent problem, and in such cases general-level solutions are not necessarily adequate.

The purpose of the “Development of data support as part of research support” project, coordinated by the library, was not to build a new service from scratch but rather to develop the existing support services of the university. With an emphasis on making the services more user driven, service design was utilised in clarifying the internal processes and external service model of data support. Two project planners with a research background from different disciplines were hired for the project for 12 months, which helped to increase understanding about the varying needs of different research disciplines and datatypes from the very beginning of the project. The project was extended for one additional year, until the end of 2022, thanks to the hiring of one project planner and one substitute on study leave.

The project was led by the library’s information specialist, who had already worked for several years in research data management support tasks at UEF. A steering group was set up in support of the project progress, with a task of clarifying what should be paid attention to next and who was the most suitable contact person at the university in various topics. The beginning of the project, its steering group and the project planners are presented in the blog “Greetings from the data support project planners” published in March 2021.

In the spring of 2021, the steering group gave us a task to begin outlinining a road map for data management support services on a longer time span, which would help in delineating the most acute service goals of UEF. We divided the roadmap into four key themes: policies and strategy work, data support services, data management training and data management expert work. Participation in national and international open science working groups plays an important role in the policy and strategy work. Fundamental policy work is currently being conducted in the coordination of open science and research by the Federation of Finnish Learned Societies, and the experts working on data management at UEF have been actively involved in it before, during and after the data support development project. In terms of data management and increasing the transparency of research materials, it is important to have UEF’s data policy updated, and this is now being promoted at UEF level in the Open Science working group led by the library. The working group has started its activities in autumn 2022.

From a library data support to a university one-stop shop data support service

The second entity of the road map, data support services, was also the focus of the development project. Even before the project, a commenting service for data management plans at UEF offered a good starting point from which we could structure the development needs. The goal was to streamline the provisioning of centralised data support services from a one-stop shop. The commenting service also helped to establish a new support task, namely the commenting of research infrastructures’ data management policies (so-called DMPol’s).

In the first season of the project, we were able to lay the foundations of the renewing services, and in the second season we proceeded to piloting them. Data support services are typically wide-ranging, because resolving support requests often requires the involvement and expertise of several professionals from different units. In the data management support services at UEF, you can find expertise in, for example, open science and its requirements, data protection, information security, IT services, information management and contract law. The support service is coordinated by the library.

Besides the services offered and developed within the organisation, there are also so-called third-party data management services that organisations can use, because organisations cannot and should not do everything by themselves. The third-party services utilised by UEF researchers cover various purposes, such as CSC’s computing services, the DMPTuuli service for preparing a data management plan, and the Language Bank of Finland or the Finnish Social Science Data Archive for storing and archiving research data, to name a few. We wanted to get a better hold of this partly fragmented whole.

Research infrastructures are close to the themes of research data management. Research infrastructures often produce large amounts of data, and in addition to equipment, they can also consist of larger entities that contain, for example, discipline-specific databases. Thus, research infrastructures can also act as drivers of various technical solutions for data management. A number of infrastructure coordinators started working at the end of 2021 as part of UEF’s Research infrastructure program (2021-2024). This offered our development project an excellent opportunity to network with experts on research infrastructures. We also brought together, for example, the deans and vice-deans of the faculties and organized workshops for researchers. All the meetings showed a strong will to cooperate with broad shoulders, in order to avoid scattered information and duplication of effort.

Service design to aid the development work

The development project aimed to build a clearer and more structured data support service, where information related to data management would be centrally available as a one-stop shop service. To help in achieving this goal, the project was able to utilise a tailored service design training package. The trainer was Sanna Soppela from UEF’s Continuing Learning Center. The service design training and sparring sessions brought together members of the UEF data support network. Together, we managed to define the key target groups for the service, its purposes, and the practical organisation including the main service channels. Along the way, we worked on a service promise, i.e. the contents and resources of the common service that the units producing data management support can commit to. Fast and light feedback implementations are part of the extensive toolbox of service design. Between the meetings, we were able to test our planned solutions with the most important target groups of the service.

Getting support at the right time soon became a red thread for the one-stop shop service. We organised the various data management themes into a service that aligns accordingly with the research life cycle, so that ideally the researchers get the support they need for each research phase clearly and from one place. One concrete result of the service design process can be seen perfectly on the UEF Data Support website. The construction of the website was influenced by feedback received from the researchers, with an aim to provide an open and a fairly comprehensive source of information. Instead of providing numerous links to other sources, the emphasis was on providing key information directly findable on the website.

Another important development of data support service channels has been the introduction of a new service management (aka ticket) system; During the period preceding the project, service requests that came to data support were handled via e-mail. If the website concretizes the data support service from the point of view of the support user, then the ticket system does the same from the point of view of the support producers. The service design training and process helped to clarify the UEF network involved in supporting research materials and data. The network is now more clearly structured into data support core operators and to a wider research materials and data support network. The process also clarified the branding of and communication about the service, as the name of the renewed one-stop shop service became fixed as UEF Data Support.

UEF Data Support’s core operators are actively involved in e.g. solving data management support requests, and these experts meet regularly about once a month. The composition of the wider network is flexible and there is some turnover in membership. The network meets a few times per semester to discuss current issues in data management. The importance of coordination and the main responsibilities underlying the UEF Data Support service became clearer during the service design process. We have discussed our experiences and thoughts about utilising service design for developing data support services in an article called “Better data support with service design” (Signum 2/2022).

Competence, training and expertise

The third main theme of the data support service development roadmap is data management training. Although teaching and training as such were not parts of the original goals of our project, their importance in data management services and in guaranteeing service continuity is major. Education is part of the service and meets the goals of achieving appropriate data management competence levels at different stages of studies and research career paths. There has been a lot of discussion about data management competence levels and skills, for example in the national open science working group, in which we actively participate in. As project planners, we were also able to take part in developing the UEF Library’s research data management teaching.

Structured expertise in data management is already being called for during the Bachelor degree phase, and a national goal has been set that by the year 2024, all thesis supervisors should be able to evaluate and comment students’ data management plans as part of their supervision work. Data management is already included – or may be included – in varying degrees as a natural part of thesis supervision. However, the future goal is to consider data management as an entity in order to clarify for the student what data management is all about. The library conducted a survey on the topic for subject teachers and thesis supervisors during late spring of 2022. The survey garnered 130 responses from all faculties and most departments. The message was clear: Support is needed for the teaching of data management at the University of Eastern Finland (see the blog post about the results).

The theme of training is also inextricably linked to the fourth entity of the data support development roadmap, the professionalisation of data management expertise. In the project description, one of the goals was to link the faculties to the data support services more efficiently. From this viewpoint, we started to think about the skills and competences needed for data management expertise and pretty soon concluded, that the professionalisation of data management is an inseparable part of the overall development of data support. Taking into account the faculties’ perspective, we prepared a report for internal use, the aim of which was to produce recommendations on the types of discipline-specific expertise and skills needed to supplement the university data support service. In preparation of the report, were gained useful background information by attending a study circle coordinated by the University of Helsinki, where we got to know various European solutions in implementing the professionalisation of data management experts and on defining and developing data stewardship in general. The study circle served as a springboard for the Open Science and Research Working Group, which started later in 2021 and aims to promote the identification of expertise in data management, to sharpen job roles and specify various job titles, and to plan training of professionals in the field.

The continuity of data support services

The importance of coordination emerges in all support work related to research data management. From the perspective of general research data management support and when defining skills and expertise, special attention must also be paid to the fact that, despite the similarities among some disciplines, the research materials and data tend to differ depending on the field of study. Hence the needs and ways of reusing research materials vary from one research field to another and are subject to a huge range of procedures and management practices. Competence levels and requirements move from technical data management to understanding the overall picture. One expert cannot meet all requirements, and the competence requirements of one discipline must not define the entire field. That is why it is absolutely important that each field of research and type of data gets its voice heard and the services and infrastructure it needs.

This is made possible by the university’s permanent and shared data support, which connects different experts into a network behind the one-stop shop service. At our university, we are on the right path. Since the development project has come to an end, the UEF Library has received two new positions, where the job descriptions are specific to data management support and training. Things are also moving forward in the faculties: the Faculty of Social Sciences and Business Studies will have a joint data management expert in the spring. It is a pleasure to continue the development of joint services and to build expertise together.

 

Niina Nurmi, tietoasiantuntija | Information specialist
Manna Satama, tietoasiantuntija | Information specialist
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Tutkijoiden viesti: Lisää tukea, osaamista ja suunnitelmallisuutta tutkimusdatan hallintaan! | Message from the researchers: More support, skills and planning for research data management, please!

(Please, scroll down to read in English.)

Tutkimusaineistoihin liittyy mitä moninaisempaa tietämystä, osaamista ja toimenpidettä. Jossain kohdin törmää yleensä siihen, että omat taidot eivät riitä tai että asiat olisivat sujuneet paremmin, jos olisi tiennyt, mistä apu on löydettävissä. Tästä aihepiiristä UEFin tutkijat ja kirjaston datatuen väki jakoivat ajatuksiaan ja kokemuksiaan 27.10.2021 pidetyssä työpajassa, jonka otsikkona oli “Tutkijoiden dataosaaminen ja -tarpeet esiin”. Teemaa on sivuttu taannoisessa blogkirjoituksessa, jossa pohdimme tutkimusaineistojen asiantuntijoiden rikasta kenttää. Työpajan teema osui selvästi ajankohtaiseen aiheeseen, sillä samalle päivälle sattuneessa Yhteiskunta- ja kauppatieteiden tiedekunnan strategiapäivässäkin avoin tiede tutkimusaineistoineen keräsi mittavan osallistujajoukon ja herätti vilkasta keskustelua.

Tutkimuksen ja tutkimusaineiston elinkaaret

Tutkimusaineistoa tai -dataa voidaan jäsentää suhteessa tutkimukseen, jonka raaka-aineena se toimii. Tutkimuksen edetessä raakadatasta muokkautuu usein valikoidumpia datasettejä, jotka ovat voineet käydä läpi erilaisia prosesseja ja muokkauksia. Aineistonhallinnan keskustelussa puhutaan usein tutkimuksen ja tutkimusaineistojen elinkaarista. Tutkimuksen elinkaari hahmotetaan kolmeen vaiheeseen: ennen tutkimusta, tutkimuksen aikana ja sen jälkeen. Tutkimusaineistojen elinkaari ulottuu usein tutkimuksen elinkaarta pidemmälle, kun aineistoja hyödynnetään uudelleen.

Työpajassa tunnistettiin tutkimusaineistoihin liittyviä toimenpiteitä ja tietotaitoa erityisesti tutkimuksen aikana. Tällaisina mainittiin vaikkapa datan analysointi, dokumentointi, ohjelmointi, tietokantaosaaminen, sensitiivisen aineiston käsittely ja datan jakaminen tietoturvallisesti yhteistyökumppaninen välillä. Työ on kuitenkin alkanut jo tutkimusta ennen aineiston keruun ja yleisemmin aineistonhallinnan suunnitteluna. Tutkimuksen jälkeen täytyy aineistollekin tehdä jotain: jokin osa aineistosta säilytetään, jokin tuhotaan, ja aineistoa myös avataan tai julkaistaan. Ihannetapauksessa aineisto on uudelleenkäytettävissä jonkin muun tutkimuksen raaka-aineena, jolloin aineiston elinkaari konkretisoi mainiosti asiakirjahallinnan ja arkistotoimen keskustelussa esiintyvää jatkumomallia.

Tutkimusaineiston käsittely edellyttää tutkijoilta usein teknisten taitojen lisäksi yleisiä aineistonhallinnan taitoja vaikkapa terminologian ymmärtämiseen tai tiedon etsimiseen omaan tilanteeseen ja tarkoitukseen sopivista toimenpiteistä ja ratkaisuista. Kaiken pohjana ovat kuitenkin tutkijan perustaidot eli tutkittavan aiheen perustavanlaatuinen tunteminen ja ymmärrys, tutkimusetiikka ja sen käytäntöjen hallinta.

Lisää osaamista ja tukea, kiitos!

UEFin datatuen kehittämisen yksi kulmakivi on yhden luukun palvelun parantaminen, jolloin tutkija pääsisi datasupport@-osoitteen kautta monen eri alan asiantuntijan avulla tuotetun kattavan tuen ja tiedon äärelle. Työpajassa tutkijat saivat vapaat kädet ideoida ja toivoa, mitä palvelua datatuen yhdestä luukusta pitäisi saada ja millainen tuki heitä olisi auttanut eteen tulleissa ongelmatilanteissa ja osaamisen puutteissa. Osa toiveista kohdistui sellaisiin tukipalveluihin, joita on jo nyt tarjolla, mutta joiden olemassaolo ei ole vielä tavoittanut tutkijoita. Esimerkiksi aineistonhallintasuunnitelman (DMP) tukea on saatavilla kommentointipalveluna ja koulutuksina, ja myös kohdennettuna tiettyihin rahoituksiin.

Neuvoja, ohjausta ja koulutusta kaivataan myös datan säilyttämiseen tutkimuksen aikana ja sen jälkeen, datan anonymisointiin, tietokantoihin ja vaikkapa datan käyttämiseen kahden yliopiston yhteisessä hankkeessa eri yliopistojen tunnuksilla. Datanhallinnan ratkaisuihin ja toimintatapoihin toivottiin suunnitelmallisuutta sekä jaettua ymmärrystä ja osaamista vähintäänkin tutkimushankkeiden sisällä. Kokonaisuuden hallinta ei saisi jäädä vain yhden ihmisen varaan.

Yleisemmän aineistonhallinnan tuen rinnalle tunnistettiin tarve aineisto- tai alakohtaisille asiantuntijoille sekä tiedekunnan tasolla oleville tukihenkilöille. Aineistonhallinnan vastuiden konkretian tasot on kuitenkin muistettava: Tukitoimet keskittyvät ohjeistuksiin, koulutuksiin ja neuvoihin, mutta ne eivät pysty vastaamaan varsinaiseen aineistonhallintaan, sillä se on tutkijoiden omalla vastuulla.

Vertaistuesta datatukeen

Vertaistuki on tutkijankin työssä ja aineistonhallinnan asioissa kullan arvoista. Vaikka epäviralliset, usein sattumanvaraiset keskustelut kollegoiden kesken ovat tiedon jakamisen tärkeä kanava, tarvetta on organisoidummalle kollegiaaliselle tuelle. Koulutukset, webinaarit ja oppimisyhteisöt mainittiin hyvinä keinoina jakaa ja saada tietoa. Osastoilla ja laitoksilla voisi olla myös tieteenalakohtaisia datanhallinnan mentoreita, jolloin vertaistukea olisi saatavilla järjestäytyneemmin.

Mikä sitten motivoisi tutkijaa tarjoamaan omaa osaamistaan? Tähänkin kaivataan kannustimia aivan kuten moniin avoimen tieteen käytännön toimiin ylipäätään. Työpajassa mainittiin esimerkkinä koulutuksiin osallistuminen, joka pitäisi pystyä kirjaamaan työraportointeihin. Datanhallinnan taitojen tulisi ylipäätään näkyä selkeämmin tutkijan meritoitumisessa. Tämä antaisi kaivattua nostetta osaamisen kehittämiselle ja lisäisi panostusta tiedekuntien datanhallintaan.

Eräänlaisena yleisenä ohjenuorana ja työpajan kiteytyksenä on suunnitelmallisuus, joka tuli keskustelussa esiin monessa kohdin. Käytännön esimerkkinä mainittiin tutkimushankkeet, joissa datanhallinnan käytänteet pitäisi dokumentoida kunnolla ja joissa niistä pitäisi huolehtia siten, että käytänteet välittyvät myös hankkeisiin tuleville uusille tutkijoille. Tämä saattaa kuulostaa itsestään selvältä, mutta tutkimuksen arjessa ideaalit eivät välttämättä toteudu. Aineistonhallinnan suunnittelun olisi löydettävä paikkansa tutkimussuunnitelman kiistattomana osana. Tässä kohdin tiedekuntien vertaistuki ja yliopiston yleinen datatuki voivat täydentää toisiaan luontevasti ja kaikkien erityisasiantuntemusta tehokkaasti hyödyntäen.

 

Arrows depicting the research data cycle from data collection to analysis and to disseminating results
Työpaja oli osa kirjaston OA-viikon ohjelmaa ja liittyi kirjaston koordinoimaan datatuen kehittämishankkeeseen, jonka kuulumisia on esitelty kirjaston blogissa. Työpajaan osallistui tutkijoita kaikista neljästä tiedekunnista. | The workshop was part of the Library’s OA Week program as well as of the data support project coordinated by the Library (see our project update from an earlier blog article). All four faculties were represented in the workshop. Image by: Patrick Hochstenbach (CC-BY)

Working with research data involves a wide variety of know-how. At some point, you may notice that your skills aren’t enough, or that things would have worked out better if you had known where help was to be found. Researchers and the library’s data support staff shared their thoughts and experiences on this theme in a workshop held on 27 October 2021, with the title “Uncovering the data skills and needs of the researchers”. We handled the same theme in our recent blog, reflecting on the wide variety of expertise in research data.

The life cycles of research and research data

Research data may be perceived in relation to the research for which it serves as the raw material. As research progresses, raw data is often modified to select data sets, which may have gone through various processes. In the context of research data management, the life cycle of both the research and the research data are common concepts. Research life cycle is often divided into three phases: before, during and after the research. The life cycle of research data typically extends beyond the life cycle of research when the data may be reutilized.

In the workshop, we identified measures and know-how related to research data particularly during the research, such as analysing and documenting data, programming and database skills, handling sensitive data and safe data sharing with research partners. The work, however, starts even before the research when data collection and managing data are planned. After the research, the data calls for some actions as well: something will be stored, something destroyed, and some data may be opened or published. Ideally, the data can be reused as raw data for new research. In this case, the life cycle of the data concretizes, in a nice way, the continuum model used in records management.

In addition to technical know-how, data handling requires skills and knowledge of a more general kind, for example, understanding the terminology or finding solutions best suited for one’s needs. However, the basic skills of the researcher, namely fundamental knowledge and understanding of the subject matter, research ethics and its practices, are the basis of everything.

More skills and support – yes, please!

Improving the one-stop-shop for data management support services at UEF is one of the cornerstones of the development project: researchers will be able to access extensive support and information through the datasupport@ service channel produced by different professionals coming together from different fields of expertise. Researchers were able to pitch their ideas and make wishes for the kinds of services the one-stop-shop for data management support should offer and what type of support would have helped them during past problems and lack of skills. Portion of the hopes matched services that had already been implemented but that the researchers were not familiar with yet. As an example of existing services, support for writing a research data management plan (DMP) is already in place in the form of a DMP commenting service and various trainings, including targeted training for specific funding instruments.

Advice, guidance, and training are also needed for storing data during and after research, anonymization of data, research data bases, and using data in a collaborative project between two different universities. Researchers also called for well-planned solutions and procedures for data management, including shared understanding and skills at least within individual research projects as a minimum level.

Managing the big picture should not be left on the shoulders of one person. The importance of experts specific to datatypes and disciplines along with support personnel embedded in faculties was recognized in supplementing general research data management support services. One must bear in mind the concrete levels of data management responsibilities though: support measures focus on guidance, training and advice, while they cannot meet the actual management of research data which remains the responsibility of researchers.

From collegial support to datasupport

Collegial support is valuable not only in matters of data management but more generally in the everyday work of a researcher. Although unofficial, often random conversations with colleagues are important channels of information sharing, there is a recognized need for more organized collegial support. Trainings, webinars and learning communities were mentioned during the workshop as good means of sharing and receiving information. Faculties and departments could also have embedded discipline-specific data management mentors, to make peer support more systematically available.

What would, then, motivate researchers to offer their know-how to others? Incentives may be needed for willingness to mentor others, and this is also recognized more widely in relation to many practical measures in open science. The possibility to record attendance on data management training sessions to work reports was mentioned as one suggestion. Overall, research data management skills should be made more visible in meriting researchers. This would give a much-needed lift to developing skills and add investment by faculties on managing research data.

The importance of planning ahead was raised several times during the conversation and hence it can be summarized here as a kind of general guideline and a take-home message from our workshop. There were practical examples from research projects, where research data management practices should be documented well and thoroughly to make sure that they will be available to new researchers entering the project. Although this may sound self-evident, such ideals do not necessarily actualize during everyday research. Data management planning should find its rightful place as an undisputable part of a research proposal. Moreover, it is one of the many avenues, where collegial support of the departments can complement general data support services, making best use of everyone’s expertise most efficiently.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Tutkimusaineistojen asiantuntijoiden monet kasvot | The many faces of research data experts

(Please, scroll down to read in English.)

Tutkimusdataan liittyvien ammattien ja asiantuntijuuksien määrittely ei ole vielä vakiintunut. Joillain tutkimusaloilla data-ammattilaisia on työllistetty jo vuosikymmeniä, joillain ei edes tunnisteta sellaisten tarvetta. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti. On datamanageria, data stewardia, data-analyytikkoa, data championia ja tietoasiantuntijaa.

Tutkimuksen yhteydessä tutkimusaineistojen asiantuntijuuteen kuuluu keskeisesti niiden hallinnan laaja-alainen ymmärrys avoimen tieteen periaatteiden mukaisesti. Tällöin asiantuntijuuteen ei kuulu ainoastaan – tai välttämättä ollenkaan – teknisluonteinen datan käsittely, vaikka sellainen herkästi liitetäänkin kaikkiin data-alkuisiin nimikkeisiin. Lähtöoletuksena on, että tutkija on vastuussa itse omasta aineistostaan. Tutkija saattaa kuitenkin tarvita apua tutkimuksen ja tutkimusaineiston elinkaaren vaiheissa. Erityisen tärkeää on pitää mielessä, että tutkija on oman tutkimusaineistonsa erityisasiantuntija vähintäänkin sisällöllisesti. Tämä saattaa jäädä helposti syrjään data-asiantuntijuuksien keskustelusta.

Tässä blogikirjoituksessa pohdimme tutkimusaineistojen asiantuntijuuden monia kasvoja ja houkuttelemme tutkijoita tuomaan esiin omia aineistonhallinnan tarpeita, toiveita ja turhautumisia. Tähän on hyvä tilaisuus OA-viikolla 27.10.2021 järjestettävässä työpajassa tutkijoille Tutkijoiden dataosaaminen ja -tarpeet esiin.

Tutkijat ja organisaatiot määrittelemässä datanhallinnan palveluja ja osaamisen sisältöjä

Kunnianhimoinen tavoite tutkimusdatan, tai vähintään sitä kuvailevan metadatan, avaamiseen FAIR-periaatteiden mukaisesti konkretisoituu lisääntyneenä tarpeena kehittää tutkimusorganisaatioiden datanhallinnan tukipalveluita. Tähän liittyy erottamattomasti myös tarve monipuolistaa tutkijoiden datanhallintaa täydentäviä ja avustavia asiantuntijuuksia. Vaikka FAIR-kirjainyhdistelmä on ehkäpä jo monelle tuttu, sen merkityssisältö saattaa olla käytännön toteutusten osalta hämärän peitossa. FAIR-toimintakulttuuri viittaa tutkimusaineistojen osalta niin kutsuttuihin FAIR-dataobjekteihin, jotka ovat helposti löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimivia (Interoperable) ja uudelleenkäytettävissä (Reusable). Tutkimusaineistojen avoimuuden palveluiden kehitystyössä pyritään edistämään tutkimusyhteisöjen ja tutkijoiden mahdollisuuksia tuottaa FAIR-periaatteiden mukaista dataa ja metadataa, joita avaamalla tietoa voidaan hyödyntää ja vertailla niin kansallisella kuin kansainvälisellä tasolla muun muassa European Open Science Cloud (EOSC) -pilvipalveluiden välityksellä.

Kansallisella tasolla on työstetty tavoitteita ja toimenpiteitä tutkimusaineistojen avoimuuden palveluista organisaatioissa osana avoimen FAIR-toimintakulttuurin edistämistä. Esimerkiksi keväällä 2021 julkaistussa, tutkimusaineistojen avointa saatavuutta käsittelevässä linjauksessa todetaan, että ”tutkijoilla on käytettävissään vastuullisen aineistonhallinnan mahdollistavat infrastruktuurit ja palvelut, ja niitä kehitetään tutkijoiden tarpeet huomioiden taloudellisesti kestävällä tavalla” (Tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjaus, osalinjaus 1, s. 11).

Periaate asettaa monella tavoin kovat tavoitteet tutkimusorganisaatioille, jotka linjausten mukaan vastaavat tutkijoiden tarvitsemien infrastruktuurien ja palvelujen tuottamisesta. Mitä palveluja pitäisi olla tarjolla, millaista infraa ja asiantuntemusta tarvitaan ja mikä yksikkö tästä vastaa? Periaatteen toteuttaminen edellyttää myös tutkijoilta itseltään hyvää ymmärrystä tutkimusaineistojen avoimen saatavuuden ja hallinnan sisällöstä ja toteuttamisesta, jotta he pystyvät ylipäätään kertomaan omat tarpeensa.

Datanhallinnan ammattilaisia ja asiantuntijoita

Tutkimusaineistojen hallinnan kokonaisuus on sirpaleinen. Tutkimusaineistoihin ja -dataan kohdistuu lukuisia toimenpiteitä ennen tutkimusta, sen aikana ja tutkimuksen jälkeen, ja nämä toimenpiteet voivat erota merkittävästi tieteenalasta ja aineistotyypistä toiseen. Tutkimusorganisaatiot voivat olla hyvinkin erilaisia valtiosta, lainsäädännöllisestä asemasta ja tieteenalasta riippuen. Kaikki tämä heijastuu tutkimusdatan hallintaan liittyvissä ammateissa ja asiantuntijuuksissa, joiden määrittely on joidenkin asiantuntijuuksien kohdalla vakiintumassa mutta kautta linjan työtehtävissä ja nimikkeissä on vielä paljon kirjoa organisaatioiden räätälöidessä työtehtäviä omien tarpeidensa mukaan. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti ja tehtävät voivat perustua kokoaikaisuuteen tai osa-aikaisuuteen. Monissa organisaatioissa on jo vakiintuneempaa toimintaa, jossa datatuen peruspalveluita tuottavat yhteistyössä kirjaston tietoasiantuntijat sekä IT- ja lakipalveluiden asiantuntijat.

Yhtenä esimerkkinä tyypillisesti kokoaikaisina organisaatioihin palkattavista data-asiantuntijoista ovat datamanagerit. Datamanagerit työskentelevät yliopistoissa ja tutkimusorganisaatioissa eritoten kliinisten tutkimusten tukena sekä monitieteisissä tutkimusprojekteissa, joissa kerätään suuria datamääriä. Datamanagerin keskeisiin työtehtäviin sisältyy tyypillisesti datatietokantojen ylläpitoa ja tietokantoihin tulevan datan hallinnointia niin, että sen ominaisuudet täyttävät tutkimusryhmän tai organisaation datalle asettamat keskeiset vaatimukset. Datamanagereilla on usein keskeinen rooli jo datan keruun suunnittelussa ja kehitystyössä, jolloin he voivat osaltaan varmistaa kerätyn datan yhteensopivuuden ja laadun. Datamanageri on usein sidoksissa tiettyyn tai tiettyihin tutkimushankkeisiin.

Osa-aikaisina datan hallinnan asiantuntijoina ja tukihenkilöinä näyttäytyvät useissa yliopistoissa niin kutsutut data championit tai data agentit. Toiminnalla on pyritty vastaamaan tieteenalakohtaisen datanhallinnan tuen tarpeeseen rekrytoimalla joko vapaaehtoisina tai osa-aikaisella pestillä erityisesti tutkijoita ja muita datanhallinnan osaajia käyttämään tietyn osan työajastaan muiden tutkimusyhteisön jäsenten tukemiseen ja kouluttamiseen datanhallinnan eri osa-alueilla. Kun mukaan saadaan tutkijoita eri aloilta, pystytään hyödyntämään myös osaamista eri tutkimusmenetelmistä ja ymmärrystä eri tutkimuksen vaiheista ja prosesseista. Eräänä vahvana teemana data championien roolissa on lisätä tietoisuutta FAIR – periaatteista ja niistä konkreettisista teoista, joilla kukin voi omalta osaltaan soveltaa periaatteita tuottamansa tutkimusdatan hallinnassa. Data championeille tyypillisinä työkaluina toimivat muun muassa työpajat, luennot sekä datanhallinnan hyviä käytäntöjä kiteyttävien tietopakettien kehittäminen.

Tutkijoiden dataosaaminen ja -tarpeet esiin: työpaja tutkijoille

Edellä kuvatut esimerkit erilaisista datanhallinnan asiantuntijuuksista ja ammateista liittyvät myös Itä-Suomen yliopiston datatuen kehittämishankkeeseen. Sen yhtenä keskeisenä tavoitteena on kytkeä tiedekunnat ja niissä sijaitseva datanhallinnan osaaminen vahvemmin osaksi yliopiston datatuen muodostavaa moniammatillista asiantuntijoiden verkostoa. Hankkeessa tehdäänkin nyt pohjatyötä, jossa selvitetään datanhallinnan asiantuntijuuksia. Tämä auttaa linkittämään datanhallinnan osaamista eri tieteenaloilla osaksi laajempaa, koko yliopiston kattavaa verkostoa sekä kartoittamaan mahdollisuutta perustaa tutkijalähtöisiä data-asiantuntijuuksia – kuten data championeja – myös Itä-Suomen yliopiston tiedekuntiin ja laitoksille. Tutkijataustainen osaaminen täydentäisi siten UEFin tarjoamia tutkimusdatan tuen peruspalveluita.

Open Access -viikko 25.10–29.10.2021 toimii oivallisena foorumina avata keskustelua datanhallinnan arjesta kaikissa tiedekunnissa ja kaikilla tieteenaloilla. Kutsumme tutkijoita osallistumaan työpajaamme, jossa pohdimme tarkemmin eri tieteenalojen tutkimusaineistojen hallintaan liittyviä kokemuksia ja haasteita, ja miten näiden pohjalta kertyvää tietotaitoa voitaisiin hyödyntää laajemmin yli tiedekuntarajojen. Työpaja järjestetään keskiviikkona 27.10. Klo 13–15 etätapahtumana. Ilmoittautumisohjeet kirjaston kotisivulla. Samalla viikolla kirjasto järjestää myös kaksi Open Science Café -keskustelutilaisuutta, joten kannattaa olla kuulolla.

Harmaasävyvalokuva, jossa on keppien päälle asetettuja naamioita. | Grayscale photo of masks on a stick.
Photo by Francesco Ungaro from Pexels.

The definition of professions and expertise related to research data is not yet well-established. In some research fields, data professionals have been employed for decades, in some the need for such is not even recognized. There are plenty of professional titles and job competencies, such as data manager, data steward, data analyst, data champion and data expert.

In the context of research, expertise includes a broad understanding of the management of research data in accordance with the principles of open science. In this case, expertise does not include only – or necessarily at all – the technical processing of data although it is easily associated with all headings beginning with data. In principle, researchers are responsible for their own data. However, they may need assistance in the different stages of the research and research data life cycles. It is especially important to keep in mind that the researcher is a specialist in his or her own research data, at least in terms of content. This can easily be ignored when discussing data expertise.

In this blog post, we discuss the many faces of experts on research data and call researches to share their needs, hopes and frustrations. For this, there is a good opportunity in a workshop on 27 October Uncovering the data skills and needs of researchers. The workshop is part of the UEF Library´s events during the International Open Access Week.

Researches and organizations defining the services and the contents of expertise

The ambitious goal for opening research data (or at least the metadata) in line with the FAIR-principles materialises in a growing need for developing data support services in research organizations. This goes hand in hand with the need to diversify the data management expertise that complement and help the data management of the researchers.

The bar is set high for the research organization; according to national and international guidelines, they are responsible for providing the information and services that researchers need. What services should be available, what kind of infrastructure and expertise is needed, and which unit is the responsible one? Moreover, researchers need to have a good understanding of the content and implementation of the management and open access of research data, so that they can communicate their needs.

Experts and professionals of data management

The entity of research data management is rather fragmented. There are numerous procedures applied to data before, during, and after research, and these procedures can vary significantly depending on the field of research and the type of data used. Moreover, research organizations can be quite different depending on their country of location, legal status, and research foci. Such aspects are also reflected in the variety of research data management professions and experts. Some data management professions have started to become more established, while overall there is still quite an array of different job titles with somewhat overlapping work descriptions, as organisations tend to tailor expertise positions according to their specific needs. The professional titles and required qualifications are numerous, and the positions can be on a full- or part-time basis. Many organizations have already relatively established basic data management support services that are typically run as a collaborative effort between the library informaticians, IT-professionals and the law department.

One example of data management professionals hired typically on full-time basis to organizations are data managers. Data managers work at universities and research institutes, especially in support of clinical research as well as in multidisciplinary research projects amassing large quantities of data. Database maintenance is one of the typical tasks of data managers, as well as making sure that the attributed of data flowing into databases complies with those prerequisites assigned by research group, consortium, or organization. Data managers typically have a central role already in the planning phase of data collection, enabling them to make sure on their part that the data to be collected is compatible and of adequate quality. Data managers tend to be embedded in a specific research project or projects.

In several organizations, part-time data management experts and support personnel can appear in the form of data champions or data agents. Data champion programmes are an attempt to match the need for discipline specific research data management support by recruiting researchers (and other personnel with expertise on data management) on voluntary or part-time basis to spend some of their working time in support of and to train others in different areas of research data management. The participation of researchers as data champions of different disciplines has the added benefit of bringing in expertise in different research methods and understanding of the various processes and phases of research. The role of a data champion is often closely tied to the overall theme of increasing awareness on the FAIR-principle, including sharing information on the concrete actions that each member of the scientific community can apply in managing the research data they produce. Among the typical tools of data champions are work shops, lectures, and developing information packages about the best practices of data management.

Uncovering the data skills and needs of researchers: a workshop for researchers

The above-mentioned examples of data management experts and professions relate to a UEF project, which aims at developing the data support services. Among the tasks is a stronger link between the current central data support services and the faculties with their discipline specific know-how managing data.  Part of this work is to explore the possibility of developing a network of data champions in some form across the faculties and departments.

The Open Access Week that takes place on 25–29 October offers a good platform to open the discussion about research data management issues on a grass root level in every faculty and in every research field. We invite researchers to take part in the workshop to talk about and share the experiences and challenges of research data management as well as to search ways to disseminate the knowledge and know-how across the different disciplines and faculties.

The workshop takes place on October 27, at 1 to 3 pm, as an online event. Instructions for registration: UEF Library’s website. In the same week, the library also hosts two Open Science Cafés. Stay tuned.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share