Tutkimusaineistojen asiantuntijoiden monet kasvot | The many faces of research data experts

(Please, scroll down to read in English.)

Tutkimusdataan liittyvien ammattien ja asiantuntijuuksien määrittely ei ole vielä vakiintunut. Joillain tutkimusaloilla data-ammattilaisia on työllistetty jo vuosikymmeniä, joillain ei edes tunnisteta sellaisten tarvetta. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti. On datamanageria, data stewardia, data-analyytikkoa, data championia ja tietoasiantuntijaa.

Tutkimuksen yhteydessä tutkimusaineistojen asiantuntijuuteen kuuluu keskeisesti niiden hallinnan laaja-alainen ymmärrys avoimen tieteen periaatteiden mukaisesti. Tällöin asiantuntijuuteen ei kuulu ainoastaan – tai välttämättä ollenkaan – teknisluonteinen datan käsittely, vaikka sellainen herkästi liitetäänkin kaikkiin data-alkuisiin nimikkeisiin. Lähtöoletuksena on, että tutkija on vastuussa itse omasta aineistostaan. Tutkija saattaa kuitenkin tarvita apua tutkimuksen ja tutkimusaineiston elinkaaren vaiheissa. Erityisen tärkeää on pitää mielessä, että tutkija on oman tutkimusaineistonsa erityisasiantuntija vähintäänkin sisällöllisesti. Tämä saattaa jäädä helposti syrjään data-asiantuntijuuksien keskustelusta.

Tässä blogikirjoituksessa pohdimme tutkimusaineistojen asiantuntijuuden monia kasvoja ja houkuttelemme tutkijoita tuomaan esiin omia aineistonhallinnan tarpeita, toiveita ja turhautumisia. Tähän on hyvä tilaisuus OA-viikolla 27.10.2021 järjestettävässä työpajassa tutkijoille Tutkijoiden dataosaaminen ja -tarpeet esiin.

Tutkijat ja organisaatiot määrittelemässä datanhallinnan palveluja ja osaamisen sisältöjä

Kunnianhimoinen tavoite tutkimusdatan, tai vähintään sitä kuvailevan metadatan, avaamiseen FAIR-periaatteiden mukaisesti konkretisoituu lisääntyneenä tarpeena kehittää tutkimusorganisaatioiden datanhallinnan tukipalveluita. Tähän liittyy erottamattomasti myös tarve monipuolistaa tutkijoiden datanhallintaa täydentäviä ja avustavia asiantuntijuuksia. Vaikka FAIR-kirjainyhdistelmä on ehkäpä jo monelle tuttu, sen merkityssisältö saattaa olla käytännön toteutusten osalta hämärän peitossa. FAIR-toimintakulttuuri viittaa tutkimusaineistojen osalta niin kutsuttuihin FAIR-dataobjekteihin, jotka ovat helposti löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimivia (Interoperable) ja uudelleenkäytettävissä (Reusable). Tutkimusaineistojen avoimuuden palveluiden kehitystyössä pyritään edistämään tutkimusyhteisöjen ja tutkijoiden mahdollisuuksia tuottaa FAIR-periaatteiden mukaista dataa ja metadataa, joita avaamalla tietoa voidaan hyödyntää ja vertailla niin kansallisella kuin kansainvälisellä tasolla muun muassa European Open Science Cloud (EOSC) -pilvipalveluiden välityksellä.

Kansallisella tasolla on työstetty tavoitteita ja toimenpiteitä tutkimusaineistojen avoimuuden palveluista organisaatioissa osana avoimen FAIR-toimintakulttuurin edistämistä. Esimerkiksi keväällä 2021 julkaistussa, tutkimusaineistojen avointa saatavuutta käsittelevässä linjauksessa todetaan, että ”tutkijoilla on käytettävissään vastuullisen aineistonhallinnan mahdollistavat infrastruktuurit ja palvelut, ja niitä kehitetään tutkijoiden tarpeet huomioiden taloudellisesti kestävällä tavalla” (Tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjaus, osalinjaus 1, s. 11).

Periaate asettaa monella tavoin kovat tavoitteet tutkimusorganisaatioille, jotka linjausten mukaan vastaavat tutkijoiden tarvitsemien infrastruktuurien ja palvelujen tuottamisesta. Mitä palveluja pitäisi olla tarjolla, millaista infraa ja asiantuntemusta tarvitaan ja mikä yksikkö tästä vastaa? Periaatteen toteuttaminen edellyttää myös tutkijoilta itseltään hyvää ymmärrystä tutkimusaineistojen avoimen saatavuuden ja hallinnan sisällöstä ja toteuttamisesta, jotta he pystyvät ylipäätään kertomaan omat tarpeensa.

Datanhallinnan ammattilaisia ja asiantuntijoita

Tutkimusaineistojen hallinnan kokonaisuus on sirpaleinen. Tutkimusaineistoihin ja -dataan kohdistuu lukuisia toimenpiteitä ennen tutkimusta, sen aikana ja tutkimuksen jälkeen, ja nämä toimenpiteet voivat erota merkittävästi tieteenalasta ja aineistotyypistä toiseen. Tutkimusorganisaatiot voivat olla hyvinkin erilaisia valtiosta, lainsäädännöllisestä asemasta ja tieteenalasta riippuen. Kaikki tämä heijastuu tutkimusdatan hallintaan liittyvissä ammateissa ja asiantuntijuuksissa, joiden määrittely on joidenkin asiantuntijuuksien kohdalla vakiintumassa mutta kautta linjan työtehtävissä ja nimikkeissä on vielä paljon kirjoa organisaatioiden räätälöidessä työtehtäviä omien tarpeidensa mukaan. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti ja tehtävät voivat perustua kokoaikaisuuteen tai osa-aikaisuuteen. Monissa organisaatioissa on jo vakiintuneempaa toimintaa, jossa datatuen peruspalveluita tuottavat yhteistyössä kirjaston tietoasiantuntijat sekä IT- ja lakipalveluiden asiantuntijat.

Yhtenä esimerkkinä tyypillisesti kokoaikaisina organisaatioihin palkattavista data-asiantuntijoista ovat datamanagerit. Datamanagerit työskentelevät yliopistoissa ja tutkimusorganisaatioissa eritoten kliinisten tutkimusten tukena sekä monitieteisissä tutkimusprojekteissa, joissa kerätään suuria datamääriä. Datamanagerin keskeisiin työtehtäviin sisältyy tyypillisesti datatietokantojen ylläpitoa ja tietokantoihin tulevan datan hallinnointia niin, että sen ominaisuudet täyttävät tutkimusryhmän tai organisaation datalle asettamat keskeiset vaatimukset. Datamanagereilla on usein keskeinen rooli jo datan keruun suunnittelussa ja kehitystyössä, jolloin he voivat osaltaan varmistaa kerätyn datan yhteensopivuuden ja laadun. Datamanageri on usein sidoksissa tiettyyn tai tiettyihin tutkimushankkeisiin.

Osa-aikaisina datan hallinnan asiantuntijoina ja tukihenkilöinä näyttäytyvät useissa yliopistoissa niin kutsutut data championit tai data agentit. Toiminnalla on pyritty vastaamaan tieteenalakohtaisen datanhallinnan tuen tarpeeseen rekrytoimalla joko vapaaehtoisina tai osa-aikaisella pestillä erityisesti tutkijoita ja muita datanhallinnan osaajia käyttämään tietyn osan työajastaan muiden tutkimusyhteisön jäsenten tukemiseen ja kouluttamiseen datanhallinnan eri osa-alueilla. Kun mukaan saadaan tutkijoita eri aloilta, pystytään hyödyntämään myös osaamista eri tutkimusmenetelmistä ja ymmärrystä eri tutkimuksen vaiheista ja prosesseista. Eräänä vahvana teemana data championien roolissa on lisätä tietoisuutta FAIR – periaatteista ja niistä konkreettisista teoista, joilla kukin voi omalta osaltaan soveltaa periaatteita tuottamansa tutkimusdatan hallinnassa. Data championeille tyypillisinä työkaluina toimivat muun muassa työpajat, luennot sekä datanhallinnan hyviä käytäntöjä kiteyttävien tietopakettien kehittäminen.

Tutkijoiden dataosaaminen ja -tarpeet esiin: työpaja tutkijoille

Edellä kuvatut esimerkit erilaisista datanhallinnan asiantuntijuuksista ja ammateista liittyvät myös Itä-Suomen yliopiston datatuen kehittämishankkeeseen. Sen yhtenä keskeisenä tavoitteena on kytkeä tiedekunnat ja niissä sijaitseva datanhallinnan osaaminen vahvemmin osaksi yliopiston datatuen muodostavaa moniammatillista asiantuntijoiden verkostoa. Hankkeessa tehdäänkin nyt pohjatyötä, jossa selvitetään datanhallinnan asiantuntijuuksia. Tämä auttaa linkittämään datanhallinnan osaamista eri tieteenaloilla osaksi laajempaa, koko yliopiston kattavaa verkostoa sekä kartoittamaan mahdollisuutta perustaa tutkijalähtöisiä data-asiantuntijuuksia – kuten data championeja – myös Itä-Suomen yliopiston tiedekuntiin ja laitoksille. Tutkijataustainen osaaminen täydentäisi siten UEFin tarjoamia tutkimusdatan tuen peruspalveluita.

Open Access -viikko 25.10–29.10.2021 toimii oivallisena foorumina avata keskustelua datanhallinnan arjesta kaikissa tiedekunnissa ja kaikilla tieteenaloilla. Kutsumme tutkijoita osallistumaan työpajaamme, jossa pohdimme tarkemmin eri tieteenalojen tutkimusaineistojen hallintaan liittyviä kokemuksia ja haasteita, ja miten näiden pohjalta kertyvää tietotaitoa voitaisiin hyödyntää laajemmin yli tiedekuntarajojen. Työpaja järjestetään keskiviikkona 27.10. Klo 13–15 etätapahtumana. Ilmoittautumisohjeet kirjaston kotisivulla. Samalla viikolla kirjasto järjestää myös kaksi Open Science Café -keskustelutilaisuutta, joten kannattaa olla kuulolla.

Harmaasävyvalokuva, jossa on keppien päälle asetettuja naamioita. | Grayscale photo of masks on a stick.

Photo by Francesco Ungaro from Pexels.

The definition of professions and expertise related to research data is not yet well-established. In some research fields, data professionals have been employed for decades, in some the need for such is not even recognized. There are plenty of professional titles and job competencies, such as data manager, data steward, data analyst, data champion and data expert.

In the context of research, expertise includes a broad understanding of the management of research data in accordance with the principles of open science. In this case, expertise does not include only – or necessarily at all – the technical processing of data although it is easily associated with all headings beginning with data. In principle, researchers are responsible for their own data. However, they may need assistance in the different stages of the research and research data life cycles. It is especially important to keep in mind that the researcher is a specialist in his or her own research data, at least in terms of content. This can easily be ignored when discussing data expertise.

In this blog post, we discuss the many faces of experts on research data and call researches to share their needs, hopes and frustrations. For this, there is a good opportunity in a workshop on 27 October Uncovering the data skills and needs of researchers. The workshop is part of the UEF Library´s events during the International Open Access Week.

Researches and organizations defining the services and the contents of expertise

The ambitious goal for opening research data (or at least the metadata) in line with the FAIR-principles materialises in a growing need for developing data support services in research organizations. This goes hand in hand with the need to diversify the data management expertise that complement and help the data management of the researchers.

The bar is set high for the research organization; according to national and international guidelines, they are responsible for providing the information and services that researchers need. What services should be available, what kind of infrastructure and expertise is needed, and which unit is the responsible one? Moreover, researchers need to have a good understanding of the content and implementation of the management and open access of research data, so that they can communicate their needs.

Experts and professionals of data management

The entity of research data management is rather fragmented. There are numerous procedures applied to data before, during, and after research, and these procedures can vary significantly depending on the field of research and the type of data used. Moreover, research organizations can be quite different depending on their country of location, legal status, and research foci. Such aspects are also reflected in the variety of research data management professions and experts. Some data management professions have started to become more established, while overall there is still quite an array of different job titles with somewhat overlapping work descriptions, as organisations tend to tailor expertise positions according to their specific needs. The professional titles and required qualifications are numerous, and the positions can be on a full- or part-time basis. Many organizations have already relatively established basic data management support services that are typically run as a collaborative effort between the library informaticians, IT-professionals and the law department.

One example of data management professionals hired typically on full-time basis to organizations are data managers. Data managers work at universities and research institutes, especially in support of clinical research as well as in multidisciplinary research projects amassing large quantities of data. Database maintenance is one of the typical tasks of data managers, as well as making sure that the attributed of data flowing into databases complies with those prerequisites assigned by research group, consortium, or organization. Data managers typically have a central role already in the planning phase of data collection, enabling them to make sure on their part that the data to be collected is compatible and of adequate quality. Data managers tend to be embedded in a specific research project or projects.

In several organizations, part-time data management experts and support personnel can appear in the form of data champions or data agents. Data champion programmes are an attempt to match the need for discipline specific research data management support by recruiting researchers (and other personnel with expertise on data management) on voluntary or part-time basis to spend some of their working time in support of and to train others in different areas of research data management. The participation of researchers as data champions of different disciplines has the added benefit of bringing in expertise in different research methods and understanding of the various processes and phases of research. The role of a data champion is often closely tied to the overall theme of increasing awareness on the FAIR-principle, including sharing information on the concrete actions that each member of the scientific community can apply in managing the research data they produce. Among the typical tools of data champions are work shops, lectures, and developing information packages about the best practices of data management.

Uncovering the data skills and needs of researchers: a workshop for researchers

The above-mentioned examples of data management experts and professions relate to a UEF project, which aims at developing the data support services. Among the tasks is a stronger link between the current central data support services and the faculties with their discipline specific know-how managing data.  Part of this work is to explore the possibility of developing a network of data champions in some form across the faculties and departments.

The Open Access Week that takes place on 25–29 October offers a good platform to open the discussion about research data management issues on a grass root level in every faculty and in every research field. We invite researchers to take part in the workshop to talk about and share the experiences and challenges of research data management as well as to search ways to disseminate the knowledge and know-how across the different disciplines and faculties.

The workshop takes place on October 27, at 1 to 3 pm, as an online event. Instructions for registration: UEF Library’s website. In the same week, the library also hosts two Open Science Cafés. Stay tuned.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services