Tutkimusaineistojen asiantuntijoiden monet kasvot | The many faces of research data experts

(Please, scroll down to read in English.)

Tutkimusdataan liittyvien ammattien ja asiantuntijuuksien määrittely ei ole vielä vakiintunut. Joillain tutkimusaloilla data-ammattilaisia on työllistetty jo vuosikymmeniä, joillain ei edes tunnisteta sellaisten tarvetta. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti. On datamanageria, data stewardia, data-analyytikkoa, data championia ja tietoasiantuntijaa.

Tutkimuksen yhteydessä tutkimusaineistojen asiantuntijuuteen kuuluu keskeisesti niiden hallinnan laaja-alainen ymmärrys avoimen tieteen periaatteiden mukaisesti. Tällöin asiantuntijuuteen ei kuulu ainoastaan – tai välttämättä ollenkaan – teknisluonteinen datan käsittely, vaikka sellainen herkästi liitetäänkin kaikkiin data-alkuisiin nimikkeisiin. Lähtöoletuksena on, että tutkija on vastuussa itse omasta aineistostaan. Tutkija saattaa kuitenkin tarvita apua tutkimuksen ja tutkimusaineiston elinkaaren vaiheissa. Erityisen tärkeää on pitää mielessä, että tutkija on oman tutkimusaineistonsa erityisasiantuntija vähintäänkin sisällöllisesti. Tämä saattaa jäädä helposti syrjään data-asiantuntijuuksien keskustelusta.

Tässä blogikirjoituksessa pohdimme tutkimusaineistojen asiantuntijuuden monia kasvoja ja houkuttelemme tutkijoita tuomaan esiin omia aineistonhallinnan tarpeita, toiveita ja turhautumisia. Tähän on hyvä tilaisuus OA-viikolla 27.10.2021 järjestettävässä työpajassa tutkijoille Tutkijoiden dataosaaminen ja -tarpeet esiin.

Tutkijat ja organisaatiot määrittelemässä datanhallinnan palveluja ja osaamisen sisältöjä

Kunnianhimoinen tavoite tutkimusdatan, tai vähintään sitä kuvailevan metadatan, avaamiseen FAIR-periaatteiden mukaisesti konkretisoituu lisääntyneenä tarpeena kehittää tutkimusorganisaatioiden datanhallinnan tukipalveluita. Tähän liittyy erottamattomasti myös tarve monipuolistaa tutkijoiden datanhallintaa täydentäviä ja avustavia asiantuntijuuksia. Vaikka FAIR-kirjainyhdistelmä on ehkäpä jo monelle tuttu, sen merkityssisältö saattaa olla käytännön toteutusten osalta hämärän peitossa. FAIR-toimintakulttuuri viittaa tutkimusaineistojen osalta niin kutsuttuihin FAIR-dataobjekteihin, jotka ovat helposti löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimivia (Interoperable) ja uudelleenkäytettävissä (Reusable). Tutkimusaineistojen avoimuuden palveluiden kehitystyössä pyritään edistämään tutkimusyhteisöjen ja tutkijoiden mahdollisuuksia tuottaa FAIR-periaatteiden mukaista dataa ja metadataa, joita avaamalla tietoa voidaan hyödyntää ja vertailla niin kansallisella kuin kansainvälisellä tasolla muun muassa European Open Science Cloud (EOSC) -pilvipalveluiden välityksellä.

Kansallisella tasolla on työstetty tavoitteita ja toimenpiteitä tutkimusaineistojen avoimuuden palveluista organisaatioissa osana avoimen FAIR-toimintakulttuurin edistämistä. Esimerkiksi keväällä 2021 julkaistussa, tutkimusaineistojen avointa saatavuutta käsittelevässä linjauksessa todetaan, että ”tutkijoilla on käytettävissään vastuullisen aineistonhallinnan mahdollistavat infrastruktuurit ja palvelut, ja niitä kehitetään tutkijoiden tarpeet huomioiden taloudellisesti kestävällä tavalla” (Tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjaus, osalinjaus 1, s. 11).

Periaate asettaa monella tavoin kovat tavoitteet tutkimusorganisaatioille, jotka linjausten mukaan vastaavat tutkijoiden tarvitsemien infrastruktuurien ja palvelujen tuottamisesta. Mitä palveluja pitäisi olla tarjolla, millaista infraa ja asiantuntemusta tarvitaan ja mikä yksikkö tästä vastaa? Periaatteen toteuttaminen edellyttää myös tutkijoilta itseltään hyvää ymmärrystä tutkimusaineistojen avoimen saatavuuden ja hallinnan sisällöstä ja toteuttamisesta, jotta he pystyvät ylipäätään kertomaan omat tarpeensa.

Datanhallinnan ammattilaisia ja asiantuntijoita

Tutkimusaineistojen hallinnan kokonaisuus on sirpaleinen. Tutkimusaineistoihin ja -dataan kohdistuu lukuisia toimenpiteitä ennen tutkimusta, sen aikana ja tutkimuksen jälkeen, ja nämä toimenpiteet voivat erota merkittävästi tieteenalasta ja aineistotyypistä toiseen. Tutkimusorganisaatiot voivat olla hyvinkin erilaisia valtiosta, lainsäädännöllisestä asemasta ja tieteenalasta riippuen. Kaikki tämä heijastuu tutkimusdatan hallintaan liittyvissä ammateissa ja asiantuntijuuksissa, joiden määrittely on joidenkin asiantuntijuuksien kohdalla vakiintumassa mutta kautta linjan työtehtävissä ja nimikkeissä on vielä paljon kirjoa organisaatioiden räätälöidessä työtehtäviä omien tarpeidensa mukaan. Ammattinimikkeitä ja työtehtävien osaamissisältöjä on runsaasti ja tehtävät voivat perustua kokoaikaisuuteen tai osa-aikaisuuteen. Monissa organisaatioissa on jo vakiintuneempaa toimintaa, jossa datatuen peruspalveluita tuottavat yhteistyössä kirjaston tietoasiantuntijat sekä IT- ja lakipalveluiden asiantuntijat.

Yhtenä esimerkkinä tyypillisesti kokoaikaisina organisaatioihin palkattavista data-asiantuntijoista ovat datamanagerit. Datamanagerit työskentelevät yliopistoissa ja tutkimusorganisaatioissa eritoten kliinisten tutkimusten tukena sekä monitieteisissä tutkimusprojekteissa, joissa kerätään suuria datamääriä. Datamanagerin keskeisiin työtehtäviin sisältyy tyypillisesti datatietokantojen ylläpitoa ja tietokantoihin tulevan datan hallinnointia niin, että sen ominaisuudet täyttävät tutkimusryhmän tai organisaation datalle asettamat keskeiset vaatimukset. Datamanagereilla on usein keskeinen rooli jo datan keruun suunnittelussa ja kehitystyössä, jolloin he voivat osaltaan varmistaa kerätyn datan yhteensopivuuden ja laadun. Datamanageri on usein sidoksissa tiettyyn tai tiettyihin tutkimushankkeisiin.

Osa-aikaisina datan hallinnan asiantuntijoina ja tukihenkilöinä näyttäytyvät useissa yliopistoissa niin kutsutut data championit tai data agentit. Toiminnalla on pyritty vastaamaan tieteenalakohtaisen datanhallinnan tuen tarpeeseen rekrytoimalla joko vapaaehtoisina tai osa-aikaisella pestillä erityisesti tutkijoita ja muita datanhallinnan osaajia käyttämään tietyn osan työajastaan muiden tutkimusyhteisön jäsenten tukemiseen ja kouluttamiseen datanhallinnan eri osa-alueilla. Kun mukaan saadaan tutkijoita eri aloilta, pystytään hyödyntämään myös osaamista eri tutkimusmenetelmistä ja ymmärrystä eri tutkimuksen vaiheista ja prosesseista. Eräänä vahvana teemana data championien roolissa on lisätä tietoisuutta FAIR – periaatteista ja niistä konkreettisista teoista, joilla kukin voi omalta osaltaan soveltaa periaatteita tuottamansa tutkimusdatan hallinnassa. Data championeille tyypillisinä työkaluina toimivat muun muassa työpajat, luennot sekä datanhallinnan hyviä käytäntöjä kiteyttävien tietopakettien kehittäminen.

Tutkijoiden dataosaaminen ja -tarpeet esiin: työpaja tutkijoille

Edellä kuvatut esimerkit erilaisista datanhallinnan asiantuntijuuksista ja ammateista liittyvät myös Itä-Suomen yliopiston datatuen kehittämishankkeeseen. Sen yhtenä keskeisenä tavoitteena on kytkeä tiedekunnat ja niissä sijaitseva datanhallinnan osaaminen vahvemmin osaksi yliopiston datatuen muodostavaa moniammatillista asiantuntijoiden verkostoa. Hankkeessa tehdäänkin nyt pohjatyötä, jossa selvitetään datanhallinnan asiantuntijuuksia. Tämä auttaa linkittämään datanhallinnan osaamista eri tieteenaloilla osaksi laajempaa, koko yliopiston kattavaa verkostoa sekä kartoittamaan mahdollisuutta perustaa tutkijalähtöisiä data-asiantuntijuuksia – kuten data championeja – myös Itä-Suomen yliopiston tiedekuntiin ja laitoksille. Tutkijataustainen osaaminen täydentäisi siten UEFin tarjoamia tutkimusdatan tuen peruspalveluita.

Open Access -viikko 25.10–29.10.2021 toimii oivallisena foorumina avata keskustelua datanhallinnan arjesta kaikissa tiedekunnissa ja kaikilla tieteenaloilla. Kutsumme tutkijoita osallistumaan työpajaamme, jossa pohdimme tarkemmin eri tieteenalojen tutkimusaineistojen hallintaan liittyviä kokemuksia ja haasteita, ja miten näiden pohjalta kertyvää tietotaitoa voitaisiin hyödyntää laajemmin yli tiedekuntarajojen. Työpaja järjestetään keskiviikkona 27.10. Klo 13–15 etätapahtumana. Ilmoittautumisohjeet kirjaston kotisivulla. Samalla viikolla kirjasto järjestää myös kaksi Open Science Café -keskustelutilaisuutta, joten kannattaa olla kuulolla.

Harmaasävyvalokuva, jossa on keppien päälle asetettuja naamioita. | Grayscale photo of masks on a stick.
Photo by Francesco Ungaro from Pexels.

The definition of professions and expertise related to research data is not yet well-established. In some research fields, data professionals have been employed for decades, in some the need for such is not even recognized. There are plenty of professional titles and job competencies, such as data manager, data steward, data analyst, data champion and data expert.

In the context of research, expertise includes a broad understanding of the management of research data in accordance with the principles of open science. In this case, expertise does not include only – or necessarily at all – the technical processing of data although it is easily associated with all headings beginning with data. In principle, researchers are responsible for their own data. However, they may need assistance in the different stages of the research and research data life cycles. It is especially important to keep in mind that the researcher is a specialist in his or her own research data, at least in terms of content. This can easily be ignored when discussing data expertise.

In this blog post, we discuss the many faces of experts on research data and call researches to share their needs, hopes and frustrations. For this, there is a good opportunity in a workshop on 27 October Uncovering the data skills and needs of researchers. The workshop is part of the UEF Library´s events during the International Open Access Week.

Researches and organizations defining the services and the contents of expertise

The ambitious goal for opening research data (or at least the metadata) in line with the FAIR-principles materialises in a growing need for developing data support services in research organizations. This goes hand in hand with the need to diversify the data management expertise that complement and help the data management of the researchers.

The bar is set high for the research organization; according to national and international guidelines, they are responsible for providing the information and services that researchers need. What services should be available, what kind of infrastructure and expertise is needed, and which unit is the responsible one? Moreover, researchers need to have a good understanding of the content and implementation of the management and open access of research data, so that they can communicate their needs.

Experts and professionals of data management

The entity of research data management is rather fragmented. There are numerous procedures applied to data before, during, and after research, and these procedures can vary significantly depending on the field of research and the type of data used. Moreover, research organizations can be quite different depending on their country of location, legal status, and research foci. Such aspects are also reflected in the variety of research data management professions and experts. Some data management professions have started to become more established, while overall there is still quite an array of different job titles with somewhat overlapping work descriptions, as organisations tend to tailor expertise positions according to their specific needs. The professional titles and required qualifications are numerous, and the positions can be on a full- or part-time basis. Many organizations have already relatively established basic data management support services that are typically run as a collaborative effort between the library informaticians, IT-professionals and the law department.

One example of data management professionals hired typically on full-time basis to organizations are data managers. Data managers work at universities and research institutes, especially in support of clinical research as well as in multidisciplinary research projects amassing large quantities of data. Database maintenance is one of the typical tasks of data managers, as well as making sure that the attributed of data flowing into databases complies with those prerequisites assigned by research group, consortium, or organization. Data managers typically have a central role already in the planning phase of data collection, enabling them to make sure on their part that the data to be collected is compatible and of adequate quality. Data managers tend to be embedded in a specific research project or projects.

In several organizations, part-time data management experts and support personnel can appear in the form of data champions or data agents. Data champion programmes are an attempt to match the need for discipline specific research data management support by recruiting researchers (and other personnel with expertise on data management) on voluntary or part-time basis to spend some of their working time in support of and to train others in different areas of research data management. The participation of researchers as data champions of different disciplines has the added benefit of bringing in expertise in different research methods and understanding of the various processes and phases of research. The role of a data champion is often closely tied to the overall theme of increasing awareness on the FAIR-principle, including sharing information on the concrete actions that each member of the scientific community can apply in managing the research data they produce. Among the typical tools of data champions are work shops, lectures, and developing information packages about the best practices of data management.

Uncovering the data skills and needs of researchers: a workshop for researchers

The above-mentioned examples of data management experts and professions relate to a UEF project, which aims at developing the data support services. Among the tasks is a stronger link between the current central data support services and the faculties with their discipline specific know-how managing data.  Part of this work is to explore the possibility of developing a network of data champions in some form across the faculties and departments.

The Open Access Week that takes place on 25–29 October offers a good platform to open the discussion about research data management issues on a grass root level in every faculty and in every research field. We invite researchers to take part in the workshop to talk about and share the experiences and challenges of research data management as well as to search ways to disseminate the knowledge and know-how across the different disciplines and faculties.

The workshop takes place on October 27, at 1 to 3 pm, as an online event. Instructions for registration: UEF Library’s website. In the same week, the library also hosts two Open Science Cafés. Stay tuned.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Miten tukea opiskelijaa ja opettajaa aineistonhallinnassa? | How to support students and teachers in data management?

Tutkimusaineistojen hallinnan tärkeys ja vaatimukset ovat viime vuosina tulleet tutkijoille tutuiksi, mutta nyt on aika viedä tietoa tästä myös tutkinto-opiskelijoille. Korkeakoulujen ja tutkimusyhteisön yhteisissä kansallisissa linjauksissa todetaan, että opinnäytetöiden ohjaajien tulee osata osana ohjaustyötään arvioida ja kommentoida opiskelijoiden datanhallintasuunnitelmia. Datanhallinnan koulutus tulisi myös sisällyttää opetussuunnitelmiin perus- ja jatkokoulutuksessa (kts. Tutkimusaineistojen ja -menetelmien avoimuus. Korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021–2025. Osalinjaus 1: Tutkimusdatan avoin saatavuus). Tämä tietenkin tuo uusia osaamisvaatimuksia niin opiskelijoille kuin opettajille. Näihin liittyviä ajatuksia ja tarpeita lähdettiin kokoamaan opettajien kanssa yhdessä kirjaston toteuttamassa Miten tukea opiskelijaa aineistonhallinnassa -työpajassa kesäkuun alussa. Työpajaan kuului kaksi tapaamiskertaa, joiden välissä osallistujilla oli viikko aikaa pohtia annetun tehtävän kautta oman oppiaineen opiskelijoille olennaisia aineistonhallinnan kysymyksiä.

Aineistonhallinnan koulutus uusien vaatimusten edessä

Aineistonhallintaan on jo koulutusta jonkin verran tarjolla. Vaikka tiedonhaku ja julkaisuasiat ovat kirjaston koulutuksessa olleetkin vahvemmin esillä, kirjasto on tarjonnut tutkijoille koulutusta ja tukea aineistonhallintaan useamman vuoden ajan, lue lisää siitä kirjaston verkkosivuilta. Jatko-opiskelijoiden opinnoissa on ollut myös tarjolla aineistonhallinnan sisältöjä ja syksystä 2021 lähtien kirjasto tarjoaa kokonaisen 1 opintopisteen laajuisen opintojakson Tutkimusaineistonhallinnan perusteet. Osana avoimen tieteen opetusta avointa tutkimusdataa käsitellään Basics of Open and Responsible Science opintojaksolla. Maisterivaiheen opiskelijoille on pieni katsaus aineistonhallintaan Syventävät informaatiotaidot opintojaksolla ja jakson oppimateriaali on avoimesti kaikkien käytettävissä.
Tutkimusaineistojen hallinta on teemana noussut esiin yhä vahvemmin, mihin ovat vaikuttaneet esimerkiksi aineistoihin liittyvät monitahoiset käyttöoikeudet ja omistajuudet tietosuojineen, aineistojen uudelleenkäytön edistäminen ja datamäärien toisinaan eksponentiaalinen kasvu. Aineistonhallinnan osaamisvaatimukset eivät rajoitu pelkästään tutkijoihin, vaan ne kohdistuvat enenevissä määrin myös opiskelijoihin. Aineistonhallinnan perustaidot ovat osa työelämätaitoja, joita tarvitaan kaikkialla – myös tutkijanuran ulkopuolella.

Aineistonhallintaan liittyviä kysymyksiä on opiskelijoiden opetuksessa käsitelty eri oppiaineissa hyvinkin eri tavoin riippuen aineistotyyppien asettamista vaatimuksista sekä ohjaajien ja opettajien kiinnostuneisuudesta ja omasta osaamisesta. Enää ei voida tukeutua oletukseen, että opiskelijat jotain kautta oppivat aineistonhallinnan perustaidot. Opinnäytetöiden ohjaajat ja esimerkiksi menetelmäopetuksesta vastaavat opettajat ovat uusien vaatimusten edessä. Tarvitaan systemaattisempaa aineistonhallinnan opetusta ja tavoitteiden kirjaamista opetussuunnitelmiin.

Työpajassa esiin nousseita huomioita

Työpajassa nousi esiin tärkeitä huomioita tarjolla oleviin ohjeisiin ja materiaaleihin. Ohjeet on suunnattu usein tutkijoille, ne ovat melko pitkiä ja sisältävät paljon opiskelijoille uutta, vaikeaselkoistakin terminologiaa. Ohjeet ja materiaalit kaipaavat muokkausta opiskelijalähtöisemmiksi. Terminologiaa pitäisi selittää yleistajuisesti ja käytännön esimerkkien avulla voitaisiin lisätä ymmärrystä, miten tutkimusaineiston hallinnan asiat linkittyvät tutkimuksen eri vaiheisiin. Esiin nousi myös se, että tarjolla olevia ohjeita ei välttämättä löydetä helposti. Opetusmateriaalin kokoaminen yhteen selkeään paikkaan helpottaisi tutkijoita, opettajia ja opiskelijoita. Syvempää tieteenala- ja aineistotyyppikohtaista tietoa tarvittaisiin lisää. Eri tieteenaloilla käytetään erilaisia aineistoja, jotka puolestaan määrittävät osaltaan mitä aineistonhallinnan osa-alueita tulisi opettaa kattavammin ja mitä asioita on saatettu jo käydä läpi muiden kurssien, kuten menetelmäkurssien, yhteydessä. Myös siinä on vaihtelua, kerätäänkö jo opinnäytetyötä tehdessä uutta vai hyödynnetäänkö olemassa olevaa aineistoa.

Osa opiskelijoista voi tehdä opinnäytetyön laajemman tutkimushankkeen osana, jolloin hankkeessa määritellään, miten aineistoa hallitaan ja millaisia oikeuksia ja velvollisuuksia siihen liittyy. Vaikka opiskelija käyttäisi valmista aineistoa opinnäytetyössään, on tärkeää, että jokainen opiskelija oppii aineistonhallinnan perustaidot, koska ne ovat myös keskeisiä työelämätaitoja. Aineistonhallinnan taidot linkittyvät myös menetelmäosaamiseen ja hyvään tieteelliseen käytäntöön. Siksi on tärkeää, että käsitteitä ja eri osa-alueita avataan mahdollisimman aikaisessa vaiheessa opintoja.

Osana työpajan tehtäviä käytiin läpi kansallisessa yhteistyössä tuotettuja luonnoksia aineistonhallinnan osaamistasoista eri kohderyhmille perustutkinto-opiskelijoille, jatko-opiskelijoille ja heidän ohjaajilleen. Osaamistavoitteista saatiin arvokkaita kommentteja opettajilta. Ne myös herättivät monenlaisia tunteita; vaikka yhteisesti määritelty osaaminen on tärkeää, se myös asettaa suuria vaatimuksia opettajille. Osaamisvaatimuksia on paljon, niin opiskelijalle kuin opettajalle. Moni opettaja totesikin kaipaavansa ja tarvitsevansa lisäkoulutusta aiheeseen. Aineistonhallinnan teemat ja sisällöt ovat laajoja, uusia asioita pitää omaksua ja osata soveltaa niitä käytäntöön, kuten GDPR ja tietosuoja-asiat ovat osoittaneet. Aineistonhallinnan opetukseen on myös käytettävissä vain rajallinen aika. Tällä hetkellä opettajille ei ole tarjolla heille suunnattua aineistonhallinnan koulutusta, jossa käytäisiin aineistonhallinnan opettamista läpi.

Työpajan keskeisenä tuotoksena voisi todeta, että aineistonhallintaa käsitellään tai sivutaan monessa kohtaa yliopisto-opintoja ja useiden tahojen toimesta, mutta se ei ole järjestelmällistä. Olisi tarve tehdä systemaattisempi katsaus ja työnjako aineistonhallinnan opetukseen; mitä sisällöt ovat, onko päällekkäisyyttä tai aukkoja, miten saadaan opetus kattamaan kaikki opiskelijat? Tästä on syytä avata yliopistotasoinen keskustelu. Aineistonhallinnan opetus ei ole yksin kenenkään vastuulla, ei kirjaston, eikä yksittäisen opettajan, vaan siihen tarvitaan joukko asiantuntijoita ja yhteistyötä, verkoston voimaa.

Kaikille opetus- ja ohjaustyötä tekeville pohdittavaksi: Miten sinä opetat aineistonhallintaa? Miten aineistonhallinnan asiat näkyvät työssäsi? Millaista koulutusta tai materiaalia kaipaat aineistonhallintaan? Kerro ajatuksiasi vastaamalla tähän kyselyyn. Vastuksista saadaan arvokasta tietoa aineistonhallinnan opetuksen kehittämiseen.


In English

In recent years, researchers have become well aware of the importance of and the requirements for research data management. Now it’s time to engage students in these matters as well. The national policies of Finnish universities and research community state that thesis supervisors have to be able to evaluate and comment on the research data management plans of the students. Data management courses should be included in the curriculum of graduate and post graduate studies (See Open research data and methods. National policy and executive plan by the higher education and research community for 2021-2025. Policy component 1: Open access to research data). Thus, new demands face students and teachers alike. This set the stage for a workshop for teachers organised by the Library. The workshop “How to support students in data management” was held in early June in two parts. In between the two sessions, the participants had time to reflect data management issues relevant to their students in their specific research field.

Training of research data management facing new demands

UEF Library has offered data management courses and support for researches for several years read more from Library’s web page although themes such as information retrieval and publishing issues have been at the front line. Post graduate students have been able to include a module on data management in their curriculum, and open research data is part of the course Basics of Open and Responsible Science. The coming fall, the Library will introduce a new course Basics of research data management 1 credit point. For graduate students, these issues are touched on in a course Syventävät informaatiotaidot. The material (in Finnish) for this course is openly available.

Research data management as a theme has emerged ever more strongly into the academic everyday work. The demands of know-how for managing research data concern not only researchers but students as well. The basic skills of data management are needed in working life even outside academic research.

Issues of data management are covered in a variety of ways in graduate studies depending on the department, the academic field, the type of data as well as the interest and the skills of the instructors. However, we no longer can just assume that the students will somehow learn basic data management skills. The thesis supervisors and instructors of graduate research methods face new demands. We need systematic teaching of data management and the competence objectives to be specified and recorded in the curriculum.

Points noted during the workshop

Some important points arose at the workshop concerning the guides and materials offered for data management. They are often targeted for researchers, tend to be rather long and contain a lot of new, complex terminology for students. Both the guides and other materials need to be rendered more student friendly. The terminology should be explained on a more general level, whereas practical examples can elucidate understanding of how different aspects of data management link to the various stages of the research process. It was also noted that the instructions offered currently are not easily found. Gathering the materials in a designated one place would help the researchers, teachers and students.

What is also required is deeper coverage of discipline- and data-specific information. The data collected and used tends to differ among the academic disciplines, which in turn determine partially which sections of research data management should be taught more thoroughly, and which topics may already have been covered during other courses, such as methods training. Another aspect varying among disciplines is, whether the students collect new data for their thesis or dissertation, or make use of existing data. It is also worth noting that some students complete their thesis or dissertation within a larger research project. In such cases, the issues concerning data management and data ownership are already resolved within the project. But whether students reuse existing data in their dissertation or not, it is important that every student learns the basic skills of research data management because such skills are also essential for working life. In addition, proficiency in data management is an integral part of methods skills and best scientific practices. It is therefore important to clarify the various terms and topics of data management during the early stage of studies.

The workshop also covered the draft versions of skill levels of data management for different target groups, including undergraduate students, graduates, and their tutors. These learning goals have been drafted in national collaboration. The learning goals yielded valuable comments from the teachers and evoked mixed feelings; although it is important to determine the desired proficiencies collaboratively, this also sets heavy requirements for the teachers. There are several learning requirements for both the students and the teachers. Many of the teachers participating in the workshop expressed their hopes and needs for more training on the topic. The themes and contents of data management are expansive, necessitating the ability to adopt new concepts and to apply them in practice, as in the case of sensitive data and GDPR. The time that can be allocated to teaching data management tends to be limited. Currently, a training package aimed for teachers on how to teach data management to students is lacking.

Among the central conclusions of the workshop, it could be stated that research data management is covered to some extent, or is touched upon, at several stages of university studies and potentially by several different teachers, yet this type of arrangement is not very structured. There is a clear need for a systematic review of teaching data management, and to discuss how to best organise the work; what are the contents, are there gaps or redundancies among various courses and modules, how to cover each student with the teaching? There is a call for opening a university-level discussion, because teaching data management is not the sole responsibility of a single unit, such as the library, nor a single teacher either. Rather, what is required is the collaborative power in the form of a network of experts, each contributing their strengths.

Anne Karhapää, tietoasiantuntija | Information specialist
Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Datatuen kehittämishanke kesän kynnyksellä | Data support project on the verge of summer

(Please, scroll down to read in English)

Tiivis kevät on takana. Nyt on hyvä hetki koota tähän asti karttunutta tietoa ja ymmärrystä UEFin tutkimusdatatuen kehittämisestä ja itsellekin muistutella, mitä kaikkea on jo keretty tekemään ja mitä on edessä.

Vaikka fyysisesti olemme enemmän tai vähemmän jämähtäneet etätyöpisteisiimme, virtuaalisesti olemme liikkuneet ahkerasti yliopiston kampuksilla osastoilta ja laitoksilta toisiin ja tutustuneet aikamoiseen asiantuntijajoukkoon. Nimet ja usein myös naamat alkavat olla etenkin kirjastolla tuttuja. Eri asia on, miten hyvin nimet ja naamat sitten yhdistyvät, kun syksyn tullessa siirrytään fyysisestikin Careliaan.

Tiivistimme edellisessä blogitekstissämme hankkeen tavoitteeksi kehittää perusta toimivalle, moniammattilaista osaamista tarvitsevalle ja hyödyntävälle tutkijalähtöiselle datatuelle. Totesimme myös, että hankkeen aikana uudelleen muotoillut datatuen palvelut käynnistetään, niitä testataan ja niistä viestitään. Tavoitteet ovat pysyneet samoina, ja niiden tärkeys on muutaman kuukauden aikana vain vahvistunut. Samalla on todettava, että vaikka tavoite on selkeästi ilmaistu ja ytimekäs, sen vaativuus on tullut selvääkin selvemmäksi.

Kokouksia ja webinaareja

Arjen työvälineet lukuisine tietokanavineen eivät enää aiheuta kovin suurta hämmennystä. Teams ja vähintäänkin oman hankkeen kansiorakenne on siis alkanut tuntua tutulta ja Heimosta osaa jo kaivaa yhtä ja toista tärkeää tietoa. Erityiskiitos kuuluu myös avointa toimintakulttuuria hienosti kunnioittaville kirjaston verkkosivuille. Ne palvelevat sekä henkilökuntaa että UEFin ulkopuolisia.

Hankkeen ohjausryhmä on kokoontunut säännöllisesti kuukausittain ja laajempi datatuen verkosto sekin kerran kuussa. Välillä on jo kerennyt tulla ihmetys, joko nyt taas kokouskutsua ja asialistaa olisi laitettava menemään. Tiivis kokoustaminen on kuitenkin pitänyt meidät itsemmekin hyvin ajan tasalla, mitä on tullut tehtyä ja mihin seuraavaksi pitäisi katse kiinnittää.

Suunnittelijan tehtävänkuva on avannut mahdollisuuksia osallistua henkilöstökoulutukseen ja vilkkaana käyvään keskusteluun tutkimusaineistojen hallinnan ympärillä. Olemme käyneet virtuaalisesti esimerkiksi Kansalliskirjaston, Tietoarkiston, CSC:n ja TSV:n järjestämissä tilaisuuksissa ja perehtyneet aineistojen kuvailun, vastuullisen tieteen, aineistojen uudelleenkäytön ja tieteenalakohtaisten data-asiantuntijoiden työnkuvan kysymyksiin.

Haastatteluja ja työpajoja

UEFin eri yksiköihin kuuluvien ja eri tieteenaloja edustavien henkilöiden haastattelut ovat olleet äärettömän mielenkiintoisia. Parikymmentä tapaamista takanamme voimme sanoa, että olemme saaneet monipuolisen kattauksen tutkimuksen, opetuksen ja hallinnon tutkimusdata-asioiden arkeen. Pakollinen etätyö on luultavasti madaltanut kynnystä haastattelujen järjestämiseen, sillä niihin käytettävä aika on ollut suhteellisen helppo sovittaa töiden lomaan eikä haastateltavien ole tarvinnut valmistautua tapaamisiin ennakolta. Pääsääntöisesti kaikki, joita olemme kysyneet haastateltaviksi, ovat siihen suostuneet ja tapaamisissa on ollut myönteinen ja kiinnostunut vire. Suuret kiitokset tätäkin kautta!

Kevään aikana hankkeen painopiste on ollut datatuen verkoston toimijoissa. Työpajoissa on pohdittu toimijoiden rooleja ja hallinnollisten yksiköiden tehtäviä ja toimintatapoja, jotka liittyvät tutkimusaineistojen hallintaan tutkimuksen eri vaiheissa. Keskustelua on käyty datatuen palvelun näkökulmasta esimerkiksi tutkimusdatan omistajuuden määrittymisestä ja omistajuudesta seuraavista vastuista. Aineiston säilyttäminen tutkimuksen aikana ja sen jälkeen, sekä tähän liittyvä arvonmäärittely, ovat myös herättäneet keskustelua. Aiheet ovat kummunneet datatuen palveluihin tulleista tutkijoiden, ohjaajien ja joskus myös opiskelijoiden kysymyksistä. Työpajat ovat osoittaneet, että datatuen palveluissa tarvitaan yhteisen toiminnan hiomista edelleen ja entistä selkeämpää koordinaatiota. Vaihtelevat palvelupyynnöt määrittävät osaltaan, keiden asiantuntemusta missäkin tapauksessa tarvitaan.

Kevään haastattelukierros valotti datatuessa työskentelevien näkökulmaa. Datatuen tehtävien osuus vaihtelee suuresti työnkuvasta toiseen. Osuudesta riippumatta kunkin erityisosaaminen on välttämätöntä, jotta saadaan tuotettua kattava, vaatimukset täyttävä ja käyttäjien tarpeita vastaava tukipalvelu. Syksyllä mietitään tutkijoiden kanssa, miten heidän aineistonhallinnan osaamistaan saadaan mukaan tukipalveluista tuottavaan verkostoon entistä enemmän. Olemme jo hieman pohjustaneet syksyn toimintaa haastattelemalla eri tiedekuntien ja tieteenalojen tutkimus- ja opetushenkilökuntaa. Osalle kirjaston rooli datatuessa ja aineistonhallinnan kysymyksissä ei ole ennen haastattelua ollut tiedossa. Haastattelut ovat siten toimineet jo itsessään datatuen viestinnän välineenä, vaikkakin satunnaisesti ja pienimuotoisesti. Tutkimusaineistojen hallinnan tukipalveluja ei ylipäätään löydetä kovin helposti – ”Heimosta ei löydy” ja “Tieto hukkuu Yammeriin” -lauseet kaikuivat keskusteluissa. Monet viittasivat myös tutkimusaineistojen hallinnan vaikeisiin käsitteisiin ja hankaliin ohjeistuksiin. Kaivataan selkokielisyyttä, termien avaamista ja yhtä selkeää paikkaa, josta tutkijat löytävät ohjeet kattavasti.

Katse lukukauden vaihtumiseen

Haastattelut, työpajat, kokoukset ja tapaamiset ovat kirkastaneet muutamia asioita. Koordinoivalle työlle on entistäkin suurempi tarve. Tämä työ tulee lisääntymään lähivuosina, mihin vaikuttaa hankkeen tavoitteisiinkin kuuluva tiedekuntien ja laitosten kytkeminen vahvemmin mukaan datatuen palveluverkostoon. Tutkimuksen ytimessä syntyvä tieteenala- ja aineistokohtainen osaaminen kasvattaa yhteistä ymmärrystä datatuen tarpeista ja ratkaisuista puolin ja toisin. Syksyllä pääsemme
tähän teemaan käsiksi toden teolla.

Kevään aikana saimme kuulla, että kirjaston johdossa tapahtuu iso muutos Jarmo Saartin lähtiessä eläkkeelle. Meille hankesuunnittelijoille tämä tuli pienoisena järkytyksenä, sillä aloitimme projektissa Jarmon vetämän ohjausryhmän suojissa. Nyt olemme toipuneet järkytyksestä. Kiitämme Jarmoa lämpimästi näistä yhteisistä kuukausista ja toivotamme yhtä lämpimästi kirjaston uuden johtajan, Ari Muhosen, mukaan jännittävälle hankematkalle.

The spring term was busy and tightly scheduled for us in the research data support project. We have learnt a lot and gained understanding of data support and its development at the UEF. Now is a good time to look back on what we have achieved and what lies ahead.

Although we’ve been stuck more or less at our remote desks, we’ve moved around virtually at the university campuses and departments and got to know quite a lot of experts of different fields. Names and faces at the library are already rather familiar. But let’s see how we manage to connect them when returning to Carelia after the summer.

In our first blog, the goal of the project was condensed into developing the foundations for a functional, researcher-friendly data support service which relies on, and takes advantage of, multiprofessional competence. We also stated that during the project the newly designed data support services will be initiated and tested, and they will be communicated effectively. These goals remain and all the more their importance has strengthened during these past months. At the same time, the degree of complexity of the aim – no matter how concisely and clearly put – has become crystal clear.

Meetings and webinars

The daily working tools, with numerous information channels and platforms, no longer cause too much confusion. Teams and the file structure of at least our own project is rather familiar, and we manage to dig information out from Heimo. A special mention goes to the UEF library home pages, which foster the culture of open access. These pages serve both the personnel of UEF and the external users and visitors.

The project steering group holds monthly meetings. Similarly, the network of stakeholders working in the background to provide services and know-how to data support gathers regularly during monthly meetings. Sometimes the meeting schedule takes us by surprise: “Is it already time to prepare agendas and other documents needed?” The tight schedule has, however, kept us on track of what we have accomplished and what to do next.

Our working position as project planners has opened possibilities to attend personnel training and engage in the intensive and diverse discussions on research data management. We’ve attended webinars organized by, for example, National Library, Finnish Social Science Data Archive, CSC and Finnish Federation of Learned Societies, covering topics ranging from documentation and metadata to research integrity, re-use of research data and the job requirements of data specialists.

Interviews and workshops

Conducting interviews with people who belong to different units of UEF, and represent different academic disciplines, has been very interesting. Having completed 20 virtual meetings, we have garnered a versatile set of viewpoints into the everyday matters of research, teaching and managing research data. The enforced remote work-mode has most likely lowered the threshold to arrange interviews, because the time allocated for them has been relatively easy to fit among other tasks. Moreover, the interviewees were not asked to prepare in advance for the meetings. Notwithstanding a few exceptions, everyone we have requested to interview have agreed and the meetings have had a positive and interested atmosphere. Many thanks (to our participants) via this blog, too!

During the spring, the project focus has been on the people working in the data support network. Operational roles and the tasks as well as best practices linked to research data management in relevant administrative units have been the central themes of workshops. Moreover, we structured the workshops with the aim to cover different stages of the research data lifecycle. The conversations, from the perspective of data support services, have revolved around themes such as defining the ownership of research data and the various responsibilities following data ownership. Storing data during, and after, research, including defining the value of data destined for long term storage, have also been points of conversation. The topics stem
from questions sent to data support services by researchers, tutors, and occasionally by students. The workshops have demonstrated the need for refining the processes of working together to find solutions, and clearer coordination of operations. A wide variety of service requests determines and provides context, whose expertise is needed at different stages and cases.

The round of interviews this spring has shed light on the perspectives of those who work in data support services. The proportion of work tasks relevant directly to research data management vary from specialist to specialist depending on the unit and role. Despite this variation, the expertise of each specialist is crucial for providing a comprehensive support service, which matches policy requirements and needs of its users.

This coming autumn, we will brainstorm with the researchers how to better integrate their expertise as part of the wider network of producing data support services. We have already done some groundwork for the themes of this fall by interviewing research and teaching personnel at different faculties and representing various academic disciplines. The role of the library as a provider of data support and a source of guidance in matters of research data management was not obvious or known to some of our interviewees. In this sense, the interviews also function to spread awareness of the data support services, even if on the grassroot level. The research data support services are not always found easily – “I could not find it in Heimo” and “The information gets lost in Yammer” were some of the comments expressed during the interviews. There were also references to difficult concepts and challenging guides. The need for clearly worded guidance and demystification of terms is obvious, along with a central place for all relevant information, where researchers can easily find and access it.

Setting the stage for the fall term

Interviews, workshops and meetings have made some things crystal clear. The need for coordination is ever greater. This will grow in the near future and is tightly connected with the aim of getting the faculties and departments involved even more in the network of data support services. The know-how of managing research data accumulates during the research process and is shaped by discipline specific challenges. This knowledge boosts the shared understanding of the needs and solutions of data support and serves thus both ways. In the fall term, we’ll deal with this theme more properly.

During the spring we heard of a major change in the management of the library as Jarmo Saarti retires. This came as a bit of a shock to us, the project planners, as our work had started under the steering group lead by him. Now we’ve somewhat got over the news. We thank Jarmo warmly for these past months working together, and welcome the new director of the library, Ari Muhonen, equally warmly to the exciting project journey!

 

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share