Tutkijoiden viesti: Lisää tukea, osaamista ja suunnitelmallisuutta tutkimusdatan hallintaan! | Message from the researchers: More support, skills and planning for research data management, please!

(Please, scroll down to read in English.)

Tutkimusaineistoihin liittyy mitä moninaisempaa tietämystä, osaamista ja toimenpidettä. Jossain kohdin törmää yleensä siihen, että omat taidot eivät riitä tai että asiat olisivat sujuneet paremmin, jos olisi tiennyt, mistä apu on löydettävissä. Tästä aihepiiristä UEFin tutkijat ja kirjaston datatuen väki jakoivat ajatuksiaan ja kokemuksiaan 27.10.2021 pidetyssä työpajassa, jonka otsikkona oli “Tutkijoiden dataosaaminen ja -tarpeet esiin”. Teemaa on sivuttu taannoisessa blogkirjoituksessa, jossa pohdimme tutkimusaineistojen asiantuntijoiden rikasta kenttää. Työpajan teema osui selvästi ajankohtaiseen aiheeseen, sillä samalle päivälle sattuneessa Yhteiskunta- ja kauppatieteiden tiedekunnan strategiapäivässäkin avoin tiede tutkimusaineistoineen keräsi mittavan osallistujajoukon ja herätti vilkasta keskustelua.

Tutkimuksen ja tutkimusaineiston elinkaaret

Tutkimusaineistoa tai -dataa voidaan jäsentää suhteessa tutkimukseen, jonka raaka-aineena se toimii. Tutkimuksen edetessä raakadatasta muokkautuu usein valikoidumpia datasettejä, jotka ovat voineet käydä läpi erilaisia prosesseja ja muokkauksia. Aineistonhallinnan keskustelussa puhutaan usein tutkimuksen ja tutkimusaineistojen elinkaarista. Tutkimuksen elinkaari hahmotetaan kolmeen vaiheeseen: ennen tutkimusta, tutkimuksen aikana ja sen jälkeen. Tutkimusaineistojen elinkaari ulottuu usein tutkimuksen elinkaarta pidemmälle, kun aineistoja hyödynnetään uudelleen.

Työpajassa tunnistettiin tutkimusaineistoihin liittyviä toimenpiteitä ja tietotaitoa erityisesti tutkimuksen aikana. Tällaisina mainittiin vaikkapa datan analysointi, dokumentointi, ohjelmointi, tietokantaosaaminen, sensitiivisen aineiston käsittely ja datan jakaminen tietoturvallisesti yhteistyökumppaninen välillä. Työ on kuitenkin alkanut jo tutkimusta ennen aineiston keruun ja yleisemmin aineistonhallinnan suunnitteluna. Tutkimuksen jälkeen täytyy aineistollekin tehdä jotain: jokin osa aineistosta säilytetään, jokin tuhotaan, ja aineistoa myös avataan tai julkaistaan. Ihannetapauksessa aineisto on uudelleenkäytettävissä jonkin muun tutkimuksen raaka-aineena, jolloin aineiston elinkaari konkretisoi mainiosti asiakirjahallinnan ja arkistotoimen keskustelussa esiintyvää jatkumomallia.

Tutkimusaineiston käsittely edellyttää tutkijoilta usein teknisten taitojen lisäksi yleisiä aineistonhallinnan taitoja vaikkapa terminologian ymmärtämiseen tai tiedon etsimiseen omaan tilanteeseen ja tarkoitukseen sopivista toimenpiteistä ja ratkaisuista. Kaiken pohjana ovat kuitenkin tutkijan perustaidot eli tutkittavan aiheen perustavanlaatuinen tunteminen ja ymmärrys, tutkimusetiikka ja sen käytäntöjen hallinta.

Lisää osaamista ja tukea, kiitos!

UEFin datatuen kehittämisen yksi kulmakivi on yhden luukun palvelun parantaminen, jolloin tutkija pääsisi datasupport@-osoitteen kautta monen eri alan asiantuntijan avulla tuotetun kattavan tuen ja tiedon äärelle. Työpajassa tutkijat saivat vapaat kädet ideoida ja toivoa, mitä palvelua datatuen yhdestä luukusta pitäisi saada ja millainen tuki heitä olisi auttanut eteen tulleissa ongelmatilanteissa ja osaamisen puutteissa. Osa toiveista kohdistui sellaisiin tukipalveluihin, joita on jo nyt tarjolla, mutta joiden olemassaolo ei ole vielä tavoittanut tutkijoita. Esimerkiksi aineistonhallintasuunnitelman (DMP) tukea on saatavilla kommentointipalveluna ja koulutuksina, ja myös kohdennettuna tiettyihin rahoituksiin.

Neuvoja, ohjausta ja koulutusta kaivataan myös datan säilyttämiseen tutkimuksen aikana ja sen jälkeen, datan anonymisointiin, tietokantoihin ja vaikkapa datan käyttämiseen kahden yliopiston yhteisessä hankkeessa eri yliopistojen tunnuksilla. Datanhallinnan ratkaisuihin ja toimintatapoihin toivottiin suunnitelmallisuutta sekä jaettua ymmärrystä ja osaamista vähintäänkin tutkimushankkeiden sisällä. Kokonaisuuden hallinta ei saisi jäädä vain yhden ihmisen varaan.

Yleisemmän aineistonhallinnan tuen rinnalle tunnistettiin tarve aineisto- tai alakohtaisille asiantuntijoille sekä tiedekunnan tasolla oleville tukihenkilöille. Aineistonhallinnan vastuiden konkretian tasot on kuitenkin muistettava: Tukitoimet keskittyvät ohjeistuksiin, koulutuksiin ja neuvoihin, mutta ne eivät pysty vastaamaan varsinaiseen aineistonhallintaan, sillä se on tutkijoiden omalla vastuulla.

Vertaistuesta datatukeen

Vertaistuki on tutkijankin työssä ja aineistonhallinnan asioissa kullan arvoista. Vaikka epäviralliset, usein sattumanvaraiset keskustelut kollegoiden kesken ovat tiedon jakamisen tärkeä kanava, tarvetta on organisoidummalle kollegiaaliselle tuelle. Koulutukset, webinaarit ja oppimisyhteisöt mainittiin hyvinä keinoina jakaa ja saada tietoa. Osastoilla ja laitoksilla voisi olla myös tieteenalakohtaisia datanhallinnan mentoreita, jolloin vertaistukea olisi saatavilla järjestäytyneemmin.

Mikä sitten motivoisi tutkijaa tarjoamaan omaa osaamistaan? Tähänkin kaivataan kannustimia aivan kuten moniin avoimen tieteen käytännön toimiin ylipäätään. Työpajassa mainittiin esimerkkinä koulutuksiin osallistuminen, joka pitäisi pystyä kirjaamaan työraportointeihin. Datanhallinnan taitojen tulisi ylipäätään näkyä selkeämmin tutkijan meritoitumisessa. Tämä antaisi kaivattua nostetta osaamisen kehittämiselle ja lisäisi panostusta tiedekuntien datanhallintaan.

Eräänlaisena yleisenä ohjenuorana ja työpajan kiteytyksenä on suunnitelmallisuus, joka tuli keskustelussa esiin monessa kohdin. Käytännön esimerkkinä mainittiin tutkimushankkeet, joissa datanhallinnan käytänteet pitäisi dokumentoida kunnolla ja joissa niistä pitäisi huolehtia siten, että käytänteet välittyvät myös hankkeisiin tuleville uusille tutkijoille. Tämä saattaa kuulostaa itsestään selvältä, mutta tutkimuksen arjessa ideaalit eivät välttämättä toteudu. Aineistonhallinnan suunnittelun olisi löydettävä paikkansa tutkimussuunnitelman kiistattomana osana. Tässä kohdin tiedekuntien vertaistuki ja yliopiston yleinen datatuki voivat täydentää toisiaan luontevasti ja kaikkien erityisasiantuntemusta tehokkaasti hyödyntäen.

 

Arrows depicting the research data cycle from data collection to analysis and to disseminating results
Työpaja oli osa kirjaston OA-viikon ohjelmaa ja liittyi kirjaston koordinoimaan datatuen kehittämishankkeeseen, jonka kuulumisia on esitelty kirjaston blogissa. Työpajaan osallistui tutkijoita kaikista neljästä tiedekunnista. | The workshop was part of the Library’s OA Week program as well as of the data support project coordinated by the Library (see our project update from an earlier blog article). All four faculties were represented in the workshop. Image by: Patrick Hochstenbach (CC-BY)

Working with research data involves a wide variety of know-how. At some point, you may notice that your skills aren’t enough, or that things would have worked out better if you had known where help was to be found. Researchers and the library’s data support staff shared their thoughts and experiences on this theme in a workshop held on 27 October 2021, with the title “Uncovering the data skills and needs of the researchers”. We handled the same theme in our recent blog, reflecting on the wide variety of expertise in research data.

The life cycles of research and research data

Research data may be perceived in relation to the research for which it serves as the raw material. As research progresses, raw data is often modified to select data sets, which may have gone through various processes. In the context of research data management, the life cycle of both the research and the research data are common concepts. Research life cycle is often divided into three phases: before, during and after the research. The life cycle of research data typically extends beyond the life cycle of research when the data may be reutilized.

In the workshop, we identified measures and know-how related to research data particularly during the research, such as analysing and documenting data, programming and database skills, handling sensitive data and safe data sharing with research partners. The work, however, starts even before the research when data collection and managing data are planned. After the research, the data calls for some actions as well: something will be stored, something destroyed, and some data may be opened or published. Ideally, the data can be reused as raw data for new research. In this case, the life cycle of the data concretizes, in a nice way, the continuum model used in records management.

In addition to technical know-how, data handling requires skills and knowledge of a more general kind, for example, understanding the terminology or finding solutions best suited for one’s needs. However, the basic skills of the researcher, namely fundamental knowledge and understanding of the subject matter, research ethics and its practices, are the basis of everything.

More skills and support – yes, please!

Improving the one-stop-shop for data management support services at UEF is one of the cornerstones of the development project: researchers will be able to access extensive support and information through the datasupport@ service channel produced by different professionals coming together from different fields of expertise. Researchers were able to pitch their ideas and make wishes for the kinds of services the one-stop-shop for data management support should offer and what type of support would have helped them during past problems and lack of skills. Portion of the hopes matched services that had already been implemented but that the researchers were not familiar with yet. As an example of existing services, support for writing a research data management plan (DMP) is already in place in the form of a DMP commenting service and various trainings, including targeted training for specific funding instruments.

Advice, guidance, and training are also needed for storing data during and after research, anonymization of data, research data bases, and using data in a collaborative project between two different universities. Researchers also called for well-planned solutions and procedures for data management, including shared understanding and skills at least within individual research projects as a minimum level.

Managing the big picture should not be left on the shoulders of one person. The importance of experts specific to datatypes and disciplines along with support personnel embedded in faculties was recognized in supplementing general research data management support services. One must bear in mind the concrete levels of data management responsibilities though: support measures focus on guidance, training and advice, while they cannot meet the actual management of research data which remains the responsibility of researchers.

From collegial support to datasupport

Collegial support is valuable not only in matters of data management but more generally in the everyday work of a researcher. Although unofficial, often random conversations with colleagues are important channels of information sharing, there is a recognized need for more organized collegial support. Trainings, webinars and learning communities were mentioned during the workshop as good means of sharing and receiving information. Faculties and departments could also have embedded discipline-specific data management mentors, to make peer support more systematically available.

What would, then, motivate researchers to offer their know-how to others? Incentives may be needed for willingness to mentor others, and this is also recognized more widely in relation to many practical measures in open science. The possibility to record attendance on data management training sessions to work reports was mentioned as one suggestion. Overall, research data management skills should be made more visible in meriting researchers. This would give a much-needed lift to developing skills and add investment by faculties on managing research data.

The importance of planning ahead was raised several times during the conversation and hence it can be summarized here as a kind of general guideline and a take-home message from our workshop. There were practical examples from research projects, where research data management practices should be documented well and thoroughly to make sure that they will be available to new researchers entering the project. Although this may sound self-evident, such ideals do not necessarily actualize during everyday research. Data management planning should find its rightful place as an undisputable part of a research proposal. Moreover, it is one of the many avenues, where collegial support of the departments can complement general data support services, making best use of everyone’s expertise most efficiently.

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Datatuen kehittämishanke kesän kynnyksellä | Data support project on the verge of summer

(Please, scroll down to read in English)

Tiivis kevät on takana. Nyt on hyvä hetki koota tähän asti karttunutta tietoa ja ymmärrystä UEFin tutkimusdatatuen kehittämisestä ja itsellekin muistutella, mitä kaikkea on jo keretty tekemään ja mitä on edessä.

Vaikka fyysisesti olemme enemmän tai vähemmän jämähtäneet etätyöpisteisiimme, virtuaalisesti olemme liikkuneet ahkerasti yliopiston kampuksilla osastoilta ja laitoksilta toisiin ja tutustuneet aikamoiseen asiantuntijajoukkoon. Nimet ja usein myös naamat alkavat olla etenkin kirjastolla tuttuja. Eri asia on, miten hyvin nimet ja naamat sitten yhdistyvät, kun syksyn tullessa siirrytään fyysisestikin Careliaan.

Tiivistimme edellisessä blogitekstissämme hankkeen tavoitteeksi kehittää perusta toimivalle, moniammattilaista osaamista tarvitsevalle ja hyödyntävälle tutkijalähtöiselle datatuelle. Totesimme myös, että hankkeen aikana uudelleen muotoillut datatuen palvelut käynnistetään, niitä testataan ja niistä viestitään. Tavoitteet ovat pysyneet samoina, ja niiden tärkeys on muutaman kuukauden aikana vain vahvistunut. Samalla on todettava, että vaikka tavoite on selkeästi ilmaistu ja ytimekäs, sen vaativuus on tullut selvääkin selvemmäksi.

Kokouksia ja webinaareja

Arjen työvälineet lukuisine tietokanavineen eivät enää aiheuta kovin suurta hämmennystä. Teams ja vähintäänkin oman hankkeen kansiorakenne on siis alkanut tuntua tutulta ja Heimosta osaa jo kaivaa yhtä ja toista tärkeää tietoa. Erityiskiitos kuuluu myös avointa toimintakulttuuria hienosti kunnioittaville kirjaston verkkosivuille. Ne palvelevat sekä henkilökuntaa että UEFin ulkopuolisia.

Hankkeen ohjausryhmä on kokoontunut säännöllisesti kuukausittain ja laajempi datatuen verkosto sekin kerran kuussa. Välillä on jo kerennyt tulla ihmetys, joko nyt taas kokouskutsua ja asialistaa olisi laitettava menemään. Tiivis kokoustaminen on kuitenkin pitänyt meidät itsemmekin hyvin ajan tasalla, mitä on tullut tehtyä ja mihin seuraavaksi pitäisi katse kiinnittää.

Suunnittelijan tehtävänkuva on avannut mahdollisuuksia osallistua henkilöstökoulutukseen ja vilkkaana käyvään keskusteluun tutkimusaineistojen hallinnan ympärillä. Olemme käyneet virtuaalisesti esimerkiksi Kansalliskirjaston, Tietoarkiston, CSC:n ja TSV:n järjestämissä tilaisuuksissa ja perehtyneet aineistojen kuvailun, vastuullisen tieteen, aineistojen uudelleenkäytön ja tieteenalakohtaisten data-asiantuntijoiden työnkuvan kysymyksiin.

Haastatteluja ja työpajoja

UEFin eri yksiköihin kuuluvien ja eri tieteenaloja edustavien henkilöiden haastattelut ovat olleet äärettömän mielenkiintoisia. Parikymmentä tapaamista takanamme voimme sanoa, että olemme saaneet monipuolisen kattauksen tutkimuksen, opetuksen ja hallinnon tutkimusdata-asioiden arkeen. Pakollinen etätyö on luultavasti madaltanut kynnystä haastattelujen järjestämiseen, sillä niihin käytettävä aika on ollut suhteellisen helppo sovittaa töiden lomaan eikä haastateltavien ole tarvinnut valmistautua tapaamisiin ennakolta. Pääsääntöisesti kaikki, joita olemme kysyneet haastateltaviksi, ovat siihen suostuneet ja tapaamisissa on ollut myönteinen ja kiinnostunut vire. Suuret kiitokset tätäkin kautta!

Kevään aikana hankkeen painopiste on ollut datatuen verkoston toimijoissa. Työpajoissa on pohdittu toimijoiden rooleja ja hallinnollisten yksiköiden tehtäviä ja toimintatapoja, jotka liittyvät tutkimusaineistojen hallintaan tutkimuksen eri vaiheissa. Keskustelua on käyty datatuen palvelun näkökulmasta esimerkiksi tutkimusdatan omistajuuden määrittymisestä ja omistajuudesta seuraavista vastuista. Aineiston säilyttäminen tutkimuksen aikana ja sen jälkeen, sekä tähän liittyvä arvonmäärittely, ovat myös herättäneet keskustelua. Aiheet ovat kummunneet datatuen palveluihin tulleista tutkijoiden, ohjaajien ja joskus myös opiskelijoiden kysymyksistä. Työpajat ovat osoittaneet, että datatuen palveluissa tarvitaan yhteisen toiminnan hiomista edelleen ja entistä selkeämpää koordinaatiota. Vaihtelevat palvelupyynnöt määrittävät osaltaan, keiden asiantuntemusta missäkin tapauksessa tarvitaan.

Kevään haastattelukierros valotti datatuessa työskentelevien näkökulmaa. Datatuen tehtävien osuus vaihtelee suuresti työnkuvasta toiseen. Osuudesta riippumatta kunkin erityisosaaminen on välttämätöntä, jotta saadaan tuotettua kattava, vaatimukset täyttävä ja käyttäjien tarpeita vastaava tukipalvelu. Syksyllä mietitään tutkijoiden kanssa, miten heidän aineistonhallinnan osaamistaan saadaan mukaan tukipalveluista tuottavaan verkostoon entistä enemmän. Olemme jo hieman pohjustaneet syksyn toimintaa haastattelemalla eri tiedekuntien ja tieteenalojen tutkimus- ja opetushenkilökuntaa. Osalle kirjaston rooli datatuessa ja aineistonhallinnan kysymyksissä ei ole ennen haastattelua ollut tiedossa. Haastattelut ovat siten toimineet jo itsessään datatuen viestinnän välineenä, vaikkakin satunnaisesti ja pienimuotoisesti. Tutkimusaineistojen hallinnan tukipalveluja ei ylipäätään löydetä kovin helposti – ”Heimosta ei löydy” ja “Tieto hukkuu Yammeriin” -lauseet kaikuivat keskusteluissa. Monet viittasivat myös tutkimusaineistojen hallinnan vaikeisiin käsitteisiin ja hankaliin ohjeistuksiin. Kaivataan selkokielisyyttä, termien avaamista ja yhtä selkeää paikkaa, josta tutkijat löytävät ohjeet kattavasti.

Katse lukukauden vaihtumiseen

Haastattelut, työpajat, kokoukset ja tapaamiset ovat kirkastaneet muutamia asioita. Koordinoivalle työlle on entistäkin suurempi tarve. Tämä työ tulee lisääntymään lähivuosina, mihin vaikuttaa hankkeen tavoitteisiinkin kuuluva tiedekuntien ja laitosten kytkeminen vahvemmin mukaan datatuen palveluverkostoon. Tutkimuksen ytimessä syntyvä tieteenala- ja aineistokohtainen osaaminen kasvattaa yhteistä ymmärrystä datatuen tarpeista ja ratkaisuista puolin ja toisin. Syksyllä pääsemme
tähän teemaan käsiksi toden teolla.

Kevään aikana saimme kuulla, että kirjaston johdossa tapahtuu iso muutos Jarmo Saartin lähtiessä eläkkeelle. Meille hankesuunnittelijoille tämä tuli pienoisena järkytyksenä, sillä aloitimme projektissa Jarmon vetämän ohjausryhmän suojissa. Nyt olemme toipuneet järkytyksestä. Kiitämme Jarmoa lämpimästi näistä yhteisistä kuukausista ja toivotamme yhtä lämpimästi kirjaston uuden johtajan, Ari Muhosen, mukaan jännittävälle hankematkalle.

The spring term was busy and tightly scheduled for us in the research data support project. We have learnt a lot and gained understanding of data support and its development at the UEF. Now is a good time to look back on what we have achieved and what lies ahead.

Although we’ve been stuck more or less at our remote desks, we’ve moved around virtually at the university campuses and departments and got to know quite a lot of experts of different fields. Names and faces at the library are already rather familiar. But let’s see how we manage to connect them when returning to Carelia after the summer.

In our first blog, the goal of the project was condensed into developing the foundations for a functional, researcher-friendly data support service which relies on, and takes advantage of, multiprofessional competence. We also stated that during the project the newly designed data support services will be initiated and tested, and they will be communicated effectively. These goals remain and all the more their importance has strengthened during these past months. At the same time, the degree of complexity of the aim – no matter how concisely and clearly put – has become crystal clear.

Meetings and webinars

The daily working tools, with numerous information channels and platforms, no longer cause too much confusion. Teams and the file structure of at least our own project is rather familiar, and we manage to dig information out from Heimo. A special mention goes to the UEF library home pages, which foster the culture of open access. These pages serve both the personnel of UEF and the external users and visitors.

The project steering group holds monthly meetings. Similarly, the network of stakeholders working in the background to provide services and know-how to data support gathers regularly during monthly meetings. Sometimes the meeting schedule takes us by surprise: “Is it already time to prepare agendas and other documents needed?” The tight schedule has, however, kept us on track of what we have accomplished and what to do next.

Our working position as project planners has opened possibilities to attend personnel training and engage in the intensive and diverse discussions on research data management. We’ve attended webinars organized by, for example, National Library, Finnish Social Science Data Archive, CSC and Finnish Federation of Learned Societies, covering topics ranging from documentation and metadata to research integrity, re-use of research data and the job requirements of data specialists.

Interviews and workshops

Conducting interviews with people who belong to different units of UEF, and represent different academic disciplines, has been very interesting. Having completed 20 virtual meetings, we have garnered a versatile set of viewpoints into the everyday matters of research, teaching and managing research data. The enforced remote work-mode has most likely lowered the threshold to arrange interviews, because the time allocated for them has been relatively easy to fit among other tasks. Moreover, the interviewees were not asked to prepare in advance for the meetings. Notwithstanding a few exceptions, everyone we have requested to interview have agreed and the meetings have had a positive and interested atmosphere. Many thanks (to our participants) via this blog, too!

During the spring, the project focus has been on the people working in the data support network. Operational roles and the tasks as well as best practices linked to research data management in relevant administrative units have been the central themes of workshops. Moreover, we structured the workshops with the aim to cover different stages of the research data lifecycle. The conversations, from the perspective of data support services, have revolved around themes such as defining the ownership of research data and the various responsibilities following data ownership. Storing data during, and after, research, including defining the value of data destined for long term storage, have also been points of conversation. The topics stem
from questions sent to data support services by researchers, tutors, and occasionally by students. The workshops have demonstrated the need for refining the processes of working together to find solutions, and clearer coordination of operations. A wide variety of service requests determines and provides context, whose expertise is needed at different stages and cases.

The round of interviews this spring has shed light on the perspectives of those who work in data support services. The proportion of work tasks relevant directly to research data management vary from specialist to specialist depending on the unit and role. Despite this variation, the expertise of each specialist is crucial for providing a comprehensive support service, which matches policy requirements and needs of its users.

This coming autumn, we will brainstorm with the researchers how to better integrate their expertise as part of the wider network of producing data support services. We have already done some groundwork for the themes of this fall by interviewing research and teaching personnel at different faculties and representing various academic disciplines. The role of the library as a provider of data support and a source of guidance in matters of research data management was not obvious or known to some of our interviewees. In this sense, the interviews also function to spread awareness of the data support services, even if on the grassroot level. The research data support services are not always found easily – “I could not find it in Heimo” and “The information gets lost in Yammer” were some of the comments expressed during the interviews. There were also references to difficult concepts and challenging guides. The need for clearly worded guidance and demystification of terms is obvious, along with a central place for all relevant information, where researchers can easily find and access it.

Setting the stage for the fall term

Interviews, workshops and meetings have made some things crystal clear. The need for coordination is ever greater. This will grow in the near future and is tightly connected with the aim of getting the faculties and departments involved even more in the network of data support services. The know-how of managing research data accumulates during the research process and is shaped by discipline specific challenges. This knowledge boosts the shared understanding of the needs and solutions of data support and serves thus both ways. In the fall term, we’ll deal with this theme more properly.

During the spring we heard of a major change in the management of the library as Jarmo Saarti retires. This came as a bit of a shock to us, the project planners, as our work had started under the steering group lead by him. Now we’ve somewhat got over the news. We thank Jarmo warmly for these past months working together, and welcome the new director of the library, Ari Muhonen, equally warmly to the exciting project journey!

 

Manna Satama, datanhallinnan projektisuunnittelija | Data management project planner
Niina Nurmi, datanhallinnan projektisuunnittelija | Data management project planner
Tutkimuksen tuki | Research support
Opetus- ja tietopalvelut | Training and information services

Share

Dialogi muutoksen välineenä – IFLA:n 85. konferenssi Ateenassa | Libraries: dialogue for change – the 85th IFLA WLIC in Athens

(Please, scroll down to read in English.)

IFLA, kansainvälinen kirjastojärjestöjen liitto, järjesti 85. konferenssinsa Ateenassa. Tämän vuoden teemana oli dialogi muutoksen tukena, joka sopi hyvin sekä Ateenan pitkään filosofiseen perinteeseen että aikamme kaoottiseen viestintätilanteeseen, jossa keskustelu ja argumentointi tuntuvat unohtuvan. Konferenssi on kirjastoalan suurin, tällä kertaa osallistujia oli noin 3500 yhteensä noin 140 maasta.

Datan hallinta akateemisten kirjastojen uutena tehtävänä

Kehittyvä tietotekniikka on antanut uusia mahdollisuuksia kirjastojen työn kehittämiselle. Julkaisemisen siirtyminen digitaaliseen ympäristöön ja tutkimuksessa syntyvien suurten digitaalisten datajoukkojen arkistointi ovat tuomassa tekoälysovellukset kirjastotyöhön. Nämä uudet työkalut mahdollistavat tällaisten laajojen data-aineistojen tehokkaan käytön ja analysoinnin tietokoneavusteisesti.

Koneoppiva tiedonhaku ja tiedonjärjestäminen tuntuvat kehittyvän tällä hetkellä nopeasti. Ne antavat uusia mahdollisuuksia tutkimukselle ja tutkijoille. Tekoälyn tuominen perinteisen tiedonhaun rinnalle näyttää antavan mahdollisuuksia uusien havaintojen tekemiseen sekä tiedonhaussa että varsinkin perustutkimuksessa. Tähänastinen kirjastojen tiedonjärjestäminen on ollut paljolti ennalta määrättyjen rakenteiden soveltamista julkaistuihin teksteihin. Datanlouhinta muuttaa tämän siten, että oppivat tietojärjestelmät kykenevät löytämään suurista datamassoista rakenteita ja suhteita, joihin ihmisen kapasiteetti ei pysty eikä käytettävissä oleva aika riitä. Tämän yhteydessä on alettu puhua tietämyksen löytämisestä (knowledge discovery).

Tähän kehitykseen liittyy myös eettisiä ja juridisia ongelmia. Sekä datan omistajuus että sen käyttö ja käyttötarkoitukset tulee määritellä kestävällä tavalla, jotta eettisesti korkeatasoinen tutkimus olisi mahdollista eikä datan väärinkäyttöä tapahtuisi. Tällä hetkellä koneiden oppiminen on myös vielä niin alkuvaiheessa, että ymmärryksemme lisääminen koneiden tekemistä tulkinnoista ja löydösten validiudesta edellyttää vielä paljon tutkimusta, jotta voimme olla varmoja tutkimustulosten pätevyydestä ja, soveltavilla aloilla, niiden soveltamisesta käytäntöön.

Kirjastoille tekoäly ja nopeasti kehittyvä älykäs semanttinen verkko aiheuttavat myös tarpeen kehittää ja jopa muuttaa toimintatapoja. Ensinnäkin jo nyt on tarjolla sovelluksia, jotka pystyvät löytämään digitaalisista teksteistä avainsanoja ja linkittämään niitä toistensa kanssa tiedonhaun tueksi. Tässä työssä kirjastojen luomat linkitettyä datan käsittelyä tukevat sanastot ja muut rakenteiset tietämyskannat ovat erityisen tärkeitä, jotta tiedonhaun tarkkuus säilyisi jatkossakin.

Tekoälyyn ja käyttäjien mallintamiseen perustuvat sovellukset ovat tulossa myös kirjastojen asiakaspalvelun tueksi. Hyvänä esimerkkinä tästä oli Oodi-kirjaston yhteyteen tehty asiakaspalvelija-sovellus. Se osasi suositella käyttäjälleen teoksia ohjelmistoon mallinnettujen käyttäjätyyppien kautta.

Avoin julkaiseminen eettisenä ja juridisena haasteena tiedeyhteisölle

IFLAn presidenttinäkin toiminut, nykyisin Etelä-Afrikan akateemisessa kirjastolaitoksessa vaikuttava Ellen Tise nosti esityksessään esille seikan, joka yleensä unohtuu suomalaisessakin keskustelussa avoimesta julkaisemisesta. Hyvin toteutettuna avoin julkaiseminen tukee myös eri maantieteellisten alueiden ja eri tieteenalojen välistä tasa-arvoa tieteellisen julkisuuden ja aineistojen saatavuuden toteutumisessa.

Valokuva esitelmän esitysmateriaalista ja puhujasta. Avoimen saatavuuden määritelmä lakikielellä. Photo of preseantation slide and presenter. Definition of open access in juridical language.
OA käännettynä juridiikan kielelle | OA in copyright juridics

Etelä-Afrikassa on tietoisesti siirrytty vihreään avoimeen julkaisemiseen, koska se mahdollistaa ensinnäkin edullisen tavan julkaista tutkimusta ja toiseksi myös kehitysmaiden äänen kuulumisen kansainvälisessä tutkimuskentässä. Tisen omassa yliopistossa tämä on tarkoittanut myös omien avointen lehtien julkaisemista. Tämä on lisännyt paikallisten tutkijoiden näkyvyyttä ja vaikuttavuutta. Parhaillaan Etelä-Afrikassa ollaan tekemässä kansallista tiekarttaa avoimesta tieteestä. Tise korostikin, että tieteessä on edelleen voimassa kolonialistisia rakenteita, joissa pohjoinen tuottaa tietoa etelän käytettäväksi, vaikka tiedon tuottamisen ja käyttämisen tulisi olla tasa-arvoista ja globaalia.

Myös malesialaisessa esimerkissä paikallistiedon digitoinnista ja avaamisesta laajaan käyttöön tuli esille globaali näkökulma. Paikalliskulttuuria ja sen tuotoksia on päästy vasta viime aikoina julkaisemaan ja jakelemaan laajasti, koska kolonialistiset rakenteet vaikuttivat ennen maan itsenäistymistä sekä siihen, mitä voitiin julkaista, että siihen, mikä katsottiin julkaisemisen arvoiseksi. Heidän esityksensä toi hyvin esille sen, kuinka paikallisten aineistojen avoin julkaiseminen lisää kulttuurista ja tiedollista moniarvoisuutta ja monipuolisuutta. Vertaaminen lajiston köyhtymiseen luonnossa antoi hyvän kuvan siitä, mitä yksiulotteinen julkaisukulttuuri voi saada aikaan maailmassa.

Kirjastot väylänä kohti avointa ja tasa-arvoista tiedettä

Avoin tiede näyttää vakiinnuttavan asemansa tieteen toimintamallina ja akateemisilla kirjastoilla on tässä keskeinen rooli. Muutamassa esityksessä huomasi sen, että avoimuuteen liittyvät tekijän ja käyttäjän oikeudet ja tietoisuus niistä ovat keskeisiä työkaluja tutkijoille, opettajille ja opiskelijoille.

Erityisen tärkeää on kouluttaa uudet opiskelijat ymmärtämään tutkimuksen avoimuuden merkitys omassa toiminnassaan, jotta he olisivat tulevaisuuden aktiivisia toimijoita tasa-arvoisen globaalin tutkimusmaailman synnyttämisessä. Tässä on meillä UEFissakin vielä tekemistä.

Kirjastojen perustyö hankkia, järjestää ja saattaa käyttöön erilaisia aineistoja näyttää tulevan rikkaammaksi digitaalisessa tekoälymaailmassa. Tämä tarkoittaa osaamisen uudistamista, uusien työkalujen luomista ja ennen kaikkea kirjaston palveluiden integroimista erilaisiin digitaalisiin toimintaympäristöihin ja ennen kaikkea akateemiseen työhön.

paljon ihmisiä, auditorio, lots of people, auditorium
IFLAn avajaiset | Opening ceremony

IFLA, the International Federation of Library Organizations, organized its 85th conference in Athens. This year’s theme was dialogue for change, which fits well with Athens’ long philosophical tradition and the chaotic communications of our time, where discussion and argumentation seem to be forgotten. The conference is the largest in the library industry, this time with around 3500 participants from about 140 countries.

Data management as a new task for academic libraries

Emerging information technology has provided new opportunities for the development of libraries. As publishing moves into the digital environment, and with the recent debate on archiving and deploying various digital data sets generated by research are bringing artificial intelligence applications to the library.

Machine learning and information management seem to be developing rapidly at the moment and offer new opportunities for research and researchers. Bringing artificial intelligence alongside traditional information retrieval techniques seems to offer opportunities for new findings both in information retrieval and especially in basic research. So far, the organization of information in libraries has largely been the application of predefined structures to published texts. Data mining changes this so that learning information systems can find structures and relationships on large masses of data that human capacity and the time available are inadequate for coping with. This has been defined as knowledge discovery.

There are also ethical and legal issues with this development. Both ownership of data and its use and uses must be defined in a sustainable manner in order to allow for ethically high-quality research and to prevent data misuse. Now, machine learning is still in its early stages, so that increasing our understanding about machine interpretations and the validity of findings still requires a great deal of research in order to be sure of the validity of research results.

For libraries, artificial intelligence and a rapidly evolving intelligent semantic networks also necessitate the development and even change of practices. First, there are already applications available that can find keywords in digital texts and link them to each other for information retrieval. In this work the structured knowledge bases and systems created by libraries can support the interlinked data in order to maintain the accuracy of information retrieval.

Applications based on artificial intelligence and user modeling are also coming to support libraries’ customer service. A good example of this was the Oodi library customer service application. It was able to recommend works to its user through the types of users modeled on the software.

Open publication as an ethical and legal challenge for the scientific community

Ellen Tise, who also served as IFLA’s president and currently works at the South African academic library community, highlighted something that is usually overlooked in the Finnish debate on open publishing. Open publishing, if well implemented, also promotes equality between geographical areas and disciplines in terms of scientific publicity and access to materials.

In South Africa, there has been a deliberate shift towards green open publishing, because it enables, firstly, a cost-effective way of publishing research, and because it also enables developing countries’ voice in the international research field. At Tise’s own university, this has also meant publishing its own open journals. This has increased the visibility and impact of local researchers. A national road map on open science is currently being prepared in South Africa. Indeed, Tise emphasized that science still has colonial structures where the North produces knowledge for use by the South, even though knowledge production and use should be equitable and global.

The Malaysian example of widespread digitization and opening of local data also brought to light this global perspective. Local culture and its output have only recently been widely published and disseminated, because before colonialism the colonial structures influenced both what could be published and what was considered worth publishing. Their presentation highlighted how the open publication of local materials enhances cultural and informational pluralism and diversity. The comparison with the decline of species in the nature gave a good idea of ​​what a one-dimensional publication culture could bring about in the world.

Libraries as a route to open and equal science

Open science seems to have established itself as an operational model of science and academic libraries play a key role here. In quite a few presentations, one discovered that openness and awareness of author and user rights are essential tools for researchers, teachers and students.

It is particularly important to educate new students to understand the importance of openness in research, so that they will be active players in the future in creating an equitable global research world. Here we have still a lot to do in UEF.

The basic work of libraries to acquire, organize and make available various materials seems to be getting richer in the digital artificial intelligence world. This means renewing knowledge, creating new tools and, above all, integrating library services into different digital environments and open learning.

Jarmo Saarti, kirjaston johtaja | Library Director

Share