Avoimen tieteen edistäjä 2018 | Open Science Award 2018 winner

(Please, scroll down to read in English.)

Kirjasto myönsi järjestyksessään kolmannen avoimen tieteen edistäjän kunniakirjan tietojenkäsittelytieteen laitoksen apulaisprofessori Tomi Kinnuselle. Hänen puheteknologiaan, erityisesti puhujantunnistukseen keskittyvä tutkimustyönsä tuottaa dataa, jonka avaamisessa Kinnunen on erityisen ansioitunut.

Tomi Kinnunen arvelee oman alansa tutkijoiden olevan melko kiitollisia avatuista tutkimusaineistoista, eikä valtavaa vastarintaa ole ilmennyt – pikemminkin päinvastoin: puheteknologiassa suurten data-aineistojen rooli on aina ollut avainasemassa. Yhteisten datajoukkojen käyttö paitsi mahdollistaa menetelmäkehityksen tuo myös alan tutkijat lähemmäksi toisiaan. Myös Kinnusen lähijohtaja, tietojenkäsittelytieteen laitosjohtaja ja professori Markku Hauta-Kasari arvelee suhtautumisen avoimeen tieteeseen olevan mutkatonta. Onhan tietojenkäsittelytieteen tutkimusalalla perinteisesti usein avoin lähdekoodi ja dokumentointi keskeisessä roolissa.

Oikeilla tavoilla avattu tutkimusdata on nuorella alalla vakiinnuttanut nopeasti jalansijansa, ja herättää keskustelua esimerkiksi kansainvälisissä konferensseissa. Kinnusen viimeaikainen tutkimus on keskittynyt mm. huijaushyökkäysten (spoofing attack) tunnistamiseen puheesta. Esimerkiksi puhesynteesin laatu paranee vuosi vuodelta ja sillä voidaan jo nyt periaatteessa ”laittaa sanoja toisen suuhun”. Biometrisen tunnistautumisen ja yksityisyysasioiden ollessa vahvasti tapetilla tärkeä tutkimuskohde onkin erotella puhuja toisesta, ja erottaa keinotekoinen puhe oikeasta puheesta – ja tämän tutkimiseksi tarvitaan standardoitua dataa. Kinnusen (yhdessä kansainvälisten partnereiden kanssa) avaamat ASVspoof-aineistot ovat olleet vakiinnuttamassa jalansijaa tälle kasvavalle tutkimusalalle. Laitoksen johtaja Hauta-Kasari painottikin puheteknologian parissa työskentelevien yhteistä innostusta datasta, josta riittää iloa ja hyötyä laajemmallekin yhteisölle. Kun dataa on saatavilla, siitä saadaan paljon irti.

Alalla dokumentointi on isossa roolissa, ja myös Tomi Kinnunen on kuvaillut metatietoja aktiivisesti ja myös puhunut tästä aiheesta eri foorumeilla. Löydettävyys on avainasemassa, kun uudenlaiset dataryppäät valtaavat alaa internetin uumenista. Tähän auttaa vain ja ainoastaan kunnollinen tiedon esittäminen vakiintunein menetelmin. Näin se on löydettävissä ajasta ja maantieteellisestä sijainnista riippumatta. Kinnusen ansioihin onkin luettavissa erityisen kansainvälisen tutkimuksen tekeminen. Hän liikkuu paljon ja verkostoituu aina Euroopasta Aasiaan, ja olikin juuri pidemmällä tutkimusvierailulla Japanissa. Tällä matkalla osittain suunniteltu uusi data-aineisto tullaan avaamaan verkkoon lähiviikkoina.
Kirjaston johtaja Jarmo Saarti totesi, että aitoa avoimen tieteen tekemistä ja siitä kertomista tarvitaan päivittäin. Verkostojen avulla tulevaisuuden haasteetkin ovat voitettavissa. Hän totesikin lopuksi, että vain toiminnan kautta maailma voi asteittain muuttua tietämyksen lisääntyessä alasta riippumatta.

Tomi Kinnusen avoimia tutkimusjulkaisuja listattuna UEF eRepossa
ja avointa tutkimusdataa.

Onnea Tomi!

Markku Hauta-Kasari (laitosjohtaja, professori | Head of the School of Computing, professor), Tomi Kinnunen (apulaisprofessori | Associate professor) & Jarmo Saarti (kirjastonjohtaja | Library director). Kuva | Photo: Taina Sahlman

In English

Library awarded associate professor Tomi Kinnunen from the School of Computing the contributor for open science and open access for this year 2018. This award is now given for the third time in a row.

Associate professor Tomi Kinnunen works with speech technology and speaker recognition, and this field of research produces data which is useful for many.

In speech technology research massive large quantities of speech data are commonly collected and used. Adopting a common data not only gathers the researchers in a specific research problem “to the same table”, but is necessary both in developing new machine learning techniques for next-generation computer systems; and in comparing such techniques on comparable footings. This was by no means self-evident in the early decades of the field when every researcher would collect their self-collected, small and poorly documented datasets. Nowadays, speech technology is one of the most organised fields in its adoption of large and carefully documented public data resources.

In modern computer science and machine learning, open datasets, open source code and detailed documentation are of key importance to the technological progress. Tomi Kinnunen has risen awareness of good practices to document the metadata.  By ensuring that the metadata of the datasets is made widely available enables the interesting datasets to be located from the endless sea of information.

Spending time abroad opens up new forms of co-operation. In Kinnunen’s work the international touch is undeniable and he does remarkably wide international research. Recently he visited in Japan to advance publishing a new large speech dataset that will be released in December 2018.

Library director Jarmo Saarti stated that genuine daily actions of open science and telling about it are important. With networks the challenges of future can be resolved. Only through action the world can gradually change as the knowledge increases regardless of the discipline, Saarti finished.

The open publications of Tomi Kinnunen in UEF eRepository and open research data.

Congratulations Tomi!

Taina Sahlman, tietopalveluneuvoja | information services advisor
Verkko- ja julkaisupalvelut | Library IT- and publishing services

Anne Karhapää, tietoasiantuntija | information specialist
Opetus- ja tietopalvelut | Training and information services

Käännöksessä ja tekstissä mukana apulaisprofessori Tomi Kinnunen | Written and translated in cooperation with associate professor Tomi Kinnunen

 

Ajankohtaista tutkimusdatan hallinnasta ja avaamisesta | Current issues in research data management and sharing

(Please, scroll down to read in English.)

UEFin kirjasto ja tietotekniikkapalvelut järjestivät Tutkimusdatan hallinta ja avaaminen –seminaarin Kuopion kampuksella 4.10.2018 . Päivän ohjelmassa kuultiin UEFin omien tutkimusdatapalvelujen esittelyä, kansallisten palvelujen esittelyä ja tutkijoiden puheenvuoroja.

UEF tietotekniikkapalvelut tarjoaa tutkijoille tutkimuksen IT-palveluja yhteistyössä CSC Tieteen tietotekniikan keskuksen kanssa. Palveluihin kuuluu muun muassa tutkimuksen aikainen datan säilytys. Datan säilytyspalvelu kannattaa valita sen mukaan millaisen suojaustason aineistosta on kysymys. Suojaustasojen tarkemmat kuvaukset löytyvät Heimosta (vain UEFilaisille). Pääasialliset tallennuspaikat ovat Microsoft O365-ympäristön OneDrive for Business sekä ryhmille tarkoitetut Teams-työtilat. Korkean suojaustason aineistot voi tallentaa tutkimuksen levytilaan yliopiston oman konesalin uumeniin. Lisätietoa on saatavilla Heimosta. Tutkimuksen IT-palveluita voi tilata asiointipalvelusta Tutkimuksen palvelut -otsikon alta ja koulutuksia järjestetään pyynnöstä tarpeen mukaan.

Kirjasto tarjoaa monipuolisesti tutkimukseen tukea. Tutkimusdatanhallinnan suunnitteluun ja toteutukseen löytyy kattavasti tietoa kirjaston tutkimuksen tuen verkkosivuilta. Tutkimusdatan avaamiseen löytyy tietoa Open UEF -sivustolta. Tutkimusdatanhallintaan liittyviä kysymyksiä voi lähettää opendata(at)uef.fi osoitteeseen, johon tutkija voi myös lähettää oman aineistonhallintasuunnitelman kommentoitavaksi. Kirjaston UEF eRepo palvelu kokoaa yhteen metatietoja Itä-Suomen yliopiston tutkijoiden tuottamasta tutkimusdatasta. Kirjasto tarjoaa myös koulutuksia, esimerkiksi aineistonhallintatyöpajoja lukuvuosittain molemmilla kampuksilla ja verkossa.

Tietosuojalaki on tuonut täsmennyksiä myös tutkimusaineistojen käsittelyyn. Tietosuojavastaava Helena Eronen kertoi tietosuojan huomioimisesta henkilötietoja sisältävän tutkimusaineiston käsittelyssä. UEF ohjeita aiheeseen koostetaan tietosuoja -sivustolle.

Päivän tärkeintä antia olivat tutkijoiden ja opettajien puheenvuorot. Apulaisprofessori Tomi Kinnunen tietojenkäsittelytieteen laitokselta kertoi tutkijan näkökulmaa tutkimusdatan avaamiseen. Viesti oli selvä, tutkimusdatan avaaminen edistää sekä tiedettä että tutkijan työtä ja uraa, mutta tällä hetkellä avaamiseen liittyvät käytännöt ovat tutkijoille liian hankalia ja työllistäviä. Tarvitaan selkeät ohjeet ja käytännöt. Tomi totesi tutkijoille, että olkaa aktiivisia ja pitäkää ääntä tutkimusdatastanne. Yliopistonlehtori Marja Alastalo yhteiskuntatieteiden laitokselta kertoi omassa esityksessään avattujen aineistojen käytöstä opetuksessa ja oppimisessa, ja totesi myös, että usein aineistojen avaaminen on tutkijalle hankalaa. Aineistojen avaaminen jatkokäyttöön vaatii resursseja eli aikaa, rahaa ja osaamista. Monien paljon käsittelyä, kuten anonymisointia vaativien aineistojen kohdalla resursseja ei ole tällä hetkellä riittävästi. Avattujen tutkimusaineistojen käytöllä opetuksessa on monia hyötyjä; se mahdollistaa opiskelijoille tuntuman oikeaan tutkimukseen ja keskittymisen analyysimenetelmien harjoitteluun. Avatut aineistot siis edistävät paitsi tutkimusta, myös oppimista.

Professori Markku Keinänen ympäristö- ja biotieteiden laitokselta esitteli Sm4rtLab-virtuaalilaboratoriokonseptin soveltamista kasvien automatisoitua kasvatusta ja monitorointia hyödyntävässä oppimisympäristössä. Sm4rtLab-konseptia ja siihen liittyviä IoT (Internet of Things) -palveluja voidaan hyödyntää mielikuvituksellisen monipuolisesti osana opetusta ja tutkimusta.

Tietoarkisto ja CSC tarjoavat kansallisesti palveluja tutkimusdatan avaamiseen ja hallintaan. Hannele Keckman-Koivuniemi esitteli Tietoarkiston palveluja. Aineistoportaali Aila arkistoi ja tarjoaa jatkokäyttöön tutkimusaineistoja. Tietoarkisto tarjoaa palvelua ja laadukasta materiaalia tutkimusaineistojen hallintaan, kuten aineistonhallintakäsikirjan. Anssi Kainulainen kertoi seminaarissa CSC:n tutkimusdatapalveluista. Fairdata-palvelut ovat yliopiston tutkijoille käytettävissä olevia palveluja tutkimusdatan säilytykseen, kuvailuun ja hakemiseen. Jussi Enkovaara kertoi CSC:n tieteellisen laskennan palveluista.

Useilla rintamilla tehdään työtä avoimen tieteen ja avoimen tutkimusdatan edistämiseksi, niin yliopistotason työryhmissä, kuin kansallisissa ja kansainvälisissä yhteistyöryhmissä. Seminaaripäivän esitykset ja syntynyt keskustelu olivat hyvä katsaus tämän hetken tilanteeseen, ja työhön jota on vielä tehtävänä.

In English

UEF Library and IT services arranged a Research data management and sharing seminar at Kuopio campus 4.10.2018. The program included presentations about UEF research data services, national services and views from researchers.

UEF IT services provide IT services for researchers together with CSC. Services include among others data storing during the research. The content of the data and the protection level it requires determines where it can be stored. More information in Heimo (only for UEFians).  The main storage services are Microsoft O365 OneDrive for Business and for groups Teams. High protection level data can be stored to university’s own server. More information in Heimo. Research IT services can be ordered in UEF e-Services and training is arranged on request.

Library offers widely research support services. Research support web pages offer information for research data management.  Open UEF web pages give information about sharing the research data. Questions about research data management can be sent  to opendata(at)uef.fi. Researchers can also sent data management plans for commentry. UEF eRepo gathers the metadata of the research data from the researchers of the University of Eastern Finland. Library also offers training.

The experiences from researchers and teachers were the most important offering of the seminar. Tomi Voutilainen and Marja Alastalo shared their experiences of data sharing and reusing the research data for research and teaching. Open research data advances science and researcher’s work and career. Also using open research data in teaching has several benefits as the students get to work with real research data. However, opening the data is often difficult because there are no straightforward guidelines and practices. It also requires resources: time, money, and expertise.

Markku Keinänen introduced how Sm4rtLab virtual laboratory concept can be used in creative ways in teaching and research.

Data Protection Officer Helena Eronen talked about data protection in scientific research. UEF guidelines can be found here.

The Finnish Social Science Data Archive (FSD)  and CSC Faidata services offer national services for research data management and sharing. CSC also offers computing services.

The presentations and conversations in seminar were a good overview on open science and open data, and to the work we still need to do to promote open data.

Anne Karhapää, tietoasiantuntija | information specialist
Opetus- ja tietopalvelut | Training and information services

UEF eRepo avoimien aineistojen palvelu laajeni myös tutkimusdataan | UEF eRepo, the open access materials service, has now been extended to include research data

UEF eRepository on Itä-Suomen yliopiston avoimien tutkimusaineistojen palvelu, joka sisältää rinnakkaistallennettuja tieteellisiä artikkeleita ja tutkimusaineistojen metatietoja. Keväällä 2018 julkaistiin eRepon uutena aineistotyyppinä tutkimusdataosio, joka kokoaa yhteen tiedot UEFin tutkijoiden tuottamasta tutkimusdatasta. UEF eRepo ei sisällä itse tutkimusdataa, vaan se kerää kuvailevaa tietoa eli metadataa tutkimusdatasta. Avoimiin aineistoihin löytyy eReposta linkki, jonka kautta myös avattu data on saatavissa.

UEF eRepository https://erepo.uef.fi/

 

UEF eRepo tutkimusdata edistää avointa tiedettä lisäämällä tutkimusaineistojen näkyvyyttä ja saatavuutta.  eRepo haravoi tietoja tutkimusdatasta useasta data-arkistosta, ja kokoaa yhteen eri palveluissa olevaa tietoa, mikä helpottaa tutkijaa ja yliopistoa, kun kaikki tiedot voidaan koota yhteen paikkaan saataville.  Tällä hetkellä haravoitavia datapalveluita ovat Etsin, Zenodo ja EUDAT.

UEF eRepo haravoi tietoja tutkimusdatasta useasta eri palvelusta, ja uusia UEF tutkijoiden käyttämiä palveluja on mahdollista lisätä haravointiin.

Tutkimusdatan tallentamiseen on käytettävissä useita luotettavia kansallisia ja kansainvälisiä tutkijoille maksuttomia palveluita. Tutkija valitsee omalle tutkimusdatalle ja tieteenalalle sopivan data-arkiston, jonne tallentaa tutkimusdatan avoimesti saataville. Tutkimusaineistojen hakupalvelu Etsintä suositellaan kaikissa tapauksissa metadatan tallentamiseen. Etsin on opetus- ja kulttuuriministeriön tarjoama palvelu suomalaisen tutkimusjärjestelmän toimijoille. Palveluun voi tallentaa metatietoja myös aineistoista, joita ei voida suoraan avata jatkokäyttöön juridisista tai eettisitä syistä johtuen. Aineiston julkiset kuvailutiedot lisäävät tietoa olemassa olevista aineistoista, ja voivat poikia esimerkiksi uusia yhteistyömahdollisuuksia tutkijoille, vaikka itse aineistoa ei voida avata.

Esimerkiksi Tietoarkiston Aila ja Kielipankki ovat tutkimusdatapalveluja, jonne tutkija voi tallentaa tutkimusaineistoja, ja avata niitä jatkokäyttöä varten. Palveluista saa myös asiantuntija-apua aineiston avaamiseen liittyviin kysymyksiin, kuten anonymisointiin. Tietoarkistoon ja Kielipankkiin tallennetuista UEF tutkijoiden aineistoista tiedot siirtyvät automaattisesti Etsimeen, ja sieltä eRepoon. Kansainvälisistä data-arkistoista UEF eRepoon haravoidaan Zenodossa ja Eudatissa sijaitsevat UEF tutkijoiden aineistot. Tietojen automaattisen siirron onnistumiseksi on tärkeää, että Itä-Suomen yliopisto mainitaan metatiedoissa. Affiliaation kirjaamiseen suosittelemme käytettävän ”University of Eastern Finland”. Lisää datapalveluja löytyy Open UEF -sivustolta.

Tutkija on paras, ja usein ainut keräämänsä aineiston asiantuntija, joten on tärkeää, että tutkija itse tuottaa aineistosta kuvailutietoa koko tutkimusprosessin ajan. Kirjaston asiantuntijoilta saa tukea ja koulutusta tutkimusdatan hallintaan, avaamiseen, kuvailuun sekä metadatan tuottamiseen. Voit lähettää kaikki tutkimusdatan hallintaan, kuten aineiston avaamiseen tai aineistonhallintasuunnitelman kirjoittamiseen liittyvät kysymykset osoitteeseen opendata(at) uef.fi. Kirjaston Tutkimuksen tuen sivuilta löytyy lisää tietoa tutkimusdatan hallinnasta.

In English

UEF eRepository, the open access materials repository of the University of Eastern Finland, contains self-archived versions of academic articles and metadata of research data made available by our researchers. In spring 2018 research data as a new resource type was added to UEF eRepo. It gathers the metadata of the research data of UEF researchers. The datasets are not deposited into UEF eRepo because it contains only the metadata, the description of the research datasets. In case the data is openly accessible in some data repository, there is a link to it in UEF eRepo.

The metadata of research data in UEF eRepo research data promotes open science by increasing the visibility and accessibility of research data. UEF eRepo harvests the scattered metadata of research data from several different data services. It benefits the researcher and university when all that metadata can be found in one place. At the moment, automatic transfer into UEF eRepo is possible from Etsin, Zenodo and EUDAT.

There are several reliable national and international data repositories that researchers can use to deposit their research data for free. The researcher can choose the repository that best suits the data and the discipline. It is recommended that the metadata is always deposited at least into Etsin, the research data finder. Etsin is a service provided by the Ministry of Education and Culture to actors in the Finnish research system. In Etsin, researchers can publish metadata also from data that cannot be opened due to the juridical or ethical reasons. Open metadata increases the awareness of the existing data and can lead, for example, to new collaboration possibilities for researchers, even if the data cannot be opened.

FSD Aila and the Language Bank of Finland are national data services where the researcher can deposit and open datasets. In addition, they provide expert guidance on questions related to opening research data such as data anonymisation. From FSD Aila and the Language Bank of Finland, the metadata of UEF researcher’s data will automatically be transffered into Etsin and from there into UEF eRepo.  From Zenodo and EUDAT, of the international data repositories, the metadata of UEF researcher’s data is automatically transferred into UEF eRepo. In order that the automatic information transfer succeeds, it is important that the university is mentioned in the metadata correctly. It is recommended to use “University of Eastern Finland” for affiliation. You can find more information about different data services information about the data services from Open UEF web pages.

The researcher is the best and often the only expert of the collected research data. Therefore, it is important that the reseachers themselves describe the data throughout the research process. UEF Library’s information specialists give guidance and training to research data management, opening the data, describing and producing the metadata of research data. If you have any questions about research data management such as how to open the data or write data management plan, you can send them to opendata (at) uef.fi. You can find more information on research data management from UEF Library’s Research support webpages.

Anne Karhapää tietoasiantuntija | information specialist
Opetus- ja tietopalvelut | Training and information services