Avoimen tieteen edistäjä 2018 | Open Science Award 2018 winner

(Please, scroll down to read in English.)

Kirjasto myönsi järjestyksessään kolmannen avoimen tieteen edistäjän kunniakirjan tietojenkäsittelytieteen laitoksen apulaisprofessori Tomi Kinnuselle. Hänen puheteknologiaan, erityisesti puhujantunnistukseen keskittyvä tutkimustyönsä tuottaa dataa, jonka avaamisessa Kinnunen on erityisen ansioitunut.

Tomi Kinnunen arvelee oman alansa tutkijoiden olevan melko kiitollisia avatuista tutkimusaineistoista, eikä valtavaa vastarintaa ole ilmennyt – pikemminkin päinvastoin: puheteknologiassa suurten data-aineistojen rooli on aina ollut avainasemassa. Yhteisten datajoukkojen käyttö paitsi mahdollistaa menetelmäkehityksen tuo myös alan tutkijat lähemmäksi toisiaan. Myös Kinnusen lähijohtaja, tietojenkäsittelytieteen laitosjohtaja ja professori Markku Hauta-Kasari arvelee suhtautumisen avoimeen tieteeseen olevan mutkatonta. Onhan tietojenkäsittelytieteen tutkimusalalla perinteisesti usein avoin lähdekoodi ja dokumentointi keskeisessä roolissa.

Oikeilla tavoilla avattu tutkimusdata on nuorella alalla vakiinnuttanut nopeasti jalansijansa, ja herättää keskustelua esimerkiksi kansainvälisissä konferensseissa. Kinnusen viimeaikainen tutkimus on keskittynyt mm. huijaushyökkäysten (spoofing attack) tunnistamiseen puheesta. Esimerkiksi puhesynteesin laatu paranee vuosi vuodelta ja sillä voidaan jo nyt periaatteessa ”laittaa sanoja toisen suuhun”. Biometrisen tunnistautumisen ja yksityisyysasioiden ollessa vahvasti tapetilla tärkeä tutkimuskohde onkin erotella puhuja toisesta, ja erottaa keinotekoinen puhe oikeasta puheesta – ja tämän tutkimiseksi tarvitaan standardoitua dataa. Kinnusen (yhdessä kansainvälisten partnereiden kanssa) avaamat ASVspoof-aineistot ovat olleet vakiinnuttamassa jalansijaa tälle kasvavalle tutkimusalalle. Laitoksen johtaja Hauta-Kasari painottikin puheteknologian parissa työskentelevien yhteistä innostusta datasta, josta riittää iloa ja hyötyä laajemmallekin yhteisölle. Kun dataa on saatavilla, siitä saadaan paljon irti.

Alalla dokumentointi on isossa roolissa, ja myös Tomi Kinnunen on kuvaillut metatietoja aktiivisesti ja myös puhunut tästä aiheesta eri foorumeilla. Löydettävyys on avainasemassa, kun uudenlaiset dataryppäät valtaavat alaa internetin uumenista. Tähän auttaa vain ja ainoastaan kunnollinen tiedon esittäminen vakiintunein menetelmin. Näin se on löydettävissä ajasta ja maantieteellisestä sijainnista riippumatta. Kinnusen ansioihin onkin luettavissa erityisen kansainvälisen tutkimuksen tekeminen. Hän liikkuu paljon ja verkostoituu aina Euroopasta Aasiaan, ja olikin juuri pidemmällä tutkimusvierailulla Japanissa. Tällä matkalla osittain suunniteltu uusi data-aineisto tullaan avaamaan verkkoon lähiviikkoina.
Kirjaston johtaja Jarmo Saarti totesi, että aitoa avoimen tieteen tekemistä ja siitä kertomista tarvitaan päivittäin. Verkostojen avulla tulevaisuuden haasteetkin ovat voitettavissa. Hän totesikin lopuksi, että vain toiminnan kautta maailma voi asteittain muuttua tietämyksen lisääntyessä alasta riippumatta.

Tomi Kinnusen avoimia tutkimusjulkaisuja listattuna UEF eRepossa
ja avointa tutkimusdataa.

Onnea Tomi!

Markku Hauta-Kasari (laitosjohtaja, professori | Head of the School of Computing, professor), Tomi Kinnunen (apulaisprofessori | Associate professor) & Jarmo Saarti (kirjastonjohtaja | Library director). Kuva | Photo: Taina Sahlman

In English

Library awarded associate professor Tomi Kinnunen from the School of Computing the contributor for open science and open access for this year 2018. This award is now given for the third time in a row.

Associate professor Tomi Kinnunen works with speech technology and speaker recognition, and this field of research produces data which is useful for many.

In speech technology research massive large quantities of speech data are commonly collected and used. Adopting a common data not only gathers the researchers in a specific research problem “to the same table”, but is necessary both in developing new machine learning techniques for next-generation computer systems; and in comparing such techniques on comparable footings. This was by no means self-evident in the early decades of the field when every researcher would collect their self-collected, small and poorly documented datasets. Nowadays, speech technology is one of the most organised fields in its adoption of large and carefully documented public data resources.

In modern computer science and machine learning, open datasets, open source code and detailed documentation are of key importance to the technological progress. Tomi Kinnunen has risen awareness of good practices to document the metadata.  By ensuring that the metadata of the datasets is made widely available enables the interesting datasets to be located from the endless sea of information.

Spending time abroad opens up new forms of co-operation. In Kinnunen’s work the international touch is undeniable and he does remarkably wide international research. Recently he visited in Japan to advance publishing a new large speech dataset that will be released in December 2018.

Library director Jarmo Saarti stated that genuine daily actions of open science and telling about it are important. With networks the challenges of future can be resolved. Only through action the world can gradually change as the knowledge increases regardless of the discipline, Saarti finished.

The open publications of Tomi Kinnunen in UEF eRepository and open research data.

Congratulations Tomi!

Taina Sahlman, tietopalveluneuvoja | information services advisor
Verkko- ja julkaisupalvelut | Library IT- and publishing services

Anne Karhapää, tietoasiantuntija | information specialist
Opetus- ja tietopalvelut | Training and information services

Käännöksessä ja tekstissä mukana apulaisprofessori Tomi Kinnunen | Written and translated in cooperation with associate professor Tomi Kinnunen

 

Koha-kirjastojärjestelmän kehitys maailmalla ja Suomessa

Koha-seminaari 21.-22.5.2015
Koha-seminaari 21.-22.5.2015 Rebekka Pilppula

Joensuun seutukirjasto järjesti Suomen ensimmäinen Koha-kirjastojärjestelmäseminaarin Joensuussa 21.-22.5.2015. Avoimen lähdekoodin Koha-järjestelmä otettiin tuotantokäyttöön seutukirjastossa kesäkuussa 2014. Osallistuimme seminaariin kiinnostuneina kuunteluoppilaina, koska tieteellisissä kirjastoissa tutkitaan eri kirjastojärjestelmävaihtoehtoja nykyisen järjestelmän uusimiseksi lähivuosina. Koha on muitten rinnalla yksi varteenotettava vaihtoehto järjestää ainakin painetun aineiston hankinta, metatiedon tuottaminen ja käytön perustoiminnot joko kokonaan tai osittain. Itä-Suomen yliopiston kirjastossa pohditaan muitten tieteellisten kirjastojen tavoin, miten palvelut pystyttäisiin tulevaisuudessa järjestämään kustannustehokkaasti mahdollisimman joustavalla ja modernilla järjestelmäkokonaisuudella. Kirjastojärjestelmä on yksi tärkeä osa tässä kokonaisuudessa.

Seminaarin pääpuhuja, ranskalainen Paul Poulain, kertoi Koha-järjestelmän osin vaiherikkaasta ja dramaattisesta kehityksestä nykyiseen versioonsa. Avoimen lähdekoodin järjestelmiä tuottavat aktiiviset kehittäjäyhteisöt, joitten toiminta perustuu suurelta osin vapaaehtoistyöhön. Päätöksentekoa varten kehittäjäyhteisöllä on kuitenkin oltava jonkinlainen järjestelmä ja avainhenkilöt, jotka vastaavat tuotteen versiohallinnasta ja kehitystyön organisoinnista. Koha-kehittäjäyhteisö oli kriisissä v. 2008-2009, jolloin ohjelmisto oli joutua kokonaan kaupallisten yritysten haltuun ja lähdekoodi ei olisi ollut enää avointa. Vuonna 2010 osa kehittäjäyhteisöstä päätti irtautua kaikista kaupallisista yrityksistä ja edetä avoimen lähdekoodin kehittäjäyhteisön alkuperäisten periaatteitten mukaisesti. Sen vuoksi markkinoilla on nyt kaksi eri Koha-tuotetta, kehittäjäyhteisön hallinnoima aidosti avoimen lähdekoodin versio ja kaupallisen yrityksen hallinnoima suljetun lähdekoodin versio. Suomessa käytetään aidosti avoimen lähdekoodin ohjelmaversiota, jonka kehitystyön tulevaisuus näyttää tällä hetkellä vakaalta ja hyvin organisoidulta.

Muut ulkomaalaiset puhujat esittelivät Koha-järjestelmän nykyisiä ja tulevia käyttötapoja omissa organisaatioissaan. Sonia Bouis kertoi, kuinka Koha-järjestelmän käyttöönotto suunniteltiin ja toteutettiin Jean Moulin Lyon 3 –yliopistossa Ranskan Lyonissa. Koha on ollut heillä nyt tuotantokäytössä muutaman vuoden ja siitä käytetään lähes kaikkia olemassa olevia toimintoja. He osallistuvat nyt myös aktiivisesti kehittäjäyhteisön toimintaan. Tukholman yliopistossa (Inga Nyman Ambrosiani) ja Oslon yleisessä kirjastossa (Arve Søreide) on tehty päätökset ottaa Koha osaksi suurempaa järjestelmäkokonaisuutta. Kohaa käytetään palvelujen tuottamiseen vain soveltuvin osin ja osa myös Kohassa olemassa olevista toiminnoista hoidetaan muitten, kirjastojen tarpeita paremmin vastaavien järjestelmien avulla. Monet näistä järjestelmistä ovat olleet organisaatioissa käytössä pitkään ja osaa niistä käytetään kirjaston lisäksi muissa organisaation yksiköissä. Molemmat käyttöönottoprojektit ovat kesken, eikä kaikkia päätöksiä järjestelmäkokonaisuuden koostamisesta ole lopullisesti tehty. Mielenkiintoisimmalta kuulosti Oslon yleisen kirjaston suunnitelma rakentaa metadatan tuottamista varten Open Linked Data –pohjainen oma järjestelmä, josta kirjastojärjestelmän tarvitsema metadata muunnetaan MARC-formaattiin kirjastojärjestelmätoimintoja varten. Kirjaston palveluissa tullaan hyödyntämään tietovarannossa olevaa linkitettyä metatietoa monin eri tavoin, mm. aineistosuositusten tuottamiseen sekä saman teoksen eri ilmiasujen tietojen linkittämiseen ja esittämiseen.

Ari Mäkiranta
Ari Mäkiranta

Suomessa Koha-järjestelmää käyttää tällä hetkellä yksi suurempi organisaatio, Joensuun seutukirjaston koordinoima Vaara-kirjastot. Vuoden 2015 loppuun mennessä mukana ovat kaikki Pohjois-Karjalan yleiset kirjastot. Ari Mäkiranta kertoi Kohan käyttöönotosta, nykytilanteesta ja tulevaisuuden suunnitelmista seutukirjastossa. Toisena seminaaripäivänä järjestelmän ominaisuuksia esiteltiin lyhyesti ja osallistujilla oli mahdollisuus esittää konkreettisia kysymyksiä ohjelmiston toiminnasta. Joensuun seutukirjasto on mm. kehittänyt Kohaan osakohteitten käsittelyn, jota tarvitaan Suomessa sekä yleisissä että tieteellisissä kirjastoissa. Tulevaisuudessa kehittämiskohteita ovat mm. maksutoiminnot, lehtivarausten käsittely sekä Kohan integrointi kansallisiin palveluihin. Näitä ovat mm. Finna-tiedonhakuportaali, Melinda-metatietovaranto ja Asteri-auktoriteettitietokanta.

Viisi yleisten kirjastojen maakuntakirjastovetoista kimppaa ovat aloittaneet Opetus- ja kulttuuriministeriön tukeman Kohti Kohaa –hankkeen. Tavoitteena on Kohan käyttöönotto kaikissa näissä viidessä suuressa kimpassa ja samalla luoda Koha-kehitystyötä varten tarvittava päätöksenteko- ja hallinnointimalli. Tämänhetkinen suunnitelma on perustaa Koha-Suomi Oy, jonka puitteissa kehitystyötä ja ohjelmaversioitten hallintaa tullaan tekemään. Muutkin organisaatiot voivat myöhemmin liittyä mukaan Koha-Suomi Oy:n ja Koha-kehittäjäyhteisön toimintaan. Tällä hetkellä ei pystytä sanomaan, voisivatko kirjastot eri sektoreilta toimia saman yhtiön puitteissa, jos esim. tieteelliset kirjastot päättäisivät ottaa Koha-järjestelmän käyttöön. Kehittäjäyhteisön toiminta on kaikille avointa.

Mielenkiintoisen seminaarin esitykset tulevat videoina katsottaviksi Kirjastokaistalle.

 

Harri Kalinen

tietoasiantuntija, verkkoresurssipalvelut

 

Antti Laurila

tietojärjestelmäasiantuntija, verkkoresurssipalvelut