Metadata – rakkauskirje tulevaisuudelle | Metadata – love letter for the future

(Please, scroll down to read in English.)

Hyvä tutkija!

Kirjoitamme Sinulle välittääksemme tärkeää sanomaa. Tämä ei ole roskaposti. Tämä on rakkauskirje, jonka viesti on lainattu Yleisradion Mikael Hindsbergiltä, ja se kuuluu näin: “Metadata on rakkauskirje tulevaisuudelle”. Kaunista, eikö vain?

Saatat ehkä kysyä, miten metadata ja rakkauskirje liittyvät toisiinsa? Entä tulevaisuus? Tulevaisuudesta emme tiedä, edes valistuneita arvauksia emme tässä heitä. Mutta juuri tulevaisuuden epävarmuuden vuoksi haluammekin muistuttaa tutkimuksen metadatasta, joka on olennainen osa tutkimusdatanhallintaa.

Metadata on siis tietoa tiedosta, dataa tutkimusdatasta. Tiesitkö, että on olemassa erilaisia metadatatyyppejä, kuten hallinnollinen metadata tai tekninen metadata? Valtaosa näihin tyyppeihin kuuluvasta metadatasta kertyy kuin huomaamatta erilaisten sähköisten järjestelmien ja välineiden avulla. Muitakin metadatan tyyppejä tai alalajeja on olemassa.  Erityisesti toivomme, että Sinua kiinnostaisi kuvaileva metadata, sillä sen rooli on ennen kaikkea parantaa tutkimusaineiston löydettävyyttä. Tässä kohtaa tutkimusaineiston huolella dokumentoitu metadata muuttuukin rakkauskirjeeksi tulevaisuudelle: tutkimusdata täytyy tehdä näkyväksi ja hakukelpoiseksi, jotta sen säilytettävyys, saavutettavuus ja jatkokäyttö mahdollistuisi.

Tutkimuksen metadatan tallennus tarkoittaa yksinkertaisimmillaan sitä, että aineistosta on tallennettu tekijän tiedot, tutkimusaineiston nimeke, aihe (mielellään myös asiasanat) ja tarkoitus, käyttöehdot sekä saatavuus- tai sijaintitiedot. Tutkimusaineiston metadatan voi tallentaa tiettyjen standardien ja formaattien mukaan, mutta tärkeintä on se, että metadataa on ylipäänsä kerätty ja tallennettu. Formaattien, standardien ja sanastojen etuna on muun muassa datan yhteneväisyys ja löydettävyys, mutta myös oman tutkimusalan ja siihen liittyvien termien näkyväksi tekeminen. Tutkimusaineisto puolestaan kannattaa mahdollisuuksien mukaan tallentaa data-arkistoon jatkolöydettävyyden vuoksi, jolloin aineisto saa esimerkiksi pysyvän tunnisteen.  Toisinaan tutkimukseen liittyy salassa pidettävää materiaalia, jonka vuoksi itse tutkimusta tai tutkimusaineistoa ei voi avata. Silloinkin kannattaa muistaa, että tutkimuksen metadataa voi aina avata. Suosittelemmekin metadatan tallennusta esimerkiksi Etsin-palveluun, jonne on mahdollista tallentaa metadataa kaikista tutkimusaineistoista.

Tutkimusaineisto on arvokasta paitsi tutkijalle, myös vastaanottajalle tai lukijalle. Annathan siis, arvoisa tutkija, tutkimuksellesi mahdollisuuden löytyä, säilyä pitkään ja antautua jatkokäyttöä varten kuvailemalla ja tallentamalla tutkimuksesi metadatan.

Ystävällisin terveisin,
Anne ja Katja

PS. Hyvin tallennettu metadata estää myös tutkimusaineiston väärinkäyttöä!

Dear researcher!

We are writing to you to convey an important message. This is not junk mail. This is a love letter and the title is a quote from Mikael Hindsberg at Yle (Finnish Broadcasting Company). He has said, ”Metadata is a love letter for the future”. Beautifully said, isn’t it?

You may wonder what metadata has to do with love letters. Or with the future, for that matter. We do not know the future and we are not going to make any educated guesses either. However, for the very reason that the future is uncertain, we want to remind you of metadata and the fact that it is an essential part of the research data management.

Metadata is information about information, data about research data. Did you know that there are different types of metadata, for example, administrative and technical metadata? Most of these types of metadata get collected almost unnoticed by different electronic systems and devices. Other types and subtypes of metadata exist, too. We hope that you would be especially interested in descriptive metadata because its role before anything is to improve the findability of research data. Thus, the meticulously documented metadata of the research data becomes a love letter for the future: research data must be made visible and searchable so that its preservability, accessibility and future usability can be ensured.

At its simplest, storing the metadata of a research means that the name of the research data, information on the author, subject (preferably also subject headings) and purpose, terms and conditions as well as availability and location information are stored. You can store the metadata of research data according to specific standards and formats but the most important thing is that the metadata is collected and stored in the first place. The benefit of using formats, standards and vocabularies is, amongst other things, the consistency and findability of data. In addition, they help to make your own field of research and its terms visible. If possible, the research data should be stored to a data repository or archive to ensure its future findability. When the data is stored to a data repository, it will receive, for example, a permanent identifier. Sometimes a research contains confidential material and therefore it or its research data cannot be opened. However, please remember that even then you can open some of the research’s metadata. Therefore, we recommend that you save the metadata, for example, to the data searching service Etsin where it is possible to save metadata from all types of research data.

Research data is valuable not only for the researcher but also for the recipient or reader. For this reason, dear researcher, please give your research a chance to be found, to be durable and to be surrendered for further use by describing and storing the metadata of your research.

Yours sincerely,
Anne and Katja

Anne Karhapää, tietoasiantuntija | information specialist
Opetus- ja tietopalvelut | Training and information services

Katja Hyvärinen, tietoasiantuntija | information specialist
Tietoaineistopalvelut | Collection services

Käännös | Translation: Suvi Tolvanen

Kuva | Photo: pixel2013, Pixabay