Tutkimusdatan avaaminen

Tutkimusdatan avaaminen

Puisista kirjaimista teksti SHARE.
CC BY airpix.

Kuten jo tiedät, tutkimusaineistot ovat arvokas resurssi. Avoimen tieteen myötä yhä useammin tieteellisten artikkeleiden taustalla olevien tutkimusaineistojen avaamista edellytetään tutkijoilta. Tutkimusrahoittajat asettavat tutkimusaineistojen avaamisen yhä korkeammalle prioriteeteissään. Tämä näkyy aineistojen avaamisen politiikoissa ja vaatimuksissa aineistonhallintasuunnitelmien tekemiseen. Siksi aineistojen avaamista uudelleenkäytettäväksi, kuten uusiin tieteellisiin tutkimuksiin tai opetustarkoituksiin, suositellaan aina, kun mahdollista.

Tutkimusdata voidaan jakaa avoimesti:

 • Tallentamalla ne kansainväliseen / kansalliseen, yleiseen tai tieteenalakohtaiseen datarepositorioon.
 • Tallentamalla ne organisaation datarepositorioon. Huomaathan, että tutkijat eivät voi talletaa tutkimusdataa suoraan UEF eRepoon. Sen sijaan Itä-Suomen yliopiston tutkijoiden yleisimpiin datarepositorioihin tallentamien datojen metatiedot haravoidaan automaattisesti UEF eRepoon.
 • Julkaisemalla ne avoimen datan lehdessä.

Tutkimusaineistojen avaaminen muiden hyödynnettäviksi voi muun muassa:

 • Lisätä aineistojen uudelleenkäyttöä.
 • Edistää tutkimusta ja innovaatioita.
 • Parantaa tutkimuksen luotettavuutta.
 • Edistää tutkimusyhteistyötä.
 • Säästä resursseja, kun aineistonkeruussa säästetään aikaa ja rahaa, jos sopivaa materiaalia on jo saatavilla.

Aineistojen avaaminen tapahtuu tyypillisesti projektin päätyttyä, mutta on erittäin tärkeää, että suunnittelet mahdollisen avaamisen jo tutkimusprojektin alussa. Useimmiten aineistoja ei voi avata ilman huolellista suunnittelua ennen aineistonkeruun aloittamista.

Aineistosta riippuen dataa voidaan avata muiden hyödynnettäväksi eriasteisesti data-arkistojen ja -repositorioiden kautta. Eettiset tai juridiset seikat voivat rajoittaa aineistojen jakamista, esimerkiksi arkaluontoiset tiedot, luottamukselliset tiedot tai liikesalaisuudet rajoittavat aineiston avaamista. Jos tutkimusaineistosi sisältää henkilötietoja, kiinnitä huomiota Aineiston kerääminen ja käyttäminen -osiossa esitettyihin tietosuojaohjeisiin. Jos aineistoasi ei voi jakaa, perustele tämä aineistonhallintasuunnitelmassa. Mikäli et voi julkaista dataasi (luottamuksellisuuden, sopimusten tai muiden seikkojen vuoksi), voit kuitenkin yleensä julkaista sen kuvailutiedot eli metadatan.

Kun suunnittelet aineiston jakamista, käy läpi seuraavat oppimateriaalit:

Datarepositoriot

On olemassa lukuisia datarepositorioita, sekä yleisiä että tiettyyn tieteenalaan tai teemaan keskittyviä. Useat datarepositoriot ovat tutkijoille ilmaisia, mutta jotkin repositoriot voivat periä maksun datan ylläpidosta. Tutkija voi valita datallensa ja tieteenalallensa parhaiten soveltuvan repositorion. Monilla kustantajilla on myös omat suosituksensa datarepositorioista, joten tarkista ne, kun julkaiset artikkeliasi ja dataasi.

Tutkimusdatarepositorioiden rekisteriä, Registry of Research Data Repositories (re3data.org) -palvelua, voidaan käyttää sopivan datarepositorion etsimiseen. Siellä voit selata esimerkiksi aiheen mukaan.

Tutustu myös Tutkimusdatapalveluihin UEF:n Avoimen tieteen sivuilla.

Jos dataa ei voi avata, on suositeltavaa, että metadata tallennetaan Etsin-palveluun. Etsin on suomalainen tutkimusdatan metadatapalvelu. Se sisältää tietoa kansallisten Fairdata-palveluiden, Kielipankin, Yhteiskuntatieteellisen tietoarkiston ja Suomen ympäristökeskuksen aineistoista ja metatiedoista, ja lisäksi Etsimeen suositellaan myös muissa datarepositorioissa olevien datojen metatietojen lisäämistä. UEF eRepository kerää UEF:n tutkijoiden tutkimusdatojen metatietoja useista eri datapalveluista, kuten Etsimestä. Aineistot voidaan kuvailla Etsimessä Qvain-palvelun avulla (Etsin -> Lisää/muokkaa aineistoja). Metatietojen julkaiseminen tuo datalle ja tutkimusprojektille näkyvyyttä myös silloin, kun varsinaista dataa ei voi jostain syystä avata.

Pohdi: Voitko jakaa tutkimusaineistosi tai osan siitä? Missä avaisit datasi? Tarkista tarvittaessa rahoittajan ja tieteenalan mahdolliset suositukset.

Lisenssit

Avattavat aineistot tulee lisensoida. Lisensoimalla aineistonsa tutkijat voivat määritellä aineiston avoimuuden ja käyttöoikeudet. Creative Commons tarjoaa ilmaisia, helppokäyttöisiä tekijänoikeuslisenssejä, joilla saat helposti ja standardoidusti annettua luvan jakaa ja käyttää aineistojasi valitsemillasi ehdoilla.

 • Avoimille tutkimustiedoille suositellaan CC BY 4.0- tai CC0-lisenssiä.
 • Tietokoneohjelmistoille suositellaan MIT-lisenssiä.
 • Tutkimusaineistojen metatiedot suositellaan lisensoitavaksi CC0-lisenssillä.

Katso video (4:29): Näin lisäät CC-lisenssin aineistoosi.

Creative Commons lisenssien kuvakkeet
CC-lisenssien kuvakkeet. Lisenssien kuvaukset löytyvät napsauttamalla kuvaa.

(7/2022 HJ)