3. Tutkimusaineiston kuvailu (dokumentointi, metadata)

Tutkimusaineiston huolellinen kuvailu on ensiarvoisen tärkeää tutkimuksen alusta asti. Se turvaa aineiston ymmärrettävyyden sekä itselle että muille, vähentää väärän tulkinnan riskiä ja edistää merkittävästi löydettävyyttä ja jatkokäyttöä.Ilman asianmukaista kuvailua tutkimusaineisto on vain kokoelma yksittäisiä tiedostoja, numeroita ja merkkejä, ja sen käyttö ja uudelleenkäyttö voi olla mahdotonta. Kuvailuun panostaminen projektin aikana säästää myös aikaa tutkimusaineistojen julkaisuhetkellä.

On hyvä muistaa, että vaikka itse tutkimusaineistoja ei jostain syystä voida avata, metatietojen julkaisemista suositellaan periaatteessa aina tutkimuksen näkyvyyden lisäämiseksi.

Pohdittavaksi

  • Mitä dokumentaatio tarkoittaa omalla tutkimusalallasi?
  • Miten dokumentaatio näkyy omassa aineistossasi?
  • Millaista metadataa tarvitset tutkimusprojektisi aikana?
  • Miten kuvailisit aineistosi perustiedot README-tiedostona?

Katso video

Metadata on keskeistä aineiston löydettävyydelle: The Elements of FAIR – Findable, CSC (8:49).

Lyhyesti sanottuna

hyvä kuvailu sisältää tiivistä tietoa esimerkiksi

  • aineistonkeruun kontekstista (esim. tutkimusprojektin tavoitteet, tiedot tutkimuksesta, jota varten aineisto on kerätty),
  • aineistonkeruun menetelmistä (esim. näytteenotto/otanta, keruuprosessi, käytetyt laitteet ja ohjelmistot)
  • tiedostojen rakenteesta
  • laadunvarmistusmenetelmistä
  • versionhallinnasta
  • pääsy- ja käyttöehdoista tai aineistojen luottamuksellisuudesta
  • muuttujista ja tietueista (arvojen nimet, merkinnät, kuvaukset),
  • käytetyistä koodeista ja luokitusjärjestelmistä (selitys tai määritelmä)
  • käytetyistä erikoistermeistä tai lyhenteistä
  • puuttuvista arvoista (koodit, syyt).

(2023-08)

Seuraavaksi: 4. Tutkimusaineiston tallennus tutkimuksen aikana ja sen jälkeen