
Podatki imajo običajno daljšo življenjsko dobo kot projekt, v katerem so bili zbrani ali ustvarjeni.
Življenjski krog raziskovalnih podatkov prikazuje posamezne faze razvoja raziskovalnih podatkov, od začetne konceptualizacije raziskovalnega problema, identifikacije obstoječih podatkovnih virov, zbiranja raziskovalnih podatkov (primarnih in sekundarnih), obdelave in analize podatkov, objave raziskovalnih rezultatov in raziskovalnih podatkov v priporočenih repozitorijih, kjer bodo podatkovni strokovnjaki poskrbeli za dolgoročno dostopnost in uporabljivost podatkov.
Cilj je varno, dokumentirano in transparentno ravnanje s podatki ter omogočanje njihove ponovne uporabe. Končni rezultat skrbnega ravnanja z raziskovalnimi podatki je v podatkovnem središču dostopna podatkovna objava, ki jo drugi ob nadaljnji uporabi navajajo kot znanstveno referenco v svojih člankih in drugih publikacijah.
V nadaljevanju predstavljamo podrobneje vse faze življenjskega kroga podatkov in navajamo priporočila o ravnanju z raziskovalnimi podatki z namenom zagotavljanja kakovosti, trajnega skrbništva in uporabljivosti podatkov po zaključku projekta.
Arhivi CESSDA smo pripravili spletni učbenik o načrtovanju ravnanja z raziskovalnimi podatki Data Management Expert Guide (DMEG), ki ga priporočamo raziskovalcem in študentom pri pripravi na zbiranje raziskovalnih podatkov. Poglavja v učbeniku DMEG so v pomoč pri izpolnjevanju obrazca Načrt ravnanja z raziskovalnimi podatki konzorcija CESSDA, ki je prilagojen za družboslovje in primeren, kadar se načrtuje podatkovno objavo v katerem od arhivov družboslovnih podatkov znotraj konzorcija.
Poglavja v DMEG sledijo življenjskemu krogu podatkov:
0. NAČRTOVANJE
Že pri zasnovi raziskave moramo skrbno načrtovati njeno kakovost. Pri tem je v pomoč načrt ravnanja z raziskovalnimi podatki (NRRP). Namen NRRP je pred začetkom dela s podatki in v času obdelave podatkov ozaveščeno razmišljati o tem, kako pridobljene podatke urediti in kje jih objaviti, da bodo skladno z načeli FAIR dostopni in uporabljivi na dolgi rok za različne uporabnike.
Z načrtovanjem ravnanja s podatki predvidimo tipične korake v življenjskem krogu podatkov s ciljem:
- zagotoviti varnost občutljivih ali zaupnih podatkov,
- maksimizirati potencial uporabljivosti podatkov in
- podpreti njihovo dolgotrajno dostopnost.
Končni cilj načrtovanja ravnanja z raziskovalnimi podatki je podatkovna objava v priporočenem repozitoriju.
Primeri NRRP:
- NRRP obrazec lahko predpiše financer ali raziskovalna organizacija. Zato velja pred sprejemom odločitve glede izbora obrazca preveriti zahteve, določene v pogodbi o financiranju raziskave in/ali pravila raziskovalne organizacije.
- NRRP je “živ” dokument, ki se spreminja skupaj s potrebami projekta in njegovih udeležencev. Med projektom se NRRP posodablja, da se zagotovi sledenje spremembam skozi čas in da odraža trenutno stanje raziskovalnega projekta, zato mora biti na koncu projekta na voljo več verzij.
Arhivi družboslovnih podatkov iz konzorcija CESSDA smo pripravili vprašalnik DMP-checklist, ki sledi poglavjem iz učbenika DMEG.
- Vprašalnik DMP-checklist v angleški različici najdete na povezavi v formatih .pdf ali .docx.
- slovensko različico vprašalnika »Pripravite načrt ravnanja s podatki« najdete v formatih .pdf in .docx.
Vsebina je podrobneje predstavljena v Učbeniku DMEG – glej poglavje Plan.
I. ISKANJE
Pri snovanju raziskave identificiramo razpoložljive vire podatkov in z njimi povezana gradiva. Na primer vprašalniki, sintakse ipd.
Glavne aktivnosti te faze so:
- identifikacija ustreznih podatkovnih repozitorijev,
- iskanje primernih podatkov,
- vrednotenje podatkov,
- pridobitev dostopa do podatkov,
- preveritev pogojev uporabe podatkov.
Za več glej poglavje Discover.
II. ZBIRANJE & DOKUMENTIRANJE
V času trajanja projekta in po njegovem zaključku je treba zagotoviti sledljivost nastanka in sprememb različic raziskovalnih podatkov, tako da je raziskovalne korake razumejo tudi tisti, ki v raziskavi niso sodelovali . V ta namen mora raziskovalec že v času obdelave novih ali sekundarnih podatkov ustrezno organizirati in dokumentirati korake in obdelavo gradiv.
Ta faza obsega:
- izbor ustrezne metodologije,
- vzorčenje oz. izbor enot oz. udeležencev raziskave,
- vrste in formate podatkov,
- identifikacijo morebitnih etičnih in zakonskih omejitev,
- uporabo sekundarnih podatkov, če obstajajo,
- zbiranje podatkov: beleženje, opazovanje, merjenje,
- dokumentiranje postopkov dela v projektu in s podatki,
- priprava končnih verzij gradiv in metapodatkov.
Za več glej poglavje Organize & Document.
III. OBDELAVA
V tej fazi je treba podatke pripraviti za analizo in objavo. Ker bodo podatki v tej fazi lahko večkrat obdelani in preurejeni, morda bo pri obdelavi sodelovalo tudi več oseb, je pomembno poskrbeti za navodila in sledljivost dela, saj je s tem lažje zagotoviti verodostojnost.
Značilne aktivnosti faze obdelave podatkov in analize so:
- vnos podatkov, digitalizacija, prepis, prevod,
- preverjanje, potrjevanje, čiščenje, anonimizacija podatkov, kjer je to potrebno,
- izpeljava podatkov,
- opis in dokumentiranje podatkov,
- analiza podatkov,
- interpretacija podatkov,
- priprava raziskovalnih rezultatov.
Za več glej poglavje Process.
IV. HRAMBA
V tej fazi je treba poskrbeti za ustrezno hrambo podatkov, tj. da jih zaščitimo pred izgubo ali nepooblaščeno rabo. Načrtovanje hrambe terja posebno pozornost pri ravnanju z občutljivimi ali zaupnimi podatki.
Značilne aktivnosti te faze so:
- zagotoviti ustrezno mesto za hrambo podatkov,
- skrb za varnostne kopije,
- skrb za reguliran dostop do podatkov.
Za več glej poglavje Store.
V. ZAŠČITA
Od tega, kakšne podatke boste obdelovali, je odvisno, katero zakonodajo in etične standarde boste upoštevali.
Glavne aktivnosti te faze so:
- poznavanje in upoštevanje:
- Evropske uredbe o varstvu osebnih podatkov (GDPR),
- nacionalne zakonodaje (npr. ZVOP-, ZASP …),
- zahtev komisije za etiko,
- drugo, npr. dogovorjeno v projektu, z udeleženci raziskave.
V tej fazi aktivnosti določajo že prej pridobljena soglasja za udeležbo v raziskavi, npr. anonimizacija, določitev režima dostopa do podatkov za različne uporabnike in druge morebitne omejitve.
Za več glej poglavje Protect.
VI. OBJAVA
Odločitev o tem, kje bodo novonastali podatki objavljeni, je priporočeno sprejeti že pri načrtovanju raziskave. Na začetku velja preveriti pogoje izbranega repozitorija in se vnaprej uskladiti glede določenih zahtev za sprejem.
Za sprejem najboljše odločitve, je treba razmisliti o naslednjih vidikih:
- izbor podatkov glede na njihov potencial za nadaljnjo rabo,
- prednosti različnih ponudnikov podatkovnih storitev (splošni, institucionalni, področni podatkovni repozitoriji),
- dodatne možnosti promocije podatkovne objave (podatkovni članek, blog, predavanje).
Za več glej poglavje Archive & Publish.
Glavne aktivnosti te faze so:
- poznavanje in upoštevanje:
- Evropske uredbe o varstvu osebnih podatkov (GDPR),
- nacionalne zakonodaje (npr. ZVOP-, ZASP …),
- zahtev komisije za etiko,
- drugo, npr. dogovorjeno v projektu, z udeleženci raziskave.
V tej fazi aktivnosti določajo že prej pridobljena soglasja za udeležbo v raziskavi, npr. anonimizacija, določitev režima dostopa do podatkov za različne uporabnike in druge morebitne omejitve.
Za več glej poglavje Protect.
.
Vir vsebin in slik: CESSDA Training Team (2017 – 2022). CESSDA Data Management Expert Guide. Bergen, Norway: CESSDA ERIC. Retrieved from https://dmeg.cessda.eu/