Nooit meer onderzoeksgegevens kwijt
Data worden steeds belangrijker in de wetenschap. Het college van bestuur wil dat alle onderzoekers op de Radboud Universiteit hun onderzoeksgegevens nu systematisch opslaan en beschikbaar stellen voor hergebruik: ze moeten aan beter Research Data Management gaan doen.
Onderzoekers produceren gigantische hoeveelheden data – en dat wordt elk jaar meer. Zo zijn hersenscans voor een enkel neuroimaging-onderzoek (met al gauw zo’n 30 deelnemers) een paar gigabyte groot – per proefpersoon. Niet alle onderzoeksdata op de campus worden echter altijd even netjes gearchiveerd, laat staan beschikbaar gesteld aan andere onderzoekers.
Dat moet beter, vindt de vereniging van Nederlandse universiteiten VSNU. Het college van bestuur voegt nu de daad bij het woord: alle onderzoekers op de campus moeten hun onderzoeksgegevens op een systematische en duurzame manier op gaan slaan en indien mogelijk beschikbaar stellen aan de buitenwereld, zo kondigde collegevoorzitter Daniël Wigboldus in zijn nieuwjaarsrede aan. Kortgezegd heet dit Research Data Management (RDM, zie kader). In 2020 moet dit proces voltooid zijn.
Kwijtgeraakte laptops
Wigboldus beschouwt RDM als een speerpunt. ‘Het hoort gewoon bij goed wetenschap bedrijven. Je hoort te verantwoorden hoe de data je wetenschappelijke inzichten ondersteunen. De transparantie is erbij gebaat dat je de onderliggende data FAIR [zie kader, red.] opslaat en beschikbaar stelt waar dat kan. Dat is – terecht – ook een eis van steeds meer wetenschappelijke tijdschriften en subsidieverstrekkers.’
‘Het zal een cultuurverandering vereisen’
Naast de kwaliteit, bevordert dit ook de duurzaamheid van onderzoek, denkt de voorzitter. ‘Wetenschappers zullen veel makkelijker van elkaars gegevens gebruik kunnen gaan maken, denk aan meta-analyses of her-analyses. Ook zullen er hopelijk minder data verloren gaan wanneer onderzoekers bijvoorbeeld naar een andere universiteit vertrekken of een laptop kwijtraken.’
Cultuurverandering
Wigboldus verwacht dat onderzoekers ook enthousiast zijn. ‘Ik denk niet dat onderzoekers van het nut overtuigd hoeven te worden. Iedere wetenschapper wil toch dat de wetenschap en de samenleving zoveel mogelijk van zijn of haar onderzoek profiteert?’ Al geeft hij toe dat delen van data lang niet overal de normaalste zaak van de wereld is. ‘In vakgebieden als sterrenkunde of sociologie is dat al de standaard. Elders mag het soms nog wel wat verbeteren vind ik; dat zal wellicht een cultuurverandering vereisen.’ Maar niemand ontkomt er aan: ‘Het belang van de wetenschap staat voorop.’
‘Onderzoekers zullen datakosten moeten begroten in subsidieaanvragen’
De onderzoeksinstituten bepalen zelf hoe ze het opslaan en delen van gegevens willen organiseren. Als ze het maar doen. Wigboldus: ‘Dat kan intern, maar ook buiten de campus, bijvoorbeeld via DANS [zie kader, red.]. Dat laten we aan de onderzoekers, die kennen hun data het beste. We gaan niet micromanagen.’ Voor het documenteren van onderzoeksdata is er wel één campusbreed systeem, de zogeheten RIS-interface (‘Research Information Services’).
Pilot
Alle onderzoekers gaan de gevolgen van RDM dus merken, niet alleen in het dagelijks werk, maar ook in de (instituuts)portemonnee. ‘RDM is natuurlijk niet gratis. Onderzoekers zullen er naartoe moeten dat ze datakosten begroten in hun projectenfinancieringen en subsidieaanvragen. Het primaire onderzoek zal dus duurder worden dan voorheen.’ Hoeveel extra het gaat kosten durft de voorzitter niet te voorspellen – de schattingen liggen rond de 5 tot 10 procent. ‘Maar dat betaalt zich uiteindelijk terug, omdat goed databeheer op de lange termijn wetenschappelijk méér oplevert.’
Het college van bestuur stelt centrale middelen beschikbaar voor de opstartfase. Het financierde bijvoorbeeld een pilotproject om bij het Donders Instituut een RDM-systeem op te laten zetten. Een succes, vertelt projectleider Eric Maris van Donders, vooral omdat RDM geïntegreerd is in de dagelijkse manier van werken. Dat ging niet vanzelf. ‘Wetenschappers en IT-ers moesten samen gaan zitten om het voor elkaar te krijgen. Dat was voor beide partijen een leerproces.’
Uiteindelijk werkt het nu naar ieders tevredenheid. ‘Op het Donders werken we met projecten. Als een project is goedgekeurd dan worden er automatisch in RDM databases aangemaakt. Op het moment dat een onderzoeker een proefpersoon scant in de MRI, worden de data naar die databases weggeschreven. Na afloop van een project kunnen die met één druk op de knop gedeeld worden met de buitenwereld.’
Onderschatting
Maris vraagt zich wel af of het college en de onderzoeksinstituten RDM niet onderschatten. ‘RDM is meer dan alleen een geschikte IT-infrastructuur bouwen’, waarschuwt hij. ‘Onderzoekers moeten hun manier van werken gaan aanpassen. Deze vorm van open science vraagt om documenteren, samenwerken en delen. Ik ben benieuwd hoe die verandering overal gerealiseerd gaat worden.’
Ook Wigboldus geeft aan dat de invoering een leerproces is voor de universiteit. ‘Het hoeft ook niet allemaal in één keer perfect. Dat kan ook niet anders, want zowel de onderzoekspraktijk als de technologische mogelijkheden ontwikkelen zich snel.’
[kader-xl] Wat houdt Research Data Management in?
- Alle data van Radboud-publicaties moeten FAIR zijn opgeslagen, en aan alle wettelijke en ethische eisen voldoen – uiterlijk in 2020.
- FAIR houdt in:
- Findable: het moet bekend zijn waar data zich bevinden
- Accessible: toegankelijk, tenminste tien jaar lang
- Interoperable: leesbaar met gratis software
- Reusable: bruikbaar voor heranalyse of nieuw onderzoek
- Dit geldt óók voor data van bachelor- en masterscripties.
- Alle onderzoeksinstituten op de campus moesten vóór 2018 een plan opstellen waarin ze beschrijven hoe ze met research data management aan de slag gaan.
- Er zijn verschillende systemen beschikbaar voor data management. Het Radboudumc werkt bijvoorbeld met een Digital Research Environment, het Donders instituut heeft het Donders Repository.
- Onderzoeksgegevens hoeven zelfs niet per se op de campus opgeslagen te blijven. Zolang ze maar makkelijk gevonden en waar mogelijk gedeeld kunnen worden. Dat kan bijvoorbeeld ook via DANS (Data Archiving and Networked Services). DANS is een instituut van de KNAW en NWO dat permanente toegang tot digitale onderzoekgegevens faciliteert.
- Metadatering gebeurt wel centraal: iedere onderzoeker moet elke publicatie en de onderliggende data documenteren via RIS (“Research Information Services”).
- Elk onderzoeksinstituut stelt een data steward aan, als coördinator en aanspreekpunt voor onderzoekers; de Universiteitsbibliotheek fungeert als centrale helpdesk.
- Instituten dragen zelf de financiële lasten, het CvB financiert de opstartfase.
Uiteindelijk zijn onderzoekers zélf verantwoordelijk dat ze op de juiste manier met data omgaan. [/kader-xl]