In het kader van de FAIR principes dienen onderzoeksdata zo FAIR als mogelijk afgeleverd te worden. Om data (her)bruikbaar te maken voor andere onderzoekers die er
nog niet mee hebben gewerkt, is datadocumentatie essentieel. Duidelijke en gedetailleerde documentatie vergroot de datakwaliteit en vergroot de kans dat de data door (toekomstige) anderen zal worden begrepen. Metadata is een speciale vorm van datadocumentatie.
Het gebied tussen data, datadocumentatie en metadata is een grijs gebied. Bepaalde dataformaten hebben in hun data ook automatisch metadata. Bijvoorbeeld belichting, diafragma, etc. bij digitale foto's. Uiteindelijk gaat het niet om de vraag of iets data, metadata of data documentatie heet maar om het onderliggende doel: het zodanig
gedetailleerd beschrijven van de data dat de kans op vindbaarheid, reproduceerbaarheid en hergebruik toeneemt.
Bron voor deze pagina: Essentials 4 Data Support by Research Data Netherlands
De kenmerken van een dataset worden op verschillende niveaus omschreven:
1. Op dataniveau: beschrijving van de data zelf
Maak een ReadMe text file waarin je een overzicht geeft van alle bestanden van de dataset met een
beschrijving van de inhoud per bestand. Denk aan een beschrijving/uitleg van:
Je kunt informatie op dataniveau ook insluiten in gegevensbestanden. Het is bijvoorbeeld het beste
om in interviews de contextuele en beschrijvende informatie over elk interview aan het begin van elk
bestand op te schrijven. En voor kwantitatieve gegevens kunnen de namen van variabelen en
waarden worden ingebed in het gegevensbestand zelf.
2. Op projectniveau: beschrijving van het dataverzamelingsproces
Leg hier uit wat de doelstellingen van de studie zijn, wat de onderzoeksvragen/hypothesen zijn,
welke methodologieën werden gebruikt, welke instrumenten en maatregelen werden gebruikt, enz.
Vragen die beantwoord zouden moeten worden:
- Met welk doel werden de data gecreëerd?
- Wat staat er in de dataset?
- Hoe zijn de data verzameld?
- Welke instrumenten zijn gebruikt? (denk aan codeboek, labjournaal, vragenlijsten, dagboek,
handleiding, etc.)
- Wie heeft de data verzameld en wanneer?
- Hoe zijn de data verwerkt?
- Welke mogelijke manipulaties zijn er met de data gedaan?
- Was er sprake van issues of bijzondere situaties?
- Wat waren de procedures voor kwaliteitsborging?
- Hoe zijn de data toegankelijk?
Meer informatie over datadocumentatie bij kwanitatieve en kwalitatieve data (onderdeel 1) en aanvullende informatie per vraag (onderdeel 2) is te vinden op deze website:
3. Omschrijving van de veranderingen van de dataset in de tijd
Een historisch verslag van de omzwervingen en bewerkingen van de onderzoeksdata in de tijd
(= data provenance). Om dit te kunnen maken zijn onderdeel 1 en 2 noodzakelijk.
Metadata zijn 'data over data' en vergemakkelijken het catalogiseren en vinden van data. Ze zijn een belangrijk element in het creëren van een FAIR datainfrastructuur; niet alleen mensen, maar ook computers kunnen metadata lezen, interpreteren en combineren. Metadata kunnen helpen om het doel, de oorsprong, het tijdstip, de locatie, de maker(s), de gebruiksvoorwaarden en de toegangsvoorwaarden van onderzoeksgegevens uit te leggen.
Typen metadata:
Voor het toekennen van metadata wordt gebruik gemaakt van metadataschema's, een set van individuele metadata-elementen die je kunt gebruiken om data te beschrijven. Er bestaan veel verschillende metadataschema's, afhankelijk van de discipline, het archief of platform.