LibGuides: Onderzoekscyclus: 2.Onderzoeksfase: Datadocumentatie

Waarom datadocumentatie?

In het kader van de FAIR principes dienen onderzoeksdata zo FAIR als mogelijk afgeleverd te worden. Om data (her)bruikbaar te maken voor andere onderzoekers die er
nog niet mee hebben gewerkt, is datadocumentatie essentieel. Duidelijke en gedetailleerde documentatie vergroot de datakwaliteit en vergroot de kans dat de data door (toekomstige) anderen zal worden begrepen. Metadata is een speciale vorm van datadocumentatie.

Het gebied tussen data, datadocumentatie en metadata is een grijs gebied. Bepaalde dataformaten hebben in hun data ook automatisch metadata. Bijvoorbeeld belichting, diafragma, etc. bij digitale foto's. Uiteindelijk gaat het niet om de vraag of iets data, metadata of data documentatie heet maar om het onderliggende doel: het zodanig
gedetailleerd beschrijven van de data dat de kans op vindbaarheid, reproduceerbaarheid en hergebruik toeneemt.

Bron voor deze pagina: Essentials 4 Data Support by Research Data Netherlands

Wat te documenteren?

De kenmerken van een dataset worden op verschillende niveaus omschreven:

1. Op dataniveau: beschrijving van de data zelf
Maak een ReadMe text file waarin je een overzicht geeft van alle bestanden van de dataset met een
beschrijving van de inhoud per bestand. Denk aan een beschrijving/uitleg van:

het dataformaat
versies
transcripten
gebruikte variabelen en wat betekenen ze
gebruikte/geschikte software om de data te lezen
parameter settings
gebruikte software code om de data te bewerken en analyseren
licenties of beperkingen opgelegd aan de data (gebruiksvoorwaarden)

Je kunt informatie op dataniveau ook insluiten in gegevensbestanden. Het is bijvoorbeeld het beste
  om in interviews de contextuele en beschrijvende informatie over elk interview aan het begin van elk
  bestand op te schrijven. En voor kwantitatieve gegevens kunnen de namen van variabelen en
  waarden worden ingebed in het gegevensbestand zelf.

2. Op projectniveau: beschrijving van het dataverzamelingsproces
Leg hier uit wat de doelstellingen van de studie zijn, wat de onderzoeksvragen/hypothesen zijn,
welke methodologieën werden gebruikt, welke instrumenten en maatregelen werden gebruikt, enz.
Vragen die beantwoord zouden moeten worden:
- Met welk doel werden de data gecreëerd?
- Wat staat er in de dataset?
- Hoe zijn de data verzameld?
- Welke instrumenten zijn gebruikt? (denk aan codeboek, labjournaal, vragenlijsten, dagboek,
handleiding, etc.)
- Wie heeft de data verzameld en wanneer?
- Hoe zijn de data verwerkt?
- Welke mogelijke manipulaties zijn er met de data gedaan?
- Was er sprake van issues of bijzondere situaties?
- Wat waren de procedures voor kwaliteitsborging?
- Hoe zijn de data toegankelijk?

Meer informatie over datadocumentatie bij kwanitatieve en kwalitatieve data (onderdeel 1) en aanvullende informatie per vraag (onderdeel 2) is te vinden op deze website:

Data documentation: CESSDA training guide

3. Omschrijving van de veranderingen van de dataset in de tijd
Een historisch verslag van de omzwervingen en bewerkingen van de onderzoeksdata in de tijd
(= data provenance). Om dit te kunnen maken zijn onderdeel 1 en 2 noodzakelijk.

Handleiding datadocumentatie

Als onderzoeker wil je je onderzoeksdata duurzaam archiveren en/of publiceren. Maar hoe doe je dat op zo’n manier dat iemand anders, of jijzelf over een paar jaar, de onderzoeksdata begrijpt?

Deze interactieve PDF beschrijft de mogelijkheden van datadocumentatie voor onderzoek:

Handleiding datadocumentatie

Metadata

Metadata zijn 'data over data' en vergemakkelijken het catalogiseren en vinden van data. Ze zijn een belangrijk element in het creëren van een FAIR datainfrastructuur; niet alleen mensen, maar ook computers kunnen metadata lezen, interpreteren en combineren. Metadata kunnen helpen om het doel, de oorsprong, het tijdstip, de locatie, de maker(s), de gebruiksvoorwaarden en de toegangsvoorwaarden van onderzoeksgegevens uit te leggen.

Typen metadata:

Beschrijvende metadata
Minimaal benodigd om een (digitaal) object te vinden.
bijv.: titel, auteur, abstract, datum
Structurele metadata
Leggen de relatie vast tussen individuele objecten die gezamenlijk een eenheid vormen.
bijv.: links naar gerelateerde objecten, zoals een op basis van de data geschreven artikel
Technische metadata
Informatie over de technische aspecten van een dataset.
bijv.: dataformaat, gebruikte hardware/software, calibratie, versie, authenticatie, encryptie
Administratieve metadata
Informatie over gebruik(srechten) en beheer.
bijv.: licentie, reden van embargo, waivers, search logs, user tracking

Metadatastandaard
Voor het toekennen van metadata wordt gebruik gemaakt van een metadatastandaard, een set van individuele metadata-elementen die je kunt gebruiken om data te beschrijven. Er bestaan veel verschillende metadatastandaarden, afhankelijk van de discipline, het archief of platform.