Skip to Main Content

Onderzoekscyclus: 2.Onderzoeksfase: Datadocumentatie

Waarom datadocumentatie?

In het kader van de FAIR principes dienen onderzoeksdata zo FAIR als mogelijk afgeleverd te worden. Om data (her)bruikbaar te maken voor andere onderzoekers die er
nog niet mee hebben gewerkt, is datadocumentatie essentieel. Duidelijke en gedetailleerde documentatie vergroot de datakwaliteit en vergroot de kans dat de data door (toekomstige) anderen zal worden begrepen. Metadata is een speciale vorm van datadocumentatie.

Het gebied tussen data, datadocumentatie en metadata is een grijs gebied. Bepaalde dataformaten hebben in hun data ook automatisch metadata. Bijvoorbeeld belichting, diafragma, etc. bij digitale foto's. Uiteindelijk gaat het niet om de vraag of iets data, metadata of data documentatie heet maar om het onderliggende doel: het zodanig 
gedetailleerd beschrijven van de data dat de kans op vindbaarheid, reproduceerbaarheid en hergebruik toeneemt.

Bron voor deze pagina:  Essentials 4 Data Support by Research Data Netherlands

Wat te documenteren?

De kenmerken van een dataset worden op verschillende niveaus omschreven:

1. Op dataniveau: beschrijving van de data zelf
    Maak een ReadMe text file waarin je een overzicht geeft van alle bestanden van de dataset met een
    beschrijving van de inhoud per bestand. Denk aan een beschrijving/uitleg van:

  • het dataformaat
  • ​versies
  • transcripten
  • gebruikte variabelen en wat betekenen ze
  • gebruikte/geschikte software om de data te lezen
  • parameter settings
  • gebruikte software code om de data te bewerken en analyseren
  • licenties of beperkingen opgelegd aan de data (gebruiksvoorwaarden)

    Je kunt informatie op dataniveau ook insluiten in gegevensbestanden. Het is bijvoorbeeld het beste
    om in interviews de contextuele en beschrijvende informatie over elk interview aan het begin van elk
    bestand op te schrijven. En voor kwantitatieve gegevens kunnen de namen van variabelen en
    waarden worden ingebed in het gegevensbestand zelf.

2. Op projectniveau: beschrijving van het dataverzamelingsproces
    Leg hier uit wat de doelstellingen van de studie zijn, wat de onderzoeksvragen/hypothesen zijn,
    welke methodologieën werden gebruikt, welke instrumenten en maatregelen werden gebruikt, enz.
    Vragen die beantwoord zouden moeten worden:
    - Met welk doel werden de data gecreëerd?
​    - Wat staat er in de dataset?
    - Hoe zijn de data verzameld?
    - Welke instrumenten zijn gebruikt? (denk aan codeboek, labjournaal, vragenlijsten, dagboek,
       handleiding, etc.)
    - Wie heeft de data verzameld en wanneer?
    - Hoe zijn de data verwerkt?
    - Welke mogelijke manipulaties zijn er met de data gedaan?
    - Was er sprake van issues of bijzondere situaties?
    - Wat waren de procedures voor kwaliteitsborging?
    - Hoe zijn de data toegankelijk?

Meer informatie over datadocumentatie bij kwanitatieve en kwalitatieve data (onderdeel 1) en aanvullende informatie per vraag (onderdeel 2) is te vinden op deze website:

3. Omschrijving van de veranderingen van de dataset in de tijd
    Een historisch verslag van de omzwervingen en bewerkingen van de onderzoeksdata in de tijd
    (= data provenance). Om dit te kunnen maken zijn onderdeel 1 en 2 noodzakelijk.

Metadata

Metadata zijn 'data over data' en vergemakkelijken het catalogiseren en vinden van data. Ze zijn een belangrijk element in het creëren van een FAIR datainfrastructuur; niet alleen mensen, maar ook computers kunnen metadata lezen, interpreteren en combineren. Metadata kunnen helpen om het doel, de oorsprong, het tijdstip, de locatie, de maker(s), de gebruiksvoorwaarden en de toegangsvoorwaarden van onderzoeksgegevens uit te leggen.

Typen metadata:

  1. Beschrijvende metadata
    Minimaal benodigd om een (digitaal) object te vinden.
    bijv.: titel, auteur, abstract, datum
  2. Structurele metadata
    Leggen de relatie vast tussen individuele objecten die gezamenlijk een eenheid vormen.
    bijv.: links naar gerelateerde objecten, zoals een op basis van de data geschreven artikel
  3. Technische metadata
    Informatie over de technische aspecten van een dataset.
    bijv.: dataformaat, gebruikte hardware/software, calibratie, versie, authenticatie, encryptie
  4. Administratieve metadata
    Informatie over gebruik(srechten) en beheer.
    bijv.: licentie, reden van embargo, waivers, search logs, user tracking

Voor het toekennen van metadata wordt gebruik gemaakt van metadataschema's, een set van individuele metadata-elementen die je kunt gebruiken om data te beschrijven. Er bestaan veel verschillende metadataschema's, afhankelijk van de discipline, het archief of platform.

www.zuyd.nl | Disclaimer | Over Zuyd Bibliotheek