Open Data

De Nederlandse overheid heeft veel data tot haar beschikking, denk bijvoorbeeld aan demografische data uit de Gemeentelijke Basisadministratie, geografische informatie door luchtfoto’s en informatie over het bedrijfsleven uit het Kadaster. Het hergebruik van overheidsinformatie is al sinds 2003 officieel in een Europese richtlijn vervat (PSI Directive 2003/98/EC). Door de stormachtige groei van interactieve toepassingen op het internet (web 2.0) is het hergebruik het afgelopen jaar in een stroomversnelling gekomen. Sommige organisaties verstrekken inmiddels actief (delen van) hun bestanden via het internet aan het publiek. Voorbeelden daarvan zijn:

  • Statline van het CBS (www.cbs.nl/nl/statline/index.htm)
  • Overzicht van gebruik geneesmiddelen in Nederland (www.gipdatabank.nl)
  • Beoordelingscijfers van alle scholen in Nederland (www.onderwijsinspectie.nl)
  • Portal met meer dan 12.000 databestanden voor onderzoek en onderwijs op het gebied van alfa- en gammawetenschappen (www.dans.knaw.nl/content/data-archief)
  • UV-straling in Europa (www.temis.nl/uvradiation/UVdose.html)
  • Geografisch overzicht van natuurgebieden in Nederland (www.staatsbosbeheer.nl/Natuurgebieden.aspx)
  • Energieverbuik en CO2-emissies per industriesector in Nederland (www.energie.nl/index4.html)

Overheidsinformatie wordt in toenemende mate gezien als een belangrijk onderdeel van open content; informatie die de basis biedt voor allerhande (creatief) hergebruik door burgers en bedrijven. Over de hele wereld zijn overheden op dit moment daarom bezig met het inrichten van een online catalogus waarin zoveel mogelijk bronnen van overheidsinformatie worden ontsloten. Voorbeelden zijn Amerika (www.data.gov) en het Verenigd Koninkrijk (www.data.gov.uk). Ook in Nederland wordt op dit moment door met Ministerie van Binnenlandse Zaken aan een soortgelijke portal gewerkt.

Ter voorbereiding op het eventueel inrichten van deze portal heeft het ministerie aan Dialogic gevraagd om een inventarisatie te maken van de datasets die beschikbaar zijn en van de voorwaarden die aan het gebruik van deze datasets zijn verbonden.

Er bestaan al een aantal thematische portals met verwijzingen naar datasets binnen het betreffende domein. Het gaat hier soms om grote aantallen datasets. CBS´ Centrum voor Beleidsstatistieken beschikt bijvoorbeeld over 145 datasets. DANS (Data Archiving and Networked Services) van NWO/KNAW heeft zelfs verwijzingen naar meer dan 12.000 datasets. Daarbij moet wel de aantekening worden geplaatst dat het in bijna alle gevallen om eenmalige, hele specifieke datasets gaat ("drankmisbruik onder jongeren in Zuidoost-Drenthe in 2007"). Dat geldt overigens ook voor de meeste buitenlandse portals, zoals data.gov en data.gov.uk.

Bij de inventarisatie van datasets hebben we vooral gezocht naar tijdsreeksen met een brede dekking. Uiteindelijk zijn er 137 datasets gevonden van meer dan 50 overheidsinstanties. Daarnaast zijn er 13 thematische portals getraceerd. Gegeven de beperkte omvang van de studie is dat geen slecht resultaat. Het totale aantal relevante datahouders op nationaal niveau wordt geschat op 100 tot 150.

Het overzicht van de datasets en de thematische portals is gepubliceerd door middel van een dynamische website, www.dialogiconderzoek.nl/opendata. De brondata is ook apart beschikbaar gesteld. Voor elke dataset heeft Dialogic een contactpersoon proberen te achterhalen. Uiteindelijk is er voor 52 datasets een reactie gekomen - een bruto respons rate van 40%. Grosso modo is 60% van de datasets open voor hergebruik. Dat lijkt veel maar bedacht moet worden dat overheidsinformatie per definitie open is. Bovendien spelen er daarnaast tal van praktische belemmeringen. Bovendien kwam tijdens het onderzoek aan het licht dat de meeste organisaties nog niet weten wat ze aanmoeten met open data. Veel organisaties zijn op dit moment volop bezig een positie te kiezen. Globaal kunnen er vier posities worden onderscheiden. Van ´open´ naar ´gesloten´:

  • I. Data geheel open, zowel voor non-commercieel als commercieel hergebruik. Voorbeelden: Databank Verkiezingsuitslagen; datasets Rijkswaterstaat zwemwater, stroomgebieden, emissieregistratie; datasets Openbare Financiën (emissies, staatsschuld)
  • II. Hergebruik toegestaan ongeacht type gebruik, zolang je er maar voor betaalt (ergo geen verschil commercieel x non-commercieel gebruik).
    Voorbeeld: Nationale Databank Wegverkeersgegevens (NDW), Kamer van Koophandel (bedrijfsgegevens)
  • III. Gebruik alleen toegestaan voor non-commercieel gebruik (wetenschappelijk onderzoek). Hergebruik niet toegestaan.Voorbeelden: de thematische portals van NWO/KNAW (DANS), CBS (Centrum voor Beleidsstatis-tiek, Sociaal Statistische Bestand), KNMI (klimaatgegevens: Cesar Database).
  • IV. Gebruik van data aan restricties gebonden, hergebruik verboden. Voorbeeld: Kadaster
  • Publicatienummer
    2010.035-1022
  • Publicatiedatum
    5 juli 2010
  •  
  • Projectnummer
    2010.035
  • Opdrachtgever(s)
    Ministerie van Binnenlandse Zaken
meer weten over dit onderwerp? Neem contact op met Robbin te Velde
Principal consultant