• Open data

    en SPOTinfo

‘Open data’ en SPOTinfo

Al meer dan een decennium propageert de Nederlandse overheid het principe van ‘open data’, daarmee aansluitend bij een wereldwijde trend. “Open data” betreft digitale gegevens die zonder ingewikkelde restricties voor algemeen gebruik ter beschikking worden gesteld door de overheid. Dit betekent overigens niet automatisch dat open data altijd kosteloos is. Hoewel er in principe geen verdienmodel aan gekoppeld is, kunnen wel degelijk ‘verstrekkingskosten’ worden gerekend. Met dergelijke inkomsten kan de overheid bijvoorbeeld werken aan voorzieningen voor het verwerken van terugmeldingen op de onvermijdelijke fouten die in elke gegevensregistratie te vinden zijn. Ook betekent ‘open’ niet altijd ‘open-in-bulk’. Zo mag van het Handelsregister (EZ/KVK) en het WOZ register (EZ) wel de data van één object per keer opgevraagd worden, maar niet van honderdduizenden locaties tegelijkertijd. Verder wordt de kwaliteit van open databronnen niet altijd even goed genormeerd door de overheid. Zo zijn het Landelijke Register Kinderopvang (LRK, DUO) en het Rijksmonumentenregister (RCE) weliswaar open data, maar de bronhouder kan de datastructuur al dan niet onaangekondigd wijzigen, en de geometrische accuratesse en volledigheid van de vulling zijn soms ongewis.

Data-analisten kunnen dus gemakkelijk in een waar moeras van honderden verschillende ‘open data’ bestanden belanden, elk met hun eigen doel, historie, en kwaliteitsregime. Het vinden, binnenhalen, valideren, combineren en weer ontsluiten van dergelijke datasets is zeer tijdrovend en foutgevoelig werk. In het combineren van twee datasets kunnen al snel onduidelijkheden, dubbelzinnigheden of ronduit tegenstrijdigheden ontstaan. Wat doe je bijvoorbeeld met een pand waarvan de BAG status gemeld staat als ‘gesloopt’, maar waar nog wel een kinderopvang locatie en Handelsregister locaties in staan vermeld? Wat doe je met een locatie waar zowel opslag van gevaarlijke stoffen geregistreerd staat alsook het verblijf van verminderd zelfredzame (kwetsbare) personen? Dergelijke zaken hoeven niet per se op fouten te duiden, maar het maakt het er niet gemakkelijker op om integraal inzicht in de omgeving te krijgen, waar het uiteindelijk om gaat.

Bij SPOTinfo combineren we al sinds 2008 vele open databronnen, vaak van de overheid maar ook vanuit communities zoals OpenStreetMap. Als geen ander hebben wij ervaren dat het betekenisvol duiden en combineren van deze bronnen geen sinecure is, en bepaald niet triviaal. In onze dagelijkse praktijkafstemming met bijvoorbeeld de vastgoedmarkt, de hulpdiensten, en gemeentelijke afdelingen, hebben wij door de jaren heen een goed gevoel gekregen bij de uitdagingen die het combineren van open data met zich meebrengt. Oftewel: wat is er voor nodig om een combi van open databronnen nog steeds betrouwbaar en betekenisvol te duiden? En wat voor kwaliteitsniveau kun je aan dat resultaat toekennen? SPOTinfo combineert en verrijkt al die databronnen tot samengestelde basisdata.  

Steeds meer ICT marktpartijen ontdekken het gemak dat ze zichzelf gunnen door dit tijdrovende en foutgevoelige dataproces niet meer zelf te doen, maar zich hierop te ontzorgen met SPOTinfo, zodat ze meer tijd over houden voor waar ze goed in zijn: slimme functionaliteit bouwen voor (maatschappelijke) vraagstukken. Zo heeft bijvoorbeeld Esri op eigen initiatief samenwerkingsafspraken gemaakt met SPOTinfo vanwege de kwaliteit van onze PandenPlus dataset met 58 kenmerken per pand, actueel en landsdekkend. Vraag je leverancier dus altijd naar SPOTinfo data in de geboden oplossingen.