Data science

Gestructureerd werken aan datakwaliteit

7 Maart 2024 - 6 minuten leestijd
Artikel door Redactie Insights

Data van goede kwaliteit is essentieel voor het functioneren van een organisatie. Dat is bekend. Toch werken nog maar weinig organisaties op een gestructureerde manier aan datakwaliteit. Natan van der Knaap deed er onderzoek naar en ontwikkelde een breed toepasbaar model voor data governance.

Van der Knaap studeerde onlangs af aan Tilburg University en werkt als consultant data & analytics bij Centric. Waarom koos hij data governance voor zijn afstudeeronderzoek? “Tijdens mijn master Information Management leerde ik dat data governance vooral gaat over het menselijke aspect van het verbeteren van data. Je kunt wel tools aanschaffen om de datakwaliteit te verbeteren, maar uiteindelijk moeten mensen die tools gebruiken. Die focus op het menselijke aspect vind ik interessant.” Hij verdiepte zich in data governance en ontdekte dat er voor de governance van master data nog geen raamwerk was. “Ik twijfelde wat ik als student zou kunnen bijdragen aan dit onderzoeksveld. Toen ik erachter kwam dat er nog geen raamwerk bestond, leek mij dat een mooie kans om iets toe te voegen! Zo kon ik zowel het menselijke als het data-aspect combineren.”

Insights-update

Ontvang nieuwe Insights maandelijks in je inbox.

Schrijf je in.

Wat is master data?

In zijn afstudeeronderzoek ontwikkelde Van der Knaap een raamwerk voor de governance van master data. “Master data zijn belangrijke gegevens die breed in de organisatie worden gebruikt. Voor de lokale overheid zijn het bijvoorbeeld de NAW-gegevens van inwoners.” Het is belangrijk dat elke afdeling, elk proces en elk systeem identieke master data gebruikt, zoals hetzelfde adres van een inwoner. Data die niet onder master data vallen, zijn bijvoorbeeld transactionele data, zoals de doorlooptijden van processen of kassabonnetjes. Kort gezegd bieden master data dus een gedeeld referentiepunt voor de kernobjecten van een organisatie. Bijvoorbeeld leveranciers, producten of medewerkers.

Belangrijke inzichten

In zijn onderzoek keek Van der Knaap naar best practices op het gebied van data governance en master data. Die combineerde hij en zo kwam hij tot een aantal hypotheses van wat de meest geschikte aanpak is voor master data governance. In interviews met zeven experts vanuit verschillende organisaties, waaronder vier vanuit de publieke sector, toetste hij deze hypotheses. Het leverde hem een aantal inzichten op. “Ik dacht dat veel organisaties al best ver waren met data governance, gezien alle literatuur die hierover te vinden is. Maar dat is niet zo. Dat betekent ook dat er nu vooral aandacht is voor datakwaliteit in brede zin, niet alleen voor master data.” Van der Knaap verbreedde het governance-raamwerk dat hij samen met de experts ontwikkelde, zodat het niet alleen voor master data, maar voor het bevorderen van datakwaliteit in het algemeen gebruikt kan worden. Een ander opvallend inzicht dat Van der Knaap opdoet, is dat organisaties duidelijke keuzes maken als het gaat om datakwaliteit. “Waardecreatie staat voorop, er wordt vooral gekeken naar hoe je zoveel mogelijk waarde uit data kunt halen. Investeringen in datakwaliteit worden vanuit dat oogpunt gedaan. Voor de hand liggend misschien, maar in de wetenschap is dat niet zo. Daar wordt gekeken naar datakwaliteit in het algemeen en wordt geen onderscheid gemaakt tussen data.”

‘Er wordt vooral gekeken naar hoe je zoveel mogelijk waarde uit data kunt halen’.

‐ Natan van der Knaap

Klein beginnen

Data governance wordt vaak gezien als iets groots en ingewikkelds, en dat is begrijpelijk, aldus Van der Knaap na gesprekken met andere data-experts. "Het omvat veel diverse aspecten, waardoor het verstandig is om klein te beginnen," zegt hij. "Vaak is bekend wie binnen een organisatie met data werkt en wie de beslissingen neemt, maar deze verantwoordelijkheden zijn vaak niet officieel vastgelegd. Door hiermee te starten, verkrijg je meer controle over de data." Het implementeren van deze verantwoordelijkheden draagt bij aan een betere regulatie van de kwaliteit van je (master)data. Daarnaast is het cruciaal om inzicht te krijgen in welke data op welke plekken binnen je organisatie wordt gebruikt. "Door te begrijpen welke waarde de data heeft en waar deze wordt toegepast, kun je samen met gebruikers plannen maken en uitvoeren om de kwaliteit te verbeteren. In het algemeen geldt dat als je de voordelen van data ervaart in je eigen dagelijkse werkzaamheden, het verbeteren van datakwaliteit in een stroomversnelling komt." voegt Van der Knaap toe.

SCRIPTIE.

Meer waarde uit je master data halen.

Download nu.

'Als je de voordelen van data ervaart in je eigen dagelijkse werkzaamheden, komt het verbeteren van datakwaliteit in een stroomversnelling’

‐ Natan van der Knaap

Gestructureerd werken aan datakwaliteit

Met het raamwerk dat Van der Knaap ontwikkelde, kunnen organisaties op een gestructureerde manier werken aan het verbeteren en borgen van datakwaliteit. Het bestaat uit rollen en maatregelen die top-down en bottom-up genomen worden. Vanaf de top worden bijvoorbeeld de strategie en standaarden bepaald en worden middelen beschikbaar gesteld. Een rol is onder meer die van de executive sponsor. Bottom-up wordt vastgesteld hoe de standaarden worden ingevuld en wat een goede kwaliteit van data is. Rollen die  daarbij horen zijn bijvoorbeeld datagebruiker en data steward. “Als je data governance op deze manier inricht, dan betrek je de hele organisatie erbij en wordt het iets dat door de hele organisatie gedragen wordt.” Hoe je het raamwerk precies inricht, is afhankelijk van de organisatie en de context waarin deze werkt.

Dienstverlening uitbreiden 

De bevindingen van Van der Knaap passen bij de dienstverlening die Centric verder wil ontwikkelen op het gebied van datamanagement. “We hebben al verschillende tools om bijvoorbeeld de kwaliteit van data in kaart te brengen. Deze dienstverlening breiden we uit, waarbij we samen met klanten werken aan het verbeteren van hun datakwaliteit en medewerkers meer bewust maken van het belang ervan. Denk hierbij aan trainingen, begeleiding bij verbeterprojecten en kennissessies.” Naast het ondersteunen van klanten bij het verbeteren van datakwaliteit van applicaties, wil Centric organisaties ook op meer strategisch niveau helpen bij vraagstukken rondom data governance. Het raamwerk dat Van der Knaap ontwikkelde, past daarbij. Ook werkt het verder aan technologie die automatisch de kwaliteit van data controleert en waar nodig aanpast. “Er zijn zoveel mogelijkheden als het gaat om het verbeteren van datakwaliteit en het inrichten van een goede data governance. We staan nog maar aan het begin ervan,” besluit Van der Knaap.

Schematische weergave van het raamwerk voor data governance

Antecedenten: de inrichting van data governance is voor elke organisatie anders. Het is afhankelijk van externe en interne factoren die voor elke organisatie verschillend zijn, zoals cultuur en regelgeving.

Analytische governance: dit is een mechanisme om te onderzoeken waarvoor data wordt gebruikt en welke waarde dit levert aan de organisatie.

Beslissingsstrategie: hier hebben organisaties de keuze tussen een centraal, decentraal of federatief model. In een federatief model worden zowel de top als de uitvoering van de organisatie het beste betrokken bij het verbeteren van datakwaliteit.

Rollen en verantwoordelijkheden: er zijn veel verschillende rollen en verantwoordelijkheden die een organisatie kan implementeren. Het is belangrijk om elk individu die een rol heeft in het waarborgen van datakwaliteit erbij te betrekken, zowel in de top als in de uitvoering. In een grote organisatie vormt een data governance office de brug tussen top en uitvoering.

Data-eigenaarschap: dit kun je verschillend invullen. Belangrijk is dat duidelijk is naar wie je kunt gaan als er problemen zijn met datakwaliteit. In best practices blijkt een proceseigenaar de aangewezen persoon om ook data-eigenaar te zijn.

In het midden van de cirkel staan de bedrijfswaarden, waar datagebruik uiteindelijk aan moet bijdragen. Bijvoorbeeld transparantie of efficiency. Uiteindelijk zijn alle governance-initiatieven ontworpen om de kwaliteit van (master)data te waarborgen, waardoor meer waarde wordt gerealiseerd.

Gerelateerde artikelen
Open over algoritmes: ‘Wacht niet tot het straks verplicht is’
Data science Public
Over enige tijd zullen overheden verplicht zijn om algoritmes die zij gebruiken te publiceren. Gemeente S ...
Datagericht werken in negen stappen
Data science
Data science biedt veel mogelijkheden om problemen binnen je organisatie in kaart te brengen én op te los ...
Data science: genees van je drempelvrees
Data science
Het wordt wel één van de pijlers onder de ‘vijfde Industriële Revolutie’ genoemd: data science. Met data ...