Deze benadering verschuift de perceptie van data als bijproduct naar een zelfstandig bezit dat waarde kan creëren. Door data als volwaardig bezit te zien, ontstaat de noodzaak om het te beheren alsof het een product is. Dit betekent dat je op dataproducten productmanagement kunt toepassen. Productmanagement wordt ook wel gedefinieerd als ‘het strategische proces van een organisatie om elke stap in de productlevenscyclus te beheren, waarbij rekening wordt gehouden met zowel zakelijke als consumentenbehoeften’.
Dataproducteigenschapen
Wanneer je productmanagement toepast op dataproducten, richt je je eigenlijk op datamanagement en - governance in elke fase van de productlevenscyclus. Met als uiteindelijk doel om te voldoen aan de behoeften van de datagebruikers.
Dehghani definieert hierbij de volgende dataproducteigenschappen voor optimaal gebruik:
- Vindbaar: Het dataproduct moet eenvoudig te vinden zijn door zowel mens als machine via een goed gestructureerde catalogus of metadata-register.
- Adresseerbaar: Het dataproduct moet toegankelijk zijn voor de gebruiker met duidelijke uitleg.
- Betrouwbaar: Het dataproduct moet accuraat en consistent zijn, met mechanismen om de kwaliteit en integriteit te waarborgen.
- Zelfbeschrijvend: Het dataproduct moet duidelijke metadata en documentatie bevatten die uitleg geven over de inhoud en het gebruik ervan. Zo wordt het herbruikbaar.
- Interoperabel: Het dataproduct moet gestandaardiseerde formaten en interfaces gebruiken om naadloos samen te werken met andere systemen en data.
- Veilig: Het dataproduct moet worden beschermd door maatregelen te nemen, zoals encryptie of toegangscontrole om ongeautoriseerde toegang te voorkomen.
Het eigenaarschap van dataproducten en de verantwoordelijkheid om te voldoen aan bovenstaande eigenschappen, moet liggen bij de plekken waar ze worden gecreëerd. Daar is de meeste (domein)kennis aanwezig om de meest geïnformeerde beslissingen te nemen. Dit past goed bij een federatieve besluitvormingsstrategie. Door dit formeel vast te leggen, geef je ruimte om beter in te spelen op gebruikersbehoeften en wordt de intrinsieke waarde van het dataproduct gemaximaliseerd.
Het gebruik van een dataproduct
Het gebruik van een dataproduct kan sterk variëren en is, net als ieder ander product, afhankelijk van de behoeften van verschillende klanten. Dit maakt het aspect ‘voor gebruik geoptimaliseerd’ (zie definitie van Dehghani) bijzonder complex. Zo kan een interne gebruiker de dataset inzetten voor een dashboard, terwijl een externe gebruiker dezelfde dataset wil gebruiken om organisaties te benchmarken. Beide gebruikers, en mogelijk nog vele anderen, kunnen uiteenlopende eisen en verwachtingen hebben ten aanzien van optimaal gebruik van de dataset.
Om deze complexiteit te beheersen, kun je je dataproduct vergelijken met een gefabriceerde auto. Maak je een standaard auto die voldoet aan algemene eisen en verwachtingen, of bied je een maatwerkoplossing? Beide benaderingen hebben hun eigen voor- en nadelen: een standaardoplossing is efficiënter, terwijl maatwerk meer inspanning vergt voor iedere klant en daardoor een hogere prijs kan rechtvaardigen. Dit is een kwestie van kostenberekening, die vervolgens kan worden vertaald naar een prijs voor de externe klant. Voor interne klanten kan het dataproduct als een ‘service’ worden beschouwd, waarbij onderlinge afspraken worden gemaakt over wat realistisch en haalbaar is.
IT-inzichten die je niet mag missen
Als eerste op de hoogte zijn van de laatste IT-ontwikkelingen? Schrijf je in voor onze maandelijkse nieuwsbrief.
Het dataproces van een dataproduct
Om data als een product te zien, is het inzichtelijk maken van het proces hoe je tot het dataproduct komt essentieel. Een proces is gedefinieerd als ‘een reeks van acties of stappen die worden ondernomen om een bepaald doel te bereiken’ (Tempelman & Schildmeijer, auteurs van Lean & Six Sigma in de Praktijk). Het proces van het dataproduct omvat verschillende stappen die nodig zijn om het uiteindelijke doel te bereiken: een voor gebruik geoptimaliseerde dataset. We hadden eerder vastgesteld dat dit wordt bereikt wanneer een dataproduct vindbaar, adresseerbaar, betrouwbaar, zelfbeschrijvend, interoperabel en veilig is. Om dit te realiseren, doorloop je of een operationeel, ofwel een ontwikkelingsproces. Als het product al in de catalogus (centraal opslagpunt met metadata over de datasets) staat, vergelijkbaar met een bestaand product in een winkel, dan heb je te maken met operationele processtappen, zoals het genereren, bewerken en beschikbaar stellen van datasets. Als het om een nieuw product gaat, doorloop je andere processtappen. Bijvoorbeeld het definiëren en modelleren van datasets om aan nieuwe behoeften te voldoen. Dit valt onder productontwikkeling, waarbij je de behoeften goed moet uitvragen en afspraken maakt over productattributen, zoals latency, veiligheid, privacy en kwaliteit. Deze afspraken kunnen worden vastgelegd in een SLA, een contract met afspraken tussen leverancier en afnemer. Het resultaat is een nieuw product in de catalogus, dat vervolgens via het operationele proces weer beschikbaar wordt gesteld aan de klant.