Simon Dalmolen

Digitale transformatie zoekt data-eigenaar!

De digitale transformatie gaat over de eindklant – het verbeteren van de ‘customer experience’. Dit vraagt onder de motorkap toch wel enige aanpassing voor veel bedrijven. Het snel verzamelen en koppelen van allerlei soorten data tussen bedrijven is essentieel. Maar is het verzamelen van data wel een zegen? Hoe moeten we omgaan met het eigenaarschap van de data? En voor welke dilemma’s staan bedrijven als het om het delen van data gaat?

Juist nu zijn data-driven organisaties nodig om te innoveren. Porter schreef er in 2014 een mooi artikel over. Hij schetst daarin een zeer interessant voorbeeld dat gaat over het denken in ecosystemen en de veranderende traditionele industrie.

System of Systems by John Deere

Afbeelding 1 Porter 2014 - System of Systems by John Deere

Zo kan John Deere de concurrentie aangaan in de bredere boerderij-automatiseringsindustrie. Dit bedrijf verkoopt niet alleen een trekker, maar koppelt dit aan een slim product/service. De trekker wordt gekoppeld aan het landbouwbewerkingstuig en leest alle beschikbare data in. Deze gecombineerde dataservice maakt ook gebruik van sensordata uit de grond, het weer en de beregeningsinstallatie (collega Hans Moonen schreef er een blog over). Dit om opbrengst per m2 te verhogen. Deze beweging zie je in meer industrieën, zoals smart homes met de Phillips HUE-lamp en in de medische wereld. Maar ook tijdens het sporten via de Apple Watch of Garmin Edge.

Data-driven organisaties

Deze bedrijven zijn getransformeerd in een data-driven organisatie of een data-driven serviceverlener. Een data-driven organisatie is een organisatie waar elk persoon die gegevens kan gebruiken om betere beslissingen te nemen, toegang heeft tot de gegevens die hij op dat moment nodig heeft. Data-driven gaat niet over het zien van een paar statische rapporten aan het begin van elke dag of week; het gaat erom de beslissers van de business de mogelijkheid te geven om gegevens zelfstandig te verkennen, zelfs als ze werken met grote of uiteenlopende gegevensbronnen.

Het grote dataverzamelen

Voor gebruikers en eindklanten is het niet meer duidelijk wie hun gegevens gebruikt en met welke reden. Zelf maak ik gebruik van Spotify, maar ik wist dat Spotify sinds eind 2016 ook informatie over mijn muziekvoorkeuren verkoopt. We moeten ons ervan bewust zijn dat veel afgenomen digitale services data van ons verzamelen en doorverkopen, ondanks dat wij voor de service betalen. En dat gebeurt natuurlijk al helemaal bij diensten die gratis worden aangeboden en waarbij wijzelf het product zijn, zoals bij Google en Facebook – services die beter dan wie dan ook weten welke behoeftes er bij bepaalde profielen en/of personen spelen.

Lekken en kopiëren

Sinds kort zijn bedrijven verplicht te melden als er een datalek is en volgend jaar komt er nog een zorgplicht bij (GDPR). Er is alleen zoveel data beschikbaar. Bovendien wordt er van de ene bron naar de andere bron gekopieerd. Hierdoor is de herkomst niet altijd meer duidelijk. Data wordt redundant opgeslagen. Het is niet altijd meer duidelijk of deze data niet is bewerkt en dus de waarheid bevat.

Ook consumenten roeren zich. In de Verenigde Staten zijn er al processen aangespannen tegen bedrijven die hun data te gelde maken van zichzelf. Dat te gelde maken gebeurt ook in Europa. Neem het Britse Tesco. Die organisatie heeft al haar data met betrekking tot loyaliteit geoutsourcet aan Dunnhumby. Toen Dunnhumby in 2014 het Duitse ad-technologiebedrijf Sociomantic overnam, kondigde ze aan dat Dunnhumby ‘haar uitgebreide inzichten over de winkelvoorkeuren van 400 miljoen consumenten’ gaat combineren met Sociomantics ‘real-time data van meer dan 700 miljoen online consumenten’ om advertenties te personaliseren en te beoordelen.

Data bij de bron

Voor bedrijven die ook experimenteren met het koppelen van gegevensbronnen, is het juist slim om het ‘data bij de bron’-principe te hanteren. Dit wordt ook wel de data centric approach genoemd. Het is daarbij mogelijk om voor één of meerdere entiteiten een digitale schaduw te creëren, waarin informatie virtueel kan worden gecategoriseerd. Deze virtuele entiteit maakt gebruik van een e-dossier. Hierin staan bijvoorbeeld de eigenschappen van de lading, de locatie, maar ook welke beperking de vracht heeft, zoals het constant houden van temperatuur en luchtvochtigheid. De partners mogen naar gelang hun rechten het dossier of bepaalde delen van het dossier inzien.

Het opslaan van data bij de bron heeft een aantal voordelen:

  1. Je kunt de complexiteit reduceren in de keten van data en informatie.
  2. Je kunt de kosten reduceren door meerdere datasilo’s te koppelen en integreren.
  3. De snelheid om nieuwe services te ontwikkelen is hoger als duidelijk is waar de data zich bevindt en hoe dit te benaderen is.
  4. De eindklant weet precies waar de data wordt opgeslagen en – indien deze functionaliteit is toegevoegd – wie de data heeft benaderd en ingezien.


Een leuke bijvangst van deze aanpak is dat de datakwaliteit automatisch omhoog gaat!

‘Data is the center of the universe’

Er is momenteel een nieuw initiatief ontstaan, genaamd data centric manifesto.

Ik citeer: ‘Data is the center of the universe; applications are ephemeral. These are the key principles of the data centric manifesto:

  1. Data is a key asset of any organization.
  2. Data is self-describing and does not rely on an application for interpretation and meaning.
  3. Data is expressed in open, non-proprietary formats.
  4. Access to and security of the data is a responsibility of the data layer, and not managed by applications.
  5. Applications are allowed to visit the data, perform their magic and express the results of their process back into the data layer for all to share.’


Deze vijf principes helpen de consument en bedrijven om voorzichtiger, efficiënter en veiliger met data om te gaan. Het koppelen van data behoeft niet altijd onveilig te zijn. We moeten alleen wel methoden ontwikkelen waarmee we aan een ieder de zekerheid kunnen bieden dat data voor de beloofde doeleinden is gebruikt. En niet is gekopieerd, gelekt of aan bepaalde afspraken niet is voldaan.

Dit alles brengt mij tot de volgende conclusie: elke organisatie wil tegenwoordig data-driven zijn en zoveel mogelijk data verzamelen. Alleen weinig bedrijven willen daadwerkelijk verantwoordelijk zijn voor de data. Door data bij de bron te houden, is het eigenaarschap beter te managen en zijn security-maatregelen sneller te implementeren.

Blogrichtlijnen en gebruikersvoorwaarden