Big Data, brandstof van de digitale economie

 Leestijd: 5 minuten0

Hans de Zwart, die voorzitter is van ‘Bits of Freedom’, een vereniging die de digitale burgerrechten verdedigt, heeft de kans niet laten liggen om een big te adopteren in de lokale kinderboerderij omdat hij dat biggetje zo een naam mocht geven; het heet nu Big Data. Hij zocht die aandacht omdat de situatie ernstig is, hyperurgent zelfs.

Laat ons dat dus maar eens als onderwerp nemen, Big Data. Je vermoedt het al, we zitten al lang niet meer op de kinderboerderij.

Het openbaar leven van Big Data vangt aan in Davos, in 2012, met het rapport van het World Economic Forum met de titel Big Data, Big Impact en met het besef bij de aanwezigen dat een aantal bedrijven zoals Google met web advertenties (539 miljard), Facebook met sociale netwerken (370 miljard), en Amazon met online commercie (354 miljard) in korte tijd onnoemelijk rijk en uitzonderlijk winstgevend werden, en dat louter door het ontginnen van Big Data, de brandstof van de nieuwe booming digitale economie. Er zijn er wel meer die dat ook zouden willen. En inderdaad, “Chinese klonen worden uitdagers” kopt de krant De Tijd. Baidu, Tencent en Alibaba worden snel groter dan het originele Google, Facebook en Amazon. De digitale economie baart hyperschaal bedrijven. Betalingsverkeer en bankdiensten zijn de volgende aantrekkelijke buit.

Wat is Big Data? Het is veel meer dan ‘veel’ gegevens. Een elementaire deeltjes-botsingsexperiment in de CERN genereert 15 petabyte (een miljoen mijard) data, maar dat is geen ‘Big Data’. Big Data is een omvattend, gelaagd en maatschappelijk concept gebouwd op drie lagen nl. 1) data collectie, 2) data-analyse en 3) data-exploitatie. Dat laatste betreft, zeg maar, de doelstellingen waar het allemaal om draait.

Data collectie

‘Veel’ blijft wel een belangrijk aspect van Big Data. Walmart in de USA registreert dagelijks 2,5 petabyte data van zijn klanten-interacties.

Belangrijker is echter de grote diversiteit van de gegevens die uit verschillende bronnen met elkaar geïnterconnecteerd worden. ‘Dataficatie’, zo heet het nieuwe fenomeen dat daaraan ten grondslag ligt. Dataficatie kwantificeert alle aspecten van het dagelijkse leven. Waar je bent, wat je doet, met wie je vriendschappelijk omgaat, je incidentele gedachten gedeeld op twitter, je aankopen en surfgedrag, de stappen die je zet… Alles wordt in detail geregistreerd. Het ‘Internet of Things’ (IoT) dat weldra ons leven aangenamer moet maken, laat alle apparaten inclusief de kleding die je draagt met elkaar communiceren, overleggen en beslissingen nemen. Wanneer je wagen je agenda consulteert en reeds de beste route heeft uitgestippeld naar je volgende afspraak en hen heeft verwittigd dat je later bent, dan vergroot dat de hoop gegevens aanzienlijk. Er zijn er zelfs die voorstander zijn van het ‘Quantified Self’, ‘het gekwantificeerde ik’, een praktijk waarbij men het eigen leven en alle interacties met anderen voordurend registreert en opslaat.

Ver van ons bed? Met geruisloos gemak registreren computers vandaag gigantische hoeveelheden data, gestructureerde data (bijvoorbeeld belastingaangifte), teksten (zoals medische dossiers), vakantiefoto’s, video’s (onderweg op de autosnelweg wordt een inwoner van het Verenigd Koninkrijk per dag 300 maal gefilmd), GPS-gegevens, e-mails (een vergaderagenda), verbruiksmeters, geluidsfragmenten (nieuwe TV’s kijken naar de kijker, de gebruikersovereenkomst stipuleert dat wat je zegt in de huiskamer gedeeld wordt met derden en dat als je iets zegt dat je beter niet zou gezegd hebben, dat je eigen verantwoordelijkheid is), ‘klickstreams’ (Facebook-‘like’s’ en web browsing)…

Dat telkens inclusief de meta-data (data over de data): dus niet alleen de foto, maar ook wanneer en waar die foto genomen is, wie er op die foto staat, of de foto behoort tot een reeks of niet, met welk toestel, enz. En dit alles op een totaal geautomatiseerde wijze.

(Foto: Shutterstock (c) Jasni)

(Foto: Shutterstock (c) Jasni)

Data-analyse

Big Data is meer dan enkel gegevens. Het omvat ook de analyse met uiterst performante statistische technieken, patroonherkenningssoftware en artificiële intelligentie om uit de massa gegevens betekenisvolle signalen op te vissen. Big Data komt met de nieuwe geloofsbeleidenis dat datamaximalisatie – het doet er niet toe welke; hoe meer data hoe liever – leidt tot relevante, bruikbare, soms op geen andere manier te achterhalen en onverwachte bevindingen.

Data-exploitatie

Big Data kan niet begrepen worden zonder de doelstellingen, het waarom van al die inspanningen. Er is een wereld van verschil tussen het gebruik van gegevens over mijn levensstijl en het gebruik van biologische, genetische en gezondheidsgegevens van in de context van de patiënt-arts relatie om de best mogelijke medische diagnose te stellen en een behandeling voor te schrijven. Het is anders als bedrijven ongeoorloofd proberen binnen te dringen in mijn privéleven, proberen invloed te verwerven en zich toeleggen op de monetarisering van mijn data.

Grote consternatie dus toen Telenet, de verdeler van telefoon-, internet- en televisiediensten, vrolijk aankondigde dat ook zij zich wensen te laven aan Big Data. Het mediagebruik zal geregistreerd worden, software distilleert daaruit een dynamisch consumentprofiel waarop adverteerders tegen betaling kunnen intekenen om gericht, volgens het cyberprofiel, reclame op maat aan te bieden. De kijker moet daar blij mee zijn want, zo zegt Telenet, het zal zijn kijkervaring (experience) verbeteren.

Dat laatste zal je nog veel horen, de breed geëtalleerde bekommernis van de digitale spelers om de kwaliteit van onze ‘ervaring’, onze ‘beleving’ van hun diensten. ‘Experience’ wordt de heilige graal en gepersonaliseerde promoties horen daarbij; dat maakt ons gelukkig, is de boodschap. Men zal bovendien opwerpen dat wij dit ook allemaal graag willen. En inderdaad, hoewel de bedreigingen ernstig zijn, kost het veel moeite om mensen daarvan te overtuigen.

Het ontgaat de kijker, de surfer, de Facebookgebruiker en twitteraar dat hijzelf inmiddels in plaats van de klant het product is geworden. Voor de ‘datahandelaars’ ben jij het product dat hen geld opbrengt. Recent nieuws meldde dat Facebook de boel heeft belazerd door de tijd die gebruikers aan haar videoadvertenties besteden, geweldig te overschatten. De adverteerders die daar 77 miljard Eeuro aan gespendeerd hebben zijn woedend.

Stel je verder voor dat je wordt opgesloten in een echokamer, een situatie waarbij je enkel nog het nieuws ziet of informatie krijgt die de filter van je geaccumuleerd internet-interesseprofiel passeert. Ooit kocht ik een boek van Noam Chomsky. Jaren heeft het internet me het ene na het andere anarchistisch traktaat aanbevolen. Sindsdien verken ik de boekenmarkt op het web maar koop ik in de winkel.

Nog zwarter wordt het wanneer de massa en het individu onder toezicht (surveillance) staan en aan computers dermate autonome beslissingsmacht werd gegeven dat algehele volgzaamheid en naleving/inachtname van voorschriften de enige manier wordt om te overleven.

De democratie vaart hier niet wel bij. De onbalans in de machtsverhoudingen tussen de hyperschaal bedrijven en het individu – en zelfs haar vertegenwoordigers – doet de wet van de sterkste primeren. Heeft iemand nog een reactie gehoord van onze Europese leiders toen de Amerikaanse bedrijven Google, Facebook, Amazon, met Apple op kop, hen onlangs met represailles bedreigden na de terugvordering van illegale staatssteun in Ierland?

Enkele suggesties

Het legale framework dat bepaalt welke gegevens verzameld kunnen worden en welke niet, welke verwerking geauthoriseerd is en wat met het resultaat mag gedaan worden, is ontoereikend en gefragmenteerd verstopt in de dataprotectie en ‘safe harbour’-wetgeving, confidentialiteitsregels, consumenten-, en werknemersbeveiliging.

Enkele suggesties. Het zijn onze gegevens. Ook wanneer wij ze bijvoorbeeld op Facebook delen of wanneer het onze ‘klickstreams’ of transacties betreft. Dat wij eigenaar zijn, moet bij wet ondubbelzinning worden vastlegd.

‘Opt-in’ moet de regel worden zonder uitzondering. Per gebruiker moet er een consulteerbaar overkoepelend ‘opt-in’ register worden bijgehouden, door de bedrijven gefinancierd. Indien geen ‘opt-in’ is verkregen, mag de data niet alleen niet gebruikt worden, maar ook niet geanalyseerd.

‘Opt-in’ kan voor specifieke doelen betrekking hebben op gebruik op geanonimiseerde/gedeïdentificeerde wijze. Die anonimisatie moet aan regels voldoen en door een erkende landelijke instelling gevalideerd, geauthoriseerd en geregistreerd worden.

Bedrijven moeten in hun gebruiksvoorwaarden een strikt onderscheid maken tussen de data en opt-in goedkeuring nodig voor de normale werking van de beschreven basisdienst enerzijds en alle en elke andere extra dienst anderzijds.

Bedrijven kunnen privacy op generleiwijze afkopen noch met financiële kortingen, noch met beloningen of een op maat verbeterde ‘experience’.

Nu het inzicht groeit dat arbeid als belastbare grondslag moet ontzien worden en het onze gegevens zijn die als grondstof gebruikt worden, is het billijk dat, bij wijze van vergoeding, een belasting geheven wordt op het datavolume en het promotievolume in de internetkanalen.

Alle dataverkeer reguleren zal onmogelijk blijken. Daarom moet misbruik van data zeer streng bestraft worden, het moet een hoofdelijke aansprakelijkheid worden en wel in hoofde van het topmanagement.

Helen Nissenbaum in de USA ontwikkelt het concept van gewettigde en wettelijke zelfverdediging om aan de surveillantie te ontsnappen door het internet actief te misleiden met irrelevante zoekopdrachten en foutieve informatie.

Je kan aan je (klein)kinderen vragen om regelmatig met de afstandsbediening te spelen om zo de Telenet-algoritmes om de tuin te leiden. Maar vergeet vooral ook niet je Telenet-privacyinstellingen op ‘algemeen’ in te stellen.

 

  Dit is een gastbijdrage. Een Apache-lezer levert met dit stuk een bijdrage aan het maatschappelijk debat. De auteur schrijft in eigen naam en is verantwoordelijk voor de inhoud van de tekst.

Auteur: Marc Peeters

Marc Peeters is zelfstandig consulent en werkte als directeur in de R&D divisies van de Europese Pharmaceutische industrie.