Dit is een gastbijdrage. Een Apache-lezer levert met dit stuk een bijdrage aan het maatschappelijk debat. De auteur schrijft in eigen naam en is verantwoordelijk voor de inhoud van de tekst.

Plezier met percentages

17 augustus 2018 Koen Smets
percent3

Een typisch voorbeeld van hoe de media vaak (grote) absolute getallen gebruiken om hun verhalen te ondersteunen. 280 klinkt aanzienlijk, maar zonder te weten hoeveel bestellingen er in totaal plaatsvonden vertelt het ons niet zoveel. Wereldwijd verstuurde Amazon 5 miljard pakketjes via Prime in 2017. Het aantal zendingen in het VK wordt niet specifiek vermeld, maar aan de hand van de omzetcijfers in het VK (11,4 miljard dollar) en globaal (178 miljard dollar) kunnen we dat wel schatten: 6,5% van 5 miljard is 320 miljoen – laten we zeggen zowat 40 miljoen in december. Dat verschaft wat perspectief voor de 280 klachten (0,0007%).

Zonder zo’n referentiepunt worden we algauw misleid tot het toeschrijven van een bedrieglijke betekenis aan een getal. Zodra het echter wordt uitgedrukt als een relevant percentage, is het vaak een stuk helderder (en lang niet zo sensationeel).

Nochtans zijn percentages geen garantie voor duidelijkheid, en hebben ze soms ook nood aan meer context. Enkele jaren terug schreef ik al eens over het vermogen van het %-teken om ons in de luren te leggen in de winkel, en bij opiniepeilingen en voorspellingen. Hier zijn nog wat meer situaties waar je toch beter wat voorzichtig bent voor je conclusies trekt.

Een waarachtige kankerepidemie?

Eerder deze zomer meldde The Independent dat het aantal kankergevallen wereldwijd in de laatste 10 jaar met een derde was toegenomen. Wat gaat er schuil achter deze dramatische epidemie? Was dit de afrekening voor onze kankerverwekkende levensstijl (roken, een ongezond dieet en te veel in de zon)?

Deels wellicht wel, maar dat is niet het hele verhaal. Kanker is vooral een ouderdomsziekte: de helft van de kankerdiagnoses in het VK vinden plaats bij personen van 70 en ouder. Slechts 10% van de gevallen komt voor bij mensen onder de 50. Naarmate de bevolking vergrijst, is het dus weinig verbazend dat het aantal kankergevallen naar omhoog gaat. '33% meer kankergevallen' als krantenkop vertelt ons dan wel meer dan '120.000 meer kankerdiagnoses', maar ook die verhouding schiet te kort.

cancer
Kanker: vooral bij de oudere medemens (bron)

Misleidend

Economische statistieken kunnen eveneens onderhevig zijn aan een vreemd en potentieel misleidend effect. Het gezinsinkomen is een veelgebruikte indicator om de verdeling van de economische middelen in een maatschappij te onderzoeken. Door na te gaan welk deel van het inkomen toekomt aan welke schijf van de bevolking kunnen we oordelen of een samenleving meer of minder gelijk is (of wordt). Maar zou het kunnen dat bijvoorbeeld iedereen rijker wordt, en desondanks het gezinsinkomen van de middenklasse daalt?

In een voortreffelijke video legt econoom en gastheer van de Econtalk podcast Russ Roberts, aan de hand van een vereenvoudigd voorbeeld, uit hoe dat zou kunnen gebeuren. Beeld u een perfect egalitaire samenleving in, met tien gezinnen van 2 personen. Elke burger verdient 50.000 euro, dus het gemiddelde gezinsinkomen in elke kwintiel (een schijf van 20%) is 100.000 euro. De economie doet het goed, en 30 jaar later is het inkomen van elke burger verdubbeld. Wel is het zo dat er, door echtscheidingen en door het feit dat jongere mensen (die de overledenen tijdens die periode komen te vervangen) later koppels vormen, nu 15 gezinnen zijn: 10 singletons en 5 koppels.

Wanneer deze opnieuw in kwintielen worden verdeeld stellen we vast dat het 'rijkste' vijfde nu 30% van het totale inkomen vertegenwoordigt, en de ‘middenklasse’ slechts 15%. De rijkste gezinnen hebben hun inkomen verdubbeld, en hun aandeel zien toenemen met 50%; het inkomen van de middenklassegezinnen daarentegen is ongewijzigd gebleven, en hun aandeel nam af met 25%.

Dit is weliswaar een hypothetische situatie, maar u ziet natuurlijk wel hoe demografische verschuivingen de cijfers kunnen beïnvloeden en ons oordeel verstoren. In het werkelijke leven heb je bijvoorbeeld het effect van de vergrijzing. Wie met pensioen is heeft meestal een lager inkomen dan toen hij of zij werkte. Naarmate iedereen langer leeft neemt de proportie van gepensioneerden toe, en dus ook van gezinnen met een relatief lager inkomen. Mensen met een lagere opleiding verdienen in het algemeen ook minder dan hoger opgeleiden, en aangezien in de eerste categorie meer gezinnen met slechts een volwassene voorkomen is ook dat een reden waarom het gemiddelde gezinsinkomen naar beneden gaat. De verdeling van het inkomen kan dus een verschuiving van arm naar rijk tonen, enkel door een relatieve toename of afname van een zeker type gezin.

Discrimineren bij het rekruteren?

Iets gelijkaardigs kom je ook tegen op andere plaatsen. Stel: een ziekenhuis wil eerdere kritiek vermijden dat het er moeilijker is voor vrouwen om er een baan te krijgen dan voor mannen. Bij de voorbereiding van het laatste jaarrapport voeren zowel het hoofd van de klinische staf als het hoofd van het administratieve personeel aan dat vrouwen het afgelopen jaar beter presteerden bij het solliciteren dan mannen. Voor klinische jobs werden bijna 87% van de vrouwelijke kandidaten ingehuurd; voor administratieve banen was dat meer dan 45%; hogere cijfers in beide gevallen dan voor mannen (respectievelijk 80% en 40%). Alles wordt netjes bijeengeteld, maar de CEO is geschokt wanneer ze vaststelt dat in totaal net geen 64% van de vrouwelijke kandidaten een job aangeboden kregen, maar dat de mannen het bijna 5% beter deden, bijna 69%.

Simpsonstabel

Dit fenomeen is bekend als de Simpson-paradox, naar de Britse statisticus Edward Simpson, die hem beschreef in een klassiek paper in 1951. (Weetje: dat was echter niet voor het eerst: het fenomeen werd voorheen geïdentificeerd door Karl Pearson in 1899 en door Udny Yule in 1903, maar het was Simpsons naam die bleef hangen.)

Het intrigerende verhaal van het ziekenhuis toont dat we voorzichtig moeten zijn bij het interpreteren van percentages. Maken vrouwen werkelijk minder kans op een baan (zoals de globale cijfers suggereren) of eigenlijk toch meer kans (zoals de departementale cijfers tonen)? Zoals zo vaak moeten we proberen oorzaak van correlatie te scheiden. Is de oorzaak van de klaarblijkelijke discriminatie tegen vrouwen het inhuurbeleid? Wanneer we de data van naderbij bekijken, zien we dat vrouwen veel meer dan mannen solliciteren voor administratieve jobs, waar minder vacatures zijn, en waar de kandidaten in het algemeen minder succesvol zijn dan bij de klinische banen. Dat is waar het tegenintuïtieve aan toe te schrijven is, maar probeer die nuance maar eens te vatten in een krantenkop…

Foppen met cijfers

Als toemaatje nog een voorbeeld van hoe je statistieken kunt gebruiken om je baas tevreden te stellen met een minimum aan inspanning. Zita heeft de leiding over twee teams van vertalers die ondertitels maken voor film en TV. Team A bestaat uit vier personen: Alice, Bob, Chris en Dan; in team B zijn ze met vijven: Erik, Fran, Gerry, Hank en Iris. Hun lange-termijngemiddelden (het aantal vertaalde woorden per dag) staan in de tabel hieronder. Team B doet het duidelijk beter dan team A, en Zoë’s baas draagt haar op een hartig woordje te praten met team A, zodat ze minstens het industriegemiddelde van 2.500 woorden per dag halen.

teamsvoor

Zoë denkt even na, en heeft dan een ingeving: ze besluit Fran van team B naar team A over te plaatsen. Niet enkel haalt het gemiddelde van team A zo het doel van 2.500 woorden per dag, haar baas zal ongetwijfeld erg tevreden zijn te horen dat ze ook de prestaties van team B heeft verbeterd!

teamsna

Was leidinggeven maar altijd zo eenvoudig…

LEES OOK
Jan Walraven / 05-11-2015

Federaal ambtenarenkorps daalde al voor aantreden Michel I

Jobs, jobs, jobs. Uit berichtgeving in de Vlaamse media moest deze week blijken dat de federale regering Michel grandioos in zijn opzet slaagt en breekt met de periode Di Rupo. In…
Premier Charles Michel (Foto: Federale Overheid)
Koen Smets / 07-08-2015

Statistiek in de komkommertijd

Moet wie oud wil worden zo snel mogelijk naar Sint-Martens-Latem verhuizen?
Koen Smets