Dit is een gastbijdrage. Een Apache-lezer levert met dit stuk een bijdrage aan het maatschappelijk debat. De auteur schrijft in eigen naam en is verantwoordelijk voor de inhoud van de tekst.

Statistiek in de komkommertijd

7 augustus 2015 Koen Smets
Koen Smets
Koen Smets
Koen Smets
Koen Smets

Een recent thema in het nieuws was de levensduur: in één jaar tijd zou die met ruim een half jaar zijn toegenomen, en afgelopen week kon men vernemen via de VRT nieuwssite dat de levensverwachting in Sint-Martens-Latem (84,2 jaar) niet minder dan acht jaar hoger ligt dan in Dour (76,5 jaar). “U leeft het langst in Sint-Martens-Latem”, meldt de kop boven het artikel. Het Laatste Nieuws gaat nog een stapje verder, en nodigt de lezer uit: “Check hier hoe oud je zal worden (voorspeld door de plek waar je woont)”. Is uw sterfdag écht zo sterk bepaald door uw adres?

Natuurlijk niet. Aardrijkskundige correlaties komen wel vaker voor – ik herinner me een grapje uit mijn kindertijd dat zich vrolijk maakte over de Limburgers: “Vraag: Wat moet je doen als het einde van de wereld aanbreekt? Antwoord: “Gauw naar Limburg gaan – daar zijn ze 20 jaar achterop.” Uiteraard onterecht, maar zelfs twijfelachtige volkswijsheid kan hardnekkig zijn.

Toch kan men zich terecht afvragen of er meer zit achter het klaarblijkelijke verband tussen de woonplaats en de levensverwachting. Er zou bijvoorbeeld een link kunnen zijn met de nabijheid van industriële activiteiten die plaatselijke lucht en water vervuilen, en zo tot ziekten leidt waardoor de bevolking in de buurt vroegtijdig overlijdt. Misschien is een groot deel van de inwoners tewerkgesteld in ongezonde en gevaarlijke productieprocessen waardoor een hoger aantal mensen om het leven komt door arbeidsongevallen of beroepsziekten. Of misschien is er helemaal geen direct verband met de woonplaats, maar eerder met het gemiddelde inkomen, en zijn het de armere gemeenten waarin de levensverwachting lager ligt.

Maar voor men tot zulke conclusies komt, is het nuttig na te gaan hoe betekenisvol zo’n verschil in levensverwachting eigenlijk is. Zoals wel eens vaker in deze stukjes wordt aangehaald is de confirmation bias nooit ver weg – ook niet onder journalisten en academici. Wanneer bijvoorbeeld een hogere incidentie van leukemie wordt vastgesteld in een gemeente nabij een nucleaire installatie, dan is de verleiding groot om meteen een causaal verband te zien. Dat is nochtans niet altijd zo. Het is belangrijk na te gaan hoe waarschijnlijk het is dat zo’n cluster, gegeven de gemiddelde kans op leukemie, voorkomt zonder dat er één specifieke oorzaak voor is.

Terug naar het verschil tussen Latem en Dour: is dat verschil van acht jaar werkelijk zo uitzonderlijk? Dat kan worden nagegaan gebaseerd op twee datasets: de sterftetabellen (die aangeven hoeveel overlijdens er waren voor elke leeftijdsgroep), en de bevolkingscijfers (hoeveel mensen zijn er van elke leeftijdsgroep). Beide datasets worden ter beschikking gesteld door de lieve mensen van de FOD Economie.

Aantal overlijdens per leeftijdsgroep (Bron: FOD)
Aantal overlijdens per leeftijdsgroep (Bron: FOD Economie)

Volgens deze gegevens was de gemiddelde leeftijd bij overlijden in 2013 voor heel België 77,3 jaar. Er zijn flink wat “gemiddelde Belgen” die dat jaar sterven op 77-jarige leeftijd – 2.635 om precies te zijn – maar dat is toch slechts 2,4% van het totale aantal overlijdens. Zoals de figuur toont, sterven mensen op allerlei leeftijden, van 0 (daar zit een piekje) tot 105 en meer (daar houden de statistici er mee op). De kans op overlijden neemt toe met de leeftijd, van ongeveer 1 op 2.000 op 1-jarige leeftijd, via 1 op 30 voor 77-jarigen, tot ruim 4 op 10 voor wie 104 jaar oud is.

Overlijdenskans per leeftijdsgroep (Bron: FOD Economie)
Overlijdenskans per leeftijdsgroep (Bron: FOD Economie)

Het overlijdensgedrag van de Belgen vertoont dus een aanzienlijke diversiteit. Is het betekenisvol dat die zich ook manifesteert als een diversiteit tussen gemeenten?

Stel dat we alle 11,1 miljoen Belgen verdelen over de 589 gemeenten, zodanig dat ze allemaal (van het kleine Herstappe met amper 85 inwoners tot het grote Antwerpen met ruim een half miljoen) hetzelfde bevolkingsprofiel hebben als het land in zijn geheel. Zou de gemiddelde leeftijd bij overlijden dan niet dezelfde zijn in elke gemeente? Dat kunnen we nader onderzoeken.

Bevolkingsprofiel (FOD Economie)
Bevolkingsprofiel (FOD Economie)

Als we de groep van 77-jarigen als voorbeeld nemen, dan verdelen we de 77.348 Belgen  van die leeftijd als volgt: 7 in Messines, 10 in Daverdisse, 59 in Sint-Martens-Latem, 118 in Dour, enzovoort, tot 1.420 in Charleroi, 1.734 in Gent en 3.539 in Antwerpen. (Er komt er ook eentje in Herstappe terecht.)  Van deze groep overleden er, zoals we al zagen, 2.635 in 2013 – ongeveer 1 op 30. Als we die overlijdens willekeurig verdelen over de hele leeftijdsgroep, ongeacht hun woonplaats, dan zal door toeval natuurlijk niet in elke gemeente netjes elke 30ste 77-jarige zijn pijp breken: in sommige gemeenten zullen er wat meer mensen overlijden in die groep dan gemiddeld, in de andere wat minder.

Wanneer we dit doen voor alle leeftijdsgroepen, dan verschijnt een beeld van de manier waarop de overlijdensleeftijd zich zou uiten als er geen inherent verschil bestaat tussen de gemeenten. Elke burger van een bepaalde leeftijd heeft evenveel kans te overlijden, ongeacht waar hij of zij woont, en het lot bepaalt wie komt te overlijden.

Een flinke rekentaak voorwaar, maar ik heb u de moeite bespaard, en het even uitgezocht. Hoe ziet dat beeld er dan uit? De gemeente met de laagste overlijdensleeftijd is de kleinste (Herstappe), maar dat is het gevolg van het feit dat er (in het experiment) slechts een inwoner overleed – een 66-jarige. Dat laten we even buiten beschouwing, en dan zien de bottom-5 en de top-5 er als volgt uit:

topandbottom

Wat meteen opvalt is dat de spreiding wanneer de overlijdens willekeurig, en dus zonder enige externe invloed, worden verdeeld over elke leeftijdscategorie, niet kleiner is dan in werkelijkheid. Wel integendeel: zelfs zonder de uitschieter Herstappe is het verschil 12,5 jaar. Een tweede observatie is dat het de kleinere gemeenten zijn die bovenaan en onderaan de rangschikking zijn. Wanneer we ons beperken tot gemeenten met meer dan 20.000 inwoners (148 van de 589), dan zit Mortsel onderaan met 75,2 jaar, en Knokke-Heist bovenaan met 79,3.  Veel dichter bij het nationale gemiddelde van 77,3 – maar nog steeds een verschil van vier jaar.

Ja maar, hoor ik u zeggen, dat is een steekproef van één enkel jaar. Niet getreurd, ik heb ook eens gekeken wat het resultaat is wanneer het gemiddelde over 10 jaar wordt genomen. Zoals verwacht wanneer een langere periode wordt beschouwd is is het resultaat minder extreem:

topandbottom2

Het kleine Herstappe zit nog steeds onderaan, maar nu niet langer als uitschieter (72,9). De spreiding is echter nog steeds bijna acht jaar, en ook hier zijn het de kleinere gemeenten die verder van het gemiddelde liggen – zelfs over een periode van 10 jaar. Bij de gemeenten van meer dan 20.000 inwoners heeft die langere periode geen groot effect: in Mortsel wordt een gemiddeld burger nu 75,3 jaar, en Knokke-Heist 78,8 jaar – een verschil van 3,5 jaar.

Statistieken behoeven, net als opgelegde komkommer, een flinke korrel zout.

Wat vertelt dit verhaal ons?

In de eerste plaats dat het is op zijn minst voorbarig is conclusies te verbinden aan die geobserveerde spreiding – althans op basis van het verschil tussen gemeenten. Als het gemiddelde inkomen van de gemeente met de laagste overlijdensleeftijd een stuk lager ligt dan dat van de gemeente met de hoogste levensverwachting, dan is het verleidelijk hieruit te besluiten dat het inkomen de levensverwachting voorspelt, zeker voor wie al zo’n vermoeden had.

Maar wanneer alle inwoners van een bepaalde leeftijdscategorie dezelfde overlijdenskans hebben, en wanneer alle gemeenten exact hetzelfde bevolkingsprofiel hebben met eenzelfde proportie van de inwoners in elke leeftijdsgroep, dan is er niets ongewoons aan een aanzienlijk verschil in levensverwachting tussen verschillende gemeenten.

Het besluit van de onderzoekers – een verschil in levensverwachting van acht jaar “is veel voor een klein land als België; je zou verwachten dat de toegang tot de gezondheidszorg dat gedeeltelijk uitvlakt, maar dat blijkt niet het geval" – lijkt dus precair. Natuurlijk kan het best zijn dat "een lagere levensverwachting deels een effect is van armoede of sociale uitsluiting, maar er ook mee de oorzaak van is" – maar dat mag niet zomaar worden geconcludeerd op basis van de levensverwachting in elke gemeente.

Deze studie en de weergave ervan in de media doen weinig om de zegswijze there are lies, damned lies, and statistics te weerleggen. Statistieken behoeven, net als opgelegde komkommer, een flinke korrel zout.

LEES OOK