‘Je hebt leugens, grove leugens en statistieken.’ Van wie deze uitspraak is, weet ik niet meer. Onlangs las ik een boek waarin iemand door middel van data zijn hypothese probeerde te bewijzen. De stellingen die hij probeerde te bewijzen waren op zich interessant, maar het schermen met data was eigenlijk vooral irritant.

Met die data probeerde hij te bewijzen dat latergeborenen in een gezin ‘radicaler’ zijn dan eerstgeborenen. Om dat te bewijzen had hij een enorme berg aan ‘data’ verzameld van geleerden uit de afgelopen eeuwen en die data in statistieken verwerkt om zijn hypothese kracht bij te zetten. Tegelijkertijd kon hij niet om het feit heen dat er ook veel uitzonderingen op de regel zijn, die dan weer verklaard werden door te beweren dat deze persoon technisch gezien bij de latergeborenen hoorde, maar, door de omstandigheden toch als eerstgeborene gezien moest worden. Maar zelfs dan waren er uitzonderingen. Maar die bevestigden dan de hypothese ook weer, omdat het uitzonderingen op de regel zouden zijn.

Het kwam op mij vooral over als gegoochel met cijfers. In ieder hoofdstuk herhaalde hij zichzelf veelvuldig, vooral door elke keer weer naar die data te verwijzen, waardoor het boek letterlijk tien keer zo dik was als, gezien de informatie die er in staat, nodig was geweest. Op zichzelf is het natuurlijk wel interessant om na te gaan of en hoe de positie van iemand in het gezin van invloed is (geweest) op diens persoonlijkheid. Daar is in de psychologie ook vaker aandacht aan besteed. Maar statistieken geven daar, hoe graag de schrijver dat ook anders ziet, geen uitsluitsel over. Dat kan ook niet, omdat individuele mensen niet alleen verschillen, maar alle gezinnen ook verschillen.

Daarbij is het de vraag wat je ‘radicaal’ noemt. De schrijver van het boek wilde graag bewijzen dat latergeborenen rebelser zijn  dan eerstgeborenen. De titel van het boek was dan ook: ‘De Rebel van de Familie’. Hij keek daarbij naar de neiging van mensen (vooral wetenschappers) om vernieuwingen te accepteren of om dat juist niet te doen. Degenen die vernieuwingen accepteren noemde hij ‘radicaal’, maar degene die dat juist niet doen, niet.

Toch is iemand die koste wat koste vasthoudt aan zijn ideeën naar mijn idee nogal radicaal. Iemands hoofd afhakken of levend verbranden omdat hij of zij anders over religie denkt, ervaar ik ook als nogal radicaal, ook al is zo iemand zeker niet in voor nieuwe ideeën. Het boek staat ook vol grafieken om te laten zien wat de data zouden aantonen. Ik heb sterk de indruk dat de schrijver eerst een hypothese had en toen naar ‘bewijzen’ van de juistheid van die hypothese is gaan zoeken. En die vond hij, in de ‘data.’

Cijfers blijken voor veel mensen een bijna magische betekenis te hebben. Ik denk dat dat komt omdat cijfers een innerlijke logica hebben, die voor sommige mensen een uitermate grote aantrekkelijkheid heeft. Anders dan bij woorden lijken cijfers maar één betekenis te hebben. Dat is op zich geen probleem, mits die cijfers niet bepalend worden voor het kijken naar de wereld zoals die echt is. Wiskunde is een systeem dat alleen in zichzelf coherent logisch is, maar daar buiten lang niet altijd.

 

Stel dat je met negen mensen op de bus staat te wachten en dat die negen mensen gemiddeld tienduizend euro bezitten. Dan komt er een tiende persoon bij en plots bezitten die tien mensen gemiddeld 8 miljard euro. Kan dat? Ja, dat kan. Dat betekent niet dat die negen mensen ineens 7.999.990.000 euro rijker zijn geworden, maar dat die tiende persoon in zijn eentje 80 miljard bezit. Nou geef ik toe; de kans dat Bill Gates op de bus gaat staan wachten is niet zo heel groot, maar het kan wel. Wat zegt zo’n gemiddelde dan? Eigenlijk helemaal niets. Want van die tien personen bezit niet één persoon het gemiddelde bedrag. Als Bill Gates vervolgens weer wegloopt omdat ie toch liever een taxi neemt, of bij de bushalte wordt opgehaald door zijn  chauffeur, dan zakt het gemiddelde bezit weer naar 10.000 euro per persoon. Maar ook dat betekent niet dat één van die negen personen precies 10.000 euro bezit. Het is waarschijnlijker dat dat niet zo is.

Stel dat je gaat berekenen hoeveel kinderen er gemiddeld deel uit maken van een gezin in Nederland. Dan kun je tot de conclusie komen dat dat 1,7 kind is. Toch zul je nooit, hoelang je ook zoekt, een gezin tegenkomen met 1,7 kind.

Nou en, zul je zeggen, het gaat toch om gemiddelden, dat zegt toch wel iets. Ja, maar wat dan? Zo blijkt, uit onderzoek dat vrouwen gemiddeld hoger scoren op een empathietest dan mannen. ‘Zie je wel,’ zullen veel vrouwen denken, ‘vrouwen hebben meer empathie dan mannen.’ Maar is dat ook zo? Ik zag laatst zo’n empathietest waarbij er te scoren viel tussen 0 en 80. Gemiddeld scoren mannen op die test 42 en vrouwen scoren gemiddeld 47. Dat lijkt te bevestigen dat vrouwen meer empathie hebben dan mannen.

Maar stel dat je tien mannen en vrouwen test, waarbij 9 mannen precies 45 scoren en 9 vrouwen ook precies 45. Dan zijn die 9 mannen en die 9 vrouwen precies even empathisch. Vervelend voor die mannen, maar nummer tien scoort bijzonder slecht en blijkt slechts een score van 18 te hebben en, oeps, daar daalt het gemiddelde van de mannen tot een gemiddelde score van 42. De vrouwen hebben geluk; nummer tien blijkt heel hoog te scoren, namelijk 65 en dat brengt de gemiddelde score op 47. Met andere woorden, dat gemiddelde zegt niets over de empathische waarde van de individuele man of vrouw.

Een vrouw die een man verwijt dat hij, omdat hij een man is, veel minder empathie heeft dan zijzelf omdat ‘vrouwen nu eenmaal meer empathie hebben dan mannen,’ zou zich wel eens danig kunnen vergissen. Zijzelf zou wel eens onder het gemiddelde kunnen zitten en op zo’n test slechts een score van 38 behalen, terwijl die man, heel goed denkbaar, een score van 49 zou kunnen halen. Sterker nog; als je honderd vrouwen en honderd mannen zou testen, dan zou een groot deel van die vrouwen onder het gemiddelde van 47 moeten zitten en dan zou ook een significant deel van de mannen hoger dan die vrouwen moeten scoren. Dat is goed om in ogenschouw te nemen.

Stel dat we de gemiddelde score van mensen berekenen, dan zou dat precies tussen 42 en 47 in moeten zitten, dan komen we op een gemiddelde van 44,5. De kans dat 40 procent van de vrouwen daar onder zit, is niet denkbeeldig en de kans dat 40 procent van de mannen daarboven zit ook niet. Dat betekent dan, ik goochel nu ook maar eventjes met cijfers, dat de 40 procent hoogst scorende mannen meer empathie hebben dan de 40 procent laagst scorende vrouwen. Maar dat soort nuances gaat, bij het berekenen van gemiddelden, vaak verloren.

Daarom zit er wel iets in die stelling aan het begin; je hebt leugens, grove leugens en statistieken. Dat komt niet omdat cijfers liegen. Dat komt simpelweg omdat cijfers de werkelijkheid niet representeren. En zeker niet als cijfers verkeerd gelezen worden. Dus helaas dames, dat je een vrouw bent betekent niet dat je automatisch meer empathie hebt dan ik. Ook al ben ik een man.

 

 

 

 

terug naar de startpagina van moors magazine

« | »