Waarom statistiek een struikelvak is

Statistiek is een essentieel onderdeel van veel wetenschappelijk onderzoek, maar veel studenten (en wetenschappers) worstelen ermee. Waarom is het zo’n lastig vak?

Statistiek is lastig. Tenminste, dat vinden sommige jaargenoten van mijn student-assistent, die het vak statistiek steeds uitstellen, omdat ze bang zijn dat het moeilijk is. Als ik aan buren of vrienden vertel dat ik statistiek onderwijs, hoor ik heel vaak dat mensen dat zo’n vreselijk vak vonden. Zelfs in de wetenschappelijke literatuur kom je artikelen tegen met als onderwerp ‘statistics anxiety’, statistiekangst. Wat is er anders aan statistiek dan aan andere vakken, zoals bijvoorbeeld virologie?

Het is jammer dat studenten soms al bang zijn voor statistiek voordat ze er serieus mee aan de slag zijn gegaan. Er zitten zeker aspecten aan het vak die maken dat je het op een andere manier moet benaderen dan veel andere vakken.  Maar het is ook weer geen magie waar je een speciaal talent voor nodig hebt. En als je het eenmaal in de vingers hebt, kan het veel voldoening geven om uit een berg data zinnige informatie te kunnen halen.

Alles is onzeker

Het principe van statistiek is onzekerheid, alles draait om kansen. Wat is de kans dat dit per toeval gebeurt? Wanneer ‘geloven’ we niet meer dat iets toeval is? Statistici houden graag een slag om de arm: dit is aangetoond, maar …  Het is zo vaag!! Het denken in kansen is niet gemakkelijk.

Wetenschap is gebouwd op onderzoek, en elk onderzoek begint met hypothesen die je vervolgens wel of niet verwerpt. Met voorspellingen op basis van een theorie, die dan wel of niet uitkomen. Bij statistiek wordt dat proces zichtbaar gemaakt.

Maar veel basisvakken zijn gebaseerd op theorieën die zo vaak onderzocht zijn, dat we ze langzamerhand als waarheid accepteren: Als je inademt komt lucht in je longblaasjes en je nieren produceren urine. Dat dit soort feiten ook ooit hypothesen waren, is weggezakt.

Denken in onzekerheden is niet alleen lastig, het voelt vaak ook ongemakkelijk.

Eén basisidee

Een belangrijk onderdeel in ons vak is het doen van statistische toetsen: je vergelijkt twee gemiddelden, je vergelijkt drie proporties of je kijkt of er een lineair verband is tussen twee dingen (variabelen). Al die toetsen zijn gebaseerd op hetzelfde principe. Als je dat principe niet echt tot je hebt laten doordringen, is elke nieuwe statistische toets weer een uitdaging.

En toegegeven, het basisidee begrijpen vraagt wel wat van de student: de hypothese van ‘geen effect’ krijgt het voordeel van de twijfel tot we behoorlijk overtuigd zijn van het tegendeel. Dat is toch wel counter-intuïtief als je juist geïnteresseerd bent in ‘wel een effect’. Maar als je het basisidee niet begrijpt, is alles wat erop volgt ook niet goed te plaatsen.

In veel andere vakken is kennis minder vervlochten. Als een je een bepaald onderdeel niet zo goed in je hoofd hebt, is dat niet zo’n ramp want je kunt wel verder met het volgende onderwerp. Als je dat gewend bent, kun je geneigd zijn om het begrijpen van het basisidee van statistiek voor je uit te schuiven als je het niet 1-2-3 doorgrondt.

Kennis en vaardigheden

De vaardigheden die je in andere vakken aanleert, zijn niet altijd noodzakelijk voor het begrijpen van de bijbehorende theorie. Leren pipetteren is niet essentieel voor het begrijpen van moleculaire processen. Oefenen in het observeren van het gedrag van dieren is niet noodzakelijk voor het begrijpen van theorieën over gedrag.

Maar statistiek is een stuk gereedschap, iets wat je moet toepassen. En het is vaak zo dat als je de theorie goed hebt overdacht, het laatste kwartjea toch pas valt als je die theorie echt gaat toepassen. Als je net een aantal vakken hebt gehad waarin theorie en praktijk minder aan elkaar hangen, kan het lastig zijn om ze bij statistiek in samenhang te beschouwen. Het kan verleidelijk zijn om of theorie of opgaven een paar dagen uit te stellen, maar dat haalt ze uit hun verband, en de stof wordt minder goed verwerkt.

Abstract

Zoals gezegd, statistiek is gereedschap. Om het te gebruiken, moet je abstracte wiskundige begrippen koppelen aan de fysieke werkelijkheid van tomaten of guppy’s. Je moet dus goed weten wat die wiskundige symbolen, zoals bijvoorbeeld gemiddelde of standaarddeviatie, echt betekenen.  En dat koppelen is vaak gemakkelijker bij situaties waar je je goed een voorstelling bij kan maken, dan bij onbekendere of complexere situaties.

Er zijn dus best redenen waarom je statistiek als lastig kunt ervaren en waarom studenten die weinig problemen ondervinden bij andere vakken, met statistiek ineens moeite kunnen hebben. Vooral de manier van studeren, waarbij begrip belangrijker is dan onthouden en waarbij je eerst het ene onderdeel echt moet verwerken voor je met het volgende onderdeel begint, kunnen studenten in andere vakken ‘afgeleerd’ hebben.

Uitdaging

Maar statistiek betreft wel de kern van wat we als moderne wetenschap beschouwen. We aanvaarden een hypothese tot we voldoende bewijs hebben verzameld dat de hypothese weerlegt. Dan aanvaarden we de nieuwe hypothese, maar altijd met een slag om de arm.

Overigens vindt lang niet iedereen het vervelend dat statistiek een wat andere studiehouding vraagt. In een recente vak-evaluatie schreef iemand: ”…this course finally challenges me to think.”, dit vak daagt me eindelijk uit om na te denken.

a kwartje: muntje uit het guldentijdperk

Figuur: https://pxhere.com/en/photo/1666318 No copyright

Avatar photo

Carolien de Kovel

Als wetenschapper heb ik er plezier in de raadsels van de natuur te ontrafelen. Met een analytische blik probeer ik de wereld om ons heen wat beter te begrijpen zonder mijn verwondering te verliezen. Ik deel mijn inzichten en vaardigheden graag met studenten en met wie maar geïnteresseerd is.

3 comments

  • “Elk onderzoek begint met hypothesen die je vervolgens wel of niet verwerpt” staat in de leerboeken maar klopt niet met de werkelijkheid. De meest interessante onderzoek begint met onderzoek naar iets anders, maar leidt tot iets onverwachts, en dat leidt tot nieuw onderzoek. Statistiek heeft twee “modusen”. Confirmatory, exploratory. In de wetenschap worden ze continu met elkaar afgewisseld. Statistiek is leuk omdat het een vitale rol speelt in *beide* fasen.

    • Dank voor je reactie.
      Het is zeker waar dat er nog veel valt te nuanceren en dat de werkelijkheid vaak afwijkt van de simpele opzet die in de boeken staat. In de meeste statistiekcursussen die wij geven op de basisniveaus, gaan we er niet op in hoe je aan je studie-opzet of aan je vraagstelling komt. Ook omdat dat vaak afhangt van het vakgebied van de student. Exploratief zien we meer als iets voor vervolgvakken met kleinere en homogenere groepen studenten.

  • Heel interessant, dit artikel, dank je wel!

    Puttend uit eigen ervaring: eind jaren ‘80 gaf ik statistiek aan studenten Psychologie; we begonnen met Waarschijnlijkheidsrekening (verzamelingenleer, kansruimten, kansverdelingen, combinatoriek, etc), gevolgd door Statistiek met een significant aantal formules. Dit waren inderdaad geen populaire vakken, “statistics anxiety”, hoe herkenbaar! Plus demotivatie, en ook, hoe meer we de diepte ingingen des te minder begreep men er van. Maar bovenal: men leerde niet hoe je de vertaalslag maakt van statistiek naar het beantwoorden van onderzoeksvragen (of welk type data men moet verzamelen om een onderzoeksvraag te beantwoorden).

    Mijn bescheiden mening is dat statistiek voor deze doelgroep (Psychologen) een hulpwetenschap is, net als voor studenten van vele andere studierichtingen. Men moet leren hoe je analysemethoden uiteindelijk verantwoord in eigen onderzoek kunt inzetten. En waarom zou je hiertoe “onder de motorkap” (Waarschijnlijkheidsrekening, allerhande formules) willen kijken? (Studenten Wiskunde, uiteraard, maar Psychologen, nee).

    In mijn volgende baan, bij een statistisch software bedrijf, kon ik mijn passie voor statistiekonderwijs volgens mijn eigen visie vorm en inhoud geven. En die visie is: als je niet onder de motorkap gaat kijken maar cursisten leert te vertrouwen op hun intuïtie en focust op het begrijpen van de leidende principes, dan kan men al heel snel een groot aantal analysemethoden verantwoord toepassen. Statistisch toetsen, zoals in het blog uitvergroot, is één van die leidende principes (en zeer intuïtief: om iets overtuigend aan te tonen geef je alle voordeel van de twijfel aan het tegenovergestelde, totdat dat uitgangspunt niet meer aannemelijk is). Als je eenmaal het idee van statistisch toetsen te pakken hebt, dan kun je de uitkomst van elke toets interpreteren. Praktisch gesproken: als je weet welke toets je moet uitvoeren (en waarom), welke assumpties je moet checken (en waarom), en het idee van statistisch toetsen te pakken hebt, dan kun je je data verantwoord analyseren. Dat is allemaal geen hogere wiskunde en vergt geen weken studie.

    Ik zou dan ook willen pleiten voor een fundamenteel ander statistiekonderwijs, namelijk het focussen op de leidende principes, vanuit een intuïtieve benadering. Niet diep ingaan op elke analysemethode (dat zou overigens ook te veel tijd vergen, zo zijn er bijvoorbeeld wel heel veel aantal algoritmen op het gebied van Data Science), maar juist leren om een breed scala analysemethoden verantwoord te leren toepassen. Kortom: het statistiekonderwijs zou moeten appelleren aan de intuïtie, gericht moeten zijn op het efficiënt leren van statistiek, aan de hand van onderzoeksvragen uit de praktijk; dat zou studenten motiveren voor het vak Statistiek en kan men Statistiek later verantwoord in eigen onderzoek toepassen. En ik zou ook zeggen, omarm AI bij het onderwijs en leer om kritisch te kijken naar de antwoorden van, zeg, ChatGPT.

    Hoe dan ook, zeer interessant en relevant om te discussiëren over hoe Statistiek onderwijs vorm en inhoud te geven. Jos den Ronden (30+ jaar ervaring in onderwijs in statistiek en data analyse)

To the VVSOR website