Liegen met cijfers

Wat moeten studenten leren over statistiek?

Docenten statistiek leren hun studenten hoe je statistiek op de correcte manier gebruikt. Ze vertellen meestal niet hoe statistiek verkeerd wordt gebruikt of zelfs misbruikt en hoe je dat kunt herkennen. Zou dat niet eigenlijk heel nuttig zijn?

Al in 1954 verscheen er het welbekende boekje van Darrell Huff How to lie with statistics. Het is geen handboek voor bedriegers, maar een waarschuwing aan het brede publiek. Huff laat zien hoe o.a. bedrijven statistiek op een foute manier naar hun hand zetten. Inmiddels is het boekje bij de zoveelste druk en heeft het navolging gevonden, bijvoorbeeld in titels als How to lie with charts (G.E. Jones) en How charts lie (A. Cairo) op het gebied van grafieken. Terecht, want het is natuurlijk nog steeds zo dat data regelmatig bewust, of vaak ook onbewust, misleidend geanalyseerd en gepresenteerd worden.

Geen uitleg over valkuilen

Maar als docent statistiek leer je je studenten eigenlijk alleen hoe het wél moet. Wanneer ik voor de collegebanken sta om statistiek te onderwijzen, dan geef ik de studenten nette voorbeelden. Ik leg ze uit hoe ze iets op de correcte manier doen. Slechts hier en daar wijs ik ze op valkuilen. Ik vertel ze over vals positieve en vals negatieve uitkomsten, maar ik ga er niet diep op in hoe vaak deze incorrecte uitkomsten wel niet opduiken in de wetenschappelijke literatuur. En ik ga al helemaal niet in op ‘p-hacking‘: het net zo lang klooien met je data tot er iets spannends uitkomt, en dan alleen dat ene publiceren. Dat ene is dan waarschijnlijk een vals positieve uitkomst en bovendien niet gebaseerd op een theorie of hypothese waarvoor je de data verzameld hebt. Daarover heb ik het dus niet. Ik vertel ze vooral wat ze wel moeten doen, veel minder wat zij en anderen niet zouden moeten doen.

Opgeschoonde datasets

De datasets waar de studenten mee oefenen zijn keurig netjes opgeschoond, hebben zelden missende getallen en alleen wanneer we daar specifiek op willen wijzen, laten we er uitbijters in. Er kan niet veel mee fout gaan. Met levensechte data wel. Veel universiteiten geven een lesmodule integriteit, en eigenlijk hoop ik dat mijn studenten niet bewust zullen sjoemelen. Maar er is een groot grijs gebied in statistiek waarvan ze onvoldoende kennis of begrip hebben en waar de verleiding groot zal zijn om dan maar met de genade mee te werken richting een interessant resultaat (en dus onbewust de statistiek verkeerd toe te passen). Dat geldt waarschijnlijk ook voor aardig wat onderzoekers van wie ze de publicaties gaan lezen. Zelfs zonder kwade opzet komt er nogal wat foutieve statistiek naar buiten. We trainen onze studenten er niet in dat risico te herkennen.

Producenten of consumenten van statistiek

Als ik zo mijn collegezaal in kijk, zie ik een gevarieerd gezelschap: sommigen zullen onderzoekers worden, anderen consulenten, beleidsmedewerkers, managers, activisten of wat dan ook. Heel wat studenten zullen zich niet verder bekwamen in statistiek. Veel van hen zullen eerder de statistische gegevens van anderen gaan gebruiken dan zelf statistiek toepassen. Zouden we ze niet duidelijker moeten waarschuwen voor foute conclusies als gevolg van onwetendheid, nonchalance of soms zelfs echt bedrog (zie o.a. Makin & Orban de Xivry (2019)[i] of Reinhart (2015)[ii])? En waarom laten we ze niet oefenen met het herkennen van problemen? Mijns inziens is daar veel te winnen. Dan moeten we wel een aantal elementen schrappen uit het lesprogramma om daar plaats voor te maken. Of we geven ze gewoon allemaal een exemplaar mee van How to lie with statistics.

Noten

[i] Makin, T.M. & Orban de Xivry, J.-J., 2019, Science forum: ten common statistical mistakes to watch out for when writing or reviewing a manuscript. eLife 2019;8:e48175 doi: 10.7554/eLife.48175.

[ii] Reinhart, A, 2015, Statistics done wrong: the woefully complete guide. No Starch Press, ISBN-13: 978-1593276201. (or https://www.statisticsdonewrong.com/data-analysis.html)

Hoofdfoto: Pinocchio, Joe Penniston op Flickr

Zie ook:

Carolien de Kovel

Als wetenschapper heb ik er plezier in de raadsels van de natuur te ontrafelen. Met een analytische blik probeer ik de wereld om ons heen wat beter te begrijpen zonder mijn verwondering te verliezen. Ik deel mijn inzichten en vaardigheden graag met studenten en met wie maar geïnteresseerd is.

Add comment

To the VVSOR website