Amerikaanse verkiezingen 2024

Voorspellen in onzekerheid: heeft Harris nog kans tegen Trump?

De Amerikanen kiezen. Wordt het Harris of Trump? De sleutel ligt bij de Blue Wall-staten: Wisconsin, Michigan en Pennsylvania.

Het voorspellende model van de Amerikaanse website 538 geeft presidentskandidaat Donald Trump op dit moment een kans van 54% om de Amerikaanse presidentsverkiezingen te winnen. In 2016 waren de voorspellingen van alle grote nieuwswebsites fout en deed Trump het een stuk beter dan voorspeld. Heeft zijn Democratische opponent Kamala Harris überhaupt nog een kans?

In momenten van grote onzekerheid en angsten voor de toekomst, houden mensen zich graag vast aan informatie die hun hoop bevestigt. Tijdens de Amerikaanse presidentsverkiezingen in 2016 waren dit de peilingen en voorspellende modellen. Die gaven overweldigend aan dat Hillary Clinton zou winnen. Afhankelijk van het model was de kans op een Clinton-overwinning tussen de 70% en 95%.

Voor de Democraten was verkiezingsnacht een deceptie. De ‘Blue Wall’ werd doorbroken. In plaats van de verwachte overwinningsmarge van 4% voor Clinton, won Trump deze staten met minder dan 1%.

Ook in 2020 was er een misser in dezelfde orde van grootte. Joe Biden was voorspeld met meer dan 6% te winnen in deze staten door het model van 538, maar won uiteindelijk met een marge van minder dan 1%. Hoe kon het zo verkeerd gaan?


We focussen in dit artikel op het model van 538, dat wordt gezien als een van de meest betrouwbare. In 2008 begon de statisticus Nate Silver met dit model en voorspelde de uiteindelijke winnaar in 49 van de 50 staten en Washington D.C. In 2012 voorspelde het model van Silver de winnaar in alle 50 staten en D.C. Zijn invloed op het moderne kwantitatieve denken over verkiezingsvoorspellingen is enorm en is ook een topic voor onderzoek van politieke en communicatiewetenschappers. (Butterworth, 2014)


We weten dat we het niet weten
Voorspellingen zijn meestal verkeerd. Het weerbericht klopt nooit exact en Google Maps weet niet precies hoe laat je arriveert. Dit komt door de grote hoeveelheid onzekerheid in systemen. Die onzekerheid kunnen we opsplitsen in twee brede categorieën: aleatorische en epistemische onzekerheid.

Aleatorische onzekerheid komt van het Latijnse ‘alea’ wat zich in modern Nederlands vertaalt als dobbelsteen. De naam vertelt iets over de betekenis. We hebben volledige kennis over een dobbelsteen, maar toch kunnen we niet voorspellen wat de uitkomst van een worp is. Bij iedere worp (met een eerlijke dobbelsteen) is de kans op een 6 exact 1/6. Zo kon Trump in 2016 nog winnen met een kans tussen de 5% en 30%, zelfs als de modellen volledig correct waren. Het aleatorische deel van de onzekerheid kun je nooit wegnemen.

Epistemische onzekerheid, van het Griekse epistèmè wat kennis betekent, is de onzekerheid die komt door gebrek aan kennis die we in theorie wel kunnen hebben. De onzekerheid in peilingen omdat ze gebaseerd zijn op een steekproef van de bevolking, is een voorbeeld van epistemische onzekerheid. Een model ontwikkelen dat niet klopt, bijvoorbeeld door een belangrijke variabele niet mee te nemen, is een andere bron van epistemische onzekerheid.

Hadden de modellen het wel fout?
Het model van 538 gaf Trump op de vooravond van de verkiezingen in 2016 een kans van 28,6% om te winnen. Hij won, ondanks de voorspelde overwinning van Clinton door dat model. Maar zelfs als het model volledig correct was, was er altijd nog die aleatorische onzekerheid. De kans dat Trump zou winnen was groter dan de kans om een 6 te gooien met een dobbelsteen. Beide hadden een zeer reële kans.

Voorspelling van 538 aan de vooravond van de verkiezingen in 2016

Figuur 1: Voorspelling van 538 aan de vooravond van de verkiezingen in 2016.

Daarnaast waren de peilingen vrij goed op landelijk niveau. Website 538 voorspelde op basis van de peilingen dat 48,5% van de stemmen voor Clinton zou zijn, wat uiteindelijk 48,2% was. Voor Trump voorspelde 538 een percentage van 44,9%, wat uiteindelijk 46,1% werd. Beide uitkomsten waren ruim binnen de onzekerheidsmarges.

De ‘Blue Wall’
De voorspellingen gingen de mist in voor de staten van de ‘Blue Wall’: Pennsylvania, Michigan en Wisconsin. Als we kijken naar de kansen die 538 Trump gaf om deze staten te winnen, kwam dit respectievelijk uit op 23%, 21% en 16,5%. Als de verkiezingen in deze drie staten niet gecorreleerd zouden zijn, was de kans dat Trump ze alle drie zou winnen minder dan 1%. Toch gebeurde dit.

Correlaties tussen Staten

Figuur 2: Correlaties tussen staten. Donkergroen is een hoge positieve correlatie en roze een negatieve correlatie. In rood omcirkeld zijn de correlaties tussen de ‘Blue Wall’ staten. Uitgelicht is de correlatie tussen Pennsylvania en Michigan van 0.81.

Val van de Blue Wall
Correlatie is een maat die aangeeft hoe sterk twee waardes op dezelfde manier veranderen. De verkiezingsuitslag in de verschillende staten in de VS zijn gecorreleerd. Als Trump populairder wordt in staat A, is de kans groot dat hij ook populairder wordt in staat B. In de Blue Wall-staten zijn de demografische samenstellingen erg vergelijkbaar en stemmen mensen overwegend hetzelfde. Daardoor zijn ze sterk gecorreleerd.

Een correlatie van 1 tussen Pennsylvania en Michigan zou betekenen dat voor iedere tien extra stemmen voor Trump in Pennsylvania, hij ook tien extra stemmen krijgt in Michigan. In het model van 538 gaan de makers uit van een correlatie van 0,81 tussen deze twee staten (zie figuur 2 hierboven). Dus iedere tien extra stemmen voor Trump in Pennsylvania leveren hem er acht op in Michigan.

Deze sterke correlaties betekenen dat als Trump één van de drie staten weet te winnen, de kans op zijn overwinning in de andere twee staten ineens een stuk hoger wordt. Dit gebeurde uiteindelijk ook in 2016. De kans dat Trump alle drie staten zou winnen, werd expliciet in het model meegenomen. Dat resulteerde in de 29% kans op zijn overwinning.

Kunnen we de modellen dit jaar vertrouwen?
Het huidige model van 538 geeft Trump een week voor de presidentsverkiezingen op 5 november een kans van 54% om te winnen. Opnieuw lijkt de sleutel te liggen bij de drie bekende Blue Wall-staten. Als Donald Trump North Carolina, Georgia, Arizona en Nevada wint, maar Kamala Harris de drie Blue Wall-staten Wisconsin, Michigan en Pennsylvania, wint Harris de verkiezingen met de kleinst mogelijke marge.

De kans is groot dat de correlatie tussen deze drie staten de verkiezing zal beslissen. Het model van 538 schat de kans dat één van deze staten de doorslag geeft (de 270ste electorale stem geeft) op ruim 48%.

Wie gaat er winnen?
Zoals genoemd, denkt 538 met een kans van 54% dat Trump gaat winnen. Het model van The Economist geeft Trump een 56% kans op te winnen. RaceToTheWH geeft Harris de grootste kans om te winnen, met 51%. Het nieuwe model van Nate Silver, the Silver Bulletin geeft Trump een 55% kans op winst. Als je na dit artikel niet meer wil vertrouwen op data maar op expertise, voorspelt historicus Allan Lichtman, die al sinds 1984 correct is geweest in de uitslag van presidentsverkiezingen, dat Kamala Harris zal winnen.

Welke conclusie kunnen we trekken uit al deze modellen en voorspellingen? Dat ligt eraan wat je eruit wil halen. Als je, zoals velen in 2016, geruststelling zoekt, kun je niet rustig ademen zodra jouw favoriete kandidaat voor staat in de voorspellingen. Geen enkel model is perfect en de kans dat de uitslag klopt, niet alleen qua staten maar ook percentages stemmen, is nihil. Door de correlaties is de kans groot dat als die peilingen verkeerd zijn, ze in heel veel staten verkeerd zullen zijn.

Hoe dan ook, de voorspellingen zijn nu 50/50. Voorspellen of er op 5 november kop of munt wordt gegooid, kan niet. We zullen weer gewoon moeten wachten tot de stemmen geteld zijn om erachter te komen wie president zal zijn.

Bronnen:
Figuur 1: Voorspelling van 538 aan de vooravond van de verkiezingen in 2016
Figuur 2: Correlaties tussen staten

Butterworth, M.L. (2014), Nate Silver and Campaign 2012: Sport, the Statistical Frame, and the Rhetoric of Electoral Forecasting. J Commun, 64: 895-914.

Foto: via Freepik

Profielfoto Toby Hackmann

Toby Hackmann

Als promovendus aan het LUMC ben ik gespecialiseerd in het ontwikkelen van voorspellende modellen voor individuele patiëntvoorspellingen, met een focus op melanoom. Mijn passie voor statistiek en data-analyse drijft me om de onzekerheid in voorspellingen helder in kaart te brengen. In mijn blogs deel ik inzichten over de uitdagingen in de ontwikkeling en het gebruik van voorspellende modellen.

Add comment

To the VVSOR website