Het nut van nutteloos onderzoek

Het nut van nutteloos statistisch onderzoek*

Soms denk je tijdens je promotieonderzoek: waar is dit goed voor? Mark van de Wiel blogt over hoe een techniek waarin hij zich had verdiept zelfs 25 jaar later van nut bleek.

Recent promoveerde mijn elfde promovendus, Jeroen Goedhart. Het was een fantastische dag met een goede verdediging. Zelf merkte hij op: “Was het nuttig? Misschien een beetje. Was het leuk? Jazeker!” Ter afsluiting van de zitting zei de voorzitster: “Maar als het dan zo leuk was, dan is het werk waarschijnlijk uiteindelijk nuttiger dan jij denkt.” Ik denk dat ze hier wel eens gelijk in zou kunnen hebben.

Terug in de tijd: het jaar 2000
Ruim 25 jaar geleden deed ik mijn promotieonderzoek aan de TU Eindhoven. Ik was gefascineerd door kansengenererende functies en leidde allerlei eigenschappen van verdelingen af aan de hand van deze functies. Ik schreef een paar artikelen, programmeerde ook het een en ander en vatte alles samen in een boekje. Ik dacht ook: “Was het nuttig? Misschien een beetje. Was het leuk? Jazeker!”

Natuurlijk was het nuttig voor mijzelf, zoals ook het werk van mijn promovendus nuttig zal zijn voor hem. Want de artikelen en het proefschrift zijn een soort brevet van vermogen, dus die hebben mij verder geholpen in mijn carrière. Maar was het ook nuttig in de bredere zin? Heeft de rest van de wereld hier iets aan?

5 jaar later (~2005)
Ping, een mail van een Duitse onderzoeker, Torsten Hothorn. Hij schrijft: “Hi Mark, ik ben bezig met een R-pakket genaamd coin, en denk dat een aantal algoritmes dat jij hebt ontwikkeld gedurende je PhD-project van nut kunnen zijn. Mag ik ze opnemen in mijn pakket?” Ik werkte inmiddels aan iets heel anders, maar vond het prima natuurlijk.

Een paar maanden later krijg ik een manuscript opgestuurd, waarin de theorie achter het pakket wordt uitgelegd. Ik lees het met plezier, geef wat commentaar en ben als jonge onderzoeker blij dat ik als co-auteur mee mag doen. Twintig jaar later: dit artikel is inmiddels >1,500 keer geciteerd en het pakket is >5 miljoen keer gedownload! Dat is natuurlijk vooral de verdienste van Torsten en zijn collega’s, maar misschien was mijn geknutsel met kansengenererende functies dan toch ergens goed voor geweest?

20 jaar later (~2020)
Computationeel bioloog Yongsoo Kim, een collega van me bij Amsterdam UMC, werkt aan een deconvolutie algoritme. Hiermee kun je met behulp van moleculaire data schatten welke celtypes het meest aanwezig zijn in een tumor. Dit kan van belang zijn voor diagnostiek en keuze van de behandeling. Yongsoo schrijft een mooi ‘Variational Bayes’ algoritme en dient het manuscript in voor publicatie.

Zijn algoritme is gebaseerd op de lognormale verdeling. Een reviewer eist een vergelijk met een andere kansverdeling, maar zijn algoritme laat zich niet zo snel aanpassen. Yongsoo heeft mijn interesse gewekt en dus schrijf ik een algoritme dat werkt voor veel kansverdelingen gebaseerd op – daar zijn ze weer – kansengenererende functies. Fijn, want generiek, en het gewenste vergelijk werkte. Dus in het artikel konden we dit mooi wegstoppen in een supplement dat verder niemand leest. Categorie ‘beetje nuttig’, maar meer ook niet, toch….?

25 jaar later (~2025)
Stavros Makrodimitris en Saskia Wilting van het Erasmus MC contacteren me. Ze zijn ook geïnteresseerd in deconvolutie. Ze willen hiermee de fractie tumorcellen in bloedsamples schatten om zo te monitoren of een geopereerde patiënt nog of weer kanker heeft. Maar ze werken met andere type data dan Yongsoo. Stavros is ervan overtuigd dat het beter is om een negatief binomiale verdeling te gebruiken en ik ga daarin mee.

Dus trekken we mijn algoritme uit de supplementaire kast en passen het toe op hun data. De geschatte tumorfracties correleren beter met klinisch beloop dan schattingen van concurrerende methoden, dus wij – en vooral zij – schrijven er een artikel over dat recent werd geaccepteerd voor een goed blad. Weer bewees dat techniekje waarin ik me 25 jaar terug had verdiept zijn waarde.

Tot slot
Het moge duidelijk zijn: nutteloos onderzoek is soms echt nuttig. Soms direct, als een ander jouw resultaten gebruikt voor een belangrijk probleem. Soms indirect, wanneer je diepe kennis hebt opgedaan van een methode of techniek welke veel later echt van nut blijkt te zijn in de praktijk. Dus jonge onderzoekers wanhoop niet als je denkt: “Waar is dit goed voor?”. Heb geduld en gij zult beloond worden.

Bron
*Inspiratie: het zeer aanbevolen boek “Het nut van nutteloos onderzoek” van Robbert Dijkgraaf
#Figuur: is het nut van ChatGPT hiermee bewezen?

Avatar photo

Mark van de Wiel

Statistiek. Voor veel onderzoekers een last, voor mij een lust.
Medische data sets: ze worden steeds groter en complexer, maar: meer meten is niet altijd meer weten. In mijn blogs wil ik de statistische uitdagingen bij dit soort data uitlichten en veelgemaakte denkfouten rechtzetten. Ik put hierbij uit ruim 20 jaar ervaring met analyse van medische data.

Add comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

To the VVSOR website