Hoe je een supplementstudie leest: Financiering, eindpunten, steekproefgrootte en effectgrootte (2026)
Een praktische gids voor wetenschappelijke geletterdheid bij het lezen van supplementonderzoek. Studiehiërarchie, surrogate versus harde eindpunten, bias door industrie-financiering, p-hacking, valkuilen bij subgroepen en effectgrootte versus statistische significantie.
De meeste marketing van supplementen verwijst naar studies. De meeste van die studies ondersteunen de claim echter niet echt. De kloof tussen "een studie toonde aan" en "het bewijs ondersteunt" is waar de supplementenindustrie zich bevindt. Leren hoe je een studie leest kost minder dan een uur en betaalt zich voor altijd terug. Je moet vijf dingen weten: waar de studie zich bevindt in de hiërarchie van bewijs, welk eindpunt is gemeten, hoeveel mensen zijn ingeschreven en voor hoe lang, wie ervoor heeft betaald, en of de effectgrootte klinisch relevant was of alleen statistisch significant. Deze gids behandelt elk aspect.
Wetenschappelijke geletterdheid is geen scientisme. Je hoeft niet elke niet-gerandomiseerde studie af te wijzen of elk door de industrie gefinancierd artikel te verwerpen. Je moet je vertrouwen calibreren. Een enkele kleine proef met een surrogate eindpunt en een industrie sponsor beweegt je een beetje. Een Cochrane meta-analyse van meerdere goed uitgevoerde RCT's met harde eindpunten beweegt je veel meer.
De hiërarchie van bewijs
Van zwakste naar sterkste
| Studietype | Typisch doel | Veelvoorkomende valkuilen | Gewicht in beslissingen |
|---|---|---|---|
| Gevalrapport | Beschrijven van zeldzame gebeurtenis of nieuwe observatie | Niet generaliseerbaar; geen controle | Alleen hypothese-genererend |
| Cross-sectioneel | Momentopname van prevalentie/associatie | Kan timing niet vaststellen; verstorende factoren | Laag — verkennend |
| Geval-controle | Retrospectieve vergelijking | Herinneringsbias; selectie-bias | Laag-matig |
| Prospectieve cohort | Volg groepen vooruit | Niet gemeten verstorende factoren; lange duur | Gemiddeld |
| Gerandomiseerde gecontroleerde studie (RCT) | Test causale effect | Kleine steekproeven; korte duur; surrogate eindpunten | Hoog, als goed uitgevoerd |
| Meta-analyse / systematische review | Groep meerdere RCT's | Heterogeniteit; publicatiebias | Hoog |
| Cochrane review | Rigorously protocolized systematische review | Smalle vraagstelling | Hoogste beschikbaar voor supplementen |
Wat dit in de praktijk betekent
Als een supplement voornamelijk wordt ondersteund door cross-sectionele studies en een paar kleine RCT's, kijk je naar een signaal, niet naar een conclusie. Als een Cochrane review de RCT's heeft samengevoegd en een klein of nul effect heeft gevonden, weegt dat zwaarder dan een nieuwe studie van vergelijkbare grootte die het tegenspreekt.
Eindpunten: surrogate versus hard
Definities
Een hard eindpunt is een klinisch relevante uitkomst: mortaliteit, beroerte, hartaanval, fractuur, ziekenhuisopname, diagnose van een ziekte.
Een surrogate eindpunt is een biomarker waarvan wordt aangenomen dat deze een hard eindpunt volgt: LDL-cholesterol, bloeddruk, HbA1c, botmineraaldichtheid, ontstekingsmarkers.
Waarom de onderscheiding belangrijk is
Surrogate eindpunten zijn sneller en goedkoper te meten dan harde eindpunten, maar ze vertalen niet altijd. De geschiedenis van de geneeskunde is vol met medicijnen die een surrogate effect hadden zonder de mortaliteit te beïnvloeden (de CAST-studie over anti-aritmica is een klassiek voorbeeld). Supplementstudies gebruiken bijna altijd surrogaten omdat harde eindpunten grote, lange, dure studies vereisen.
Wanneer een supplementadvertentie citeert "klinisch bewezen om LDL te verlagen," is de vertaling: "een biomarker is veranderd in een studie." Of die verandering in biomarker leidt tot een langer of gezonder leven is een aparte vraag.
Steekproefgrootte en studieduur
Waarom steekproefgrootte het eerste getal is om te controleren
Een studie met 20 mensen kan alleen een enorme effectgrootte betrouwbaar detecteren. De meeste supplementen produceren geen enorme effecten. Proeven met kleine steekproeven zijn vatbaar voor de "winner's curse" — een echt maar klein effect wordt per ongeluk te groot geschat, en krimpt vervolgens bij herhalingen.
Powerberekeningen
Een geloofwaardige studie rapporteert een vooraf gespecificeerde powerberekening: "We hebben 180 deelnemers ingeschreven om 80% power te hebben om een verschil van 10% te detecteren bij alpha 0.05." Studies die geen powerberekeningen rapporteren, of die de steekproefgrootte aanpassen na het bekijken van de gegevens, moeten met extra scepsis worden gelezen.
Duur
Veel supplementeindpunten vereisen minstens 8 tot 12 weken om te meten. Zes weken durende studies over huidelasticiteit, kraakbeenherstel of cognitieve prestaties onderschatten vaak effecten die meer tijd nodig hebben. Omgekeerd kunnen lange studies die vroeg resultaten rapporteren bij een tussentijdse analyse de kortetermijneffecten overdrijven.
Financiering en belangenconflicten
Onderzoek gefinancierd door de industrie heeft een positieve bias
Lesser en collega's (BMJ 2007) ontdekten dat voedingsstudies gefinancierd door de industrie vaker resultaten rapporteerden die gunstig waren voor de sponsor dan onafhankelijk gefinancierde studies. Latere onderzoeken naar financiering door de farmaceutische en voedingsindustrie hebben dit patroon herhaaldelijk bevestigd.
Dit betekent niet dat onderzoek gefinancierd door de industrie gefabriceerd is. Het betekent dat keuzes in studieontwerp, selectie van eindpunten en selectieve publicatie de bevindingen enigszins kunnen beïnvloeden. Een enkele positieve studie gefinancierd door de industrie zou je minder moeten beïnvloeden dan een onafhankelijke studie van dezelfde grootte.
Openbaarmaking van belangenconflicten
Betrouwbare tijdschriften vereisen dat auteurs financieringsbronnen en belangenconflicten openbaar maken. Lees de openbaarmakingssectie voordat je de samenvatting leest. Als de corresponderende auteur een betaalde consultant is voor de sponsor en de studie positief is, calibreren dan dienovereenkomstig.
P-hacking en meerdere eindpunten
Hoe p-hacking eruitziet
Een studie meet 20 uitkomsten. Eén bereikt p < 0.05 bij toeval. Het artikel kopieert die bevinding. Dit wordt "meerdere vergelijkingen" of "de tuin van splitsende paden" genoemd, en het verhoogt het aantal valse positieven.
Waarschuwingssignalen
- Het primaire eindpunt dat bij registratie is vermeld (controleer ClinicalTrials.gov) verschilt van het primaire eindpunt in het gepubliceerde artikel.
- De samenvatting benadrukt een secundaire of subgroepanalyse.
- Er is geen correctie (Bonferroni, Benjamini-Hochberg) toegepast voor meerdere vergelijkingen.
- Significante resultaten worden alleen gerapporteerd voor subgroepen (bijvoorbeeld "bij mannen boven de 55 met een lage baseline vitamine D").
Subgroepanalyse
Bevindingen uit subgroepen moeten als hypothese-genererend worden behandeld, niet als conclusief, tenzij de studie vooraf was gespecificeerd om die subgroep met voldoende power te testen.
Effectgrootte versus statistische significantie
Waarom "statistisch significant" niet genoeg is
Een p-waarde vertelt je hoe onwaarschijnlijk de waargenomen gegevens zouden zijn als de nulhypothese waar zou zijn. Het vertelt je niet hoe groot het effect is of of het klinisch relevant is.
Een goed ontworpen studie met 5.000 deelnemers kan een triviaal klein effect als statistisch significant detecteren. De juiste vraag is: hoe groot is het effect, en doet het er toe?
Nuttige maatstaven voor effectgrootte
- Cohen's d: gestandaardiseerd verschil tussen twee gemiddelden. d = 0.2 is klein, 0.5 is gematigd, 0.8 is groot.
- Risico-ratio / odds-ratio: hoe veel waarschijnlijker (of minder waarschijnlijk) een uitkomst is in de behandelingsgroep.
- Aantal nodig om te behandelen (NNT): hoeveel mensen het supplement moeten innemen voor één extra persoon om te profiteren. NNT van 10 is sterk; NNT van 500 is triviaal voor de meeste gezonde mensen.
- Absolute risicoreductie: werkelijke procentuele verandering, niet relatief. Een daling van 2% naar 1% is een 50% relatieve reductie maar slechts een absolute reductie van 1 procentpunt.
Relatieve risicoreducties worden vaak in marketing gebruikt omdat ze groter klinken dan ze zijn.
Replicatie
Eén studie is een hypothese
Ongeacht hoe goed ontworpen, is een enkele studie een startpunt. Replicatie — idealiter in verschillende populaties door verschillende onderzoeksgroepen — is wat een bevinding in bewijs verandert. Supplementen met positieve enkele proeven die niet repliceren (bijvoorbeeld resveratrol voor levensduur bij mensen) moeten met enige voorzichtigheid worden behandeld.
Pre-registratie
Controleer of de proef vooraf was geregistreerd (ClinicalTrials.gov, ISRCTN, of een tijdschriftregistratie). Pre-registratie vermindert de kans op uitkomstwisseling en selectieve rapportage.
Vijf vragen om te stellen bij elke supplementstudie
- Wie heeft betaald? Industrie-sponsoring is een calibratiefactor, geen diskwalificatie.
- Hoe groot? Steekproefgrootte en vooraf gespecificeerde power.
- Hoe lang? Past het bij de biologie van het geclaimde effect?
- Welk eindpunt? Harde uitkomst of surrogate marker?
- Gerepliceerd? Is er een meta-analyse of Cochrane review over deze vraag?
Als je deze vijf vragen kunt beantwoorden, kun je de meeste supplementonderzoeken kritischer lezen dan de meeste marketingafdelingen die het citeren.
Nutrola en op bewijs gebaseerde keuzes
Nutrola is gebouwd rond het volgen van bewijs in plaats van marketingclaims. De app volgt meer dan 100 voedingsstoffen, supplementinname en veranderingen in biomarkers voor €2,50 per maand zonder advertenties, zodat gebruikers hun eigen n-of-1 kunnen uitvoeren naast het gepubliceerde bewijs. Nutrola Daily Essentials ($49/maand, laboratorium getest, EU-gecertificeerd, 100% natuurlijk) is gepositioneerd rond ingrediënten met ondersteuning van meerdere RCT's of Cochrane-niveau in plaats van buzz van enkele proeven.
Nutrola heeft een beoordeling van 4,9 sterren op basis van 1.340.080 beoordelingen.
Veelgestelde Vragen
Is een RCT altijd beter dan een cohortstudie?
Voor causale vragen over behandelingseffecten, ja — een goed uitgevoerde RCT is sterker dan een cohortstudie van vergelijkbare grootte. Maar cohortstudies zijn essentieel voor langetermijneffecten (mortaliteit, chronische ziekten) die RCT's zelden meten. De twee studietypes vullen elkaar aan.
Wat is een klinisch relevante effectgrootte?
Het hangt af van de uitkomst. Een daling van 3 mmHg in de systolische bloeddruk is individueel bescheiden maar betekenisvol op populatieniveau. Een verbetering van 1 punt op een schaal van 100 voor slaap is meestal niet betekenisvol. Vraag altijd welke omvang belangrijk is voor de specifieke uitkomst.
Moet ik een door de industrie gefinancierde studie vertrouwen?
Je kunt het lezen, maar weeg het minder zwaar. Door de industrie gefinancierde studies rapporteren vaker gunstige bevindingen. Een enkele positieve studie gefinancierd door de industrie zou niet zwaarder moeten wegen dan een Cochrane review die nul toont.
Wat is het verschil tussen een systematische review en een meta-analyse?
Een systematische review is een gestructureerde, protocolmatige zoektocht en samenvatting van de literatuur. Een meta-analyse voegt kwantitatief de resultaten van meerdere studies samen. Cochrane reviews zijn beide.
Hoe kom ik erachter of een supplement goed bewijs heeft?
Begin met de feitelijke bladen van het NIH Office of Dietary Supplements, Cochrane reviews en belangrijke meta-analyses in geïndexeerde tijdschriften. Websites van supplementbedrijven zijn geen bewijsbases; het zijn verkoopmaterialen die selectief bewijs citeren.
Waarom benadrukt Nutrola het lezen van studies?
Omdat de kloof tussen gepubliceerd bewijs en marketingclaims de grootste bron van verspild geld in deze categorie is. Gebruikers leren hoe ze een studie moeten lezen is goedkoper en duurzamer dan ze een lijst met goedgekeurde producten te geven.
Medische disclaimer
Dit artikel is voor educatieve doeleinden en vormt geen medisch advies. De interpretatie van studies voor persoonlijke gezondheidsbeslissingen moet idealiter worden gedaan met een gekwalificeerde arts. Begin, stop of wijzig geen supplement of medicatie op basis van slechts één studie.
Referenties
- Lesser LI, et al. Relatie tussen financieringsbron en conclusie onder voeding-gerelateerde wetenschappelijke artikelen. PLoS Med / BMJ.
- Higgins JPT, et al. Cochrane Handbook voor Systematische Reviews van Interventies.
- Ioannidis JPA. Waarom de meeste gepubliceerde onderzoeksbevindingen vals zijn. PLoS Med.
- Chan AW, et al. SPIRIT 2013-verklaring: het definiëren van standaardprotocolitems voor klinische proeven. Ann Intern Med.
- Schulz KF, et al. CONSORT 2010-verklaring: bijgewerkte richtlijnen voor het rapporteren van parallelle groep gerandomiseerde proeven. BMJ.
- Fleming TR, DeMets DL. Surrogaten eindpunten in klinische proeven: worden we misleid? Ann Intern Med.
- Head ML, et al. De omvang en gevolgen van p-hacking in de wetenschap. PLoS Biol.
Klaar om je voedingstracking te transformeren?
Sluit je aan bij duizenden die hun gezondheidsreis hebben getransformeerd met Nutrola!