So lesen Sie eine Studien zu Nahrungsergänzungsmitteln: Finanzierung, Endpunkte, Stichprobengröße und Effektgröße (2026)
Ein praktischer Leitfaden zur wissenschaftlichen Lesekompetenz für die Analyse von Forschung zu Nahrungsergänzungsmitteln. Studienhierarchie, surrogate vs. harte Endpunkte, Verzerrungen durch Industrie-Finanzierung, p-Hacking, Fallstricke bei Subgruppen und Effektgröße vs. statistische Signifikanz.
Die meisten Marketingaussagen zu Nahrungsergänzungsmitteln beziehen sich auf Studien. Viele dieser Studien unterstützen jedoch nicht tatsächlich die gemachten Behauptungen. Die Kluft zwischen „eine Studie hat gezeigt“ und „die Beweise unterstützen“ ist der Bereich, in dem die Nahrungsergänzungsindustrie agiert. Das Lesen einer Studie erfordert weniger als eine Stunde an Konzeptarbeit und zahlt sich für immer aus. Sie müssen fünf Dinge wissen: Wo steht die Studie in der Evidenzhierarchie, welchen Endpunkt hat sie gemessen, wie viele Personen wurden eingeschlossen und über welchen Zeitraum, wer hat sie finanziert und ob die Effektgröße klinisch relevant oder nur statistisch signifikant war. Dieser Leitfaden behandelt jedes dieser Themen.
Wissenschaftliche Lesekompetenz bedeutet nicht, dass Sie jede nicht-randomisierte Studie ablehnen oder jede industriegeförderte Arbeit verwerfen müssen. Sie müssen Ihr Vertrauen kalibrieren. Eine einzelne kleine Studie mit einem surrogate endpoint und einem Industrie-Sponsor bewegt Sie nur geringfügig. Eine Cochrane-Metaanalyse mehrerer gut durchgeführter RCTs mit harten Endpunkten hat jedoch erhebliches Gewicht.
Die Evidenzhierarchie
Von schwächsten zu stärksten Studien
| Studientyp | Typischer Zweck | Häufige Fallstricke | Gewicht in Entscheidungen |
|---|---|---|---|
| Fallbericht | Beschreibung eines seltenen Ereignisses oder einer neuen Beobachtung | Nicht verallgemeinerbar; keine Kontrolle | Nur Hypothesen-generierend |
| Querschnittsstudie | Momentaufnahme von Prävalenz/Assoziation | Kann keine zeitlichen Zusammenhänge herstellen; Störfaktoren | Niedrig — explorativ |
| Fall-Kontroll-Studie | Retrospektiver Vergleich | Erinnerungsbias; Auswahlbias | Niedrig-mittel |
| Prospektive Kohortenstudie | Verfolgen von Gruppen über die Zeit | Unbeobachtete Störfaktoren; lange Dauer | Mittel |
| Randomisierte kontrollierte Studie (RCT) | Testen eines kausalen Effekts | Kleine Stichproben; kurze Dauer; surrogate endpoints | Hoch, wenn gut durchgeführt |
| Metaanalyse / systematische Überprüfung | Zusammenfassung mehrerer RCTs | Heterogenität; Publikationsbias | Hoch |
| Cochrane-Überprüfung | Streng protokollierte systematische Überprüfung | Enger Fragenbereich | Höchstes verfügbares Niveau für Nahrungsergänzungsmittel |
Was das in der Praxis bedeutet
Wenn ein Nahrungsergänzungsmittel hauptsächlich durch Querschnittsstudien und einige kleine RCTs unterstützt wird, handelt es sich um ein Signal, nicht um eine Schlussfolgerung. Wenn eine Cochrane-Überprüfung die RCTs zusammengefasst hat und einen kleinen oder null Effekt gefunden hat, hat dies mehr Gewicht als jede neue Studie ähnlicher Größe, die dem widerspricht.
Endpunkte: surrogate vs. harte Endpunkte
Definitionen
Ein harter Endpunkt ist ein klinisch bedeutsames Ergebnis: Sterblichkeit, Schlaganfall, Herzinfarkt, Fraktur, Krankenhausaufenthalt, Diagnose einer Krankheit.
Ein surrogate endpoint ist ein Biomarker, der als Indikator für einen harten Endpunkt angesehen wird: LDL-Cholesterin, Blutdruck, HbA1c, Knochendichte, Entzündungsmarker.
Warum die Unterscheidung wichtig ist
Surrogate Endpunkte sind schneller und kostengünstiger zu messen als harte Endpunkte, aber sie übersetzen sich nicht immer in klinisch relevante Ergebnisse. Die Geschichte der Medizin ist voll von Medikamenten, die einen surrogate endpoint erreicht haben, ohne die Sterblichkeit zu beeinflussen (das CAST-Studie zu Antiarrhythmika ist ein klassisches Beispiel). Nahrungsergänzungsstudien verwenden fast immer surrogate endpoints, da harte Endpunkte große, langwierige und teure Studien erfordern.
Wenn eine Werbung für ein Nahrungsergänzungsmittel „klinisch bewiesen, dass es LDL senkt“ zitiert, bedeutet das übersetzt: „ein Biomarker hat sich in einer Studie verändert.“ Ob diese Veränderung des Biomarkers zu einem längeren oder gesünderen Leben führt, ist eine separate Frage.
Stichprobengröße und Studiendauer
Warum die Stichprobengröße die erste Zahl ist, die Sie überprüfen sollten
Eine Studie mit 20 Personen kann nur massive Effekte zuverlässig erkennen. Die meisten Nahrungsergänzungsmittel erzeugen keine massiven Effekte. Studien mit kleinen Stichproben sind anfällig für den „Gewinnerfluch“ — ein realer, aber kleiner Effekt wird zufällig zu groß geschätzt und schrumpft bei Wiederholungen.
Power-Berechnungen
Eine glaubwürdige Studie berichtet eine vorab festgelegte Power-Berechnung: „Wir haben 180 Teilnehmer eingeschlossen, um eine 80%ige Power zu haben, um einen Unterschied von 10% bei Alpha 0,05 zu erkennen.“ Studien, die keine Power-Berechnungen berichten oder die die Stichprobengröße nach Sichtung der Daten anpassen, sollten mit zusätzlicher Skepsis gelesen werden.
Dauer
Viele Endpunkte von Nahrungsergänzungsmitteln erfordern mindestens 8 bis 12 Wochen zur Messung. Sechs-Wochen-Studien zu Hautelastizität, Knorpelregeneration oder kognitiver Leistung unterschätzen oft Effekte, die mehr Zeit benötigen. Umgekehrt können lange Studien, die Ergebnisse bereits bei einer frühen Zwischenanalyse berichten, kurzfristige Effekte überbewerten.
Finanzierung und Interessenkonflikte
Industriegeförderte Forschung verzerrt die Ergebnisse
Lesser und Kollegen (BMJ 2007) fanden heraus, dass Ernährungsstudien, die von der Industrie finanziert wurden, eher positive Ergebnisse berichteten als unabhängig finanzierte Studien. Spätere Arbeiten zu Finanzierungen durch die Pharma- und Lebensmittelindustrie haben dieses Muster wiederholt bestätigt.
Das bedeutet nicht, dass industriegeförderte Forschung gefälscht ist. Es bedeutet, dass Entscheidungen im Studiendesign, die Auswahl der Endpunkte und die selektive Veröffentlichung die Ergebnisse leicht verzerren. Eine einzelne positive Studie, die von der Industrie finanziert wurde, sollte Ihr Vertrauen weniger beeinflussen als eine unabhängige Studie ähnlicher Größe.
Offenlegung von Interessenkonflikten
Renommierte Fachzeitschriften verlangen von den Autoren, dass sie Finanzierungsquellen und Interessenkonflikte offenlegen. Lesen Sie den Offenlegungsabschnitt, bevor Sie die Zusammenfassung lesen. Wenn der korrespondierende Autor ein bezahlter Berater des Sponsors ist und die Studie positiv ist, sollten Sie entsprechend kalibrieren.
P-Hacking und multiple Endpunkte
Wie P-Hacking aussieht
Eine Studie misst 20 Ergebnisse. Eines erreicht p < 0,05 zufällig. Die Veröffentlichung hebt dieses Ergebnis hervor. Dies wird als „multiple Vergleiche“ oder „der Garten der abzweigenden Pfade“ bezeichnet und führt zu einer Erhöhung von falsch positiven Ergebnissen.
Warnsignale
- Der primäre Endpunkt, der bei der Registrierung angegeben wurde (überprüfen Sie ClinicalTrials.gov), unterscheidet sich vom primären Endpunkt in der veröffentlichten Studie.
- Die Zusammenfassung betont eine sekundäre oder Subgruppenanalyse.
- Es wird keine Korrektur (Bonferroni, Benjamini-Hochberg) für multiple Vergleiche angewendet.
- Signifikante Ergebnisse werden nur für Subgruppen berichtet (zum Beispiel „bei Männern über 55 mit niedrigem Ausgangswert von Vitamin D“).
Subgruppenanalyse
Ergebnisse aus Subgruppen sollten als Hypothesen-generierend und nicht als schlüssig betrachtet werden, es sei denn, die Studie war vorab festgelegt, um diese Subgruppe mit ausreichender Power zu testen.
Effektgröße vs. statistische Signifikanz
Warum „statistisch signifikant“ nicht genug ist
Ein p-Wert sagt Ihnen, wie unwahrscheinlich die beobachteten Daten wären, wenn die Nullhypothese wahr wäre. Er sagt Ihnen jedoch nicht, wie groß der Effekt ist oder ob er klinisch relevant ist.
Eine gut durchgeführte Studie mit 5.000 Teilnehmern kann einen trivial kleinen Effekt als statistisch signifikant erkennen. Die richtige Frage ist: Wie groß ist der Effekt und ist er relevant?
Nützliche Maße der Effektgröße
- Cohen's d: standardisierte Differenz zwischen zwei Mittelwerten. d = 0,2 ist klein, 0,5 ist moderat, 0,8 ist groß.
- Risikoquotient / Odds Ratio: wie viel wahrscheinlicher (oder weniger wahrscheinlich) ein Ergebnis in der Behandlungsgruppe ist.
- Number needed to treat (NNT): wie viele Personen das Nahrungsergänzungsmittel einnehmen müssen, damit eine zusätzliche Person profitiert. Eine NNT von 10 ist stark; eine NNT von 500 ist trivial für die meisten gesunden Menschen.
- Absolute Risikominderung: tatsächliche prozentuale Veränderung, nicht relativ. Ein Rückgang von 2% auf 1% ist eine 50% relative Reduktion, aber nur eine absolute Reduktion um 1 Prozentpunkt.
Relative Risikominderungen werden häufig im Marketing verwendet, weil sie größer erscheinen als sie sind.
Replikation
Eine Studie ist eine Hypothese
Egal wie gut gestaltet, ist eine einzelne Studie nur ein Ausgangspunkt. Die Replikation — idealerweise in unterschiedlichen Populationen durch verschiedene Forschungsteams — verwandelt eine Entdeckung in Beweise. Nahrungsergänzungsmittel mit positiven Einzelstudien, die sich nicht replizieren lassen (zum Beispiel Resveratrol für Langlebigkeit beim Menschen), sollten mit Vorsicht betrachtet werden.
Vorregistrierung
Überprüfen Sie, ob die Studie vorregistriert wurde (ClinicalTrials.gov, ISRCTN oder eine Zeitschriftenregistrierung). Die Vorregistrierung verringert die Möglichkeit von Ergebniswechseln und selektiver Berichterstattung.
Fünf Fragen, die Sie zu jeder Studie über Nahrungsergänzungsmittel stellen sollten
- Wer hat bezahlt? Die Finanzierung durch die Industrie ist ein Kalibrierungsfaktor, kein Ausschlusskriterium.
- Wie groß? Stichprobengröße und vorab festgelegte Power.
- Wie lange? Entspricht es der Biologie des behaupteten Effekts?
- Welcher Endpunkt? Harter Endpunkt oder surrogate Marker?
- Repliziert? Gibt es eine Metaanalyse oder Cochrane-Überprüfung zu dieser Frage?
Wenn Sie diese fünf Fragen beantworten können, können Sie die meisten Forschungsarbeiten zu Nahrungsergänzungsmitteln kritischer lesen als die meisten Marketingabteilungen, die sie zitieren.
Nutrola und evidenzbasierte Entscheidungen
Nutrola basiert auf der Verfolgung von Evidenz anstelle von Marketingansprüchen. Die App verfolgt über 100 Nährstoffe, die Einnahme von Nahrungsergänzungsmitteln und Veränderungen von Biomarkern für nur €2,50 pro Monat ohne Werbung, sodass die Nutzer ihre eigenen n-of-1-Studien neben den veröffentlichten Beweisen durchführen können. Nutrola Daily Essentials (49 $/Monat, labortestet, EU-zertifiziert, 100% natürlich) konzentriert sich auf Inhaltsstoffe mit Unterstützung durch mehrere RCTs oder Cochrane-Niveau anstelle von Einzelstudien-Hype.
Nutrola hat 4,9 Sterne aus 1.340.080 Bewertungen.
Häufig gestellte Fragen
Ist ein RCT immer besser als eine Kohortenstudie?
Ja, für kausale Fragen zu Behandlungseffekten ist ein gut durchgeführter RCT stärker als eine Kohortenstudie ähnlicher Größe. Aber Kohortenstudien sind entscheidend für langfristige Ergebnisse (Sterblichkeit, chronische Krankheiten), die RCTs selten messen. Die beiden Studientypen ergänzen sich.
Was ist eine klinisch relevante Effektgröße?
Das hängt vom Ergebnis ab. Ein Rückgang von 3 mmHg des systolischen Blutdrucks ist individuell bescheiden, aber auf Bevölkerungsebene bedeutsam. Eine Verbesserung um 1 Punkt auf einer 100-Punkte-Schlafskala ist normalerweise nicht bedeutsam. Fragen Sie immer, welche Größe für das spezifische Ergebnis wichtig ist.
Sollte ich einer industriegeförderten Studie vertrauen?
Sie können sie lesen, sollten sie aber weniger gewichten. Industriegeförderte Studien berichten eher von positiven Ergebnissen. Eine einzelne positive Studie, die von der Industrie finanziert wurde, sollte nicht schwerer wiegen als eine Cochrane-Überprüfung, die null zeigt.
Was ist der Unterschied zwischen einer systematischen Überprüfung und einer Metaanalyse?
Eine systematische Überprüfung ist eine strukturierte, protokollierte Suche und Zusammenfassung der Literatur. Eine Metaanalyse fasst quantitativ die Ergebnisse mehrerer Studien zusammen. Cochrane-Überprüfungen sind beides.
Wie finde ich heraus, ob ein Nahrungsergänzungsmittel gute Beweise hat?
Beginnen Sie mit den Informationsblättern des NIH Office of Dietary Supplements, Cochrane-Überprüfungen und großen Metaanalysen in indexierten Zeitschriften. Webseiten von Nahrungsergänzungsunternehmen sind keine Evidenzbasen; sie sind Verkaufsunterlagen, die Beweise selektiv zitieren.
Warum betont Nutrola das Lesen von Studien?
Weil die Kluft zwischen veröffentlichten Beweisen und Marketingansprüchen die größte Quelle für verschwendetes Geld in dieser Kategorie ist. Den Nutzern beizubringen, wie man eine Studie liest, ist kostengünstiger und nachhaltiger, als ihnen eine Liste genehmigter Produkte zu geben.
Medizinischer Hinweis
Dieser Artikel dient Bildungszwecken und stellt keine medizinische Beratung dar. Die Interpretation von Studien für persönliche Gesundheitsentscheidungen sollte idealerweise mit einem qualifizierten Arzt erfolgen. Beginnen, stoppen oder ändern Sie ein Nahrungsergänzungsmittel oder Medikament nicht ausschließlich auf der Grundlage einer einzelnen Studie.
Quellen
- Lesser LI, et al. Beziehung zwischen Finanzierungsquelle und Schlussfolgerung bei ernährungsbezogenen wissenschaftlichen Artikeln. PLoS Med / BMJ.
- Higgins JPT, et al. Cochrane-Handbuch für systematische Überprüfungen von Interventionen.
- Ioannidis JPA. Warum die meisten veröffentlichten Forschungsergebnisse falsch sind. PLoS Med.
- Chan AW, et al. SPIRIT 2013-Erklärung: Definition von Standardprotokollpunkten für klinische Studien. Ann Intern Med.
- Schulz KF, et al. CONSORT 2010-Erklärung: Aktualisierte Richtlinien für die Berichterstattung über parallel gruppierte randomisierte Studien. BMJ.
- Fleming TR, DeMets DL. Surrogatendpunkte in klinischen Studien: Werden wir irregeführt? Ann Intern Med.
- Head ML, et al. Das Ausmaß und die Folgen von P-Hacking in der Wissenschaft. PLoS Biol.
Bereit, Ihr Ernährungstracking zu transformieren?
Schließen Sie sich Tausenden an, die ihre Gesundheitsreise mit Nutrola transformiert haben!