Jak czytać badania dotyczące suplementów: finansowanie, punkty końcowe, wielkość próby i wielkość efektu (2026)

19 kwietnia 2026

Praktyczny przewodnik po literackiej wiedzy naukowej dotyczący badań suplementów. Hierarchia badań, punkty końcowe, stronniczość finansowania przemysłu, p-hacking, pułapki podgrupowe oraz wielkość efektu w porównaniu do istotności statystycznej.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Większość marketingu suplementów powołuje się na badania. Jednak wiele z tych badań nie wspiera w rzeczywistości przedstawianych twierdzeń. Różnica między „badanie wykazało” a „dowody wspierają” to przestrzeń, w której działa przemysł suplementów. Nauka czytania badań zajmuje mniej niż godzinę pracy koncepcyjnej, a korzyści z tego płyną na zawsze. Musisz znać pięć rzeczy: gdzie badanie plasuje się w hierarchii dowodów, jaki punkt końcowy zmierzono, ile osób wzięło udział i przez jak długi czas, kto je sfinansował oraz czy wielkość efektu była klinicznie istotna, czy tylko statystycznie znacząca. Ten przewodnik przeprowadzi Cię przez każdy z tych aspektów.

Literacka wiedza naukowa to nie to samo co scientyzm. Nie musisz odrzucać każdego badania nielosowego ani odrzucać każdego artykułu finansowanego przez przemysł. Musisz dostosować swoją pewność. Jedno małe badanie z punktem końcowym zastępczym i sponsorem z branży przesuwa Cię nieco. Meta-analiza Cochrane'a, która łączy wiele dobrze zaplanowanych RCT z twardymi punktami końcowymi, przesuwa Cię znacznie bardziej.

Hierarchia dowodów

Od najsłabszych do najsilniejszych

Typ badania	Typowy cel	Typowe pułapki	Waga w decyzjach
Raport przypadków	Opisanie rzadkiego zdarzenia lub nowej obserwacji	Nie można uogólniać; brak kontroli	Tylko generowanie hipotez
Badanie przekrojowe	Momentalne spojrzenie na częstość/wiązek	Nie można ustalić czasu; czynniki zakłócające	Niska — eksploracyjna
Badanie przypadków i kontrolne	Retrospektywne porównanie	Błąd pamięci; błąd selekcji	Niska-umiarkowana
Kohorta prospektywna	Obserwacja grup w czasie	Niezmierzone czynniki zakłócające; długi czas	Umiarkowana
Randomizowane badanie kontrolne (RCT)	Testowanie efektu przyczynowego	Małe próbki; krótki czas; punkty końcowe zastępcze	Wysoka, jeśli dobrze przeprowadzone
Meta-analiza / przegląd systematyczny	Połączenie wielu RCT	Heterogeniczność; stronniczość publikacji	Wysoka
Przegląd Cochrane'a	Rygorystycznie zaplanowany przegląd systematyczny	Wąski zakres pytania	Najwyższa dostępna dla suplementów

Co to oznacza w praktyce

Jeśli suplement jest wspierany głównie przez badania przekrojowe i kilka małych RCT, masz do czynienia z sygnałem, a nie z wnioskiem. Jeśli przegląd Cochrane'a połączył RCT i wykazał mały lub zerowy efekt, to przeważa nad każdym nowym badaniem o podobnej wielkości, które temu zaprzecza.

Punkty końcowe: zastępcze vs twarde

Definicje

Twardy punkt końcowy to klinicznie istotny wynik: śmiertelność, udar, zawał serca, złamanie, hospitalizacja, diagnoza choroby.

Zastępczy punkt końcowy to biomarker, który ma odzwierciedlać twardy punkt końcowy: cholesterol LDL, ciśnienie krwi, HbA1c, gęstość mineralna kości, markery zapalne.

Dlaczego ta różnica ma znaczenie

Punkty końcowe zastępcze są szybsze i tańsze niż twarde punkty końcowe, ale nie zawsze się przekładają. Historia medycyny jest pełna leków, które poprawiły wskaźnik zastępczy, nie wpływając na śmiertelność (klasycznym przykładem jest badanie CAST dotyczące leków przeciwarytmicznych). Badania dotyczące suplementów prawie zawsze korzystają z punktów końcowych zastępczych, ponieważ twarde punkty końcowe wymagają dużych, długoterminowych i kosztownych badań.

Gdy reklama suplementu powołuje się na „klinicznie udowodnione obniżenie LDL”, tłumaczenie brzmi: „biomarker zmienił się w badaniu”. Czy ta zmiana biomarkera prowadzi do dłuższego lub zdrowszego życia, to osobne pytanie.

Wielkość próby i czas trwania badania

Dlaczego wielkość próby to pierwszy wskaźnik, który należy sprawdzić

Badanie z udziałem 20 osób nie może wiarygodnie wykryć niczego poza ogromnym efektem. Większość suplementów nie wywołuje ogromnych efektów. Badania z małymi próbkami są podatne na „klątwę zwycięzcy” — rzeczywisty, ale mały efekt jest szacowany zbyt wysoko przez przypadek, a następnie maleje w replikacjach.

Obliczenia mocy

Wiarygodne badanie podaje wcześniej określoną kalkulację mocy: „Zrekrutowaliśmy 180 uczestników, aby mieć 80% mocy do wykrycia 10% różnicy przy alfa 0.05.” Badania, które nie podają obliczeń mocy lub które dostosowują wielkość próby po zapoznaniu się z danymi, powinny być czytane z większą ostrożnością.

Czas trwania

Wiele punktów końcowych suplementów wymaga co najmniej 8 do 12 tygodni do pomiaru. Sześciotygodniowe badania dotyczące elastyczności skóry, regeneracji chrząstki czy wydolności poznawczej często niedoszacowują efektów, które potrzebują więcej czasu. Z drugiej strony, długie badania, które zaczynają raportować wyniki na wczesnej analizie pośredniej, mogą zawyżać krótkoterminowe efekty.

Finansowanie i konflikty interesów

Badania finansowane przez przemysł mają tendencję do pozytywnych wyników

Lesser i in. (BMJ 2007) odkryli, że badania dotyczące żywienia finansowane przez przemysł częściej raportowały wyniki korzystne dla sponsora niż badania finansowane niezależnie. Późniejsze prace dotyczące finansowania przemysłu farmaceutycznego i spożywczego wielokrotnie potwierdzały ten wzór.

To nie oznacza, że badania finansowane przez przemysł są fałszywe. Oznacza to, że wybory dotyczące projektu badania, wybór punktów końcowych i selektywna publikacja lekko przechylają wyniki. Jedno pozytywne badanie finansowane przez przemysł powinno wpływać na Twoją ocenę mniej niż niezależne badanie o tej samej wielkości.

Ujawnienia konfliktów interesów

Renomowane czasopisma wymagają od autorów ujawnienia źródeł finansowania i konfliktów interesów. Przeczytaj sekcję ujawnienia przed przeczytaniem streszczenia. Jeśli autor korespondencyjny jest płatnym konsultantem sponsora, a badanie jest pozytywne, dostosuj swoją ocenę odpowiednio.

P-hacking i wiele punktów końcowych

Jak wygląda p-hacking

Badanie mierzy 20 wyników. Jeden osiąga p < 0.05 przez przypadek. Artykuł nagłaśnia ten wynik. To nazywa się „wieloma porównaniami” lub „ogrodem rozwidlenia”, co zwiększa liczbę fałszywych pozytywów.

Czerwone flagi

Główny punkt końcowy wymieniony w rejestracji (sprawdź ClinicalTrials.gov) różni się od głównego punktu końcowego w opublikowanym artykule.
Streszczenie podkreśla analizę wtórną lub podgrupową.
Nie zastosowano korekty (Bonferroni, Benjamini-Hochberg) dla wielu porównań.
Istotne wyniki raportowane są tylko dla podgrup (na przykład „u mężczyzn powyżej 55 roku życia z niskim poziomem witaminy D”).

Analiza podgrup

Wyniki z analiz podgrup powinny być traktowane jako generujące hipotezy, a nie jako ostateczne, chyba że badanie zostało wcześniej zaplanowane do testowania tej podgrupy z odpowiednią mocą.

Wielkość efektu vs istotność statystyczna

Dlaczego „istotność statystyczna” to za mało

Wartość p mówi, jak mało prawdopodobne są zaobserwowane dane, jeśli hipoteza zerowa jest prawdziwa. Nie mówi, jak duży jest efekt ani czy ma znaczenie kliniczne.

Dobrze zaprojektowane badanie z 5,000 uczestników może wykryć trywialnie mały efekt jako statystycznie istotny. Prawidłowe pytanie brzmi: jak duży jest efekt i czy ma znaczenie?

Przydatne miary wielkości efektu

Cohen's d: znormalizowana różnica między dwoma średnimi. d = 0.2 to mały, 0.5 to umiarkowany, 0.8 to duży.
Wskaźnik ryzyka / wskaźnik szans: jak bardzo bardziej (lub mniej) prawdopodobne jest wystąpienie wyniku w grupie leczonej.
Liczba potrzebna do leczenia (NNT): ile osób musi przyjąć suplement, aby jedna dodatkowa osoba odniosła korzyść. NNT wynosząca 10 jest silna; NNT wynosząca 500 jest trywialna dla większości zdrowych osób.
Bezwzględna redukcja ryzyka: rzeczywista zmiana procentowa, a nie względna. Spadek z 2% do 1% to 50% względna redukcja, ale tylko 1-punktowa bezwzględna redukcja.

Względne redukcje ryzyka są często wykorzystywane w marketingu, ponieważ brzmią większe, niż są w rzeczywistości.

Replikacja

Jedno badanie to hipoteza

Bez względu na to, jak dobrze zaprojektowane, pojedyncze badanie to punkt wyjścia. Replikacja — najlepiej w różnych populacjach przez różne grupy badawcze — to to, co przekształca odkrycie w dowód. Suplementy z pozytywnymi pojedynczymi badaniami, które nie udają się w replikacji (na przykład resweratrol w kontekście długowieczności u ludzi), powinny być traktowane z ostrożnością.

Pre-rejestracja

Sprawdź, czy badanie było wcześniej zarejestrowane (ClinicalTrials.gov, ISRCTN lub rejestracja w czasopiśmie). Pre-rejestracja zmniejsza możliwość zmiany wyników i selektywnego raportowania.

Pięć pytań do każdego badania dotyczącego suplementów

Kto zapłacił? Sponsoring przemysłowy to czynnik kalibracyjny, a nie dyskwalifikujący.
Jak duża? Wielkość próby i wcześniej określona moc.
Jak długo? Czy odpowiada biologii deklarowanego efektu?
Jaki punkt końcowy? Twardy wynik czy marker zastępczy?
Replikowane? Czy istnieje meta-analiza lub przegląd Cochrane'a dotyczący tej kwestii?

Jeśli potrafisz odpowiedzieć na te pięć pytań, możesz czytać większość badań dotyczących suplementów bardziej krytycznie niż większość działów marketingu, które się na nie powołują.

Nutrola i wybory oparte na dowodach

Nutrola opiera się na śledzeniu dowodów, a nie na twierdzeniach marketingowych. Aplikacja śledzi ponad 100 składników odżywczych, spożycie suplementów i zmiany biomarkerów za 2,50 € miesięcznie, bez reklam, aby użytkownicy mogli prowadzić własne badania n-of-1 obok opublikowanych dowodów. Nutrola Daily Essentials (49 $ miesięcznie, testowane w laboratoriach, certyfikowane w UE, 100% naturalne) jest ukierunkowane na składniki z wieloma badaniami RCT lub wsparciem na poziomie Cochrane'a, a nie na pojedynczych badaniach.

Nutrola ma ocenę 4.9 gwiazdek na podstawie 1,340,080 recenzji.

Najczęściej zadawane pytania

Czy RCT zawsze jest lepsze od badania kohortowego?

Tak — w przypadku pytań o efekty leczenia dobrze przeprowadzone RCT jest silniejsze niż badanie kohortowe o podobnej wielkości. Jednak badania kohortowe są niezbędne do oceny długoterminowych wyników (śmiertelność, choroby przewlekłe), które RCT rzadko mierzą. Oba typy badań się uzupełniają.

Jaka jest klinicznie istotna wielkość efektu?

To zależy od wyniku. Spadek ciśnienia skurczowego o 3 mmHg jest skromny indywidualnie, ale istotny na poziomie populacyjnym. Poprawa o 1 punkt w 100-punktowej skali snu zazwyczaj nie jest istotna. Zawsze pytaj, jaka wielkość ma znaczenie dla konkretnego wyniku.

Czy powinienem ufać badaniu finansowanemu przez przemysł?

Możesz je przeczytać, ale nadaj mu mniejszą wagę. Badania finansowane przez przemysł częściej raportują korzystne wyniki. Jedno pozytywne badanie finansowane przez przemysł nie powinno przeważać nad przeglądem Cochrane'a, który wykazuje zerowy efekt.

Jaka jest różnica między przeglądem systematycznym a meta-analizą?

Przegląd systematyczny to strukturalne, zaplanowane przeszukiwanie i podsumowanie literatury. Meta-analiza ilościowo łączy wyniki wielu badań. Przeglądy Cochrane'a są obydwoma.

Jak mogę dowiedzieć się, czy suplement ma dobre dowody?

Zacznij od arkuszy informacyjnych NIH Office of Dietary Supplements, przeglądów Cochrane'a i głównych meta-analiz w indeksowanych czasopismach. Strony internetowe firm suplementowych nie są bazami dowodów; są materiałami sprzedażowymi, które selektywnie cytują dowody.

Dlaczego Nutrola podkreśla czytanie badań?

Ponieważ różnica między opublikowanymi dowodami a twierdzeniami marketingowymi jest największym źródłem marnotrawstwa pieniędzy w tej kategorii. Nauczanie użytkowników, jak czytać badania, jest tańsze i bardziej trwałe niż dostarczanie im listy zatwierdzonych produktów.

Zastrzeżenie medyczne

Ten artykuł ma charakter edukacyjny i nie stanowi porady medycznej. Interpretacja badań w kontekście osobistych decyzji zdrowotnych powinna być idealnie przeprowadzona z udziałem wykwalifikowanego klinicysty. Nie rozpoczynaj, nie przerywaj ani nie zmieniaj suplementu lub leku wyłącznie na podstawie jednego badania.

Bibliografia

Lesser LI, et al. Związek między źródłem finansowania a wnioskami w artykułach naukowych dotyczących żywienia. PLoS Med / BMJ.
Higgins JPT, et al. Podręcznik Cochrane'a dla systematycznych przeglądów interwencji.
Ioannidis JPA. Dlaczego większość opublikowanych wyników badań jest fałszywa. PLoS Med.
Chan AW, et al. Oświadczenie SPIRIT 2013: definiowanie standardowych elementów protokołu dla badań klinicznych. Ann Intern Med.
Schulz KF, et al. Oświadczenie CONSORT 2010: zaktualizowane wytyczne dotyczące raportowania równoległych badań randomizowanych. BMJ.
Fleming TR, DeMets DL. Punkty końcowe zastępcze w badaniach klinicznych: czy jesteśmy wprowadzani w błąd? Ann Intern Med.
Head ML, et al. Zakres i konsekwencje p-hackingu w nauce. PLoS Biol.

Gotowy, aby przeksztalcic sledzenie zywienia?

Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!

Download on theApp Store

GET IT ONGoogle Play