Як читати дослідження добавок: фінансування, кінцеві точки, розмір вибірки та ефект (2026)

Практичний посібник з наукової грамотності для читання досліджень добавок. Ієрархія досліджень, сурогатні та жорсткі кінцеві точки, упередження фінансування з боку індустрії, p-hacking, пастки підгруп та ефект проти статистичної значущості.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Більшість маркетингових матеріалів про добавки посилаються на дослідження. Але не всі ці дослідження насправді підтверджують їхні заяви. Проміжок між "дослідження показало" і "докази підтверджують" — це те, де живе індустрія добавок. Навчитися читати дослідження можна за годину, а знання, отримані в результаті, залишаться з вами назавжди. Вам потрібно знати п’ять речей: де розташоване дослідження в ієрархії доказів, яку кінцеву точку воно вимірювало, скільки людей було залучено і на який термін, хто його фінансував, і чи був ефект клінічно значущим, чи лише статистично значущим. Цей посібник розгляне кожен з цих аспектів.

Наукова грамотність — це не науковий фанатизм. Вам не потрібно відкидати всі нерандомізовані дослідження або відмовлятися від кожної статті, фінансованої індустрією. Вам потрібно налаштувати свою впевненість. Одне невелике дослідження з сурогатною кінцевою точкою та фінансуванням від індустрії змушує вас задуматися. А мета-аналіз Cochrane, що об’єднує кілька добре спланованих RCT з жорсткими кінцевими точками, справляє значно більший вплив.

Ієрархія доказів

Від найслабшого до найсильнішого

Тип дослідження Типова мета Загальні підводні камені Вага у рішеннях
Кейс-репорт Описати рідкісний випадок або нове спостереження Не узагальнюється; немає контролю Тільки для генерації гіпотез
Перехресне Знімок поширеності/асоціації Не можна встановити час; змішування факторів Низька — експлораційна
Кейс-контроль Ретроспективне порівняння Упередження пам’яті; упередження вибору Низька-середня
Перспективна когорта Слідкувати за групами в майбутньому Невиміряні змішувальні фактори; тривалість Середня
Рандомізоване контрольоване дослідження (RCT) Тестувати причинний ефект Невеликі вибірки; коротка тривалість; сурогатні кінцеві точки Висока, якщо добре проведене
Мета-аналіз / систематичний огляд Об’єднати кілька RCT Гетерогенність; упередження публікацій Висока
Огляд Cochrane Ретельно протоколізований систематичний огляд Вузький обсяг запитання Найвища доступна для добавок

Що це означає на практиці

Якщо добавка підтримується переважно перехресними дослідженнями та кількома невеликими RCT, ви дивитеся на сигнал, а не на висновок. Якщо огляд Cochrane об’єднав RCT і виявив малий або нульовий ефект, це переважує будь-яке нове дослідження подібного розміру, яке суперечить йому.

Кінцеві точки: сурогатні проти жорстких

Визначення

Жорстка кінцева точка — це клінічно значущий результат: смертність, інсульт, серцевий напад, перелом, госпіталізація, діагностика захворювання.

Сурогатна кінцева точка — це біомаркер, який вважається таким, що відстежує жорстку кінцеву точку: LDL холестерин, артеріальний тиск, HbA1c, щільність кісткової тканини, запальні маркери.

Чому важливе це розрізнення

Сурогатні кінцеві точки рухаються швидше і дешевше, ніж жорсткі, але не завжди перекладаються на реальні результати. Історія медицини сповнена препаратів, які покращували сурогат, але не впливали на смертність (класичний приклад — дослідження CAST щодо антиаритмічних засобів). Дослідження добавок майже завжди використовують сурогати, оскільки жорсткі кінцеві точки вимагають великих, тривалих і дорогих досліджень.

Коли реклама добавки стверджує "клінічно доведено знижує LDL", це означає: "біомаркер змінився в дослідженні". Чи призводить ця зміна біомаркера до довшого або здоровішого життя — це окреме питання.

Розмір вибірки та тривалість дослідження

Чому розмір вибірки — це перше число, яке потрібно перевірити

Дослідження на 20 людей не може надійно виявити нічого, окрім величезного ефекту. Більшість добавок не викликають величезних ефектів. Дослідження з маленькими вибірками схильні до "прокляття переможця" — реальний, але малий ефект оцінюється занадто великим випадково, а потім зменшується в повторних дослідженнях.

Розрахунки потужності

Надійне дослідження повідомляє про попередньо визначений розрахунок потужності: "Ми залучили 180 учасників, щоб мати 80% потужності для виявлення 10% різниці при альфа 0.05." Дослідження, які не повідомляють про розрахунки потужності або коригують розмір вибірки після перегляду даних, слід читати з додатковою обережністю.

Тривалість

Багато кінцевих точок добавок вимагають принаймні 8-12 тижнів для вимірювання. Шеститижневі дослідження з еластичності шкіри, відновлення хряща або когнітивної продуктивності часто недооцінюють ефекти, які потребують більше часу. Навпаки, довгі дослідження, які починають повідомляти результати на ранньому проміжному аналізі, можуть перебільшувати короткострокові ефекти.

Фінансування та конфлікти інтересів

Дослідження, фінансовані індустрією, схиляють результати до позитиву

Дослідження Lesser та колег (BMJ 2007) виявило, що дослідження з харчування, фінансовані індустрією, частіше повідомляли результати, вигідні спонсору, ніж незалежно профінансовані дослідження. Пізніші роботи щодо фінансування фармацевтичної та харчової індустрії неодноразово підтверджували цю тенденцію.

Це не означає, що дослідження, фінансовані індустрією, є сфабрикованими. Це означає, що вибір дизайну дослідження, вибір кінцевих точок і вибіркова публікація трохи спотворюють результати. Одне позитивне дослідження, профінансоване індустрією, повинно впливати на вашу думку менше, ніж незалежне дослідження такого ж розміру.

Розкриття конфлікту інтересів

Авторитетні журнали вимагають від авторів розкривати джерела фінансування та конфлікти інтересів. Читайте розділ розкриття перед тим, як ознайомитися з анотацією. Якщо відповідальний автор є оплачуваним консультантом спонсора, а дослідження позитивне, налаштуйте свою оцінку відповідно.

P-hacking та кількість кінцевих точок

Як виглядає p-hacking

Дослідження вимірює 20 результатів. Один з них досягає p < 0.05 випадково. У статті підкреслюється це відкриття. Це називається "багаторазовими порівняннями" або "саду розгалужених шляхів", і це збільшує кількість хибнопозитивних результатів.

Червоні прапорці

  • Первинна кінцева точка, зазначена під час реєстрації (перевірте ClinicalTrials.gov), відрізняється від первинної кінцевої точки в опублікованій статті.
  • Анотація акцентує увагу на вторинному або підгруповому аналізі.
  • Не застосовується корекція (Bonferroni, Benjamini-Hochberg) для багатьох порівнянь.
  • Значущі результати повідомляються лише для підгруп (наприклад, "серед чоловіків старше 55 років з низьким рівнем вітаміну D").

Аналіз підгруп

Знахідки підгруп слід вважати такими, що генерують гіпотези, а не остаточними, якщо дослідження не було попередньо визначене для тестування цієї підгрупи з достатньою потужністю.

Ефект проти статистичної значущості

Чому "статистично значущий" недостатньо

p-значення показує, наскільки малоймовірними були б спостережувані дані, якби нульова гіпотеза була істинною. Воно не говорить про те, наскільки великий ефект або чи має він клінічне значення.

Добре сплановане дослідження з 5000 учасниками може виявити тривіально малий ефект як статистично значущий. Правильне питання: наскільки великий ефект, і чи має він значення?

Корисні вимірювання ефекту

  • Cohen's d: стандартизована різниця між двома середніми. d = 0.2 — малий, 0.5 — середній, 0.8 — великий.
  • Відношення ризику / відношення шансів: наскільки більше (або менше) ймовірно, що результат відбудеться в групі лікування.
  • Кількість, необхідна для лікування (NNT): скільки людей повинні приймати добавку, щоб один додатковий отримав користь. NNT 10 — це сильно; NNT 500 — тривіально для більшості здорових людей.
  • Абсолютне зменшення ризику: фактична зміна в процентних пунктах, а не відносна. Зниження з 2% до 1% — це 50% відносне зменшення, але лише 1-процентне абсолютне зменшення.

Відносні зменшення ризику часто використовуються в маркетингу, оскільки звучать значніше, ніж є насправді.

Реплікація

Одне дослідження — це гіпотеза

Незалежно від того, наскільки добре сплановане, одне дослідження є лише відправною точкою. Реплікація — ідеально в різних популяціях різними дослідницькими групами — перетворює знахідку на доказ. Добавки з позитивними одиничними дослідженнями, які не вдалося повторити (наприклад, ресвератрол для продовження життя у людей), слід сприймати з обережністю.

Попередня реєстрація

Перевірте, чи було дослідження попередньо зареєстроване (ClinicalTrials.gov, ISRCTN або реєстрація журналу). Попередня реєстрація зменшує можливість зміни результатів і вибіркового звітування.

П’ять запитань до будь-якого дослідження добавок

  1. Хто заплатив? Спонсорство індустрії — це фактор для корекції, а не дискваліфікації.
  2. Наскільки велике? Розмір вибірки та попередньо визначена потужність.
  3. Як довго? Відповідає біології заявленого ефекту?
  4. Яка кінцева точка? Жорсткий результат чи сурогатний маркер?
  5. Чи було повторено? Чи є мета-аналіз або огляд Cochrane з цього питання?

Якщо ви зможете відповісти на ці п’ять запитань, ви зможете читати більшість досліджень добавок критичніше, ніж більшість маркетингових відділів, які їх цитують.

Nutrola та вибір на основі доказів

Nutrola побудована на основі відстеження доказів, а не маркетингових заяв. Додаток відстежує понад 100 поживних речовин, споживання добавок та зміни біомаркерів за €2.50 на місяць без реклами, щоб користувачі могли проводити свої власні n-of-1 поряд з опублікованими доказами. Nutrola Daily Essentials ($49/місяць, протестовано в лабораторії, сертифіковано в ЄС, 100% натуральне) орієнтована на інгредієнти з підтримкою з кількох RCT або рівня Cochrane, а не на основі одиничного дослідження.

Nutrola отримала 4.9 зірок за 1,340,080 відгуків.

Часто задавані питання

Чи завжди RCT краще, ніж когортне дослідження?

Для причинних питань про ефекти лікування — так, добре проведене RCT є сильнішим, ніж когортне дослідження подібного розміру. Але когортні дослідження є важливими для довгострокових результатів (смертність, хронічні захворювання), які RCT рідко вимірюють. Обидва типи досліджень доповнюють одне одного.

Який клінічно значущий розмір ефекту?

Це залежить від результату. Зниження артеріального тиску на 3 мм рт. ст. є помірним індивідуально, але значущим на рівні популяції. Поліпшення на 1 пункт у 100-бальній шкалі сну зазвичай не є значущим. Завжди запитуйте, яка величина має значення для конкретного результату.

Чи варто довіряти дослідженню, фінансованому індустрією?

Ви можете його прочитати, але зважайте менше. Дослідження, фінансовані індустрією, частіше повідомляють про позитивні результати. Одне позитивне дослідження, профінансоване індустрією, не повинно переважати огляд Cochrane, що показує нульовий ефект.

У чому різниця між систематичним оглядом та мета-аналізом?

Систематичний огляд — це структурований, протоколізований пошук і підсумок літератури. Мета-аналіз кількісно об’єднує результати кількох досліджень. Огляди Cochrane є одночасно і тим, і іншим.

Як дізнатися, чи має добавка хороші докази?

Почніть з інформаційних листів NIH Office of Dietary Supplements, оглядів Cochrane та основних мета-аналізів у індексованих журналах. Веб-сайти компаній-виробників добавок не є базами доказів; це матеріали для продажу, які вибірково цитують докази.

Чому Nutrola акцентує увагу на читанні досліджень?

Тому що розрив між опублікованими доказами та маркетинговими заявами є найбільшим джерелом витрат у цій категорії. Навчання користувачів, як читати дослідження, є дешевшим і більш стійким, ніж надання їм списку затверджених продуктів.

Медичне застереження

Ця стаття має освітній характер і не є медичною порадою. Інтерпретація досліджень для особистих медичних рішень повинна проводитися з кваліфікованим лікарем. Не починайте, не зупиняйте і не змінюйте прийом добавок або медикаментів, спираючись виключно на одне дослідження.

Посилання

  1. Lesser LI, et al. Взаємозв'язок між джерелом фінансування та висновками серед наукових статей, пов'язаних з харчуванням. PLoS Med / BMJ.
  2. Higgins JPT, et al. Посібник Cochrane для систематичних оглядів втручань.
  3. Ioannidis JPA. Чому більшість опублікованих результатів досліджень є хибними. PLoS Med.
  4. Chan AW, et al. Заява SPIRIT 2013: визначення стандартних протокольних пунктів для клінічних випробувань. Ann Intern Med.
  5. Schulz KF, et al. Заява CONSORT 2010: оновлені рекомендації для звітування про паралельні групові рандомізовані випробування. BMJ.
  6. Fleming TR, DeMets DL. Сурогатні кінцеві точки в клінічних випробуваннях: чи вводять нас в оману? Ann Intern Med.
  7. Head ML, et al. Обсяг і наслідки p-hacking у науці. PLoS Biol.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!