Como Ler um Estudo de Suplemento: Financiamento, Desfechos, Tamanho da Amostra e Tamanho do Efeito (2026)
Um guia prático de alfabetização científica para ler pesquisas sobre suplementos. Hierarquia dos estudos, desfechos substitutos vs desfechos duros, viés de financiamento da indústria, p-hacking, armadilhas de subgrupos e tamanho do efeito vs significância estatística.
A maioria das campanhas de marketing de suplementos cita estudos. Contudo, muitos desses estudos não sustentam realmente a alegação. A diferença entre "um estudo mostrou" e "as evidências suportam" é onde a indústria de suplementos atua. Aprender a ler um estudo leva menos de uma hora de trabalho conceitual e traz retornos para toda a vida. Você precisa saber cinco coisas: onde o estudo se posiciona na hierarquia das evidências, qual desfecho foi medido, quantas pessoas foram incluídas e por quanto tempo, quem financiou o estudo e se o tamanho do efeito foi clinicamente relevante ou apenas estatisticamente significativo. Este guia aborda cada um desses pontos.
A alfabetização científica não é cientificismo. Você não precisa descartar todos os estudos não randomizados ou rejeitar todos os artigos financiados pela indústria. É necessário calibrar a confiança. Um único pequeno ensaio com um desfecho substituto e um patrocinador da indústria deve ser considerado com cautela. Já uma meta-análise Cochrane de múltiplos RCTs bem estruturados com desfechos duros tem um peso muito maior.
A hierarquia das evidências
Do mais fraco ao mais forte
| Tipo de estudo | Propósito típico | Armadilhas comuns | Peso nas decisões |
|---|---|---|---|
| Relato de caso | Descrever evento raro ou observação nova | Não generalizável; sem controle | Apenas gerador de hipóteses |
| Transversal | Instantâneo de prevalência/associação | Não estabelece temporalidade; confundidores | Baixo — exploratório |
| Caso-controle | Comparação retrospectiva | Viés de recordação; viés de seleção | Baixo-moderado |
| Coorte prospectiva | Acompanhar grupos ao longo do tempo | Confundidores não medidos; longa duração | Moderado |
| Ensaio clínico randomizado (RCT) | Testar efeito causal | Amostras pequenas; curta duração; desfechos substitutos | Alto, se bem conduzido |
| Meta-análise / revisão sistemática | Agrupar múltiplos RCTs | Heterogeneidade; viés de publicação | Alto |
| Revisão Cochrane | Revisão sistemática rigorosamente protocolada | Escopo de questão estreito | O mais alto disponível para suplementos |
O que isso significa na prática
Se um suplemento é apoiado principalmente por estudos transversais e alguns pequenos RCTs, você está observando um sinal, não uma conclusão. Se uma revisão Cochrane agrupou os RCTs e encontrou um efeito pequeno ou nulo, isso pesa mais do que qualquer novo ensaio de tamanho semelhante que contradiga essa conclusão.
Desfechos: substitutos vs duros
Definições
Um desfecho duro é um resultado clinicamente significativo: mortalidade, AVC, infarto, fratura, hospitalização, diagnóstico de uma doença.
Um desfecho substituto é um biomarcador que se acredita acompanhar um desfecho duro: colesterol LDL, pressão arterial, HbA1c, densidade mineral óssea, marcadores inflamatórios.
Por que a distinção é importante
Desfechos substitutos são mais rápidos e baratos de medir do que desfechos duros, mas nem sempre se traduzem em resultados clínicos. A história da medicina está repleta de medicamentos que melhoraram um substituto sem impactar a mortalidade (o ensaio CAST sobre antiarrítmicos é um exemplo clássico). Ensaios com suplementos quase sempre usam substitutos, pois desfechos duros requerem estudos grandes, longos e caros.
Quando um anúncio de suplemento afirma "clinicamente comprovado para reduzir o LDL", a tradução é: "um biomarcador foi alterado em um estudo." Se essa mudança no biomarcador resulta em uma vida mais longa ou saudável é uma questão separada.
Tamanho da amostra e duração do estudo
Por que o tamanho da amostra é o primeiro número a ser verificado
Um estudo com 20 pessoas não pode detectar de forma confiável nada além de um efeito massivo. A maioria dos suplementos não produz efeitos massivos. Ensaios com amostras pequenas estão sujeitos à "maldição do vencedor" — um efeito real, mas pequeno, é estimado como muito grande por acaso e depois diminui em repetições.
Cálculos de poder
Um estudo credível reporta um cálculo de poder pré-especificado: "Inscrevemos 180 participantes para ter 80% de poder para detectar uma diferença de 10% com alpha 0.05." Estudos que não reportam cálculos de poder ou que ajustam o tamanho da amostra após analisar os dados devem ser lidos com ceticismo adicional.
Duração
Muitos desfechos de suplementos requerem pelo menos 8 a 12 semanas para serem medidos. Ensaios de seis semanas sobre elasticidade da pele, recuperação da cartilagem ou desempenho cognitivo frequentemente subestimam efeitos que precisam de mais tempo. Por outro lado, ensaios longos que começam a relatar resultados em uma análise interina precoce podem exagerar os efeitos de curto prazo.
Financiamento e conflitos de interesse
Pesquisas financiadas pela indústria tendem a ser positivas
Lesser e colegas (BMJ 2007) descobriram que estudos de nutrição financiados pela indústria eram mais propensos a relatar resultados favoráveis ao patrocinador do que estudos financiados de forma independente. Trabalhos posteriores sobre financiamento da indústria farmacêutica e alimentícia repetidamente replicaram esse padrão.
Isso não significa que a pesquisa financiada pela indústria seja fabricada. Significa que as escolhas de design do estudo, seleção de desfechos e publicação seletiva tendem a inclinar ligeiramente os resultados. Um único ensaio positivo financiado pela indústria deve ser considerado com menos peso do que um independente de tamanho semelhante.
Divulgações de conflitos de interesse
Revistas respeitáveis exigem que os autores divulguem fontes de financiamento e conflitos. Leia a seção de divulgação antes de ler o resumo. Se o autor correspondente é um consultor pago do patrocinador e o estudo é positivo, ajuste sua interpretação de acordo.
P-hacking e múltiplos desfechos
Como é o p-hacking
Um estudo mede 20 desfechos. Um deles atinge p < 0.05 por acaso. O artigo destaca essa descoberta. Isso é chamado de "comparações múltiplas" ou "o jardim de caminhos bifurcados", e inflaciona falsos positivos.
Sinais de alerta
- O desfecho primário listado no registro (verifique ClinicalTrials.gov) difere do desfecho primário no artigo publicado.
- O resumo enfatiza uma análise secundária ou de subgrupo.
- Nenhuma correção (Bonferroni, Benjamini-Hochberg) é aplicada para comparações múltiplas.
- Resultados significativos são relatados apenas para subgrupos (por exemplo, "em homens acima de 55 anos com baixo nível de vitamina D").
Análise de subgrupo
Descobertas de subgrupos devem ser tratadas como geradoras de hipóteses, não conclusivas, a menos que o estudo tenha sido pré-especificado para testar aquele subgrupo com poder adequado.
Tamanho do efeito vs significância estatística
Por que "estatisticamente significativo" não é suficiente
Um valor de p indica quão improvável seriam os dados observados se a hipótese nula fosse verdadeira. Não diz o quão grande é o efeito ou se ele é clinicamente relevante.
Um estudo bem projetado com 5.000 participantes pode detectar um efeito trivial como estatisticamente significativo. A pergunta correta é: quão grande é o efeito e isso importa?
Medidas úteis de tamanho do efeito
- d de Cohen: diferença padronizada entre duas médias. d = 0.2 é pequeno, 0.5 é moderado, 0.8 é grande.
- Razão de risco / razão de chances: quão mais (ou menos) provável é um resultado no grupo de tratamento.
- Número necessário para tratar (NNT): quantas pessoas precisam tomar o suplemento para que uma pessoa adicional se beneficie. NNT de 10 é forte; NNT de 500 é trivial para a maioria das pessoas saudáveis.
- Redução de risco absoluto: mudança percentual real, não relativa. Uma queda de 2% para 1% é uma redução relativa de 50%, mas apenas uma redução absoluta de 1 ponto percentual.
Reduções de risco relativas são frequentemente usadas em marketing porque parecem maiores do que realmente são.
Replicação
Um estudo é uma hipótese
Não importa quão bem projetado, um único estudo é um ponto de partida. A replicação — idealmente em diferentes populações por diferentes grupos de pesquisa — é o que transforma uma descoberta em evidência. Suplementos com ensaios positivos únicos que não conseguem se replicar (por exemplo, resveratrol para longevidade em humanos) devem ser considerados com cautela.
Pré-registro
Verifique se o ensaio foi pré-registrado (ClinicalTrials.gov, ISRCTN ou um registro de revista). O pré-registro reduz a oportunidade de troca de desfechos e relato seletivo.
Cinco perguntas para fazer a qualquer estudo de suplemento
- Quem pagou? O patrocínio da indústria é um fator de calibração, não um desqualificador.
- Quão grande? Tamanho da amostra e poder pré-especificado.
- Por quanto tempo? Corresponde à biologia do efeito alegado?
- Qual desfecho? Resultado duro ou marcador substituto?
- Replicado? Existe uma meta-análise ou revisão Cochrane sobre essa questão?
Se você conseguir responder a essas cinco perguntas, poderá ler a maioria das pesquisas sobre suplementos de forma mais crítica do que a maioria dos departamentos de marketing que as citam.
Nutrola e escolhas baseadas em evidências
A Nutrola é construída em torno do rastreamento de evidências, em vez de alegações de marketing. O aplicativo rastreia mais de 100 nutrientes, ingestão de suplementos e mudanças em biomarcadores por €2.50 por mês, sem anúncios, para que os usuários possam conduzir seu próprio n=1 ao lado das evidências publicadas. O Nutrola Daily Essentials ($49/mês, testado em laboratório, certificado pela UE, 100% natural) é posicionado em torno de ingredientes com suporte de múltiplos RCTs ou nível Cochrane, em vez de apenas um único ensaio.
A Nutrola possui uma avaliação de 4.9 estrelas em 1.340.080 avaliações.
Perguntas Frequentes
Um RCT é sempre melhor do que um estudo de coorte?
Para questões causais sobre efeitos de tratamento, sim — um RCT bem conduzido é mais forte do que um estudo de coorte de tamanho semelhante. Mas estudos de coorte são essenciais para resultados de longo prazo (mortalidade, doenças crônicas) que RCTs raramente medem. Os dois tipos de estudo se complementam.
O que é um tamanho de efeito clinicamente significativo?
Depende do resultado. Uma queda de 3 mmHg na pressão arterial sistólica é modesta individualmente, mas significativa em nível populacional. Uma melhoria de 1 ponto em uma escala de sono de 100 pontos geralmente não é significativa. Sempre pergunte qual magnitude importa para o resultado específico.
Devo confiar em um estudo financiado pela indústria?
Você pode lê-lo, mas deve dar menos peso. Estudos financiados pela indústria são mais propensos a relatar descobertas favoráveis. Um único ensaio positivo financiado pela indústria não deve superar uma revisão Cochrane que mostre resultados nulos.
Qual é a diferença entre uma revisão sistemática e uma meta-análise?
Uma revisão sistemática é uma busca estruturada e protocolada da literatura e um resumo dela. Uma meta-análise agrupa quantitativamente os resultados de múltiplos estudos. As revisões Cochrane são ambas.
Como posso descobrir se um suplemento tem boas evidências?
Comece com as folhas informativas do NIH Office of Dietary Supplements, revisões Cochrane e principais meta-análises em periódicos indexados. Sites de empresas de suplementos não são bases de evidências; são materiais de venda que citam evidências de forma seletiva.
Por que a Nutrola enfatiza a leitura de estudos?
Porque a diferença entre as evidências publicadas e as alegações de marketing é a maior fonte de desperdício de dinheiro nessa categoria. Ensinar os usuários a ler um estudo é mais barato e duradouro do que fornecer uma lista de produtos aprovados.
Isenção de responsabilidade médica
Este artigo é para fins educacionais e não constitui aconselhamento médico. A interpretação de estudos para decisões de saúde pessoal deve ser feita idealmente com um clínico qualificado. Não comece, pare ou altere um suplemento ou medicação com base apenas em um único estudo.
Referências
- Lesser LI, et al. Relação entre fonte de financiamento e conclusão entre artigos científicos relacionados à nutrição. PLoS Med / BMJ.
- Higgins JPT, et al. Manual Cochrane para Revisões Sistemáticas de Intervenções.
- Ioannidis JPA. Por que a maioria das descobertas de pesquisas publicadas são falsas. PLoS Med.
- Chan AW, et al. Declaração SPIRIT 2013: definindo itens padrão de protocolo para ensaios clínicos. Ann Intern Med.
- Schulz KF, et al. Declaração CONSORT 2010: diretrizes atualizadas para relato de ensaios randomizados em paralelo. BMJ.
- Fleming TR, DeMets DL. Desfechos substitutos em ensaios clínicos: estamos sendo enganados? Ann Intern Med.
- Head ML, et al. A extensão e as consequências do p-hacking na ciência. PLoS Biol.
Pronto para Transformar seu Rastreamento Nutricional?
Junte-se a milhares que transformaram sua jornada de saúde com o Nutrola!