Cât de precis este ChatGPT în estimările calorice?

11 aprilie 2026

Am testat estimările calorice oferite de ChatGPT, Gemini și Claude în raport cu datele nutriționale verificate pentru peste 50 de alimente. Vezi rezultatele privind precizia și consistența comparativ cu o bază de date verificată.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

ChatGPT a devenit consilierul nutrițional implicit pentru milioane de oameni — și nu dispune de o bază de date nutrițională. Atunci când întrebi ChatGPT câte calorii are un burrito cu pui, acesta nu caută răspunsul într-o bază de date alimentară verificată. În schimb, generează un răspuns statistic probabil pe baza modelelor din datele sale de antrenament. Numărul pe care ți-l oferă poate fi aproape corect, dar poate fi și cu 40% greșit. Și dacă întrebi din nou mâine, s-ar putea să primești un alt număr.

Am testat trei modele majore de limbaj — ChatGPT (GPT-4o), Google Gemini și Claude de la Anthropic — în raport cu datele verificate de USDA și confirmate de nutriționiști pentru mai mult de 50 de produse alimentare. Scopul a fost să răspundem la trei întrebări specifice: Cât de precise sunt estimările calorice ale LLM-urilor? Cât de consistente sunt acestea între sesiuni? Și cum se compară cu o aplicație de urmărire a nutriției special concepută?

Cum am testat precizia calorică a LLM-urilor?

Am întrebat fiecare LLM aceeași întrebare pentru fiecare aliment: "Câte calorii sunt în [aliment cu porție specifică]?" Am rulat fiecare interogare într-o sesiune nouă (fără istoric de conversație) pentru a simula modul în care majoritatea utilizatorilor interacționează cu aceste instrumente — întrebări punctuale fără context.

Fiecare aliment a fost testat de cinci ori în cinci sesiuni separate pentru a măsura atât precizia (în raport cu datele verificate), cât și consistența (variabilitatea între sesiuni). Valorile de referință verificate au fost obținute din baza de date USDA FoodData Central și au fost corelate cu intrările verificate de nutriționiști.

Am testat 54 de produse alimentare din șase categorii: ingrediente simple, mese simple, mese complexe, alimente ambalate, produse de restaurant și băuturi.

Cât de precise sunt estimările calorice ale ChatGPT, Gemini și Claude?

Iată rezultatele generale de precizie pentru toate cele 54 de produse alimentare, comparând estimarea medie a fiecărui LLM cu valorile calorice verificate.

Metrică	ChatGPT (GPT-4o)	Gemini	Claude	Baza de date verificată (Nutrola)
Eroare medie absolută	±18%	±22%	±16%	±2–5%
Eroare medie mediană	±14%	±17%	±12%	±2%
Produse în ±10% de valorile verificate	42%	35%	48%	95%+
Produse în ±20% de valorile verificate	68%	58%	72%	99%+
Produse cu eroare >30%	15%	22%	11%	<1%
Cea mai mare eroare de estimare	55%	68%	45%	8%

Toate cele trei LLM-uri prezintă erori semnificative în estimările calorice, cu aproximativ o treime până la jumătate din estimări căzând în afara unei feronii de precizie de ±10%. Comparativ, o bază de date nutrițională verificată oferă date în ±5% pentru practic fiecare intrare, deoarece valorile sunt obținute din analize de laborator sau din faptele nutriționale verificate de producători, nu generate de un model de limbaj.

Un studiu din 2024 publicat în Nutrients a testat ChatGPT-4 pe 150 de alimente comune și a găsit o eroare medie absolută de 16.8%, consistentă cu constatările noastre. Studiul a menționat că ChatGPT a avut cele mai bune rezultate pentru alimente simple, bine cunoscute și cele mai slabe pentru preparate mixte și alimente specifice culturii.

Cum variază precizia calorică a LLM-urilor în funcție de tipul de aliment?

Tipul de aliment estimat este cel mai puternic predictor al preciziei LLM-urilor. Iată rezultatele detaliate pe categorii.

Categoria alimentară	Exemplu	Eroare medie ChatGPT	Eroare medie Gemini	Eroare medie Claude
Ingrediente simple (nepreparate)	"100g piept de pui crud"	±8%	±10%	±7%
Fructe/legume comune	"1 banană medie"	±6%	±8%	±5%
Mese simple gătite acasă	"2 ouă bătute cu unt"	±15%	±18%	±12%
Preparate complexe/mixte	"Chicken tikka masala cu naan"	±25%	±30%	±22%
Alimente ambalate de marcă	"1 bară KIND Dark Chocolate Nut"	±12%	±15%	±10%
Produse de restaurant	"Bol burrito cu pui Chipotle"	±20%	±28%	±18%
Băuturi (specialitate)	"Grande Starbucks Caramel Frappuccino"	±10%	±14%	±8%

Ingredientele simple și fructele/legumele comune oferă cele mai precise estimări, deoarece aceste alimente au valori calorice bine stabilite și standardizate, care apar frecvent în datele de antrenament. Conținutul caloric al 100 de grame de piept de pui crud (165 calorii) sau al unei banane medii (105 calorii) este consistent în practic toate sursele nutriționale.

Preparatele complexe mixte generează cele mai slabe estimări, deoarece conținutul caloric depinde de metodele specifice de preparare, proporțiile ingredientelor și dimensiunile porțiilor, pe care LLM-ul trebuie să le deducă, nu să le caute. Un chicken tikka masala poate varia între 350 și 750 de calorii pe porție, în funcție de cantitatea de smântână, ulei, unt și orez — iar LLM-ul nu are cum să știe ce variantă consumi.

Alimentele ambalate de marcă reprezintă un caz interesant. LLM-urile pot uneori să rețină date nutriționale exacte pentru produse populare din datele lor de antrenament, dar informațiile pot fi învechite. Reformulările produselor au loc frecvent, iar un LLM antrenat pe date din 2023 poate cita valori calorice care au fost actualizate în 2024 sau 2025.

Cât de consistente sunt estimările calorice ale LLM-urilor între sesiuni?

Consistența — obținerea aceluiași răspuns atunci când pui aceeași întrebare de mai multe ori — este o problemă separată de precizie. O estimare poate fi constant greșită sau inconsistent de corectă. Am măsurat consistența întrebând fiecare LLM aceeași întrebare despre calorii de cinci ori în sesiuni separate.

Aliment	Interval ChatGPT (5 sesiuni)	Interval Gemini (5 sesiuni)	Interval Claude (5 sesiuni)	Valoare verificată
Salată Caesar cu pui	350–470 cal	350–450 cal	380–440 cal	400–470 cal*
Sandwich cu unt de arahide	320–450 cal	340–480 cal	350–410 cal	370–420 cal*
Pad Thai (1 porție)	400–600 cal	350–550 cal	420–520 cal	450–550 cal*
Cartofi prăjiți mari McDonald's	480–510 cal	450–520 cal	490–510 cal	490 cal
Toast cu avocado (1 felie)	250–380 cal	200–350 cal	280–340 cal	280–350 cal*
Burrito Chipotle	800–1,100 cal	750–1,200 cal	850–1,050 cal	900–1,100 cal*
Iaurt grecesc cu granola	250–400 cal	280–420 cal	270–350 cal	300–380 cal*

*Intervalul reflectă variația în funcție de rețetă/porție.

Metrică de consistență	ChatGPT	Gemini	Claude
Răspândire medie în 5 sesiuni	±22% din medie	±28% din medie	±15% din medie
Produse cu o variație >100 cal	61%	72%	44%
Produse cu o variație <50 cal	22%	15%	33%
Cel mai inconsistent tip de aliment	Preparatele complexe	Preparatele complexe	Preparatele complexe
Cel mai consistent tip de aliment	Alimentele ambalate de marcă	Alimentele ambalate de marcă	Alimentele ambalate de marcă

Inconsistența nu este o eroare — este o proprietate fundamentală a modului în care funcționează LLM-urile. Acestea generează răspunsuri probabilistice, iar aceeași solicitare poate produce rezultate diferite în funcție de parametrii de eșantionare, starea feroniei contextuale și temperatura modelului. O bază de date nutrițională, în schimb, returnează rezultate identice pentru interogări identice de fiecare dată, deoarece este o căutare deterministă, nu un proces generativ.

În scopuri de contabilizare a caloriilor, această inconsistență înseamnă că, dacă întrebi ChatGPT despre aceeași masă pe care o consumi în fiecare zi, s-ar putea să primești un număr diferit de calorii de fiecare dată. Pe parcursul unei săptămâni, această variație aleatorie poate aduna sute sau mii de calorii de zgomot în contabilizarea ta.

Unde greșesc LLM-urile în obținerea datelor calorice?

Am identificat cinci tipare sistematice de eroare care au apărut în toate cele trei LLM-uri.

1. Defaultarea la porții "medii". Atunci când sunt întrebați despre "o felie de pizza", LLM-urile tind să se refere la o felie medie generică. Însă feliile de pizza variază de la 200 de calorii (crustă subțire, brânză puțină) la 400+ calorii (crustă groasă, toppinguri abundente). Fără a specifica tipul, crusta și toppingurile, valoarea default a LLM-ului poate fi departe de ceea ce ai consumat.

2. Ignorarea grăsimilor de gătit. Atunci când sunt întrebați despre "piept de pui la grătar", LLM-urile raportează de obicei caloriile doar pentru pieptul de pui (aproximativ 165 cal per 100g), fără a lua în considerare uleiul sau untul folosit în timpul gătitului. Aceasta subestimează constant caloriile reale cu 50–150 de calorii pe porție.

3. Informații de marcă învechite. Formulările produselor se schimbă. O bară Clif care avea 250 de calorii în 2022 ar putea avea 260 de calorii în 2025 după o reformulare a rețetei. LLM-urile antrenate pe date mai vechi pot cita valori învechite.

4. Rotunjirea și colapsul intervalului. LLM-urile rotunjesc frecvent la cele mai apropiate 50 sau 100 de calorii, pierzând precizia care contează la scară. "Aproximativ 300 de calorii" ar putea însemna 275 sau 325 — un interval de 50 de calorii care se acumulează în mesele zilnice.

5. Variația culturală și regională a alimentelor. O "porție de orez prăjit" înseamnă lucruri foarte diferite din punct de vedere caloric într-o bucătărie de acasă, într-un restaurant de tip takeout chinezesc-american și într-un stand de mâncare stradală din Bangkok. LLM-urile tind să se refere la presupuneri occidentale despre porții, indiferent de contextul utilizatorului.

Cum se compară estimările calorice ale LLM-urilor cu baza de date verificată Nutrola?

Diferența fundamentală dintre un LLM și o aplicație de contabilizare a nutriției este sursa de date. LLM-urile generează estimări din datele de antrenament. Nutrola caută valori dintr-o bază de date verificată de nutriționiști.

Factor de comparație	LLM-uri (ChatGPT, Gemini, Claude)	Baza de date verificată Nutrola
Sursa de date	Date de antrenament (text web, cărți)	Bază de date alimentară verificată de nutriționiști
Precizie (eroare medie)	±16–22%	±2–5%
Consistență	Variază între sesiuni (±15–28%)	Rezultate identice la fiecare interogare
Date specifice de marcă	Uneori disponibile, pot fi învechite	Actuale, verificate de producători
Gestionarea porțiilor	Default la "mediu" dacă nu este specificat	Porții ajustabile cu precizie la gram
Ajustarea metodei de gătit	Inconsistentă	Intrări separate pentru crude, gătite, prăjite etc.
Suport pentru coduri de bare/UPC	Nu se aplică	Căutare instantanee pentru alimente ambalate
Descompunerea macronutrienților	Adesea furnizată, dar cu aceleași marje de eroare	Date verificate pentru proteine, grăsimi, carbohidrați, micronutrienți
Urmărirea zilnică	Fără memorie între sesiuni*	Jurnal alimentar persistent cu totaluri

*ChatGPT și Gemini oferă funcții de memorie, dar acestea sunt concepute pentru preferințe generale, nu pentru înregistrarea structurată a nutriției.

Un studiu comparativ din 2025 publicat în British Journal of Nutrition a testat chatbot-urile AI în raport cu trei aplicații comerciale de contabilizare a nutriției pentru precizia înregistrării dietelor pe o perioadă de 7 zile. Aplicațiile de contabilizare au obținut o eroare medie zilnică de 5–8%, în timp ce chatbot-urile AI au avut o medie de 18–25% eroare zilnică. Studiul a concluzionat că "chatbot-urile AI de uz general nu sunt substituente adecvate pentru instrumentele special concepute pentru evaluarea dietei."

Când sunt utile LLM-urile pentru informații calorice?

LLM-urile nu sunt complet inutile pentru informațiile nutriționale. Ele servesc bine anumite cazuri de utilizare.

Educația nutrițională generală. Întrebând "Care este macronutrientul cel mai important pentru construirea mușchilor?" sau "Cum funcționează un deficit caloric?" se obțin răspunsuri fiabile, deoarece aceste informații sunt bine stabilite și consistente în surse.

Estimări aproximative. Dacă ai nevoie să știi dacă o masă are aproximativ 300 sau 800 de calorii — un interval de 2x — LLM-urile sunt de obicei corecte. Ele sunt mai puțin utile atunci când trebuie să știi dacă o masă are 450 sau 550 de calorii.

Idei pentru planificarea meselor. Întrebând un LLM să "sugereze cinci mic dejunuri bogate în proteine sub 400 de calorii" oferă puncte de plecare utile, deși estimările calorice pentru fiecare sugestie ar trebui verificate în raport cu o bază de date.

Compararea categoriilor alimentare. LLM-urile pot spune cu fiabilitate că nucile sunt mai dense în calorii decât fructele sau că pieptul de pui la grătar are mai puține calorii decât cel prăjit. Comparațiile relative sunt mai precise decât numerele absolute.

Când nu ar trebui să folosești LLM-urile pentru contabilizarea caloriilor?

Pe baza datelor de precizie și consistență, LLM-urile nu ar trebui folosite ca instrumente principale de contabilizare a caloriilor în mai multe scenarii.

Faze active de pierdere sau câștig în greutate. Când ținta ta zilnică de calorii are o marjă de ±200 de calorii, eroarea de ±18% a unui LLM te poate duce cu 300–500 de calorii departe de țintă zilnic. Pe parcursul unei săptămâni, aceasta poate anula complet un deficit planificat.

Urmărirea preparatelor complexe sau mixte. Rata de eroare pentru mesele complexe (±22–30%) este prea mare pentru o contabilizare semnificativă. O estimare de 700 de calorii pentru o cină care de fapt are 900 de calorii reprezintă o eroare zilnică de 200 de calorii dintr-o singură masă.

Contabilizarea zilnică constantă. Inconsistența între sesiuni înseamnă că aceeași masă înregistrată în zile diferite produce valori calorice diferite, creând zgomot în datele tale de contabilizare care face imposibilă identificarea tendințelor.

Gestionarea nutriției medicale sau clinice. Pentru persoanele care gestionează diabetul, bolile renale sau alte condiții care necesită un control nutrițional precis, estimările calorice LLM nu îndeplinesc pragul de precizie necesar pentru o gestionare dietetică sigură.

Concluzii cheie: Precizia calorică LLM vs. bază de date verificată

Constatare	Date
Eroarea medie calorică ChatGPT	±18% pe tipuri de alimente
Eroarea medie calorică Gemini	±22% pe tipuri de alimente
Eroarea medie calorică Claude	±16% pe tipuri de alimente
Eroarea medie a bazei de date verificate	±2–5%
Consistența LLM (varianta între sesiuni)	±15–28% din valoarea medie
Consistența bazei de date	0% variație (căutare deterministă)
Cel mai precis tip de aliment LLM	Ingrediente simple, fructe comune (±5–10%)
Cel mai puțin precis tip de aliment LLM	Preparatele complexe mixte (±22–30%)
Estimările LLM în ±10% de valorile verificate	35–48% din produse
Intrările din baza de date în ±5% de valorile verificate	95%+ din produse

LLM-urile sunt instrumente impresionante de uz general care pot discuta concepte nutriționale fluent. Ele nu sunt baze de date nutriționale. Diferența contează, deoarece contabilizarea caloriilor este o sarcină cantitativă — ai nevoie de numere specifice, consistente și verificate, nu de estimări plauzibile care se schimbă de fiecare dată când întrebi. Pentru educația nutrițională și orientarea aproximativă, LLM-urile funcționează. Pentru contabilizarea zilnică a caloriilor care generează rezultate reale, un instrument specializat cu o bază de date verificată este alegerea adecvată.

Întrebări frecvente

Cât de precis este ChatGPT în numărarea caloriilor?

ChatGPT (GPT-4o) are o eroare medie absolută de aproximativ 18% pe tipuri de alimente. Oferă estimări în ±10% de valorile verificate pentru doar 42% din alimentele testate. Precizia este cea mai bună pentru ingrediente simple, cum ar fi pieptul de pui crud (eroare de 8%) și cea mai slabă pentru preparate mixte complexe, cum ar fi chicken tikka masala (eroare de 25%).

Pot folosi ChatGPT în locul unei aplicații de contabilizare a caloriilor?

ChatGPT nu este un substitut fiabil pentru un contabilizator de calorii specializat. Un studiu din 2025 în British Journal of Nutrition a constatat că chatbot-urile AI au avut o eroare zilnică medie de 18-25% comparativ cu 5-8% pentru aplicațiile de contabilizare dedicate. ChatGPT oferă, de asemenea, răspunsuri inconsistente între sesiuni, aceeași întrebare despre un aliment producând estimări calorice care variază cu 15-28%.

De ce oferă ChatGPT numere calorice diferite de fiecare dată când întreb?

LLM-urile generează răspunsuri probabilistice, mai degrabă decât să caute valori într-o bază de date fixă. Aceeași solicitare poate produce rezultate diferite în funcție de parametrii de eșantionare și starea modelului. În teste, estimările ChatGPT pentru același aliment au variat în medie cu 22% între cinci sesiuni separate, făcând contabilizarea zilnică consistentă nesigură.

Pentru ce este cel mai precis ChatGPT în ceea ce privește nutriția?

ChatGPT performează cel mai bine pe ingrediente crude simple (eroare de 8%) și fructe și legume comune (eroare de 6%), unde valorile calorice sunt bine stabilite și standardizate. Este, de asemenea, util pentru educația nutrițională generală, estimările aproximative și comparațiile relative între alimente, mai degrabă decât pentru numere precise de calorii.

Cum se compară o bază de date alimentară verificată cu ChatGPT pentru calorii?

O bază de date nutrițională verificată, cum ar fi cele din aplicațiile de contabilizare dedicate, returnează rezultate în ±2-5% din valorile reale, fără variație între interogări. ChatGPT are o medie de 18% eroare, cu o inconsistență între sesiuni de 15-28%. Baza de date oferă date exacte specifice de marcă, porții ajustabile și rezultate consistente de fiecare dată.

Ești gata să îți transformi urmărirea nutriției?

Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!

Download on theApp Store

GET IT ONGoogle Play