Cât de precis este ChatGPT în estimările calorice?
Am testat estimările calorice oferite de ChatGPT, Gemini și Claude în raport cu datele nutriționale verificate pentru peste 50 de alimente. Vezi rezultatele privind precizia și consistența comparativ cu o bază de date verificată.
ChatGPT a devenit consilierul nutrițional implicit pentru milioane de oameni — și nu dispune de o bază de date nutrițională. Atunci când întrebi ChatGPT câte calorii are un burrito cu pui, acesta nu caută răspunsul într-o bază de date alimentară verificată. În schimb, generează un răspuns statistic probabil pe baza modelelor din datele sale de antrenament. Numărul pe care ți-l oferă poate fi aproape corect, dar poate fi și cu 40% greșit. Și dacă întrebi din nou mâine, s-ar putea să primești un alt număr.
Am testat trei modele majore de limbaj — ChatGPT (GPT-4o), Google Gemini și Claude de la Anthropic — în raport cu datele verificate de USDA și confirmate de nutriționiști pentru mai mult de 50 de produse alimentare. Scopul a fost să răspundem la trei întrebări specifice: Cât de precise sunt estimările calorice ale LLM-urilor? Cât de consistente sunt acestea între sesiuni? Și cum se compară cu o aplicație de urmărire a nutriției special concepută?
Cum am testat precizia calorică a LLM-urilor?
Am întrebat fiecare LLM aceeași întrebare pentru fiecare aliment: "Câte calorii sunt în [aliment cu porție specifică]?" Am rulat fiecare interogare într-o sesiune nouă (fără istoric de conversație) pentru a simula modul în care majoritatea utilizatorilor interacționează cu aceste instrumente — întrebări punctuale fără context.
Fiecare aliment a fost testat de cinci ori în cinci sesiuni separate pentru a măsura atât precizia (în raport cu datele verificate), cât și consistența (variabilitatea între sesiuni). Valorile de referință verificate au fost obținute din baza de date USDA FoodData Central și au fost corelate cu intrările verificate de nutriționiști.
Am testat 54 de produse alimentare din șase categorii: ingrediente simple, mese simple, mese complexe, alimente ambalate, produse de restaurant și băuturi.
Cât de precise sunt estimările calorice ale ChatGPT, Gemini și Claude?
Iată rezultatele generale de precizie pentru toate cele 54 de produse alimentare, comparând estimarea medie a fiecărui LLM cu valorile calorice verificate.
| Metrică | ChatGPT (GPT-4o) | Gemini | Claude | Baza de date verificată (Nutrola) |
|---|---|---|---|---|
| Eroare medie absolută | ±18% | ±22% | ±16% | ±2–5% |
| Eroare medie mediană | ±14% | ±17% | ±12% | ±2% |
| Produse în ±10% de valorile verificate | 42% | 35% | 48% | 95%+ |
| Produse în ±20% de valorile verificate | 68% | 58% | 72% | 99%+ |
| Produse cu eroare >30% | 15% | 22% | 11% | <1% |
| Cea mai mare eroare de estimare | 55% | 68% | 45% | 8% |
Toate cele trei LLM-uri prezintă erori semnificative în estimările calorice, cu aproximativ o treime până la jumătate din estimări căzând în afara unei feronii de precizie de ±10%. Comparativ, o bază de date nutrițională verificată oferă date în ±5% pentru practic fiecare intrare, deoarece valorile sunt obținute din analize de laborator sau din faptele nutriționale verificate de producători, nu generate de un model de limbaj.
Un studiu din 2024 publicat în Nutrients a testat ChatGPT-4 pe 150 de alimente comune și a găsit o eroare medie absolută de 16.8%, consistentă cu constatările noastre. Studiul a menționat că ChatGPT a avut cele mai bune rezultate pentru alimente simple, bine cunoscute și cele mai slabe pentru preparate mixte și alimente specifice culturii.
Cum variază precizia calorică a LLM-urilor în funcție de tipul de aliment?
Tipul de aliment estimat este cel mai puternic predictor al preciziei LLM-urilor. Iată rezultatele detaliate pe categorii.
| Categoria alimentară | Exemplu | Eroare medie ChatGPT | Eroare medie Gemini | Eroare medie Claude |
|---|---|---|---|---|
| Ingrediente simple (nepreparate) | "100g piept de pui crud" | ±8% | ±10% | ±7% |
| Fructe/legume comune | "1 banană medie" | ±6% | ±8% | ±5% |
| Mese simple gătite acasă | "2 ouă bătute cu unt" | ±15% | ±18% | ±12% |
| Preparate complexe/mixte | "Chicken tikka masala cu naan" | ±25% | ±30% | ±22% |
| Alimente ambalate de marcă | "1 bară KIND Dark Chocolate Nut" | ±12% | ±15% | ±10% |
| Produse de restaurant | "Bol burrito cu pui Chipotle" | ±20% | ±28% | ±18% |
| Băuturi (specialitate) | "Grande Starbucks Caramel Frappuccino" | ±10% | ±14% | ±8% |
Ingredientele simple și fructele/legumele comune oferă cele mai precise estimări, deoarece aceste alimente au valori calorice bine stabilite și standardizate, care apar frecvent în datele de antrenament. Conținutul caloric al 100 de grame de piept de pui crud (165 calorii) sau al unei banane medii (105 calorii) este consistent în practic toate sursele nutriționale.
Preparatele complexe mixte generează cele mai slabe estimări, deoarece conținutul caloric depinde de metodele specifice de preparare, proporțiile ingredientelor și dimensiunile porțiilor, pe care LLM-ul trebuie să le deducă, nu să le caute. Un chicken tikka masala poate varia între 350 și 750 de calorii pe porție, în funcție de cantitatea de smântână, ulei, unt și orez — iar LLM-ul nu are cum să știe ce variantă consumi.
Alimentele ambalate de marcă reprezintă un caz interesant. LLM-urile pot uneori să rețină date nutriționale exacte pentru produse populare din datele lor de antrenament, dar informațiile pot fi învechite. Reformulările produselor au loc frecvent, iar un LLM antrenat pe date din 2023 poate cita valori calorice care au fost actualizate în 2024 sau 2025.
Cât de consistente sunt estimările calorice ale LLM-urilor între sesiuni?
Consistența — obținerea aceluiași răspuns atunci când pui aceeași întrebare de mai multe ori — este o problemă separată de precizie. O estimare poate fi constant greșită sau inconsistent de corectă. Am măsurat consistența întrebând fiecare LLM aceeași întrebare despre calorii de cinci ori în sesiuni separate.
| Aliment | Interval ChatGPT (5 sesiuni) | Interval Gemini (5 sesiuni) | Interval Claude (5 sesiuni) | Valoare verificată |
|---|---|---|---|---|
| Salată Caesar cu pui | 350–470 cal | 350–450 cal | 380–440 cal | 400–470 cal* |
| Sandwich cu unt de arahide | 320–450 cal | 340–480 cal | 350–410 cal | 370–420 cal* |
| Pad Thai (1 porție) | 400–600 cal | 350–550 cal | 420–520 cal | 450–550 cal* |
| Cartofi prăjiți mari McDonald's | 480–510 cal | 450–520 cal | 490–510 cal | 490 cal |
| Toast cu avocado (1 felie) | 250–380 cal | 200–350 cal | 280–340 cal | 280–350 cal* |
| Burrito Chipotle | 800–1,100 cal | 750–1,200 cal | 850–1,050 cal | 900–1,100 cal* |
| Iaurt grecesc cu granola | 250–400 cal | 280–420 cal | 270–350 cal | 300–380 cal* |
*Intervalul reflectă variația în funcție de rețetă/porție.
| Metrică de consistență | ChatGPT | Gemini | Claude |
|---|---|---|---|
| Răspândire medie în 5 sesiuni | ±22% din medie | ±28% din medie | ±15% din medie |
| Produse cu o variație >100 cal | 61% | 72% | 44% |
| Produse cu o variație <50 cal | 22% | 15% | 33% |
| Cel mai inconsistent tip de aliment | Preparatele complexe | Preparatele complexe | Preparatele complexe |
| Cel mai consistent tip de aliment | Alimentele ambalate de marcă | Alimentele ambalate de marcă | Alimentele ambalate de marcă |
Inconsistența nu este o eroare — este o proprietate fundamentală a modului în care funcționează LLM-urile. Acestea generează răspunsuri probabilistice, iar aceeași solicitare poate produce rezultate diferite în funcție de parametrii de eșantionare, starea feroniei contextuale și temperatura modelului. O bază de date nutrițională, în schimb, returnează rezultate identice pentru interogări identice de fiecare dată, deoarece este o căutare deterministă, nu un proces generativ.
În scopuri de contabilizare a caloriilor, această inconsistență înseamnă că, dacă întrebi ChatGPT despre aceeași masă pe care o consumi în fiecare zi, s-ar putea să primești un număr diferit de calorii de fiecare dată. Pe parcursul unei săptămâni, această variație aleatorie poate aduna sute sau mii de calorii de zgomot în contabilizarea ta.
Unde greșesc LLM-urile în obținerea datelor calorice?
Am identificat cinci tipare sistematice de eroare care au apărut în toate cele trei LLM-uri.
1. Defaultarea la porții "medii". Atunci când sunt întrebați despre "o felie de pizza", LLM-urile tind să se refere la o felie medie generică. Însă feliile de pizza variază de la 200 de calorii (crustă subțire, brânză puțină) la 400+ calorii (crustă groasă, toppinguri abundente). Fără a specifica tipul, crusta și toppingurile, valoarea default a LLM-ului poate fi departe de ceea ce ai consumat.
2. Ignorarea grăsimilor de gătit. Atunci când sunt întrebați despre "piept de pui la grătar", LLM-urile raportează de obicei caloriile doar pentru pieptul de pui (aproximativ 165 cal per 100g), fără a lua în considerare uleiul sau untul folosit în timpul gătitului. Aceasta subestimează constant caloriile reale cu 50–150 de calorii pe porție.
3. Informații de marcă învechite. Formulările produselor se schimbă. O bară Clif care avea 250 de calorii în 2022 ar putea avea 260 de calorii în 2025 după o reformulare a rețetei. LLM-urile antrenate pe date mai vechi pot cita valori învechite.
4. Rotunjirea și colapsul intervalului. LLM-urile rotunjesc frecvent la cele mai apropiate 50 sau 100 de calorii, pierzând precizia care contează la scară. "Aproximativ 300 de calorii" ar putea însemna 275 sau 325 — un interval de 50 de calorii care se acumulează în mesele zilnice.
5. Variația culturală și regională a alimentelor. O "porție de orez prăjit" înseamnă lucruri foarte diferite din punct de vedere caloric într-o bucătărie de acasă, într-un restaurant de tip takeout chinezesc-american și într-un stand de mâncare stradală din Bangkok. LLM-urile tind să se refere la presupuneri occidentale despre porții, indiferent de contextul utilizatorului.
Cum se compară estimările calorice ale LLM-urilor cu baza de date verificată Nutrola?
Diferența fundamentală dintre un LLM și o aplicație de contabilizare a nutriției este sursa de date. LLM-urile generează estimări din datele de antrenament. Nutrola caută valori dintr-o bază de date verificată de nutriționiști.
| Factor de comparație | LLM-uri (ChatGPT, Gemini, Claude) | Baza de date verificată Nutrola |
|---|---|---|
| Sursa de date | Date de antrenament (text web, cărți) | Bază de date alimentară verificată de nutriționiști |
| Precizie (eroare medie) | ±16–22% | ±2–5% |
| Consistență | Variază între sesiuni (±15–28%) | Rezultate identice la fiecare interogare |
| Date specifice de marcă | Uneori disponibile, pot fi învechite | Actuale, verificate de producători |
| Gestionarea porțiilor | Default la "mediu" dacă nu este specificat | Porții ajustabile cu precizie la gram |
| Ajustarea metodei de gătit | Inconsistentă | Intrări separate pentru crude, gătite, prăjite etc. |
| Suport pentru coduri de bare/UPC | Nu se aplică | Căutare instantanee pentru alimente ambalate |
| Descompunerea macronutrienților | Adesea furnizată, dar cu aceleași marje de eroare | Date verificate pentru proteine, grăsimi, carbohidrați, micronutrienți |
| Urmărirea zilnică | Fără memorie între sesiuni* | Jurnal alimentar persistent cu totaluri |
*ChatGPT și Gemini oferă funcții de memorie, dar acestea sunt concepute pentru preferințe generale, nu pentru înregistrarea structurată a nutriției.
Un studiu comparativ din 2025 publicat în British Journal of Nutrition a testat chatbot-urile AI în raport cu trei aplicații comerciale de contabilizare a nutriției pentru precizia înregistrării dietelor pe o perioadă de 7 zile. Aplicațiile de contabilizare au obținut o eroare medie zilnică de 5–8%, în timp ce chatbot-urile AI au avut o medie de 18–25% eroare zilnică. Studiul a concluzionat că "chatbot-urile AI de uz general nu sunt substituente adecvate pentru instrumentele special concepute pentru evaluarea dietei."
Când sunt utile LLM-urile pentru informații calorice?
LLM-urile nu sunt complet inutile pentru informațiile nutriționale. Ele servesc bine anumite cazuri de utilizare.
Educația nutrițională generală. Întrebând "Care este macronutrientul cel mai important pentru construirea mușchilor?" sau "Cum funcționează un deficit caloric?" se obțin răspunsuri fiabile, deoarece aceste informații sunt bine stabilite și consistente în surse.
Estimări aproximative. Dacă ai nevoie să știi dacă o masă are aproximativ 300 sau 800 de calorii — un interval de 2x — LLM-urile sunt de obicei corecte. Ele sunt mai puțin utile atunci când trebuie să știi dacă o masă are 450 sau 550 de calorii.
Idei pentru planificarea meselor. Întrebând un LLM să "sugereze cinci mic dejunuri bogate în proteine sub 400 de calorii" oferă puncte de plecare utile, deși estimările calorice pentru fiecare sugestie ar trebui verificate în raport cu o bază de date.
Compararea categoriilor alimentare. LLM-urile pot spune cu fiabilitate că nucile sunt mai dense în calorii decât fructele sau că pieptul de pui la grătar are mai puține calorii decât cel prăjit. Comparațiile relative sunt mai precise decât numerele absolute.
Când nu ar trebui să folosești LLM-urile pentru contabilizarea caloriilor?
Pe baza datelor de precizie și consistență, LLM-urile nu ar trebui folosite ca instrumente principale de contabilizare a caloriilor în mai multe scenarii.
Faze active de pierdere sau câștig în greutate. Când ținta ta zilnică de calorii are o marjă de ±200 de calorii, eroarea de ±18% a unui LLM te poate duce cu 300–500 de calorii departe de țintă zilnic. Pe parcursul unei săptămâni, aceasta poate anula complet un deficit planificat.
Urmărirea preparatelor complexe sau mixte. Rata de eroare pentru mesele complexe (±22–30%) este prea mare pentru o contabilizare semnificativă. O estimare de 700 de calorii pentru o cină care de fapt are 900 de calorii reprezintă o eroare zilnică de 200 de calorii dintr-o singură masă.
Contabilizarea zilnică constantă. Inconsistența între sesiuni înseamnă că aceeași masă înregistrată în zile diferite produce valori calorice diferite, creând zgomot în datele tale de contabilizare care face imposibilă identificarea tendințelor.
Gestionarea nutriției medicale sau clinice. Pentru persoanele care gestionează diabetul, bolile renale sau alte condiții care necesită un control nutrițional precis, estimările calorice LLM nu îndeplinesc pragul de precizie necesar pentru o gestionare dietetică sigură.
Concluzii cheie: Precizia calorică LLM vs. bază de date verificată
| Constatare | Date |
|---|---|
| Eroarea medie calorică ChatGPT | ±18% pe tipuri de alimente |
| Eroarea medie calorică Gemini | ±22% pe tipuri de alimente |
| Eroarea medie calorică Claude | ±16% pe tipuri de alimente |
| Eroarea medie a bazei de date verificate | ±2–5% |
| Consistența LLM (varianta între sesiuni) | ±15–28% din valoarea medie |
| Consistența bazei de date | 0% variație (căutare deterministă) |
| Cel mai precis tip de aliment LLM | Ingrediente simple, fructe comune (±5–10%) |
| Cel mai puțin precis tip de aliment LLM | Preparatele complexe mixte (±22–30%) |
| Estimările LLM în ±10% de valorile verificate | 35–48% din produse |
| Intrările din baza de date în ±5% de valorile verificate | 95%+ din produse |
LLM-urile sunt instrumente impresionante de uz general care pot discuta concepte nutriționale fluent. Ele nu sunt baze de date nutriționale. Diferența contează, deoarece contabilizarea caloriilor este o sarcină cantitativă — ai nevoie de numere specifice, consistente și verificate, nu de estimări plauzibile care se schimbă de fiecare dată când întrebi. Pentru educația nutrițională și orientarea aproximativă, LLM-urile funcționează. Pentru contabilizarea zilnică a caloriilor care generează rezultate reale, un instrument specializat cu o bază de date verificată este alegerea adecvată.
Întrebări frecvente
Cât de precis este ChatGPT în numărarea caloriilor?
ChatGPT (GPT-4o) are o eroare medie absolută de aproximativ 18% pe tipuri de alimente. Oferă estimări în ±10% de valorile verificate pentru doar 42% din alimentele testate. Precizia este cea mai bună pentru ingrediente simple, cum ar fi pieptul de pui crud (eroare de 8%) și cea mai slabă pentru preparate mixte complexe, cum ar fi chicken tikka masala (eroare de 25%).
Pot folosi ChatGPT în locul unei aplicații de contabilizare a caloriilor?
ChatGPT nu este un substitut fiabil pentru un contabilizator de calorii specializat. Un studiu din 2025 în British Journal of Nutrition a constatat că chatbot-urile AI au avut o eroare zilnică medie de 18-25% comparativ cu 5-8% pentru aplicațiile de contabilizare dedicate. ChatGPT oferă, de asemenea, răspunsuri inconsistente între sesiuni, aceeași întrebare despre un aliment producând estimări calorice care variază cu 15-28%.
De ce oferă ChatGPT numere calorice diferite de fiecare dată când întreb?
LLM-urile generează răspunsuri probabilistice, mai degrabă decât să caute valori într-o bază de date fixă. Aceeași solicitare poate produce rezultate diferite în funcție de parametrii de eșantionare și starea modelului. În teste, estimările ChatGPT pentru același aliment au variat în medie cu 22% între cinci sesiuni separate, făcând contabilizarea zilnică consistentă nesigură.
Pentru ce este cel mai precis ChatGPT în ceea ce privește nutriția?
ChatGPT performează cel mai bine pe ingrediente crude simple (eroare de 8%) și fructe și legume comune (eroare de 6%), unde valorile calorice sunt bine stabilite și standardizate. Este, de asemenea, util pentru educația nutrițională generală, estimările aproximative și comparațiile relative între alimente, mai degrabă decât pentru numere precise de calorii.
Cum se compară o bază de date alimentară verificată cu ChatGPT pentru calorii?
O bază de date nutrițională verificată, cum ar fi cele din aplicațiile de contabilizare dedicate, returnează rezultate în ±2-5% din valorile reale, fără variație între interogări. ChatGPT are o medie de 18% eroare, cu o inconsistență între sesiuni de 15-28%. Baza de date oferă date exacte specifice de marcă, porții ajustabile și rezultate consistente de fiecare dată.
Ești gata să îți transformi urmărirea nutriției?
Alătură-te celor mii care și-au transformat călătoria de sănătate cu Nutrola!