Kan Gemini AI Spåra Dina Kalorier? Vi Testade Det Mot En Dedikerad App
Vi bad Gemini och ChatGPT att uppskatta kalorier för 30 måltider och jämförde resultaten med Nutrola och vägda livsmedelsreferenser. Noggrannhetsgapet var större än förväntat.
När AI-chattbotar blir en del av vardagen uppstår en naturlig fråga: kan du bara be Gemini eller ChatGPT att spåra dina kalorier istället för att använda en dedikerad näringsapp? Vi testade detta direkt. Under två veckor bad vi Google Gemini och OpenAI ChatGPT att uppskatta kalori- och makronäringsinnehållet i 30 olika måltider, från enkla livsmedel med en ingrediens till komplexa restauraträtter. Vi jämförde deras uppskattningar med två referenser: Nutrolas verifierade livsmedelsdatabas och vägda livsmedelsreferenser beräknade med hjälp av USDA FoodData Central-värden.
Resultaten avslöjar grundläggande begränsningar i att använda allmänna AI-chattbotar för kostspårning, begränsningar som är strukturella snarare än tillfälliga, vilket innebär att de sannolikt inte kommer att lösas helt med framtida modelluppdateringar.
Kan jag använda Gemini för att räkna kalorier?
Du kan be Gemini att uppskatta kalorierna i en måltid, och den kommer att ge ett svar. Frågan är om det svaret är tillräckligt noggrant och konsekvent för att stödja faktisk kosthantering. Baserat på våra tester är svaret nej för alla användningsfall som kräver pålitlighet.
Testmetodik: Vi förberedde eller köpte 30 måltider med varierande komplexitet. Varje måltid vägdes på en kalibrerad köksvåg, och referensvärden för kalorier beräknades med hjälp av USDA FoodData Central-näringsdata. Vi beskrev sedan varje måltid för Gemini (Googles AI-assistent) på naturligt språk, på samma sätt som en verklig användare skulle göra, och registrerade dess kaloriuppskattning. Vi genomförde samma test med ChatGPT (GPT-4o) och loggade varje måltid i Nutrola med hjälp av fotigenkänning och databasuppslag.
Definition av noggrannhet: Vi definierade en uppskattning som "noggrann" om den låg inom 10 procent av det vägda referensvärdet, en standardtröskel som används i forskningen om kostbedömning (Subar et al., The Journal of Nutrition, 2015).
Hur noggranna är AI-chattbotar för kaloriräkning?
Resultaten var konsekventa över måltidskategorier: allmänna AI-chattbotar ger grova uppskattningar som inte är tillräckligt pålitliga för kalorikontrollerade dieter.
| Metrik | Gemini | ChatGPT (GPT-4o) | Nutrola | Vägd referens |
|---|---|---|---|---|
| Måltider inom 10% av referens | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Genomsnittligt absolut fel | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Genomsnittligt procentuellt fel | 22,4% | 18,6% | 6,1% | 0% |
| Största enskilda överskattning | +340 kcal (pastarätt) | +285 kcal (wok) | +95 kcal (restaurangmåltid) | N/A |
| Största enskilda underskattning | -290 kcal (sallad med dressing) | -315 kcal (granolabowl) | -72 kcal (hemgjord soppa) | N/A |
| Konsekvent över upprepade frågor | Nej (varierade med 50-200 kcal) | Nej (varierade med 30-150 kcal) | Ja (databaslåst) | N/A |
Nyckelfynd: Det genomsnittliga absoluta felet på 108 till 127 kalorier per måltid motsvarar 324 till 381 kalorier av kumulativt fel över tre måltider per dag. För någon som siktar på ett kaloriunderskott på 500 kalorier för viktminskning kan denna nivå av felaktighet eliminera 65 till 76 procent av deras avsedda underskott, vilket effektivt stannar upp framstegen.
Varför får AI-chattbotar fel på kaloriberäkningar?
De fel vi observerade var inte slumpmässiga. De följde förutsägbara mönster som avslöjar strukturella begränsningar i att använda stora språkmodeller för näringsuppskattning.
Problem 1: Ingen verifierad databas. Gemini och ChatGPT söker inte upp livsmedel i en strukturerad näringsdatabas när du ber dem om kaloriuppskattningar. De genererar svar baserat på mönster i sina träningsdata, som inkluderar en blandning av korrekt USDA-data, användargenererat innehåll, uppskattningar från matbloggar och marknadsföringsmaterial. Ett enskilt livsmedel kan ha helt olika kaloriinnehåll över dessa källor, och modellen har ingen mekanism för att identifiera vilken källa som är korrekt.
Nutrola och andra dedikerade näringsappar använder verifierade livsmedelsdatabaser. Nutrolas databas innehåller över 1,8 miljoner poster som korsrefereras med USDA FoodData Central, tillverkarens näringsetiketter och oberoende laboratorieanalyser. När du loggar "grillad kycklingbröst, 150g" returneras ett verifierat datapunkt, inte ett statistiskt genomsnitt av allt som internet någonsin sagt om kyckling.
Problem 2: Ingen grund för portionsstorlek. När du säger till en AI-chattbot att du hade "en skål pasta" måste den gissa vad "en skål" betyder. Är det 200 gram kokt pasta eller 400 gram? Skillnaden är 250 kalorier eller mer. AI-chattbotar utgår från kulturellt genomsnittliga portionsantaganden som kanske inte matchar din faktiska servering.
I våra tester var felaktig portionsberäkning den enskilt största källan till fel. Gemini underskattade en granolabowl med 210 kalorier eftersom den antog en mindre portion än vad som faktiskt konsumerades. ChatGPT överskattade en wok med 285 kalorier eftersom den antog restaurangstorlekar när måltiden var hemlagad.
Nutrola hanterar detta genom flera mekanismer: streckkodsskanning kopplar direkt till tillverkarens angivna portionsstorlekar, AI-fotigenkänning uppskattar portionsvolymen från bilden, och användare kan justera portioner i gram med hjälp av en köksvåg för maximal noggrannhet.
Problem 3: Ingen minnesfunktion mellan sessioner. Detta är kanske den mest grundläggande begränsningen för pågående kalorispårning. AI-chattbotar upprätthåller ingen bestående logg över vad du har ätit. Varje konversation börjar från noll. Det finns ingen daglig total, ingen veckotendens, ingen löpande makronäringsuppdelning.
Effektiv kalorispårning kräver kumulativ data. Du behöver veta inte bara kalorierna i din lunch utan också din löpande dagliga total, ditt veckogenomsnitt, din makronäringsfördelning och din vikttrend över tid. En chattbot ger isolerade punktuppskattningar utan kontinuitet.
Problem 4: Inkonsekventa uppskattningar för identiska frågor. Vi bad både Gemini och ChatGPT att uppskatta kalorierna för samma måltidsbeskrivning tre gånger på olika dagar. Resultaten varierade med 50 till 200 kalorier mellan frågorna. En "medium Caesar-sallad med grillad kyckling" gav uppskattningar på 380, 450 och 520 kalorier från Gemini över tre separata konversationer. Denna inkonsekvens är inneboende i hur språkmodeller genererar svar. De är probabilistiska textgeneratorer, inte databassökningssystem.
Problem 5: Hallucinerad näringsdata. I 4 av 30 måltidsuppskattningar gav ChatGPT specifika men påhittade näringsuppdelningar. Till exempel angav den att en viss varumärkesproteinbar innehöll 22g protein och 210 kalorier, när den faktiska etiketten visar 20g protein och 190 kalorier. Siffrorna var tillräckligt nära för att verka trovärdiga men felaktiga nog att spela roll över tid. Detta fenomen, känt som hallucination inom AI-forskning, är särskilt farligt inom näring eftersom felen ser auktoritativa ut.
Är ChatGPT noggrann för kaloriräkning?
ChatGPT presterade något bättre än Gemini i våra tester, med 43 procent av uppskattningarna inom 10 procent av referensen jämfört med 37 procent för Gemini. Men denna skillnad är inte praktiskt meningsfull. Båda chattbotarna ligger långt under noggrannhetströskeln som krävs för pålitlig kosthantering.
Den akademiska standarden för verktyg för kostbedömning, som definieras av forskare som Subar et al. och Thompson et al. vid National Cancer Institute, kräver att ett verktyg ska visa mindre än 10 procent genomsnittligt fel för att anses giltigt för individuell kostövervakning. Båda chattbotarna överskrider denna tröskel med god marginal.
ChatGPT:s fördel över Gemini verkade komma från något bättre portionsstorleksantaganden för vanliga amerikanska livsmedel, vilket sannolikt återspeglar sammansättningen av dess träningsdata. För internationella livsmedel, regionala rätter och hemlagade måltider sjönk noggrannheten betydligt för båda modellerna.
AI-chattbot vs näringsapp för kostspårning: Full jämförelse
Utöver rå noggrannhet sträcker sig de funktionella skillnaderna mellan en chattbot och en dedikerad näringsapp över flera dimensioner som påverkar användbarheten i verkligheten.
| Funktion | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Kalorinoggrannhet (jämfört med vägda referens) | 18-22% genomsnittligt fel | 6% genomsnittligt fel |
| Verifierad livsmedelsdatabas | Nej | Ja, 1,8M+ poster |
| Streckkodsskanning | Nej | Ja |
| Fotobaserad livsmedelsigenkänning | Begränsad (kräver uppladdning) | Inbyggd AI-igenkänning |
| Röstloggning | Indirekt (röst-till-text) | Inhemsk röstmatloggning |
| Bestående daglig logg | Nej | Ja, automatisk |
| Löpande dagliga/veckototals | Nej (måste summeras manuellt) | Ja, i realtid |
| Makronäringsuppdelning | Uppskattad per fråga | Spårad per livsmedel, dagligen, veckovis |
| Mikronäringsspårning | Inkonsekvent | 100+ näringsämnen |
| Vikttrendspårning | Nej | Ja, med grafisk visning |
| Apple Watch-integration | Nej | Ja |
| Anpassningsbara kaloritarget | Nej | Ja, justeras efter dina trender |
| Konsekventa uppskattningar | Nej (varierar per fråga) | Ja (databaslåst) |
| Offlineåtkomst | Nej | Ja |
| Kostnad | Gratis (med prenumeration för avancerat) | Från €2.50/månad |
| Annonser | Varierar beroende på plattform | Inga annonser |
Vad är AI-chattbotar bra på inom näring?
Trots sina begränsningar för kalorispårning har allmänna AI-chattbotar legitima näringsanvändningsområden som bör erkännas.
Allmän näringsutbildning. Att fråga Gemini eller ChatGPT om skillnaden mellan mättade och omättade fetter, eller att beskriva hur proteinsyntes fungerar, ger vanligtvis korrekta och välorganiserade svar. För konceptuella frågor med etablerad vetenskaplig konsensus presterar AI-chattbotar bra.
Måltidsidéer. Chattbotar är duktiga på att generera receptidéer baserat på begränsningar som "högt proteinmåltider under 500 kalorier med kyckling och broccoli." Den specifika kaloriantalet kanske inte är exakt, men måltidskoncepten är användbara utgångspunkter.
Jämförelse av kostmönster. Att be en chattbot att jämföra medelhavskosten, ketogen kost och växtbaserade dieter ger rimliga sammanfattningar av bevisen för varje tillvägagångssätt.
Där chattbotar misslyckas är i den kvantitativa, beständiga och noggrannhetsberoende uppgiften att dagligen spåra kalorier och näringsämnen. Detta är ett databas- och loggningsproblem, inte ett språkgenereringsproblem.
Varför överträffar dedikerade näringsappar allmänna AI-chattbotar
Den grundläggande anledningen är arkitektonisk. En kostspårningsapp är byggd kring en strukturerad databas, en bestående användarprofil och ackumuleringslogik. En AI-chattbot är byggd kring nästa-token-prediktion från en språkmodell. Dessa är fundamentalt olika verktyg optimerade för fundamentalt olika uppgifter.
Beständighet. Nutrola upprätthåller en komplett logg över varje livsmedel du loggar, dina dagliga och veckovisa totala, dina makronäringstrender och din vikt historia. Denna longitudinella data är vad som gör kalorispårning effektiv. En enda kaloriuppskattning, oavsett hur noggrann, är värdelös utan kontexten av din dagliga total och veckomönster.
Verifierad data. En databaspost för "Chobani Grekisk Yoghurt, Naturell, 150g" i Nutrola kommer från tillverkarens näringsetikett och verifieras mot USDA-standarder. När en chattbot uppskattar samma objekt genomsnittar den information från tusentals webbkällor av varierande tillförlitlighet, vilket ger ett plausibelt men overifierat nummer.
Integrering med bärbara enheter. Data från Apple Watch matas direkt in i Nutrola, vilket ger exakta aktivitetskaloriuppskattningar som kombineras med livsmedelsloggning för att beräkna nettoenergibalans. Ingen chattbot kan få tillgång till dina bärbara data för att justera kalori rekommendationer baserat på din faktiska dagliga rörelse.
Hastighet och bekvämlighet. Att ta en bild av din tallrik, skanna en streckkod eller tala in din måltid tar under 30 sekunder. Att skriva en detaljerad måltidsbeskrivning till en chattbot, vänta på svaret och sedan manuellt registrera uppskattningen någonstans tar betydligt längre tid och ger ett mindre exakt resultat.
Kan AI-chattbotar förbättras tillräckligt för att ersätta näringsappar?
Detta är en fråga om grundläggande arkitektur, inte bara modellkapacitet. Även med perfekt noggrannhet i kaloriuppskattning (vilket nuvarande modeller är långt ifrån att uppnå) skulle AI-chattbotar fortfarande sakna den beständiga loggningen, kumulativa spårningen, integreringen med bärbara enheter och verifieringen av strukturerade databaser som kostspårning kräver.
Framtida AI-system skulle teoretiskt kunna inkludera dessa funktioner. Men vid det laget skulle de i praktiken vara kostappar med ett konversationsgränssnitt, inte allmänna chattbotar. De funktioner som gör kalorispårning effektiv, en verifierad databas, beständiga användarloggar, enhetsintegrationer och adaptiva algoritmer, är ingenjörssystem, inte språkförmågor.
Den mest troliga framtiden är inte "chattbotar ersätter kostappar" utan snarare "kostappar inkorporerar konverserande AI." Detta händer redan. Nutrolas AI-drivna fotigenkänning och röstloggning ger bekvämligheten av konverserande interaktion till den strukturerade tillförlitligheten hos en verifierad näringsdatabas. Du får den naturliga interaktionen av att prata med en AI med noggrannheten och beständigheten hos ett syftesbyggt spårningssystem.
Vad händer när du ber en AI att spåra dina kalorier?
För att illustrera den praktiska skillnaden, här är hur en typisk dag av kalorispårning ser ut med varje metod.
Använda Gemini eller ChatGPT: Du ber chattboten att uppskatta din frukost. Den ger dig ett nummer. Du skriver ner det någonstans eller försöker komma ihåg det. Vid lunchtid påbörjar du en ny konversation (chattboten kommer inte ihåg frukosten) och får en annan uppskattning. Du lägger mentalt ihop de två siffrorna. Vid middagstid har du en grov löpande total som kan vara fel med 200 till 400 kalorier, och du har ingen makronäringsuppdelning, ingen bestående logg och ingen veckotendens.
Använda Nutrola: Du fotograferar din frukost. AI:n känner igen livsmedlen, matchar dem med verifierade databasposter och loggar dem automatiskt. Din dagliga total uppdateras i realtid. Vid lunchtid skannar du en streckkod på din smörgåspaket, och den exakta tillverkarens näringsdata läggs till din logg. Vid middagstid har du en exakt löpande total, en makronäringsuppdelning och en måltidshistorik som matar in i dina veckovisa och månatliga trender. Ditt kaloritarget justeras baserat på din faktiska vikttrenddata som synkroniseras från din Apple Watch.
Skillnaden är inte subtil. Det är skillnaden mellan en gissning och ett system.
Viktiga slutsatser
Allmänna AI-chattbotar som Gemini och ChatGPT är imponerande verktyg för många uppgifter, men kalorispårning är inte en av dem. Vårt test med 30 måltider visade genomsnittliga fel på 108 till 127 kalorier per måltid, inkonsekventa resultat över upprepade frågor, ingen bestående loggningskapacitet och ingen integration med livsmedelsdatabaser eller bärbara enheter. Dessa begränsningar är strukturella, inte tillfälliga. De härstammar från den grundläggande skillnaden mellan en språkmodell och ett kostspårningssystem.
För alla som är seriösa med att hantera sin kost är en dedikerad app med en verifierad databas, bestående loggning och anpassningsbara mål fortfarande avgörande. Nutrola kombinerar AI-drivna bekvämligheter (fotigenkänning, röstloggning, streckkodsskanning) med noggrannheten och beständigheten hos en strukturerad näringsplattform, allt för 2,50 euro per månad utan annonser. När det gäller kalorispårning är frågan inte om AI är involverad. Det är om AI:n stöds av rätt arkitektur för jobbet.
Redo att förvandla din näringsspårning?
Gå med tusentals som har förvandlat sin hälsoresa med Nutrola!