Kan Gemini AI Je Calorieën Bijhouden? We Hebben Het Getest Tegen Een Toegewijde App
We hebben Gemini en ChatGPT gevraagd om de calorieën van 30 maaltijden te schatten en vergeleken de resultaten met Nutrola en gewogen voedselreferenties. De nauwkeurigheidsverschillen waren groter dan verwacht.
Nu AI-chatbots een onderdeel van ons dagelijks leven worden, rijst de vraag: kun je gewoon Gemini of ChatGPT vragen om je calorieën bij te houden in plaats van een toegewijde voedingsapp te gebruiken? We hebben dit direct getest. Gedurende twee weken vroegen we Google Gemini en OpenAI ChatGPT om de calorie- en macronutriëntinhoud van 30 verschillende maaltijden te schatten, variërend van eenvoudige een-ingrediënt gerechten tot complexe restaurantgerechten. We vergeleken hun schattingen met twee benchmarks: de geverifieerde voedselgegevens van Nutrola en gewogen voedselreferenties berekend met behulp van USDA FoodData Central-waarden.
De resultaten onthullen fundamentele beperkingen bij het gebruik van algemene AI-chatbots voor voedingsregistratie, beperkingen die structureel zijn en niet tijdelijk, wat betekent dat ze waarschijnlijk niet volledig zullen worden opgelost met toekomstige modelupdates.
Kan ik Gemini gebruiken om calorieën te tellen?
Je kunt Gemini vragen om de calorieën in een maaltijd te schatten, en het zal een antwoord geven. De vraag is of dat antwoord nauwkeurig en consistent genoeg is om daadwerkelijk je dieet te beheren. Op basis van onze tests is het antwoord nee voor elk gebruiksdoel dat betrouwbaarheid vereist.
Testmethodologie: We hebben 30 maaltijden voorbereid of gekocht die een scala aan complexiteit dekken. Elke maaltijd werd gewogen op een gekalibreerde keukenweegschaal, en referentiewaarden voor calorieën werden berekend met behulp van USDA FoodData Central voedingsdata. Vervolgens beschreef we elke maaltijd aan Gemini (de AI-assistent van Google) in natuurlijke taal, op dezelfde manier als een echte gebruiker zou doen, en registreerden we zijn calorie-inschatting. We voerden dezelfde test uit met ChatGPT (GPT-4o) en logden elke maaltijd in Nutrola met behulp van fotoherkenning en databasezoekopdrachten.
Nauwkeurigheidsdefinitie: We definieerden een schatting als "nauwkeurig" als deze binnen 10 procent van de gewogen referentiewaarde viel, een standaarddrempel die wordt gebruikt in onderzoek naar dieetbeoordeling (Subar et al., The Journal of Nutrition, 2015).
Hoe nauwkeurig zijn AI-chatbots voor calorieën tellen?
De resultaten waren consistent over maaltijdcategorieën: algemene AI-chatbots bieden ruwe schattingen die niet betrouwbaar genoeg zijn voor calorie-beheerde diëten.
| Metriek | Gemini | ChatGPT (GPT-4o) | Nutrola | Gewogen Referentie |
|---|---|---|---|---|
| Maaltijden binnen 10% van referentie | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Gemiddelde absolute fout | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Gemiddeld percentage fout | 22.4% | 18.6% | 6.1% | 0% |
| Grootste enkele overschatting | +340 kcal (pastagerecht) | +285 kcal (roerbakschotel) | +95 kcal (restaurantmaaltijd) | N/A |
| Grootste enkele onderschatting | -290 kcal (salade met dressing) | -315 kcal (granola kom) | -72 kcal (huisgemaakte soep) | N/A |
| Consistentie bij herhaalde vragen | Nee (variatie van 50-200 kcal) | Nee (variatie van 30-150 kcal) | Ja (database-gebonden) | N/A |
Belangrijkste bevinding: De gemiddelde absolute fout van 108 tot 127 calorieën per maaltijd vertaalt zich naar 324 tot 381 calorieën cumulatieve fout over drie maaltijden per dag. Voor iemand die streeft naar een tekort van 500 calorieën voor gewichtsverlies, kan dit niveau van onnauwkeurigheid 65 tot 76 procent van hun beoogde tekort elimineren, wat de voortgang effectief stillegt.
Waarom krijgen AI-chatbots calorie-informatie verkeerd?
De fouten die we observeerden waren niet willekeurig. Ze volgden voorspelbare patronen die de structurele beperkingen onthullen van het gebruik van grote taalmodellen voor voedingsschatting.
Probleem 1: Geen geverifieerde database. Gemini en ChatGPT kijken niet in een gestructureerde voedingsdatabase wanneer je hen vraagt om calorie-inschattingen. Ze genereren antwoorden op basis van patronen in hun trainingsdata, die een mix van nauwkeurige USDA-gegevens, door gebruikers gegenereerde inhoud, schattingen van voedselblogs en marketingmateriaal bevatten. Een enkel voedingsitem kan enorm verschillende caloriewaarden hebben over deze bronnen, en het model heeft geen mechanisme om te identificeren welke bron correct is.
Nutrola en andere toegewijde voedingsapps gebruiken geverifieerde voedselgegevens. De database van Nutrola bevat meer dan 1,8 miljoen entries die zijn gecontroleerd tegen USDA FoodData Central, voedingslabels van fabrikanten en onafhankelijke laboratoriumanalyses. Wanneer je "kipfilet, gegrild, 150g" logt, is de waarde die wordt teruggegeven een geverifieerd datapunt, geen statistisch gemiddelde van alles wat het internet ooit over kip heeft gezegd.
Probleem 2: Geen gronding in portiegrootte. Wanneer je een AI-chatbot vertelt dat je "een kom pasta" had, moet het raden wat "een kom" betekent. Is het 200 gram gekookte pasta of 400 gram? Het verschil is 250 calorieën of meer. AI-chatbots gaan uit van cultureel gemiddelde portie aannames die mogelijk niet overeenkomen met jouw werkelijke portie.
In onze tests was de fout in portiegrootte de grootste bron van fouten. Gemini onderschatte een granola kom met 210 calorieën omdat het een kleinere portie aannam dan wat daadwerkelijk werd geconsumeerd. ChatGPT overschatte een roerbakschotel met 285 calorieën omdat het uitging van restaurantporties terwijl de maaltijd thuis was bereid.
Nutrola pakt dit aan via meerdere mechanismen: barcode-scanning koppelt direct aan de door de fabrikant vermelde portiegroottes, AI-fotoherkenning schat het portievolume op basis van de afbeelding, en gebruikers kunnen porties in grammen aanpassen met behulp van een keukenweegschaal voor maximale nauwkeurigheid.
Probleem 3: Geen geheugen tussen sessies. Dit is misschien wel de meest fundamentele beperking voor voortdurende calorie tracking. AI-chatbots houden geen blijvende log bij van wat je hebt gegeten. Elk gesprek begint opnieuw. Er is geen dagelijkse totaal, geen wekelijkse trend, geen lopende macronutriëntenverdeling.
Effectieve calorie tracking vereist cumulatieve gegevens. Je moet niet alleen de calorieën in je lunch weten, maar ook je lopende dagelijkse totaal, je wekelijkse gemiddelde, je macronutriëntenverdeling en je gewichtstrend in de loop van de tijd. Een chatbot biedt geïsoleerde puntinschattingen zonder continuïteit.
Probleem 4: Inconsistente schattingen voor identieke vragen. We vroegen zowel Gemini als ChatGPT om calorieën te schatten voor dezelfde maaltijdbeschrijving drie keer op verschillende dagen. De resultaten varieerden met 50 tot 200 calorieën tussen de vragen. Een "medium Caesar salade met gegrilde kip" gaf schattingen van 380, 450 en 520 calorieën van Gemini over drie afzonderlijke gesprekken. Deze inconsistentie is inherent aan hoe taalmodellen antwoorden genereren. Ze zijn probabilistische tekstgeneratoren, geen databasezoeksystemen.
Probleem 5: Hallucinated voedingsdata. In 4 van de 30 maaltijdschattingen gaf ChatGPT specifieke maar gefabriceerde voedingsverdelingen. Bijvoorbeeld, het beweerde dat een bepaald merk-eiwitreep 22g eiwit en 210 calorieën bevatte, terwijl het werkelijke label 20g eiwit en 190 calorieën aangeeft. De cijfers leken plausibel maar waren te onnauwkeurig om er op de lange termijn op te vertrouwen. Dit fenomeen, bekend als hallucination in AI-onderzoek, is bijzonder gevaarlijk in voeding omdat de fouten autoritair lijken.
Is ChatGPT nauwkeurig voor calorieën tellen?
ChatGPT presteerde iets beter dan Gemini in onze tests, met 43 procent van de schattingen binnen 10 procent van de referentie versus 37 procent voor Gemini. Deze verschillen zijn echter niet praktisch betekenisvol. Beide chatbots blijven ver onder de nauwkeurigheidsdrempel die nodig is voor betrouwbaar dieetbeheer.
De academische standaard voor hulpmiddelen voor dieetbeoordeling, zoals gedefinieerd door onderzoekers zoals Subar et al. en Thompson et al. van het National Cancer Institute, vereist dat een hulpmiddel minder dan 10 procent gemiddelde fout vertoont om als geldig te worden beschouwd voor individuele dieetmonitoring. Beide chatbots overschrijden deze drempel met een grote marge.
Het voordeel van ChatGPT ten opzichte van Gemini leek te komen van iets betere aannames over portiegrootte voor gangbare Amerikaanse voedingsmiddelen, waarschijnlijk als gevolg van de samenstelling van zijn trainingsdata. Voor internationale voedingsmiddelen, regionale gerechten en huisgemaakte maaltijden daalde de nauwkeurigheid aanzienlijk voor beide modellen.
AI Chatbot vs Voedingsapp voor Dieet Tracking: Volledige Vergelijking
Naast de ruwe nauwkeurigheid, zijn de functionele verschillen tussen een chatbot en een toegewijde voedingsapp veelzijdig en beïnvloeden ze de bruikbaarheid in de echte wereld.
| Kenmerk | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Calorie nauwkeurigheid (ten opzichte van gewogen referentie) | 18-22% gemiddelde fout | 6% gemiddelde fout |
| Geverifieerde voedseldatabase | Nee | Ja, 1.8M+ entries |
| Barcode-scanning | Nee | Ja |
| Foto-gebaseerde voedselherkenning | Beperkt (vereist upload) | Ingebouwde AI-herkenning |
| Stemregistratie | Indirect (stem-naar-tekst) | Native stemvoedselregistratie |
| Blijvende dagelijkse log | Nee | Ja, automatisch |
| Lopende dagelijkse/wekelijks totalen | Nee (moet handmatig worden opgeteld) | Ja, in real-time |
| Macronutriëntenverdeling | Geschat per vraag | Gevolgd per voedsel, dagelijks, wekelijks |
| Micronutriënten tracking | Inconsistent | 100+ voedingsstoffen |
| Gewichtstrend tracking | Nee | Ja, met grafieken |
| Apple Watch integratie | Nee | Ja |
| Adaptieve calorie doelen | Nee | Ja, past zich aan jouw trends aan |
| Consistente schattingen | Nee (variëren per vraag) | Ja (database-gebonden) |
| Offline toegang | Nee | Ja |
| Kosten | Gratis (met abonnement voor geavanceerd) | Vanaf €2.50/maand |
| Advertenties | Varieert per platform | Geen advertenties |
Waar zijn AI-chatbots goed in op het gebied van voeding?
Ondanks hun beperkingen voor calorie tracking, hebben algemene AI-chatbots legitieme voedingsgebruikstoepassingen die erkend moeten worden.
Algemene voedingseducatie. Het vragen van Gemini of ChatGPT om het verschil tussen verzadigde en onverzadigde vetten uit te leggen, of om te beschrijven hoe eiwitsynthese werkt, levert doorgaans nauwkeurige en goed georganiseerde antwoorden op. Voor conceptuele vragen met gevestigde wetenschappelijke consensus presteren AI-chatbots goed.
Maaltijdidee generatie. Chatbots zijn uitstekend in het genereren van receptideeën op basis van beperkingen zoals "eiwitrijke maaltijden onder de 500 calorieën met kip en broccoli." Het specifieke calorieaantal is misschien niet precies, maar de maaltijdconcepten zijn nuttige uitgangspunten.
Vergelijking van dieetpatronen. Het vragen van een chatbot om de mediterrane, ketogene en plantaardige diëten te vergelijken, levert redelijke samenvattingen van het bewijs voor elke aanpak op.
Waar chatbots falen, is in de kwantitatieve, blijvende en nauwkeurigheid-afhankelijke taak van dagelijkse calorie- en voedingsregistratie. Dit is een database- en logprobleem, geen taalgeneratieprobleem.
Waarom Toegewijde Voedingsapps Beter Presteren Dan Algemene AI-chatbots
De kernreden is architectonisch. Een voedingsregistratie-app is gebouwd rond een gestructureerde database, een blijvend gebruikersprofiel en accumulatie-logica. Een AI-chatbot is gebouwd rond de voorspelling van de volgende token vanuit een taalmodel. Dit zijn fundamenteel verschillende tools die zijn geoptimaliseerd voor fundamenteel verschillende taken.
Volharding. Nutrola houdt een volledig record bij van elk voedsel dat je logt, je dagelijkse en wekelijkse totalen, je macronutriënten trends en je gewichtsgeschiedenis. Deze longitudinale gegevens maken calorie tracking effectief. Een enkele calorie-inschatting, hoe nauwkeurig ook, is nutteloos zonder de context van je dagelijkse totaal en wekelijkse patroon.
Geverifieerde gegevens. Een database-entry voor "Chobani Griekse Yoghurt, Naturel, 150g" in Nutrola is afkomstig van het voedingslabel van de fabrikant en geverifieerd tegen de USDA-normen. Wanneer een chatbot hetzelfde item schat, gemiddeld het informatie van duizenden webbronnen van verschillende betrouwbaarheid, wat een plausibel maar niet-geverifieerd nummer oplevert.
Integratie met draagbare apparaten. Gegevens van de Apple Watch worden rechtstreeks in Nutrola gevoed, wat nauwkeurige schattingen van activiteit calorieën biedt die worden gecombineerd met voedselregistratie om de netto-energiebalans te berekenen. Geen enkele chatbot kan toegang krijgen tot je draagbare gegevens om calorie-aanbevelingen aan te passen op basis van je daadwerkelijke dagelijkse beweging.
Snelheid en gemak. Het maken van een foto van je bord, het scannen van een barcode of het inspreken van je maaltijd duurt minder dan 30 seconden. Het typen van een gedetailleerde maaltijdbeschrijving naar een chatbot, wachten op het antwoord en vervolgens de schatting handmatig ergens registreren, kost aanzienlijk langer en levert een minder nauwkeurig resultaat op.
Kunnen AI-chatbots Verbeteren Genoeg Om Voedingsapps Te Vervangen?
Dit is een vraag over fundamentele architectuur, niet alleen over modelcapaciteit. Zelfs met perfecte nauwkeurigheid in calorie-inschatting (wat huidige modellen ver van het bereiken zijn), zouden AI-chatbots nog steeds ontbreken aan de blijvende log, cumulatieve tracking, integratie met draagbare apparaten en gestructureerde databaseverificatie die voedingsregistratie vereist.
Toekomstige AI-systemen zouden theoretisch deze functies kunnen integreren. Maar op dat moment zouden ze in wezen voedingsapps zijn met een conversatie-interface, geen algemene chatbots. De functies die calorie tracking laten werken, een geverifieerde database, blijvende gebruikerslogs, apparaatintegraties, adaptieve algoritmen, zijn engineering-systemen, geen taalcapaciteiten.
De meest waarschijnlijke toekomst is niet "chatbots vervangen voedingsapps" maar eerder "voedingsapps incorporeren conversatie-AI." Dit gebeurt al. Nutrola's AI-gestuurde fotoherkenning en stemregistratie brengen het gemak van conversatie-interactie naar de gestructureerde betrouwbaarheid van een geverifieerde voedingsdatabase. Je krijgt de natuurlijke interactie van het praten met een AI met de nauwkeurigheid en volharding van een speciaal ontwikkeld registratiesysteem.
Wat Gebeurt Er Als Je Een AI Vraagt Om Je Calorieën Bij Te Houden?
Om het praktische verschil te illustreren, hier is hoe een typische dag van calorie tracking eruitziet met elke aanpak.
Gebruikmakend van Gemini of ChatGPT: Je vraagt de chatbot om je ontbijt te schatten. Het geeft je een getal. Je schrijft het ergens op of probeert het te onthouden. Bij de lunch begin je een nieuw gesprek (de chatbot herinnert zich het ontbijt niet) en krijgt een andere schatting. Je telt de twee getallen mentaal op. Tegen het diner heb je een ruwe lopende totaal die mogelijk 200 tot 400 calorieën afwijkt, en je hebt geen macronutriëntenverdeling, geen blijvend record en geen wekelijkse trend.
Gebruikmakend van Nutrola: Je maakt een foto van je ontbijt. De AI herkent de voedingsmiddelen, koppelt ze aan geverifieerde database entries en logt ze automatisch. Je dagelijkse totaal wordt in real-time bijgewerkt. Bij de lunch scan je een barcode op de verpakking van je sandwich, en de exacte voedingsgegevens van de fabrikant worden aan je log toegevoegd. Tegen het diner heb je een nauwkeurig lopend totaal, een macronutriëntenverdeling en een maaltijdgeschiedenis die bijdraagt aan je wekelijkse en maandelijkse trends. Je calorie-doel past zich aan op basis van je werkelijke gewichtstrendgegevens die zijn gesynchroniseerd vanuit je Apple Watch.
Het verschil is niet subtiel. Het is het verschil tussen een gok en een systeem.
Belangrijkste Conclusies
Algemene AI-chatbots zoals Gemini en ChatGPT zijn indrukwekkende tools voor veel taken, maar calorie tracking is daar niet een van. Onze test met 30 maaltijden vond gemiddelde fouten van 108 tot 127 calorieën per maaltijd, inconsistente resultaten bij herhaalde vragen, geen blijvende logcapaciteit en geen integratie met voedsel databases of draagbare apparaten. Deze beperkingen zijn structureel, niet incidenteel. Ze zijn het gevolg van het fundamentele verschil tussen een taalmodel en een voedingsregistratiesysteem.
Voor iedereen die serieus bezig is met het beheren van hun voeding, blijft een toegewijde app met een geverifieerde database, blijvende logging en adaptieve doelen essentieel. Nutrola combineert AI-gestuurde gemak (fotoherkenning, stemregistratie, barcode-scanning) met de nauwkeurigheid en volharding van een gestructureerd voedingsplatform, allemaal voor 2,50 euro per maand zonder advertenties. Als het gaat om calorie tracking, is de vraag niet of AI betrokken is. Het is of de AI wordt ondersteund door de juiste architectuur voor de klus.
Klaar om je voedingstracking te transformeren?
Sluit je aan bij duizenden die hun gezondheidsreis hebben getransformeerd met Nutrola!