Kann Gemini AI Ihre Kalorien verfolgen? Wir haben es mit einer spezialisierten App getestet
Wir haben Gemini und ChatGPT gebeten, die Kalorien für 30 Mahlzeiten zu schätzen und die Ergebnisse mit Nutrola und gewogenen Lebensmittelreferenzen verglichen. Die Genauigkeitslücke war größer als erwartet.
Mit der zunehmenden Verbreitung von AI-Chatbots stellt sich eine naheliegende Frage: Kann man Gemini oder ChatGPT einfach nach seinen Kalorien fragen, anstatt eine spezialisierte Ernährungs-App zu nutzen? Wir haben dies direkt getestet. Über einen Zeitraum von zwei Wochen baten wir Google Gemini und OpenAI ChatGPT, den Kalorien- und Makronährstoffgehalt von 30 verschiedenen Mahlzeiten zu schätzen, die von einfachen Einzelzutaten bis hin zu komplexen Restaurantgerichten reichten. Wir verglichen ihre Schätzungen mit zwei Referenzwerten: den verifizierten Lebensmitteldaten von Nutrola und den gewogenen Lebensmittelreferenzen, die auf den Werten von USDA FoodData Central basieren.
Die Ergebnisse zeigen grundlegende Einschränkungen bei der Verwendung von allgemeinen AI-Chatbots zur Ernährungsüberwachung. Diese Einschränkungen sind struktureller Natur und werden durch zukünftige Modellaktualisierungen voraussichtlich nicht vollständig behoben.
Kann ich Gemini zur Kalorienzählung verwenden?
Sie können Gemini bitten, die Kalorien in einer Mahlzeit zu schätzen, und es wird eine Antwort geben. Die Frage ist, ob diese Antwort genau und konsistent genug ist, um eine tatsächliche Ernährungsverwaltung zu unterstützen. Basierend auf unseren Tests lautet die Antwort „nein“ für alle Anwendungsfälle, die Zuverlässigkeit erfordern.
Testmethodik: Wir bereiteten oder kauften 30 Mahlzeiten mit unterschiedlichem Schwierigkeitsgrad. Jede Mahlzeit wurde auf einer kalibrierten Küchenwaage gewogen, und die Referenzkalorienwerte wurden anhand der USDA FoodData Central-Nährwertdaten berechnet. Anschließend beschrieben wir jede Mahlzeit in natürlicher Sprache gegenüber Gemini (dem AI-Assistenten von Google), so wie es ein echter Nutzer tun würde, und notierten die Kalorienschätzung. Den gleichen Test führten wir mit ChatGPT (GPT-4o) durch und protokollierten jede Mahlzeit in Nutrola mithilfe von Fotoerkennung und Datenbankabgleich.
Genauigkeitsdefinition: Wir definierten eine Schätzung als „genau“, wenn sie innerhalb von 10 Prozent des gewogenen Referenzwerts lag, ein Standardmaß, das in der Ernährungsforschung verwendet wird (Subar et al., The Journal of Nutrition, 2015).
Wie genau sind AI-Chatbots bei der Kalorienzählung?
Die Ergebnisse waren über die Kategorien der Mahlzeiten hinweg konsistent: Allgemeine AI-Chatbots liefern grobe Schätzungen, die für kalorienkontrollierte Diäten nicht zuverlässig genug sind.
| Metrik | Gemini | ChatGPT (GPT-4o) | Nutrola | Gewogene Referenz |
|---|---|---|---|---|
| Mahlzeiten innerhalb von 10% des Referenzwerts | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Durchschnittlicher absoluter Fehler | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Durchschnittlicher prozentualer Fehler | 22,4% | 18,6% | 6,1% | 0% |
| Größte einzelne Überschätzung | +340 kcal (Nudelgericht) | +285 kcal (Pfannengericht) | +95 kcal (Restaurantmahlzeit) | N/A |
| Größte einzelne Unterschätzung | -290 kcal (Salat mit Dressing) | -315 kcal (Granola-Schüssel) | -72 kcal (hausgemachte Suppe) | N/A |
| Konsistent über wiederholte Anfragen | Nein (variierte um 50-200 kcal) | Nein (variierte um 30-150 kcal) | Ja (datenbankgesperrt) | N/A |
Wichtigste Erkenntnis: Der durchschnittliche absolute Fehler von 108 bis 127 Kalorien pro Mahlzeit summiert sich auf 324 bis 381 Kalorien kumulativen Fehler über drei Mahlzeiten pro Tag. Für jemanden, der ein Kaloriendefizit von 500 Kalorien zur Gewichtsreduktion anstrebt, kann dieses Maß an Ungenauigkeit 65 bis 76 Prozent des beabsichtigten Defizits eliminieren und den Fortschritt effektiv zum Stillstand bringen.
Warum liegen AI-Chatbots bei Kalorienangaben falsch?
Die Fehler, die wir beobachteten, waren nicht zufällig. Sie folgten vorhersehbaren Mustern, die strukturelle Einschränkungen bei der Verwendung großer Sprachmodelle zur Nährwertschätzung offenbaren.
Problem 1: Keine verifizierte Datenbank. Gemini und ChatGPT greifen nicht auf eine strukturierte Nährwertdatenbank zu, wenn Sie sie nach Kalorienangaben fragen. Sie generieren Antworten basierend auf Mustern in ihren Trainingsdaten, die eine Mischung aus genauen USDA-Daten, nutzergenerierten Inhalten, Schätzungen von Foodblogs und Marketingmaterialien enthalten. Ein einzelnes Lebensmittel kann in diesen Quellen stark unterschiedliche Kalorienwerte aufweisen, und das Modell hat keinen Mechanismus, um zu identifizieren, welche Quelle korrekt ist.
Nutrola und andere spezialisierte Ernährungs-Apps verwenden verifizierte Lebensmitteldatenbanken. Die Datenbank von Nutrola enthält über 1,8 Millionen Einträge, die mit den USDA FoodData Central, den Nährwertangaben der Hersteller und unabhängigen Laboranalysen abgeglichen sind. Wenn Sie „Hähnchenbrust, gegrillt, 150g“ protokollieren, ist der zurückgegebene Wert ein verifiziertes Datenpunkt, kein statistischer Durchschnitt von allem, was das Internet jemals über Hähnchen gesagt hat.
Problem 2: Keine Portionierungsgrundlage. Wenn Sie einem AI-Chatbot sagen, dass Sie „eine Schüssel Pasta“ hatten, muss er raten, was „eine Schüssel“ bedeutet. Sind das 200 Gramm gekochte Pasta oder 400 Gramm? Der Unterschied sind 250 Kalorien oder mehr. AI-Chatbots gehen standardmäßig von kulturell durchschnittlichen Portionsannahmen aus, die möglicherweise nicht mit Ihrer tatsächlichen Portion übereinstimmen.
In unseren Tests war die Fehlberechnung der Portionsgröße die größte Fehlerquelle. Gemini unterschätzte eine Granola-Schüssel um 210 Kalorien, weil es eine kleinere Portion annahm als tatsächlich konsumiert. ChatGPT überschätzte ein Pfannengericht um 285 Kalorien, weil es von Restaurantportionen ausging, während die Mahlzeit hausgemacht war.
Nutrola adressiert dies durch mehrere Mechanismen: Die Barcode-Scanfunktion verknüpft direkt mit den vom Hersteller angegebenen Portionsgrößen, die AI-Fotoerkennung schätzt das Portionsvolumen aus dem Bild, und die Nutzer können die Portionen in Gramm mithilfe einer Küchenwaage für maximale Genauigkeit anpassen.
Problem 3: Kein Gedächtnis zwischen den Sitzungen. Dies ist vielleicht die grundlegendste Einschränkung für die fortlaufende Kalorienverfolgung. AI-Chatbots führen kein dauerhaftes Protokoll darüber, was Sie gegessen haben. Jedes Gespräch beginnt von neuem. Es gibt kein tägliches Total, keinen wöchentlichen Trend, keine fortlaufende Makronährstoffaufstellung.
Effektive Kalorienverfolgung erfordert kumulative Daten. Sie müssen nicht nur die Kalorien Ihres Mittagessens kennen, sondern auch Ihr laufendes tägliches Total, Ihren wöchentlichen Durchschnitt, Ihre Makronährstoffverteilung und Ihren Gewichtstrend über die Zeit. Ein Chatbot liefert isolierte Punkteschätzungen ohne Kontinuität.
Problem 4: Inkonsistente Schätzungen bei identischen Anfragen. Wir baten sowohl Gemini als auch ChatGPT, die Kalorien für dieselbe Mahlzeitbeschreibung dreimal an verschiedenen Tagen zu schätzen. Die Ergebnisse variierten um 50 bis 200 Kalorien zwischen den Anfragen. Ein „mittlerer Caesar-Salat mit gegrilltem Hähnchen“ lieferte Schätzungen von 380, 450 und 520 Kalorien von Gemini über drei separate Gespräche. Diese Inkonsistenz ist inhärent in der Art und Weise, wie Sprachmodelle Antworten generieren. Sie sind probabilistische Textgeneratoren, keine Datenbanksysteme.
Problem 5: Halluzinierte Nährwertdaten. Bei 4 von 30 Mahlzeiten schätzte ChatGPT spezifisch klingende, aber erfundene Nährwertangaben. Zum Beispiel gab es an, dass ein bestimmter Marken-Proteinriegel 22g Protein und 210 Kalorien enthielt, während das tatsächliche Etikett 20g Protein und 190 Kalorien angibt. Die Zahlen waren nah genug, um plausibel zu erscheinen, aber falsch genug, um über die Zeit hinweg von Bedeutung zu sein. Dieses Phänomen, bekannt als Halluzination in der AI-Forschung, ist besonders gefährlich in der Ernährung, da die Fehler autoritär wirken.
Ist ChatGPT genau bei der Kalorienzählung?
ChatGPT schnitt in unseren Tests etwas besser ab als Gemini, mit 43 Prozent der Schätzungen, die innerhalb von 10 Prozent des Referenzwerts lagen, gegenüber 37 Prozent für Gemini. Dieser Unterschied ist jedoch nicht praktisch bedeutsam. Beide Chatbots liegen weit unter dem Genauigkeitsniveau, das für eine zuverlässige Ernährungsverwaltung erforderlich ist.
Der akademische Standard für Werkzeuge zur Ernährungsbewertung, definiert von Forschern wie Subar et al. und Thompson et al. am National Cancer Institute, verlangt, dass ein Werkzeug weniger als 10 Prozent durchschnittlichen Fehler aufweist, um für die individuelle Ernährungsüberwachung als gültig zu gelten. Beide Chatbots überschreiten diesen Schwellenwert bei weitem.
Der Vorteil von ChatGPT gegenüber Gemini schien sich aus etwas besseren Annahmen zur Portionsgröße für gängige amerikanische Lebensmittel zu ergeben, was wahrscheinlich die Zusammensetzung der Trainingsdaten widerspiegelt. Bei internationalen Lebensmitteln, regionalen Gerichten und hausgemachten Mahlzeiten fiel die Genauigkeit für beide Modelle erheblich ab.
AI-Chatbot vs. Ernährungs-App zur Diätverfolgung: Vollständiger Vergleich
Über die reine Genauigkeit hinaus umfassen die funktionalen Unterschiede zwischen einem Chatbot und einer spezialisierten Ernährungs-App mehrere Dimensionen, die die Benutzerfreundlichkeit in der realen Welt beeinflussen.
| Funktion | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Kaloriengenauigkeit (im Vergleich zur gewogenen Referenz) | 18-22% durchschnittlicher Fehler | 6% durchschnittlicher Fehler |
| Verifizierte Lebensmitteldatenbank | Nein | Ja, 1,8M+ Einträge |
| Barcode-Scannen | Nein | Ja |
| Foto-basierte Lebensmittel-Erkennung | Eingeschränkt (erfordert Upload) | Eingebaute AI-Erkennung |
| Sprachprotokollierung | Indirekt (Sprache-zu-Text) | Native Sprachprotokollierung |
| Persistentes tägliches Protokoll | Nein | Ja, automatisch |
| Laufende tägliche/wöchentliche Totale | Nein (muss manuell summiert werden) | Ja, in Echtzeit |
| Makronährstoffaufteilung | Geschätzt pro Anfrage | Pro Lebensmittel, täglich, wöchentlich verfolgt |
| Mikronährstoffverfolgung | Inkonsistent | 100+ Nährstoffe |
| Gewichtstrendverfolgung | Nein | Ja, mit Grafiken |
| Apple Watch-Integration | Nein | Ja |
| Adaptive Kalorienziele | Nein | Ja, passt sich Ihren Trends an |
| Konsistente Schätzungen | Nein (variieren pro Anfrage) | Ja (datenbankgesperrt) |
| Offline-Zugriff | Nein | Ja |
| Kosten | Kostenlos (mit Abonnement für erweiterte Funktionen) | Ab 2,50 €/Monat |
| Werbung | Variiert je nach Plattform | Keine Werbung |
Worin sind AI-Chatbots in der Ernährung gut?
Trotz ihrer Einschränkungen bei der Kalorienverfolgung haben allgemeine AI-Chatbots legitime Anwendungsfälle in der Ernährung, die anerkannt werden sollten.
Allgemeine Ernährungsbildung. Wenn Sie Gemini oder ChatGPT fragen, den Unterschied zwischen gesättigten und ungesättigten Fetten zu erklären oder zu beschreiben, wie die Proteinsynthese funktioniert, liefern sie in der Regel genaue und gut organisierte Antworten. Bei konzeptionellen Fragen mit etabliertem wissenschaftlichem Konsens schneiden AI-Chatbots gut ab.
Generierung von Essensideen. Chatbots sind hervorragend darin, Rezeptideen basierend auf Vorgaben wie „hochwertige Proteinmahlzeiten unter 500 Kalorien mit Hähnchen und Brokkoli“ zu erzeugen. Die spezifische Kalorienanzahl ist möglicherweise nicht genau, aber die Mahlzeitkonzepte sind nützliche Ausgangspunkte.
Vergleich von Ernährungsweisen. Wenn Sie einen Chatbot bitten, mediterrane, ketogene und pflanzenbasierte Diäten zu vergleichen, liefert er vernünftige Zusammenfassungen der Beweise für jeden Ansatz.
Wo Chatbots versagen, ist die quantitative, fortlaufende und genauigkeitsabhängige Aufgabe der täglichen Kalorien- und Nährstoffverfolgung. Dies ist ein Datenbank- und Protokollierungsproblem, kein Sprachgenerierungsproblem.
Warum spezialisierte Ernährungs-Apps allgemeine AI-Chatbots übertreffen
Der Hauptgrund ist architektonischer Natur. Eine Ernährungs-Tracking-App ist um eine strukturierte Datenbank, ein persistentes Benutzerprofil und Akkumulationslogik herum aufgebaut. Ein AI-Chatbot basiert auf der Vorhersage des nächsten Tokens aus einem Sprachmodell. Dies sind grundlegend unterschiedliche Werkzeuge, die für grundlegend unterschiedliche Aufgaben optimiert sind.
Persistenz. Nutrola führt ein vollständiges Protokoll aller Lebensmittel, die Sie protokollieren, Ihrer täglichen und wöchentlichen Totale, Ihrer Makronährstofftrends und Ihrer Gewichtshistorie. Diese longitudinalen Daten machen die Kalorienverfolgung effektiv. Eine einmalige Kalorienabschätzung, egal wie genau, ist ohne den Kontext Ihres täglichen Totals und wöchentlichen Musters nutzlos.
Verifizierte Daten. Ein Datenbankeintrag für „Chobani Griechischer Joghurt, Natur, 150g“ in Nutrola stammt von der Nährwertangabe des Herstellers und wurde gegen die USDA-Standards verifiziert. Wenn ein Chatbot dasselbe Produkt schätzt, mittelt er Informationen aus Tausenden von Webquellen mit unterschiedlicher Zuverlässigkeit und liefert eine plausible, aber unbestätigte Zahl.
Integration tragbarer Geräte. Daten von der Apple Watch fließen direkt in Nutrola ein und liefern genaue Schätzungen der Aktivitätskalorien, die mit der Lebensmittelprotokollierung kombiniert werden, um die Nettobilanz zu berechnen. Kein Chatbot kann auf Ihre tragbaren Daten zugreifen, um die Kalorienempfehlungen basierend auf Ihrer tatsächlichen täglichen Bewegung anzupassen.
Geschwindigkeit und Bequemlichkeit. Ein Foto Ihres Tellers zu machen, einen Barcode zu scannen oder Ihr Essen zu sprechen, dauert weniger als 30 Sekunden. Eine detaillierte Mahlzeitbeschreibung in einen Chatbot einzugeben, auf die Antwort zu warten und die Schätzung dann manuell irgendwo zu protokollieren, dauert erheblich länger und führt zu einem weniger genauen Ergebnis.
Könnten AI-Chatbots sich genug verbessern, um Ernährungs-Apps zu ersetzen?
Dies ist eine Frage der grundlegenden Architektur, nicht nur der Modellfähigkeit. Selbst bei perfekter Genauigkeit der Kalorienabschätzung (die aktuelle Modelle weit davon entfernt sind zu erreichen) würden AI-Chatbots weiterhin das persistente Protokollieren, die kumulative Verfolgung, die Integration tragbarer Geräte und die strukturierte Datenbankverifizierung vermissen, die für die Ernährungsüberwachung erforderlich sind.
Zukünftige AI-Systeme könnten theoretisch diese Funktionen integrieren. Aber zu diesem Zeitpunkt wären sie im Wesentlichen Ernährungs-Apps mit einer konversationellen Schnittstelle, keine allgemeinen Chatbots mehr. Die Funktionen, die die Kalorienverfolgung funktionieren lassen – eine verifizierte Datenbank, persistente Benutzerprotokolle, Geräteintegrationen, adaptive Algorithmen – sind Ingenieursysteme, keine Sprachfähigkeiten.
Die wahrscheinlichste Zukunft ist nicht „Chatbots ersetzen Ernährungs-Apps“, sondern vielmehr „Ernährungs-Apps integrieren konversationelle AI“. Das geschieht bereits. Nutrolas AI-gestützte Fotoerkennung und Sprachprotokollierung bringen die Bequemlichkeit der konversationellen Interaktion in die strukturierte Zuverlässigkeit einer verifizierten Ernährungsdatenbank. Sie erhalten die natürliche Interaktion mit einem AI-System und die Genauigkeit und Beständigkeit eines spezialisierten Tracking-Systems.
Was passiert, wenn Sie eine AI bitten, Ihre Kalorien zu verfolgen?
Um den praktischen Unterschied zu veranschaulichen, sehen wir uns an, wie ein typischer Tag der Kalorienverfolgung mit jedem Ansatz aussieht.
Verwendung von Gemini oder ChatGPT: Sie bitten den Chatbot, Ihr Frühstück zu schätzen. Er gibt Ihnen eine Zahl. Sie notieren sie irgendwo oder versuchen, sich daran zu erinnern. Zum Mittagessen beginnen Sie ein neues Gespräch (der Chatbot erinnert sich nicht an das Frühstück) und erhalten eine weitere Schätzung. Sie addieren die beiden Zahlen mental. Bis zum Abendessen haben Sie eine grobe laufende Summe, die um 200 bis 400 Kalorien abweichen kann, und Sie haben keine Makronährstoffaufteilung, kein persistentes Protokoll und keinen wöchentlichen Trend.
Verwendung von Nutrola: Sie fotografieren Ihr Frühstück. Die AI erkennt die Lebensmittel, verknüpft sie mit verifizierten Datenbankeinträgen und protokolliert sie automatisch. Ihr tägliches Total wird in Echtzeit aktualisiert. Zum Mittagessen scannen Sie einen Barcode auf der Verpackung Ihres Sandwiches, und die genauen Nährwertdaten des Herstellers werden Ihrem Protokoll hinzugefügt. Bis zum Abendessen haben Sie ein genaues laufendes Total, eine Makronährstoffaufteilung und eine Mahlzeitgeschichte, die in Ihre wöchentlichen und monatlichen Trends einfließt. Ihr Kalorienziel passt sich basierend auf Ihren tatsächlichen Gewichtstrenddaten an, die von Ihrer Apple Watch synchronisiert werden.
Der Unterschied ist nicht subtil. Es ist der Unterschied zwischen einer Schätzung und einem System.
Wichtige Erkenntnisse
Allgemeine AI-Chatbots wie Gemini und ChatGPT sind beeindruckende Werkzeuge für viele Aufgaben, aber die Kalorienverfolgung gehört nicht dazu. Unser Test mit 30 Mahlzeiten ergab durchschnittliche Fehler von 108 bis 127 Kalorien pro Mahlzeit, inkonsistente Ergebnisse bei wiederholten Anfragen, keine persistente Protokollierungsfähigkeit und keine Integration mit Lebensmitteldatenbanken oder tragbaren Geräten. Diese Einschränkungen sind struktureller Natur und nicht zufällig. Sie ergeben sich aus dem grundlegenden Unterschied zwischen einem Sprachmodell und einem Ernährungstracking-System.
Für alle, die ernsthaft ihre Ernährung verwalten möchten, bleibt eine spezialisierte App mit einer verifizierten Datenbank, persistentem Protokoll und adaptiven Zielen unerlässlich. Nutrola kombiniert die Bequemlichkeit von AI-gestützter Technologie (Fotoerkennung, Sprachprotokollierung, Barcode-Scannen) mit der Genauigkeit und Beständigkeit einer strukturierten Ernährungsplattform – alles für 2,50 Euro pro Monat und ohne Werbung. Bei der Kalorienverfolgung stellt sich nicht die Frage, ob AI beteiligt ist. Es geht darum, ob die AI von der richtigen Architektur für die Aufgabe unterstützt wird.
Bereit, Ihr Ernährungstracking zu transformieren?
Schließen Sie sich Tausenden an, die ihre Gesundheitsreise mit Nutrola transformiert haben!