Czy Gemini AI może śledzić Twoje kalorie? Przetestowaliśmy go w porównaniu z dedykowaną aplikacją
Poprosiliśmy Gemini i ChatGPT o oszacowanie kalorii w 30 posiłkach, a następnie porównaliśmy wyniki z Nutrola i ważonymi referencjami żywności. Różnice w dokładności były większe, niż się spodziewaliśmy.
W miarę jak chatboty AI stają się częścią codziennego życia, pojawia się naturalne pytanie: czy można po prostu poprosić Gemini lub ChatGPT o śledzenie kalorii zamiast korzystać z dedykowanej aplikacji żywieniowej? Przetestowaliśmy to bezpośrednio. Przez dwa tygodnie prosiliśmy Google Gemini i OpenAI ChatGPT o oszacowanie zawartości kalorii i makroskładników w 30 różnych posiłkach, od prostych produktów jednoskładnikowych po złożone dania restauracyjne. Porównaliśmy ich oszacowania z dwoma punktami odniesienia: zweryfikowanymi danymi z bazy Nutrola oraz ważonymi referencjami obliczonymi na podstawie wartości z USDA FoodData Central.
Wyniki ujawniają fundamentalne ograniczenia w korzystaniu z ogólnych chatbotów AI do śledzenia żywności, ograniczenia, które mają charakter strukturalny, a nie tymczasowy, co oznacza, że prawdopodobnie nie zostaną w pełni rozwiązane w przyszłych aktualizacjach modeli.
Czy mogę używać Gemini do liczenia kalorii?
Możesz poprosić Gemini o oszacowanie kalorii w posiłku, a ono poda odpowiedź. Pytanie brzmi, czy ta odpowiedź jest wystarczająco dokładna i spójna, aby wspierać rzeczywiste zarządzanie dietą. Na podstawie naszych testów odpowiedź brzmi: nie, w przypadku jakiegokolwiek zastosowania, które wymaga niezawodności.
Metodologia testu: Przygotowaliśmy lub zakupiliśmy 30 posiłków o różnym stopniu skomplikowania. Każdy posiłek został zważony na skalibrowanej wadze kuchennej, a wartości kaloryczne obliczone na podstawie danych żywieniowych USDA FoodData Central. Następnie opisaliśmy każdy posiłek Gemini (asystentowi AI Google) w naturalnym języku, tak jak zrobiłby to prawdziwy użytkownik, i zanotowaliśmy jego oszacowanie kalorii. Przeprowadziliśmy ten sam test z ChatGPT (GPT-4o) i zarejestrowaliśmy każdy posiłek w Nutrola, korzystając z rozpoznawania zdjęć i wyszukiwania w bazie danych.
Definicja dokładności: Zdefiniowaliśmy oszacowanie jako "dokładne", jeśli mieściło się w 10 procentach wartości referencyjnej, co jest standardowym progiem stosowanym w badaniach oceny diety (Subar i in., The Journal of Nutrition, 2015).
Jak dokładne są chatboty AI w liczeniu kalorii?
Wyniki były spójne w różnych kategoriach posiłków: ogólne chatboty AI dostarczają przybliżone oszacowania, które nie są wystarczająco wiarygodne dla diet kontrolujących kalorie.
| Metryka | Gemini | ChatGPT (GPT-4o) | Nutrola | Ważona referencja |
|---|---|---|---|---|
| Posiłki w obrębie 10% wartości referencyjnej | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Średni błąd bezwzględny | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Średni błąd procentowy | 22.4% | 18.6% | 6.1% | 0% |
| Największe pojedyncze przeszacowanie | +340 kcal (danie z makaronem) | +285 kcal (smażony ryż) | +95 kcal (posiłek z restauracji) | N/A |
| Największe pojedyncze niedoszacowanie | -290 kcal (sałatka z sosem) | -315 kcal (miska granoli) | -72 kcal (domowa zupa) | N/A |
| Spójność w powtarzanych zapytaniach | Nie (zmiana o 50-200 kcal) | Nie (zmiana o 30-150 kcal) | Tak (zablokowane w bazie danych) | N/A |
Kluczowy wniosek: Średni błąd bezwzględny wynoszący od 108 do 127 kalorii na posiłek przekłada się na 324 do 381 kalorii błędu skumulowanego w ciągu trzech posiłków dziennie. Dla kogoś, kto dąży do deficytu 500 kalorii w celu utraty wagi, taki poziom niedokładności może zniwelować 65 do 76 procent zamierzonego deficytu, skutecznie zatrzymując postęp.
Dlaczego chatboty AI mylą się w liczeniu kalorii?
Błędy, które zaobserwowaliśmy, nie były przypadkowe. Podążały za przewidywalnymi wzorcami, które ujawniają strukturalne ograniczenia korzystania z dużych modeli językowych do oszacowania wartości odżywczych.
Problem 1: Brak zweryfikowanej bazy danych. Gemini i ChatGPT nie przeszukują żywności w uporządkowanej bazie danych żywieniowych, gdy prosisz je o oszacowanie kalorii. Generują odpowiedzi na podstawie wzorców w danych treningowych, które obejmują mieszankę dokładnych danych z USDA, treści generowanych przez użytkowników, oszacowań blogów kulinarnych i materiałów marketingowych. Pojedynczy produkt spożywczy może mieć skrajnie różne wartości kaloryczne w tych źródłach, a model nie ma mechanizmu, aby zidentyfikować, które źródło jest poprawne.
Nutrola i inne dedykowane aplikacje żywieniowe korzystają ze zweryfikowanych baz danych żywności. Baza danych Nutrola zawiera ponad 1,8 miliona wpisów, które są porównywane z danymi z USDA FoodData Central, etykietami żywieniowymi producentów oraz niezależnymi analizami laboratoryjnymi. Gdy rejestrujesz "pierś z kurczaka, grillowana, 150g", zwracana wartość to zweryfikowany punkt danych, a nie statystyczna średnia wszystkiego, co kiedykolwiek powiedziano w internecie o kurczaku.
Problem 2: Brak odniesienia do wielkości porcji. Gdy mówisz chatbotowi AI, że miałeś "miseczkę makaronu", musi zgadywać, co oznacza "miseczka". Czy to 200 gramów ugotowanego makaronu, czy 400 gramów? Różnica to 250 kalorii lub więcej. Chatboty AI domyślnie opierają się na uśrednionych założeniach dotyczących porcji, które mogą nie odpowiadać Twoim rzeczywistym porcjom.
W naszych testach błędne oszacowanie wielkości porcji było największym źródłem błędów. Gemini niedoszacował miskę granoli o 210 kalorii, ponieważ założył mniejszą porcję, niż faktycznie została spożyta. ChatGPT przeszacował smażony ryż o 285 kalorii, ponieważ założył porcje w rozmiarze restauracyjnym, gdy posiłek był przygotowany w domu.
Nutrola rozwiązuje ten problem na kilka sposobów: skanowanie kodów kreskowych łączy się bezpośrednio z wielkościami porcji podanymi przez producentów, rozpoznawanie zdjęć AI szacuje objętość porcji na podstawie obrazu, a użytkownicy mogą dostosować porcje w gramach, korzystając z wagi kuchennej dla maksymalnej dokładności.
Problem 3: Brak pamięci między sesjami. To być może najbardziej fundamentalne ograniczenie dla ciągłego śledzenia kalorii. Chatboty AI nie prowadzą trwałego rejestru tego, co zjadłeś. Każda rozmowa zaczyna się od zera. Nie ma dziennego podsumowania, nie ma tygodniowego trendu, nie ma bieżącego podziału makroskładników.
Skuteczne śledzenie kalorii wymaga danych skumulowanych. Musisz znać nie tylko kalorie w swoim lunchu, ale także całkowitą dzienną sumę, średnią tygodniową, podział makroskładników i trend wagi w czasie. Chatbot dostarcza izolowane oszacowania punktowe bez ciągłości.
Problem 4: Niekonsekwentne oszacowania dla identycznych zapytań. Proszono zarówno Gemini, jak i ChatGPT o oszacowanie kalorii dla tego samego opisu posiłku trzy razy w różnych dniach. Wyniki różniły się o 50 do 200 kalorii w zależności od zapytania. "Średnia sałatka Cezar z grillowanym kurczakiem" zwróciła oszacowania 380, 450 i 520 kalorii od Gemini w trzech oddzielnych rozmowach. Ta niekonsekwencja jest inherentna w sposobie, w jaki modele językowe generują odpowiedzi. Są to probabilistyczne generatory tekstu, a nie systemy wyszukiwania w bazach danych.
Problem 5: Halucynacje danych żywieniowych. W 4 z 30 oszacowań posiłków ChatGPT podał konkretne, ale wymyślone rozkłady wartości odżywczych. Na przykład stwierdził, że konkretna marka batona białkowego zawiera 22g białka i 210 kalorii, podczas gdy rzeczywista etykieta wskazuje 20g białka i 190 kalorii. Liczby były na tyle bliskie, aby wydawały się wiarygodne, ale na tyle błędne, aby miało to znaczenie w dłuższym okresie. Zjawisko to, znane jako halucynacja w badaniach AI, jest szczególnie niebezpieczne w kontekście żywienia, ponieważ błędy wyglądają autorytatywnie.
Czy ChatGPT jest dokładny w liczeniu kalorii?
ChatGPT wypadł nieco lepiej niż Gemini w naszych testach, z 43 procentami oszacowań mieszczącymi się w 10 procentach wartości referencyjnej w porównaniu do 37 procent dla Gemini. Jednak ta różnica nie ma praktycznego znaczenia. Oba chatboty znacznie odbiegają od progu dokładności potrzebnego do wiarygodnego zarządzania dietą.
Akademicki standard dla narzędzi oceny diety, określony przez badaczy takich jak Subar i in. oraz Thompson i in. z National Cancer Institute, wymaga, aby narzędzie wykazywało mniej niż 10 procent średniego błędu, aby mogło być uznane za ważne dla monitorowania diety na poziomie indywidualnym. Oba chatboty znacznie przekraczają ten próg.
Przewaga ChatGPT nad Gemini wydaje się wynikać z nieco lepszych założeń dotyczących wielkości porcji dla typowych amerykańskich potraw, co prawdopodobnie odzwierciedla skład danych treningowych. W przypadku potraw międzynarodowych, regionalnych dań i domowych posiłków dokładność znacznie spadła dla obu modeli.
Chatbot AI vs Aplikacja żywieniowa w śledzeniu diety: Pełne porównanie
Poza surową dokładnością, funkcjonalne różnice między chatbotem a dedykowaną aplikacją żywieniową obejmują wiele wymiarów, które wpływają na rzeczywistą użyteczność.
| Funkcja | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Dokładność kalorii (w porównaniu do ważonej referencji) | 18-22% średni błąd | 6% średni błąd |
| Zweryfikowana baza danych żywności | Nie | Tak, 1.8M+ wpisów |
| Skanowanie kodów kreskowych | Nie | Tak |
| Rozpoznawanie żywności na podstawie zdjęć | Ograniczone (wymaga przesłania) | Wbudowane rozpoznawanie AI |
| Rejestrowanie głosowe | Pośrednie (głos na tekst) | Natywne rejestrowanie żywności głosowo |
| Trwały dziennik dzienny | Nie | Tak, automatyczny |
| Bieżące sumy dzienne/tygodniowe | Nie (trzeba sumować ręcznie) | Tak, w czasie rzeczywistym |
| Rozkład makroskładników | Szacowany na zapytanie | Śledzony na podstawie żywności, dziennie, tygodniowo |
| Śledzenie mikroskładników | Niekonsekwentne | 100+ składników odżywczych |
| Śledzenie trendu wagi | Nie | Tak, z wykresami |
| Integracja z Apple Watch | Nie | Tak |
| Adaptacyjne cele kaloryczne | Nie | Tak, dostosowuje się do Twoich trendów |
| Spójne oszacowania | Nie (zmieniają się w zależności od zapytania) | Tak (zablokowane w bazie danych) |
| Dostęp offline | Nie | Tak |
| Koszt | Darmowe (z subskrypcją dla zaawansowanych) | Od €2.50/miesiąc |
| Reklamy | Zróżnicowane w zależności od platformy | Zero reklam |
W czym chatboty AI są dobre w zakresie żywienia?
Pomimo swoich ograniczeń w śledzeniu kalorii, ogólne chatboty AI mają uzasadnione zastosowania w dziedzinie żywienia, które należy docenić.
Edukacja żywieniowa. Pytanie Gemini lub ChatGPT o różnicę między tłuszczami nasyconymi a nienasyconymi lub o opisanie, jak działa synteza białka, zazwyczaj przynosi dokładne i dobrze zorganizowane odpowiedzi. W przypadku pytań koncepcyjnych z ustalonym konsensusem naukowym chatboty AI sprawdzają się dobrze.
Generowanie pomysłów na posiłki. Chatboty doskonale radzą sobie z generowaniem pomysłów na przepisy na podstawie ograniczeń, takich jak "posiłki wysokobiałkowe poniżej 500 kalorii z kurczakiem i brokułami". Konkretna liczba kalorii może nie być precyzyjna, ale koncepcje posiłków są użytecznymi punktami wyjścia.
Porównanie wzorców dietetycznych. Prosząc chatbota o porównanie diet śródziemnomorskiej, ketogenicznej i roślinnej, otrzymujesz rozsądne podsumowania dowodów dla każdego podejścia.
Gdzie chatboty zawodzą, to w ilościowym, ciągłym i zależnym od dokładności zadaniu codziennego śledzenia kalorii i składników odżywczych. To problem bazy danych i logowania, a nie generowania języka.
Dlaczego dedykowane aplikacje żywieniowe przewyższają ogólne chatboty AI
Podstawowym powodem jest architektura. Aplikacja do śledzenia żywności jest zbudowana wokół uporządkowanej bazy danych, trwałego profilu użytkownika i logiki akumulacji. Chatbot AI jest zbudowany wokół przewidywania następnego tokena z modelu językowego. To fundamentalnie różne narzędzia zoptymalizowane do fundamentalnie różnych zadań.
Trwałość. Nutrola utrzymuje pełny rejestr każdego jedzenia, które rejestrujesz, twoje dzienne i tygodniowe sumy, trendy makroskładników oraz historię wagi. Te dane longitudinalne sprawiają, że śledzenie kalorii jest skuteczne. Jedno oszacowanie kalorii, niezależnie od tego, jak dokładne, jest bezużyteczne bez kontekstu twojej dziennej sumy i tygodniowego wzoru.
Zweryfikowane dane. Wpis bazy danych dla "Chobani Greek Yogurt, Plain, 150g" w Nutrola pochodzi z etykiety żywieniowej producenta i jest zweryfikowany zgodnie z normami USDA. Gdy chatbot oszacowuje ten sam produkt, uśrednia informacje z tysięcy źródeł internetowych o różnej wiarygodności, produkując wiarygodną, ale nieweryfikowaną liczbę.
Integracja z urządzeniami noszonymi. Dane z Apple Watch są bezpośrednio przesyłane do Nutrola, dostarczając dokładne oszacowania kalorii związanych z aktywnością, które są łączone z logowaniem żywności w celu obliczenia bilansu energetycznego. Żaden chatbot nie może uzyskać dostępu do twoich danych z urządzeń noszonych, aby dostosować zalecenia kaloryczne na podstawie twojego rzeczywistego codziennego ruchu.
Szybkość i wygoda. Zrobienie zdjęcia talerza, zeskanowanie kodu kreskowego lub wypowiedzenie posiłku zajmuje mniej niż 30 sekund. Wpisywanie szczegółowego opisu posiłku do chatbota, czekanie na odpowiedź, a następnie ręczne zapisanie oszacowania gdzie indziej zajmuje znacznie więcej czasu i prowadzi do mniej dokładnego wyniku.
Czy chatboty AI mogą się poprawić na tyle, aby zastąpić aplikacje żywieniowe?
To pytanie dotyczy fundamentalnej architektury, a nie tylko możliwości modelu. Nawet przy idealnej dokładności oszacowania kalorii (której obecne modele są dalekie od osiągnięcia), chatboty AI wciąż będą pozbawione trwałego logowania, akumulacyjnego śledzenia, integracji z urządzeniami noszonymi i weryfikacji w bazie danych, które są wymagane do śledzenia żywności.
Przyszłe systemy AI teoretycznie mogłyby włączyć te funkcje. Ale w tym momencie byłyby w zasadzie aplikacjami żywieniowymi z interfejsem konwersacyjnym, a nie ogólnymi chatbotami. Funkcje, które sprawiają, że śledzenie kalorii działa, takie jak zweryfikowana baza danych, trwałe logi użytkowników, integracje z urządzeniami, adaptacyjne algorytmy, to systemy inżynieryjne, a nie możliwości językowe.
Najbardziej prawdopodobna przyszłość to nie "chatboty zastępują aplikacje żywieniowe", ale raczej "aplikacje żywieniowe włączają konwersacyjną AI". To już się dzieje. AI Nutrola z rozpoznawaniem zdjęć i logowaniem głosowym łączy wygodę interakcji konwersacyjnej z uporządkowaną niezawodnością zweryfikowanej bazy danych żywieniowej. Otrzymujesz naturalną interakcję z AI przy jednoczesnej dokładności i trwałości systemu do śledzenia.
Co się dzieje, gdy prosisz AI o śledzenie kalorii?
Aby zobrazować praktyczną różnicę, oto jak wygląda typowy dzień śledzenia kalorii przy każdym z podejść.
Korzystając z Gemini lub ChatGPT: Proszysz chatbot o oszacowanie swojego śniadania. Podaje ci liczbę. Zapisujesz ją gdzieś lub próbujesz ją zapamiętać. Na lunchu zaczynasz nową rozmowę (chatbot nie pamięta śniadania) i otrzymujesz kolejne oszacowanie. Mentalnie dodajesz dwie liczby. Na kolację masz przybliżoną sumę, która może się różnić o 200 do 400 kalorii, a nie masz rozkładu makroskładników, trwałego rejestru ani tygodniowego trendu.
Korzystając z Nutrola: Fotografujesz swoje śniadanie. AI rozpoznaje jedzenie, dopasowuje je do zweryfikowanych wpisów w bazie danych i automatycznie je rejestruje. Twoja dzienna suma aktualizuje się w czasie rzeczywistym. Na lunchu skanujesz kod kreskowy na opakowaniu kanapki, a dokładne dane żywieniowe producenta są dodawane do twojego logu. Na kolację masz dokładną bieżącą sumę, rozkład makroskładników i historię posiłków, które wpływają na twoje tygodniowe i miesięczne trendy. Twój cel kaloryczny dostosowuje się na podstawie danych o trendach wagi zsynchronizowanych z twoim Apple Watch.
Różnica nie jest subtelna. To różnica między zgadywaniem a systemem.
Kluczowe wnioski
Ogólne chatboty AI, takie jak Gemini i ChatGPT, są imponującymi narzędziami do wielu zadań, ale śledzenie kalorii nie jest jednym z nich. Nasz test 30 posiłków wykazał średnie błędy wynoszące od 108 do 127 kalorii na posiłek, niespójne wyniki w powtarzanych zapytaniach, brak trwałej zdolności logowania oraz brak integracji z bazami danych żywności lub urządzeniami noszonymi. Te ograniczenia mają charakter strukturalny, a nie incydentalny. Wynikają z fundamentalnej różnicy między modelem językowym a systemem do śledzenia żywności.
Dla każdego, kto poważnie podchodzi do zarządzania swoją dietą, dedykowana aplikacja z zweryfikowaną bazą danych, trwałym logowaniem i adaptacyjnymi celami pozostaje niezbędna. Nutrola łączy wygodę napędzaną AI (rozpoznawanie zdjęć, logowanie głosowe, skanowanie kodów kreskowych) z dokładnością i trwałością uporządkowanej platformy żywieniowej, wszystko za 2,50 euro miesięcznie bez reklam. Kiedy chodzi o śledzenie kalorii, pytanie nie brzmi, czy AI jest zaangażowane. Chodzi o to, czy AI jest wspierane przez odpowiednią architekturę do wykonania zadania.
Gotowy, aby przeksztalcic sledzenie zywienia?
Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!