Может ли Gemini AI отслеживать ваши калории? Мы протестировали его по сравнению с специализированным приложением
Мы попросили Gemini и ChatGPT оценить калорийность 30 блюд, а затем сравнили результаты с Nutrola и взвешенными данными о продуктах. Разрыв в точности оказался больше, чем мы ожидали.
С учетом того, что AI-чатботы становятся частью повседневной жизни, возникает естественный вопрос: можно ли просто попросить Gemini или ChatGPT отслеживать ваши калории вместо использования специализированного приложения для питания? Мы провели прямое тестирование. В течение двух недель мы просили Google Gemini и OpenAI ChatGPT оценить калорийность и содержание макронутриентов 30 различных блюд — от простых продуктов до сложных ресторанных блюд. Мы сравнили их оценки с двумя эталонами: проверенными записями из базы данных Nutrola и взвешенными данными о продуктах, рассчитанными с использованием значений USDA FoodData Central.
Результаты выявили фундаментальные ограничения использования универсальных AI-чатботов для отслеживания питания, которые носят структурный характер, а не временный, что означает, что они вряд ли будут полностью решены в будущем.
Могу ли я использовать Gemini для подсчета калорий?
Вы можете попросить Gemini оценить калории в блюде, и он предоставит ответ. Вопрос в том, насколько этот ответ точен и последователен для реального управления питанием. На основе нашего тестирования ответ — нет, для любого случая, требующего надежности.
Методология тестирования: Мы приготовили или купили 30 блюд с различной сложностью. Каждое блюдо было взвешено на откалиброванных кухонных весах, а значения калорий были рассчитаны с использованием данных USDA FoodData Central. Затем мы описали каждое блюдо для Gemini (AI-ассистента Google) на естественном языке, как это сделал бы реальный пользователь, и записали его оценку калорий. Мы провели тот же тест с ChatGPT (GPT-4o) и зарегистрировали каждое блюдо в Nutrola, используя распознавание фотографий и поиск в базе данных.
Определение точности: Мы определили оценку как "точную", если она находилась в пределах 10 процентов от взвешенного эталонного значения — стандартный порог, используемый в исследованиях оценки питания (Subar et al., The Journal of Nutrition, 2015).
Насколько точны AI-чатботы для подсчета калорий?
Результаты были последовательными по категориям блюд: универсальные AI-чатботы предоставляют грубые оценки, которые недостаточно надежны для диет с контролем калорий.
| Параметр | Gemini | ChatGPT (GPT-4o) | Nutrola | Взвешенный эталон |
|---|---|---|---|---|
| Блюда в пределах 10% от эталона | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Средняя абсолютная ошибка | 127 ккал | 108 ккал | 38 ккал | 0 ккал |
| Средняя процентная ошибка | 22.4% | 18.6% | 6.1% | 0% |
| Наибольшее одноразовое завышение | +340 ккал (блюдо из пасты) | +285 ккал (жаркое) | +95 ккал (ресторанное блюдо) | N/A |
| Наибольшее одноразовое занижение | -290 ккал (салат с соусом) | -315 ккал (чаша гранолы) | -72 ккал (домашний суп) | N/A |
| Последовательность при повторных запросах | Нет (варьировалось на 50-200 ккал) | Нет (варьировалось на 30-150 ккал) | Да (заблокировано в базе данных) | N/A |
Ключевое наблюдение: Средняя абсолютная ошибка в 108-127 калорий на блюдо переводится в 324-381 калорий совокупной ошибки за три блюда в день. Для человека, нацеленного на дефицит в 500 калорий для похудения, такая степень неточности может устранить 65-76 процентов его запланированного дефицита, фактически останавливая прогресс.
Почему AI-чатботы ошибаются в подсчете калорий?
Ошибки, которые мы наблюдали, не были случайными. Они следовали предсказуемым шаблонам, которые выявляют структурные ограничения использования больших языковых моделей для оценки питания.
Проблема 1: отсутствие проверенной базы данных. Gemini и ChatGPT не ищут продукты в структурированной базе данных питания, когда вы просите их оценить калории. Они генерируют ответы на основе шаблонов в своих обучающих данных, которые включают смесь точных данных USDA, контента, созданного пользователями, оценок из кулинарных блогов и рекламных материалов. Один и тот же продукт может иметь совершенно разные значения калорий в этих источниках, и модель не имеет механизма для определения, какой источник правильный.
Nutrola и другие специализированные приложения для питания используют проверенные базы данных о продуктах. База данных Nutrola содержит более 1.8 миллиона записей, перекрестно проверенных с данными USDA FoodData Central, этикетками питания производителей и независимыми лабораторными анализами. Когда вы регистрируете "куриную грудку, жареную, 150 г", возвращаемое значение — это проверенная точка данных, а не статистическая средняя величина всего, что когда-либо говорилось в интернете о курице.
Проблема 2: отсутствие привязки к размеру порции. Когда вы говорите AI-чатботу, что у вас была "чаша пасты", ему нужно угадать, что означает "чаша". Это 200 граммов приготовленной пасты или 400 граммов? Разница составляет 250 калорий или более. AI-чатботы по умолчанию используют культурные усредненные предположения о порциях, которые могут не соответствовать вашему фактическому размеру порции.
В нашем тестировании ошибка в расчете размера порции была единственным крупнейшим источником ошибок. Gemini недооценил чашу гранолы на 210 калорий, потому что предположил меньшую порцию, чем была на самом деле. ChatGPT переоценил жаркое на 285 калорий, потому что предположил порции ресторанного размера, когда блюдо было приготовлено дома.
Nutrola решает эту проблему с помощью нескольких механизмов: сканирование штрих-кодов напрямую связывает с указанными производителем размерами порций, AI-распознавание фотографий оценивает объем порции по изображению, а пользователи могут регулировать порции в граммах с помощью кухонных весов для максимальной точности.
Проблема 3: отсутствие памяти между сессиями. Это, возможно, самое фундаментальное ограничение для постоянного отслеживания калорий. AI-чатботы не ведут постоянный журнал того, что вы ели. Каждый разговор начинается с нуля. Нет ежедневного итога, нет недельной тенденции, нет текущего разбивки макронутриентов.
Эффективное отслеживание калорий требует накопительных данных. Вам нужно знать не только калории в вашем обеде, но и ваш текущий ежедневный итог, вашу недельную среднюю, вашу разбивку макронутриентов и вашу тенденцию веса с течением времени. Чатбот предоставляет изолированные точечные оценки без непрерывности.
Проблема 4: непоследовательные оценки для идентичных запросов. Мы просили как Gemini, так и ChatGPT оценить калории для одного и того же описания блюда трижды в разные дни. Результаты варьировались на 50-200 калорий между запросами. "Средний Цезарь с курицей на гриле" возвращал оценки 380, 450 и 520 калорий от Gemini за три отдельных разговора. Эта непоследовательность присуща тому, как языковые модели генерируют ответы. Они являются вероятностными текстовыми генераторами, а не системами поиска в базе данных.
Проблема 5: галлюцинация данных о питательных веществах. В 4 из 30 оценок блюд ChatGPT предоставил конкретные, но вымышленные данные о питательных веществах. Например, он утверждал, что определенный бренд протеинового батончика содержит 22 г белка и 210 калорий, в то время как на самом деле этикетка показывает 20 г белка и 190 калорий. Цифры были достаточно близки, чтобы казаться правдоподобными, но достаточно ошибочными, чтобы иметь значение со временем. Это явление, известное как галлюцинация в исследованиях AI, особенно опасно в питании, потому что ошибки выглядят авторитетно.
Насколько точен ChatGPT для подсчета калорий?
ChatGPT показал немного лучшие результаты, чем Gemini в нашем тестировании, с 43 процентами оценок, попадающих в пределах 10 процентов от эталона против 37 процентов для Gemini. Однако эта разница не имеет практического значения. Оба чатбота значительно ниже порога точности, необходимого для надежного управления питанием.
Академический стандарт для инструментов оценки питания, определяемый такими исследователями, как Subar et al. и Thompson et al. из Национального института рака, требует, чтобы инструмент демонстрировал менее 10 процентов средней ошибки, чтобы считаться действительным для индивидуального мониторинга питания. Оба чатбота превышают этот порог на значительное расстояние.
Преимущество ChatGPT над Gemini, похоже, связано с немного лучшими предположениями о размере порции для обычных американских продуктов, вероятно, отражая состав его обучающих данных. Для международных продуктов, региональных блюд и домашних блюд точность значительно снижалась для обеих моделей.
AI-чатбот против приложения для питания для отслеживания диеты: полное сравнение
Помимо сырой точности, функциональные различия между чатботом и специализированным приложением для питания охватывают несколько аспектов, которые влияют на реальную удобство использования.
| Функция | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Точность калорий (по сравнению с взвешенным эталоном) | 18-22% средняя ошибка | 6% средняя ошибка |
| Проверенная база данных о продуктах | Нет | Да, 1.8M+ записей |
| Сканирование штрих-кодов | Нет | Да |
| Распознавание пищи на основе фотографий | Ограниченное (требует загрузки) | Встроенное AI-распознавание |
| Голосовая регистрация | Косвенная (голос в текст) | Нативная голосовая регистрация пищи |
| Постоянный ежедневный журнал | Нет | Да, автоматически |
| Текущие ежедневные/недельные итоги | Нет (нужно вручную суммировать) | Да, в реальном времени |
| Разбивка макронутриентов | Оценивается по запросу | Отслеживается по продукту, ежедневно, еженедельно |
| Отслеживание микронутриентов | Непоследовательно | 100+ питательных веществ |
| Отслеживание тенденций веса | Нет | Да, с графиками |
| Интеграция с Apple Watch | Нет | Да |
| Адаптивные цели по калориям | Нет | Да, корректируется по вашим тенденциям |
| Последовательные оценки | Нет (варьируется по запросу) | Да (заблокировано в базе данных) |
| Офлайн-доступ | Нет | Да |
| Стоимость | Бесплатно (с подпиской для продвинутых функций) | От €2.50/месяц |
| Реклама | Варьируется по платформе | Никакой рекламы |
В чем AI-чатботы хороши в питании?
Несмотря на свои ограничения для подсчета калорий, универсальные AI-чатботы имеют законные случаи использования в области питания, которые следует признать.
Общее образование по питанию. Попросив Gemini или ChatGPT объяснить разницу между насыщенными и ненасыщенными жирами или описать, как работает синтез белка, обычно можно получить точные и хорошо организованные ответы. Для концептуальных вопросов с установленным научным консенсусом AI-чатботы показывают хорошие результаты.
Генерация идей для блюд. Чатботы отлично справляются с генерацией идей рецептов на основе ограничений, таких как "блюда с высоким содержанием белка менее 500 калорий с курицей и брокколи". Конкретное количество калорий может быть неточным, но концепции блюд являются полезными отправными точками.
Сравнение диетических паттернов. Попросив чатбота сравнить средиземноморскую, кетогенную и растительную диеты, можно получить разумные резюме доказательств для каждого подхода.
Где чатботы терпят неудачу, так это в количественной, постоянной и зависящей от точности задаче ежедневного отслеживания калорий и питательных веществ. Это проблема базы данных и ведения журнала, а не проблема генерации языка.
Почему специализированные приложения для питания превосходят универсальные AI-чатботы
Основная причина заключается в архитектуре. Приложение для отслеживания питания построено вокруг структурированной базы данных, постоянного профиля пользователя и логики накопления. AI-чатбот построен вокруг предсказания следующего токена на основе языковой модели. Это совершенно разные инструменты, оптимизированные для совершенно разных задач.
Постоянство. Nutrola ведет полный учет каждой пищи, которую вы регистрируете, ваших ежедневных и недельных итогов, тенденций макронутриентов и истории веса. Эти долгосрочные данные делают отслеживание калорий эффективным. Оценка калорий в одной точке, какой бы точной она ни была, бесполезна без контекста вашего ежедневного итога и недельного паттерна.
Проверенные данные. Запись базы данных для "Chobani Greek Yogurt, Plain, 150g" в Nutrola основана на этикетке питания производителя и проверена по стандартам USDA. Когда чатбот оценивает тот же продукт, он усредняет информацию из тысяч веб-источников с различной надежностью, производя правдоподобное, но непроверенное число.
Интеграция с носимыми устройствами. Данные Apple Watch напрямую поступают в Nutrola, предоставляя точные оценки калорий активности, которые комбинируются с регистрацией пищи для расчета чистого энергетического баланса. Ни один чатбот не может получить доступ к вашим данным носимого устройства, чтобы скорректировать рекомендации по калориям на основе вашего фактического ежедневного движения.
Скорость и удобство. Сделать фотографию своей тарелки, отсканировать штрих-код или произнести свое блюдо занимает менее 30 секунд. Вводить подробное описание блюда в чатбот, ждать ответа, а затем вручную записывать оценку где-то занимает значительно больше времени и приводит к менее точному результату.
Могут ли AI-чатботы улучшиться достаточно, чтобы заменить приложения для питания?
Это вопрос о фундаментальной архитектуре, а не просто о возможностях модели. Даже с идеальной точностью оценки калорий (к которой текущие модели далеки от достижения) AI-чатботы все равно будут лишены постоянного ведения журнала, накопительного отслеживания, интеграции с носимыми устройствами и проверки по структурированной базе данных, которые необходимы для отслеживания питания.
Будущие AI-системы теоретически могут включать эти функции. Но в этом случае они фактически станут приложениями для питания с разговорным интерфейсом, а не универсальными чатботами. Функции, которые делают отслеживание калорий эффективным — проверенная база данных, постоянные пользовательские журналы, интеграции устройств, адаптивные алгоритмы — это инженерные системы, а не языковые возможности.
Наиболее вероятное будущее — это не "чатботы заменяют приложения для питания", а "приложения для питания интегрируют разговорный AI". Это уже происходит. AI-управляемое распознавание фотографий и голосовая регистрация Nutrola приносят удобство разговорного взаимодействия к структурированной надежности проверенной базы данных о питании. Вы получаете естественное взаимодействие с AI с точностью и постоянством специализированной системы отслеживания.
Что происходит, когда вы просите AI отслеживать ваши калории?
Чтобы проиллюстрировать практическую разницу, вот как выглядит типичный день отслеживания калорий с каждым подходом.
Используя Gemini или ChatGPT: Вы просите чатбота оценить ваш завтрак. Он дает вам число. Вы записываете его где-то или пытаетесь запомнить. На обед вы начинаете новый разговор (чатбот не помнит о завтраке) и получаете другую оценку. Вы мысленно добавляете два числа. К ужину у вас есть приблизительный текущий итог, который может отличаться на 200-400 калорий, и у вас нет разбивки макронутриентов, постоянной записи и недельной тенденции.
Используя Nutrola: Вы фотографируете свой завтрак. AI распознает продукты, сопоставляет их с проверенными записями базы данных и автоматически регистрирует их. Ваш ежедневный итог обновляется в реальном времени. На обед вы сканируете штрих-код на упаковке своего сэндвича, и точные данные о питательных веществах производителя добавляются в ваш журнал. К ужину у вас есть точный текущий итог, разбивка макронутриентов и история приемов пищи, которые влияют на ваши недельные и месячные тенденции. Ваша цель по калориям корректируется на основе ваших фактических данных о тенденциях веса, синхронизированных с вашего Apple Watch.
Разница не является незначительной. Это разница между догадкой и системой.
Ключевые выводы
Универсальные AI-чатботы, такие как Gemini и ChatGPT, являются впечатляющими инструментами для многих задач, но подсчет калорий не входит в их число. Наш тест на 30 блюд показал средние ошибки в 108-127 калорий на блюдо, непоследовательные результаты при повторных запросах, отсутствие постоянной возможности ведения журнала и отсутствие интеграции с базами данных о продуктах или носимыми устройствами. Эти ограничения носят структурный характер, а не случайный. Они возникают из фундаментальной разницы между языковой моделью и системой отслеживания питания.
Для тех, кто серьезно относится к управлению своим питанием, специализированное приложение с проверенной базой данных, постоянным ведением журнала и адаптивными целями остается необходимым. Nutrola сочетает в себе удобство, управляемое AI (распознавание фотографий, голосовая регистрация, сканирование штрих-кодов), с точностью и постоянством структурированной платформы для питания, всего за 2.50 евро в месяц без рекламы. Когда дело доходит до подсчета калорий, вопрос не в том, вовлечен ли AI. Вопрос в том, поддерживается ли AI правильной архитектурой для этой задачи.
Готовы трансформировать отслеживание питания?
Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!