Может ли ИИ считать калории лучше вас? Мы протестировали 1,000 блюд с Nutrola
Мы фотографировали, взвешивали и отслеживали 1,000 блюд, используя три метода — человеческие предположения, ручной ввод в приложение и распознавание изображений с помощью ИИ Nutrola — а затем сравнили каждую оценку с данными весов. Вот полные результаты, включая случаи, когда ИИ ошибался, и когда он был на высоте.
Каждый, кто когда-либо отслеживал калории, знает это чувство: смотришь на тарелку с пастой и думаешь, 500 калорий это или 800. Оценка калорий человеком известна своей ненадежностью, и опубликованные исследования показывают погрешности от 20% до более 50% в зависимости от населения и типа пищи. Вопрос, который мы хотели решить, был простым: может ли распознавание изображений ИИ Nutrola делать это значительно лучше, чем человеческая оценка, и как оно сравнивается с более трудоемким методом ручного ввода в традиционное приложение для подсчета калорий?
Мы провели структурированный внутренний тест на 1,000 блюдах в течение 12 недель. В этой статье представлены полная методология, таблицы результатов, случаи ошибок и практические выводы для всех, кто пытается точно контролировать свой калорийный intake.
Методология исследования
Обзор дизайна
Мы собрали данные о 1,000 блюдах, приготовленных или купленных ротационной группой из 14 внутренних тестировщиков в трех городах. Каждое блюдо прошло через стандартизированный четырехступенчатый процесс:
Взвешивание и запись истинной величины. Каждый ингредиент взвешивался на откалиброванных весах (точность ±1 г) перед подачей. Для ресторанных и выносных блюд мы взвешивали все блюдо целиком, а затем определяли компоненты, используя данные о питательных веществах, предоставленные заведением или базой данных USDA FoodData Central. Истинные калорийные значения рассчитывались с использованием проверенных питательных баз данных, сопоставленных с как минимум двумя источниками.
Человеческая оценка. Тестировщик, не участвовавший в приготовлении пищи, смотрел на поданное блюдо и давал оценку калорий в течение 15 секунд. Без инструментов, без ссылок, без этикеток. Просто визуальная оценка — так, как большинство людей оценивает, когда пропускает ввод данных.
Ручной ввод в приложение. Второй тестировщик записывал блюдо, используя обычное приложение для подсчета калорий, ища каждый ингредиент по отдельности, выбирая ближайшее соответствие из базы данных и вводя предполагаемые размеры порций визуально (без использования данных весов). Это воспроизводит то, как старательный ручной трекер будет записывать блюдо на практике.
Распознавание изображений Nutrola AI. Третий тестировщик фотографировал блюдо с помощью встроенной камеры Nutrola и принимал оценку калорий, сгенерированную ИИ. Никакие ручные корректировки не вносились в результат ИИ. Мы хотели протестировать сырой, необработанный результат ИИ.
Контроль и соображения
- Тестировщики менялись ролями, чтобы ни один человек не был всегда "человеческим оценщиком".
- Блюда охватывали широкий спектр: домашняя еда, рестораны, фастфуд, заранее приготовленные блюда, закуски и напитки.
- Мы исключили только жидкие продукты (обычная вода, черный кофе), так как они содержат ноль или почти ноль калорий и могли бы искусственно завысить оценки точности.
- Все сравнения калорий использовали абсолютный процент ошибки: |оценка - фактическая| / фактическая × 100.
- Исследование проводилось с декабря 2025 года по февраль 2026 года.
Общие результаты
Основные цифры рассказывают ясную историю. Распознавание изображений ИИ показало значительно более низкие уровни ошибок, чем как человеческие предположения, так и ручной ввод, хотя все три метода продемонстрировали значительные возможности для улучшения.
| Показатель | Человеческая оценка | Ручной ввод в приложение | Nutrola AI Фото |
|---|---|---|---|
| Средняя абсолютная ошибка | 34.2% | 17.8% | 10.4% |
| Медианная абсолютная ошибка | 29.5% | 14.1% | 7.9% |
| Уровень переоценки | 23.7% блюд | 38.4% блюд | 41.2% блюд |
| Уровень недооценки | 76.3% блюд | 61.6% блюд | 58.8% блюд |
| Блюда в пределах ±10% от фактического | 18.3% | 41.7% | 62.4% |
| Блюда в пределах ±20% от фактического | 39.1% | 68.5% | 84.6% |
Два паттерна выделяются. Во-первых, человеческие оценки были неверными более чем на 30% в третьей всех протестированных блюд. Во-вторых, все три метода показали систематическую предвзятость к недооценке, но эта предвзятость была гораздо более выраженной при помощи неоснащенной человеческой оценки. Люди склонны недооценивать калории, и делают это с большой погрешностью. ИИ Nutrola также чаще недооценивал, чем переоценивал, но величина недооценки была значительно меньше.
Результаты по типу блюда
Не все блюда одинаково легко оценить. Завтрак, как правило, включает более простые, стандартизированные продукты. Ужин чаще всего включает более сложные приготовления, большие порции и скрытые источники калорий, такие как масла для готовки и соусы. Закуски обманчивы, потому что люди склонны считать их низкокалорийными, независимо от фактического содержания.
| Тип блюда | Протестированные блюда | Средняя ошибка человеческой оценки | Средняя ошибка ручного ввода | Средняя ошибка Nutrola AI | Лучший метод |
|---|---|---|---|---|---|
| Завтрак | 241 | 27.1% | 13.2% | 7.8% | Nutrola AI |
| Ужин | 289 | 33.8% | 18.4% | 10.1% | Nutrola AI |
| Ужин | 312 | 40.6% | 21.3% | 13.2% | Nutrola AI |
| Закуски | 158 | 35.4% | 16.9% | 9.7% | Nutrola AI |
Nutrola AI выиграл в каждой категории. Однако разница между ИИ и ручным вводом значительно сократилась для завтраков (разница 5.4 процентных пункта) по сравнению с ужином (разница 8.1 процентных пункта). Это интуитивно понятно: тарелка овсянки с черникой легче ввести вручную, чем жаркое с несколькими соусами, белками и овощами, смешанными вместе.
Человеческие оценки показали наихудшие результаты на ужине, со средней ошибкой, превышающей 40%. Это соответствует существующим исследованиям, показывающим, что точность оценки калорий ухудшается по мере увеличения сложности блюда.
Результаты по сложности пищи
Мы классифицировали каждое блюдо на одну из трех категорий сложности, чтобы исследовать, как каждый метод справляется с задачами оценки, становящимися все более сложными.
| Уровень сложности | Описание | Блюда | Ошибка человека | Ошибка ручного ввода | Ошибка Nutrola AI |
|---|---|---|---|---|---|
| Простое | Один ингредиент или очень немного компонентов (например, банан, тарелка риса, куриная грудка на гриле) | 287 | 22.4% | 9.7% | 5.3% |
| Умеренное | Несколько идентифицируемых компонентов на тарелке (например, курица с рисом и овощами, сэндвич с видимыми слоями) | 438 | 33.9% | 17.2% | 9.8% |
| Сложное | Смешанные блюда с соусами, скрытыми ингредиентами или многослойными приготовлениями (например, лазанья, карри, буррито с несколькими начинками) | 275 | 47.8% | 27.4% | 17.1% |
Эффект сложности был драматичным для всех методов. Точность человеческой оценки почти вдвое уменьшилась от простых к сложным блюдам. Ошибка ручного ввода почти утроилась. Ошибка Nutrola AI также примерно утроилась, увеличившись с 5.3% до 17.1%, но абсолютная ошибка оставалась значительно ниже, чем у других методов на каждом уровне.
Вывод заключается в том, что сложные, смешанные блюда остаются трудной задачей для всех — как для людей, так и для алгоритмов. Но ИИ все равно сохраняет значительное преимущество даже в наихудшем сценарии.
Где ИИ испытывал трудности: честные случаи неудач
Прозрачность важнее, чем маркетинг. Распознавание изображений Nutrola AI не идеально, и были категории, где его производительность заметно снизилась. Мы выявили три постоянные проблемные области.
Супы и рагу
Супы были единственной самой сложной категорией для ИИ. Когда калорийные ингредиенты (мясо, бобы, сливки, масло) находятся под жидкой поверхностью, фотография просто не содержит достаточной визуальной информации для точной оценки. В нашем наборе данных по 47 супам и рагу средняя ошибка ИИ составила 22.8%, по сравнению с 19.1% для ручного ввода. Это была одна из немногих категорий, где ручной ввод на самом деле превзошел ИИ, потому что человек может перечислить известные ингредиенты, независимо от того, видны они или нет.
Блюда с большим количеством соуса и глазури
Блюда, пропитанные соусами — глазури терияки, сливочные соусы для пасты, подливы и густые карри — представили аналогичную проблему с закрытием. ИИ мог определить тип блюда, но постоянно недооценивал калорийный вклад самого соуса. В 63 блюдах с большим количеством соуса средняя ошибка ИИ составила 19.4%. Для контекста, человеческие оценки по тем же блюдам в среднем составили 44.1% ошибки, так что ИИ все равно был значительно лучше, но работал выше своего общего среднего.
Очень маленькие порции и приправы
Когда на тарелке находилось очень небольшое количество калорийного продукта (столовая ложка арахисового масла, небольшая горсть орехов, тонкий ломтик сыра), ИИ иногда ошибался в оценке размера порции на значительную величину. В 31 блюде, где общая калорийность была ниже 150, средняя ошибка ИИ составила 24.3%. Небольшие абсолютные числа означали, что даже ошибка в 30 калорий переводилась в высокую процентную ошибку.
Где ИИ преуспел
Сильные стороны ИИ были также очевидны и охватывали большинство типичных блюд, которые люди едят ежедневно.
Стандартные поданные блюда
Тарелка с четкими, видимыми компонентами — кусок белка, углеводы, овощи — была "сладким местом" ИИ. В 312 блюдах, подходящих под это описание, средняя ошибка составила всего 6.4%. ИИ особенно хорошо справлялся с оценкой размеров порций распространенных белков, таких как куриная грудка, филе лосося и котлеты из говядины, вероятно, потому что эти продукты часто встречаются в его обучающих данных и имеют относительно однородную калорийность.
Узнаваемые упакованные и ресторанные блюда
Для блюд из известных ресторанных сетей или распространенных упакованных продуктов ИИ извлекал выгоду из проверенной базы данных Nutrola. Когда ИИ распознавал блюдо как конкретный элемент меню, он получал данные о калориях непосредственно из базы данных, а не оценивал только по изображению. Это привело к средним ошибкам ниже 4% для 89 блюд, идентифицированных как известные ресторанные позиции.
Оценка порций углеводов и крахмалов
Одной из областей, где ИИ постоянно превосходил ручной ввод, была оценка порций риса, пасты, хлеба и картофеля. Ручные регистраторы часто вводили общие значения "1 чашка" или "1 порция", которые не соответствовали фактическому количеству на тарелке. ИИ, работая от визуального размера относительно тарелки и других предметов, достиг средней ошибки 6.1% по углеводам по сравнению с 15.8% для ручного ввода.
Сравнение времени
Точность — это лишь часть уравнения. Если метод занимает слишком много времени, люди не будут использовать его постоянно, а последовательность важнее, чем точность, для долгосрочного управления калориями.
| Метод | Среднее время на блюдо | Примечания |
|---|---|---|
| Человеческая оценка | 5 секунд | Быстро, но неточно; запись не создается |
| Ручной ввод в приложение | 3 минуты 42 секунды | Требует поиска в базе данных, выбора элементов, оценки порций для каждого компонента |
| Nutrola AI Фото | 12 секунд | Сделать фото, просмотреть оценку, подтвердить |
Разница во времени между ручным вводом и распознаванием изображений ИИ была значительной: 3 минуты и 30 секунд экономии на каждом блюде. За три блюда и два перекуса в день это переводится примерно в 17 минут экономии ежедневно или почти два часа в неделю. Опубликованные исследования по соблюдению режима показывают, что снижение трения при вводе пищи увеличивает долгосрочную последовательность отслеживания, что, в свою очередь, предсказывает лучшие результаты управления весом.
Конкретные примеры больших ошибок в оценке
Абстрактные проценты могут скрывать, как эти ошибки выглядят на практике. Вот пять реальных примеров из нашего набора данных, которые иллюстрируют, как неудачи в оценке проявляются на реальных тарелках.
| Блюдо | Фактические калории | Человеческая оценка | Ручной ввод | Nutrola AI |
|---|---|---|---|---|
| Курица альфредо с чесночным хлебом | 1,140 ккал | 620 ккал (−45.6%) | 840 ккал (−26.3%) | 1,020 ккал (−10.5%) |
| Чаша акай с гранолой и арахисовым маслом | 750 ккал | 400 ккал (−46.7%) | 580 ккал (−22.7%) | 690 ккал (−8.0%) |
| Цезарь с гренками и соусом | 680 ккал | 310 ккал (−54.4%) | 470 ккал (−30.9%) | 590 ккал (−13.2%) |
| Два куска пиццы с пепперони | 570 ккал | 500 ккал (−12.3%) | 540 ккал (−5.3%) | 555 ккал (−2.6%) |
| Пад тай с креветками (порция из ресторана) | 920 ккал | 550 ккал (−40.2%) | 710 ккал (−22.8%) | 830 ккал (−9.8%) |
Пример с курицей альфредо показателен. Человеческий оценщик увидел пасту и оценил умеренную порцию. Что они упустили, так это содержание сливок и масла в соусе альфредо и масла, использованного для чесночного хлеба. Ручной регистратор недооценил количество соуса. ИИ Nutrola, обученный на тысячах подобных блюд, распознал тип блюда и оценил ближе к фактической калорийности сливочной пасты.
Цезарь — еще одна распространенная ловушка. Люди предполагают, что салаты низкокалорийные, но соус, гренки и пармезан в ресторанном Цезаре быстро накапливаются. Оценка человеческого оценщика была ошибочной более чем на 50%.
Кумулятивный эффект: почему маленькие ошибки имеют значение
Средняя ошибка в 10% может показаться приемлемой для одного блюда, но отслеживание калорий — это кумулятивное упражнение. Ошибки накапливаются с каждым блюдом, каждым днем, каждой неделей.
Рассмотрим человека, который ест 2,200 калорий в день и пытается поддерживать дефицит в 500 калорий ежедневно для похудения:
| Метод отслеживания | Ошибка в калориях в день (средняя) | Ошибка в калориях за неделю | Влияние на дефицит |
|---|---|---|---|
| Человеческая оценка | ±752 ккал/день | ±5,264 ккал/неделя | Дефицит фактически стирается большинство дней |
| Ручной ввод | ±392 ккал/день | ±2,744 ккал/неделя | Дефицит снижен в среднем на ~56% |
| Nutrola AI | ±229 ккал/день | ±1,603 ккал/неделя | Дефицит снижен в среднем на ~33% |
Когда систематическая предвзятость к недооценке принимается во внимание, ситуация для человеческой оценки становится еще хуже. Если вы постоянно считаете, что едите 1,700 калорий, когда на самом деле едите 2,300, вы не будете терять вес и не поймете, почему. Это одна из самых распространенных причин, по которой люди сообщают, что подсчет калорий "не работает для них". Проблема не в самом отслеживании — проблема в точности.
ИИ Nutrola не безошибочен, но его ошибки достаточно малы, чтобы предполагаемый калорийный дефицит оставался в значительной степени неизменным на протяжении типичной недели.
Ограничения этого исследования
Мы хотим быть откровенными относительно границ этого анализа. Это был внутренний тест, а не рецензируемое клиническое испытание. Выборка из 14 тестировщиков, хотя и обеспечила 1,000 данных о блюдах, не представляет полного разнообразия мировых кухонь, культурных привычек питания или индивидуальных стилей подачи. Человеческие оценщики были сотрудниками компании по технологиям питания и могли иметь более высокий уровень базовых знаний о пище, чем средний человек, что означает, что наши показатели ошибок человеческой оценки могут быть на самом деле консервативными по сравнению с общей популяцией.
Кроме того, правило "без корректировок" для теста ИИ более ограничительно, чем в реальном использовании. На практике Nutrola позволяет пользователям корректировать оценки ИИ — исправлять размеры порций, добавлять отсутствующие ингредиенты или заменять элементы базы данных. Пользователь, который просматривает и корректирует вывод ИИ, вероятно, достигнет точности лучше, чем 10.4% средней ошибки, о которой здесь сообщается.
Что это значит для вашего отслеживания
Данные указывают на практическое заключение. Для подавляющего большинства блюд распознавание изображений ИИ предоставляет значительно лучшие оценки калорий, чем как неоснащенная человеческая оценка, так и ручной ввод в приложение, и делает это за гораздо более короткое время. Сочетание более высокой точности и меньшего трения делает последовательное отслеживание гораздо более достижимым.
Для блюд, где ИИ известно, что он испытывает трудности — супы, блюда с большим количеством соуса и очень маленькие порции — лучшая стратегия заключается в том, чтобы использовать ИИ как отправную точку, а затем вручную корректировать. Nutrola поддерживает этот рабочий процесс: ИИ предоставляет первоначальную оценку по более чем 100 питательным веществам, а пользователь может уточнить любое значение, ища в проверенной базе данных продуктов или корректируя размеры порций.
Подсчет калорий не должен быть идеальным, чтобы быть полезным. Но разница между средней ошибкой 34% и средней ошибкой 10% — это разница между системой отслеживания, которая подрывает ваши цели, и той, которая их поддерживает.
Часто задаваемые вопросы
Насколько точен подсчет калорий ИИ по сравнению с человеческой оценкой?
На основе нашего тестирования 1,000 блюд распознавание изображений ИИ Nutrola достигло средней абсолютной ошибки 10.4%, по сравнению с 34.2% для неоснащенной человеческой оценки и 17.8% для ручного ввода в приложение. ИИ поместил 62.4% всех оценок блюд в пределах 10% от фактического значения калорий, в то время как человеческие оценки попали в этот диапазон только 18.3% времени. Эти результаты согласуются с опубликованными исследованиями, показывающими, что неподготовленные люди недооценивают потребление калорий на 20-50%.
Могут ли приложения для подсчета калорий на основе ИИ полностью заменить весы для пищи?
Не совсем. Весы остаются золотым стандартом для точности, и в нашем исследовании использовались значения, измеренные весами, как истинные. Однако распознавание изображений ИИ приближается достаточно близко для практического управления калориями. С средней ошибкой 10.4% Nutrola's AI предоставляет оценки, которые достаточны для поддержания значительного калорийного дефицита или избытка с течением времени. Для пользователей, которым нужна клиническая точность — например, для спортсменов, соревнующихся в весовых категориях, или людей с определенными медицинскими диетическими требованиями — комбинирование оценок ИИ с периодической проверкой весов является наиболее практичным подходом.
С какими типами блюд подсчет калорий ИИ испытывает наибольшие трудности?
В нашем тестировании распознавание изображений ИИ показало наихудшие результаты по трем категориям: супы и рагу (средняя ошибка 22.8%), блюда с большим количеством соуса (средняя ошибка 19.4%) и очень маленькие порции менее 150 калорий (средняя ошибка 24.3%). Общий фактор — визуальное закрытие — когда калорийные ингредиенты скрыты под жидкостью, соусом или когда порция слишком мала, чтобы ИИ мог точно оценить размер. Для этих блюд ручной просмотр и корректировка оценки ИИ дают лучшие результаты.
Сколько времени экономит отслеживание калорий с помощью ИИ по сравнению с ручным вводом?
В нашем исследовании распознавание изображений Nutrola AI заняло в среднем 12 секунд на блюдо, по сравнению с 3 минутами и 42 секундами для ручного ввода в приложение. Это экономия примерно 3.5 минут на каждом блюде. Для кого-то, кто вводит три блюда и два перекуса ежедневно, это переводится примерно в 17 минут экономии в день или близко к двум часам в неделю. Исследования по самоотслеживанию диеты последовательно показывают, что сокращение времени ввода улучшает долгосрочную приверженность, что является самым сильным предиктором успешного управления весом.
Отслеживает ли Nutrola только калории или также другие питательные вещества?
Nutrola отслеживает более 100 питательных веществ с одной фотографии еды, включая макронутриенты (белки, углеводы, жиры, клетчатка), микронутриенты (витамины, минералы) и другие диетические маркеры. Оценка ИИ в этом исследовании сосредоточилась на точности общего количества калорий, но тот же анализ фотографии генерирует полный профиль питательных веществ. Пользователи могут просматривать детализированные разбивки для любого зарегистрированного блюда и отслеживать цели по питательным веществам со временем. Основные функции отслеживания, включая распознавание изображений ИИ и проверенную базу данных продуктов, доступны бесплатно.
Достаточно ли точен подсчет калорий ИИ для похудения?
Да, для подавляющего большинства пользователей. Наши данные показывают, что ИИ Nutrola поддерживает оценки калорий достаточно точными, чтобы сохранить значительный ежедневный дефицит. При средней ошибке 10.4% на день с 2,200 калориями, средняя ежедневная погрешность составляет примерно 229 калорий. Хотя это не ноль, этот уровень ошибки позволяет сохранить целевой дефицит в 500 калорий в значительной степени неизменным. В отличие от этого, человеческие оценки приводят к средним ежедневным ошибкам, превышающим 750 калорий, что может полностью устранить предполагаемый дефицит. Последовательное отслеживание с помощью ИИ с периодическими ручными корректировками для сложных блюд обеспечивает наилучший баланс между точностью, скоростью и долгосрочной приверженностью.
Готовы трансформировать отслеживание питания?
Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!