Насколько точен AI в распознавании пищи? Подробный анализ точности

AI в распознавании пищи не идеален — и любой, кто говорит иначе, не честен. Однако с точностью 80-95% он значительно превосходит человеческие оценки в 50-60%. Вот подробный анализ, когда ему можно доверять, а когда стоит перепроверить.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

AI в распознавании пищи использует компьютерное зрение — раздел искусственного интеллекта, который позволяет машинам интерпретировать визуальную информацию из изображений — для определения продуктов на фотографиях и оценки их питательной ценности. Эта технология стала широко доступной, и миллионы людей ежедневно фотографируют свои блюда. Но остается вопрос: насколько она точна, чтобы ей можно было доверять?

Ответ на этот вопрос требует нюансов, а не маркетинга. Точность распознавания пищи AI значительно варьируется в зависимости от типа продукта, сложности блюда и — что критически важно — базы данных, на которую опирается AI при идентификации. Вот всесторонняя, основанная на данных оценка.

Вопрос точности: что показывают исследования?

Рецензируемые исследования предоставляют конкретные данные о точности систем распознавания пищи с помощью AI:

Thames и др. (2021) оценили модели распознавания пищи на основе глубокого обучения в IEEE Access и сообщили о точности классификации от 80% до 93% по стандартизированным наборам изображений пищи, с наилучшей производительностью на хорошо освещенных, четко сервированных блюдах.

Mezgec и Korousic Seljak (2017) рассмотрели системы распознавания пищи в Nutrients и обнаружили, что подходы на основе глубокого обучения достигли 79-93% точности top-1 на контрольных наборах данных, что является значительным улучшением по сравнению с более ранними методами компьютерного зрения.

Lu и др. (2020) специально изучили оценку порций в IEEE Transactions on Multimedia и обнаружили, что оценка объема на основе AI достигла точности в пределах 15-25% от измеренных количеств для большинства типов пищи.

Liang и Li (2017) продемонстрировали точность классификации отдельных продуктов, превышающую 90% с использованием современных архитектур сверточных нейронных сетей.

Эти исследования предоставляют базу для доказательств. Теперь давайте разберем это по типам блюд, которые вы действительно едите.

Подробный анализ точности по типам блюд

Простые одиночные продукты: 90-95% точности

Это самые простые случаи для AI, и именно в них технология действительно преуспевает.

Тип пищи Точность распознавания Точность порции Общая точность калорий
Целые фрукты (яблоко, банан, апельсин) 95%+ В пределах 5-10% В пределах 10%
Одиночный белок (куриная грудка, стейк) 90-95% В пределах 10-15% В пределах 15%
Упакованные закуски (узнаваемая упаковка) 95%+ Точно (штрих-код) Почти точно
Простые углеводы (кусок хлеба, тарелка риса) 90-95% В пределах 10-15% В пределах 15%
Напитки в стандартной упаковке 90-95% В пределах 5-10% В пределах 10%

Уровень доверия: высокий. Для одиночных, четко видимых продуктов распознавание пищи AI дает результаты, достаточно надежные для значимого отслеживания калорий.

Простые сервированные блюда (2-3 видимых элемента): 85-92% точности

Это типичные домашние или кафетерийные блюда с четко разделенными компонентами.

Тип пищи Точность распознавания Точность порции Общая точность калорий
Гриль + углеводы + овощи 88-92% В пределах 15-20% В пределах 15-20%
Салат с видимыми добавками 85-90% В пределах 15-20% В пределах 20%
Завтрак (яйца, тост, фрукты) 88-92% В пределах 10-15% В пределах 15%
Сэндвич с видимыми начинками 82-88% В пределах 15-20% В пределах 20%

Уровень доверия: хороший. AI в большинстве случаев правильно идентифицирует основные компоненты, а оценка порций достаточно близка для эффективного отслеживания. Основной источник ошибок — скрытые добавления, такие как масло для готовки, масло, соусы, добавленные во время приготовления.

Сложные сервированные блюда (4+ элемента): 80-88% точности

Блюда из ресторанов, тарелки на ужинах и блюда с несколькими соусами или гарнирами.

Тип пищи Точность распознавания Точность порции Общая точность калорий
Основное блюдо с гарнирами 80-88% В пределах 20-25% В пределах 20-25%
Многофункциональные салаты 78-85% В пределах 20-25% В пределах 25%
Тарелки с несколькими соусами/заправками 75-85% В пределах 20-30% В пределах 25-30%
Плато суши (много кусочков) 82-90% В пределах 15-20% В пределах 20%

Уровень доверия: умеренный. Полезно для общего отслеживания и поддержания осведомленности, но недостаточно точно для планирования питания на уровне соревнований. Перепроверяйте и корректируйте результаты AI, когда точность важна.

Смешанные блюда (смешанные ингредиенты): 70-85% точности

Здесь AI сталкивается с самой сложной задачей — блюда, в которых ингредиенты смешаны, и отдельные компоненты визуально неразличимы.

Тип пищи Точность распознавания Точность порции Общая точность калорий
Жаркое с соусом 75-85% В пределах 25-30% В пределах 25-30%
Карри с рисом 72-82% В пределах 25-30% В пределах 30%
Запеканки и запеченные блюда 70-80% В пределах 25-35% В пределах 30-35%
Густые супы и рагу 68-78% В пределах 25-35% В пределах 30-35%
Смуси 60-70% (только визуально) В пределах 30-40% В пределах 35-40%

Уровень доверия: использовать как отправную точку. AI предоставляет разумную оценку, которую следует пересмотреть и скорректировать. Для часто употребляемых смешанных блюд лучше один раз записать рецепт (используя функцию импорта рецептов Nutrola) и повторно использовать его, что обеспечит гораздо большую точность, чем распознавание по фото.

Критический контекст: AI против человеческой оценки

Процент точности, указанный выше, может показаться тревожным в изоляции. Но его следует оценивать в сравнении с альтернативой — а для большинства людей альтернативой является человеческая оценка без каких-либо инструментов.

Исследования точности оценки калорий человеком:

  • Lichtman и др. (1992)New England Journal of Medicine: Участники недооценивали потребление калорий в среднем на 47%. Некоторые недооценивали до 75%.
  • Schoeller и др. (1990) — Используя двойную меченую воду (золотой стандарт для измерения фактического энергозатрата), исследователи обнаружили систематическое недоотчет калорийности пищи на 20-50%.
  • Wansink и Chandon (2006) — Ошибки в оценке размера порции увеличивались с размером блюда и калорийной плотностью пищи, с наибольшими ошибками для тех продуктов, где точность имеет наибольшее значение.
  • Champagne и др. (2002) — Опубликовано в Journal of the American Dietetic Association, даже обученные диетологи недооценивали калорийность ресторанных блюд в среднем на 25%.

Сравнение бок о бок

Метод Точность простого блюда Точность сложного блюда Систематическая ошибка Время, необходимое для оценки
Необученная человеческая оценка 50-60% 40-55% Сильная недооценка Нет
Оценка обученного диетолога 70-80% 60-75% Умеренная недооценка Нет
AI распознавание пищи 85-92% 70-85% Случайная (без систематической ошибки) 3-5 секунд
AI + проверенная база данных 88-95% 75-88% Случайная, корректируемая 3-10 секунд
Весы + проверенная база данных 95-99% 90-95% Практически нулевая 2-5 минут

Ключевая идея: AI в распознавании пищи, даже в худшем случае (70% точности для смешанных блюд), все равно значительно точнее, чем необученная человеческая оценка в лучшем случае (60% для простых продуктов). AI с точностью 80% не должен быть идеальным — он должен быть лучше альтернативы, и это так.

Что определяет хорошее и плохое распознавание пищи AI

Не все реализации AI в распознавании пищи обеспечивают указанные выше диапазоны точности. Разница зависит от трех факторов:

Фактор 1: База данных, стоящая за AI

Это самый важный фактор и тот, который чаще всего упускается из виду. Когда AI идентифицирует "куриный салат Цезарь", количество калорий, которое он возвращает, зависит от того, откуда берутся данные о питательной ценности:

  • Оценка, сгенерированная AI (без базы данных): AI генерирует число калорий на основе своих обучающих данных. Результаты варьируются между сканированием и могут не соответствовать никакому реальному источнику питательных данных.
  • Краудсорсинговая база данных: AI сопоставляет с пользовательским вводом, который может содержать ошибки, устаревшие данные или нестандартные размеры порций.
  • Проверенная база данных: AI сопоставляет с записью, проверенной диетологом, с стандартизированными размерами порций и проверенными данными о питательной ценности.

Nutrola решает проблему точности, поддерживая свое распознавание пищи AI базой данных из 1.8 миллиона записей. Каждая запись была проверена специалистами по питанию. Когда AI идентифицирует продукт, он обращается к этому проверенному источнику, а не генерирует оценку или сопоставляет с непроверенными данными. Это страховка, которая делает распознавание пищи AI надежным.

Фактор 2: Механизмы коррекции

Даже лучший AI будет ошибаться в идентификации продуктов определенный процент времени. То, что происходит дальше, определяет, будет ли инструмент полезным:

  • Нет опции коррекции: Пользователь остается с оценкой AI, правильной или неправильной.
  • Базовая коррекция: Пользователь может удалить запись AI и вручную найти правильный продукт.
  • Умная коррекция: Пользователь может нажать на предложение AI, увидеть альтернативы из проверенной базы данных и выбрать правильное соответствие одним нажатием.

Возможность быстро и легко корректировать 5-15% записей, которые AI определяет неправильно, отделяет надежное распознавание пищи AI от разочаровывающего.

Фактор 3: Множественные методы ввода

AI распознавание по фото не является подходящим инструментом для каждой ситуации ведения учета пищи:

Ситуация Лучший метод ввода
Видимое сервированное блюдо AI распознавание по фото
Упакованная еда со штрих-кодом Сканирование штрих-кода
Простые блюда, которые легко описать Голосовой ввод ("курица и рис")
Сложный рецепт с известными ингредиентами Импорт рецепта или ручной ввод
Часто употребляемые блюда Быстрый ввод из недавней истории

Nutrola предоставляет все эти методы ввода — AI фото, голосовой ввод на 15 языках, сканирование штрих-кодов, импорт рецептов по URL и ручной поиск по 1.8 миллиона проверенных записей. Правильный инструмент для каждой ситуации максимизирует точность по всем типам блюд.

Когда доверять распознаванию пищи AI

Доверяйте AI для: Четко видимых, простых блюд; одиночных продуктов; сервированных блюд с четкими компонентами; упакованных продуктов, идентифицированных по штрих-коду; распространенных ресторанных блюд.

Перепроверяйте и корректируйте для: Блюд с скрытыми соусами или маслами для готовки; блюд с более чем 4-5 компонентами; смешанных блюд, где ингредиенты смешаны; ресторанных блюд с неясными методами приготовления.

Используйте альтернативный метод ввода для: Смуси и смешанных напитков; домашних рецептов с конкретными ингредиентами и количествами; блюд, для которых вы знаете точный рецепт; упакованных продуктов (используйте штрих-код вместо этого).

Таблица доказательств: Исследования распознавания пищи AI

Исследование Год Ключевая находка Диапазон точности
Mezgec & Korousic Seljak 2017 Обзор распознавания пищи на основе глубокого обучения 79-93% классификации
Liang & Li 2017 Классификация пищи на основе CNN 90%+ для одиночных продуктов
Lu и др. 2020 Оценка порций AI В пределах 15-25% от фактического
Thames и др. 2021 Распознавание сложных блюд 80-90% классификации
Lichtman и др. 1992 Базовая оценка человеческой оценки 47% средняя недооценка
Champagne и др. 2002 Оценка диетологами ресторанных блюд 25% средняя недооценка

Итог

AI в распознавании пищи достаточно точен, чтобы ему можно было доверять для подавляющего большинства повседневных блюд — и он значительно точнее, чем альтернатива в виде человеческой оценки. Он не идеален, и честное сообщение о его ограничениях важно для правильного формирования ожиданий.

Ключ к тому, чтобы сделать распознавание пищи AI по-настоящему надежным, заключается в том, что стоит за AI: проверенная база данных продуктов, которая предоставляет точные данные о питательной ценности, когда идентификация AI верна, и путь коррекции, когда это не так. Это и есть разница между функцией сканирования, которая выглядит впечатляюще на демонстрации, и той, которая предоставляет данные, на основе которых вы можете действительно принимать решения о своем питании.

Nutrola сочетает в себе AI распознавание по фото, голосовой ввод и сканирование штрих-кодов с проверенной базой данных из 1.8 миллиона записей, отслеживая более 100 питательных веществ на 15 языках. С бесплатным пробным периодом и €2.50 в месяц после — без рекламы — вы можете протестировать точность на своих собственных блюдах и решить для себя, доставляет ли технология.

Часто задаваемые вопросы

Насколько точен AI в распознавании пищи по сравнению с весами?

Весы с проверенной базой данных являются золотым стандартом, достигая 95-99% точности. AI в распознавании пищи с проверенной базой данных достигает 85-95% для простых блюд и 70-85% для сложных смешанных блюд. Компромисс заключается во времени: весы требуют 2-5 минут на блюдо, в то время как AI сканирование занимает 3-5 секунд. Для большинства целей в области здоровья и снижения веса точности AI достаточно.

Работает ли AI в распознавании пищи при низком освещении или в ресторанах?

Современные модели AI достаточно устойчивы к изменениям освещения, но точность снижается при очень низком освещении, необычных углах или когда еда сильно затенена. Для ресторанных блюд фотографирование с помощью вспышки вашего телефона или при разумном освещении дает наилучшие результаты. Большинство ресторанов имеют достаточное освещение для получения полезного фото.

Может ли AI в распознавании пищи обнаруживать масла для готовки и масло?

Это известное ограничение. AI иногда может обнаружить видимое масло (блестящие поверхности, скопления масла), но не может надежно обнаружить впитанные жиры. Для наиболее точного учета домашних блюд добавляйте масла для готовки и масло как отдельные записи после того, как AI отсканирует видимую пищу. AI Nutrola обучен подсказывать пользователям о жирах для готовки, когда он обнаруживает характеристики жареных или обжаренных блюд.

Достаточно ли точен AI для медицинских диетических требований?

Для медицинских состояний, требующих точного контроля питания (например, болезни почек с конкретными ограничениями по калиям), AI сканирование само по себе не достаточно точно. Используйте AI сканирование как отправную точку, затем проверяйте критические питательные вещества по проверенной базе данных и корректируйте количества, используя измеренные порции. Всегда следуйте рекомендациям вашего врача для управления медицинским питанием.

Почему одно и то же блюдо иногда получает разные оценки калорий?

Вариации между сканированиями могут происходить из-за различий в угле фото, освещении, расположении тарелки и вероятностном процессе классификации AI. Если вы замечаете значительные вариации, это обычно указывает на то, что AI менее уверен в своей идентификации. В таких случаях проверьте выбор по базе данных и скорректируйте, если это необходимо. Использование сканирования штрих-кода или голосового ввода для часто употребляемых блюд дает более последовательные результаты.

Как точность AI в распознавании пищи улучшится в будущем?

Технология улучшается за счет трех механизмов: больших обучающих наборов данных (больше изображений пищи из разнообразных кухонь), улучшенной оценки глубины с помощью камер телефонов (лучшая точность порций) и данных о коррекции пользователей, которые обучают модель на ее ошибках. База Nutrola из более чем 2 миллионов пользователей предоставляет данные для непрерывного улучшения. Прогнозы в отрасли предполагают, что распознавание пищи AI достигнет 95%+ точности для большинства типов блюд в течение следующих 2-3 лет.

Готовы трансформировать отслеживание питания?

Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!