Является ли отслеживание калорий с помощью ИИ просто уловкой? Технология распознавания пищи

ИИ-сканирование пищи основано на реальной науке — но также имеет свои ограничения. Здесь мы честно рассмотрим, что может и чего не может сделать компьютерное зрение для отслеживания калорий, и почему база данных, стоящая за ИИ, важнее самого ИИ.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Распознавание пищи с помощью ИИ — это применение компьютерного зрения и глубокого обучения для идентификации продуктов на фотографиях и оценки их питательной ценности. Это звучит впечатляюще в маркетинговых материалах, и скептицизм вполне естественен: может ли камера телефона действительно сказать, сколько калорий на вашей тарелке? Это настоящая технология или просто эффектная функция, созданная для привлечения загрузок?

Честный ответ заключается в том, что распознавание пищи с помощью ИИ реально, полезно и несовершенно — одновременно. Давайте разберемся, что на самом деле делает эта технология, что говорят исследования о ее точности, где она терпит неудачи и чем отличается настоящее отслеживание на основе ИИ от уловок.

Как на самом деле работает распознавание пищи с помощью ИИ

Понимание технологии помогает отделить суть от шумихи. Современные системы распознавания пищи используют сверточные нейронные сети (CNN), обученные на миллионах изображений еды. Процесс проходит в три этапа:

Этап 1: Обнаружение пищи. ИИ определяет отдельные продукты на фотографии — отделяя курицу от риса и овощей на вашей тарелке.

Этап 2: Классификация пищи. Каждый идентифицированный элемент сопоставляется с обученной моделью категорий продуктов. Система определяет, что белый элемент — это рис, а не картофельное пюре или цветная капуста.

Этап 3: Оценка порции. Используя контрольные точки на изображении (размер тарелки, размер столового прибора, оценка глубины), система оценивает количество каждого продукта и рассчитывает питательные значения на основе соответствующей записи в базе данных.

Это не магия и не уловка. Это та же категория технологий, которая используется для анализа медицинских изображений, обнаружения объектов в автономных транспортных средствах и контроля качества в промышленности. Применение к пище новее и менее зрелое, чем в этих областях, но основа науки компьютерного зрения хорошо устоялась.

Что говорят исследования о точности?

Несколько рецензируемых исследований оценили точность распознавания пищи с помощью ИИ:

  • Mezgec и Korousic Seljak (2017) опубликовали обширный обзор в журнале Nutrients, показывающий, что системы распознавания пищи на основе глубокого обучения достигли точности top-1 от 79% до 93% на стандартных наборах изображений пищи, при этом точность варьировалась в зависимости от сложности пищи и качества изображения.
  • Liang и Li (2017) продемонстрировали в исследовании о распознавании пищи с помощью глубокого обучения, что современные архитектуры CNN достигли более 90% точности классификации на наборах данных с изображениями одиночных продуктов.
  • Thames и др. (2021) опубликовали исследование в IEEE Access, показывающее, что современные модели распознавания пищи могут идентифицировать продукты в сложных сценах блюд с точностью 80-90%, с наивысшей точностью для четко отделенных продуктов.
  • Lu и др. (2020) разработали модель оценки порции, опубликованную в IEEE Transactions on Multimedia, которая оценивает объем пищи с погрешностью 15-25% от фактических измерений, что является значительным улучшением по сравнению с оценкой, выполняемой без помощи.

Точность по сложности блюда

Тип блюда Точность распознавания ИИ Точность оценки порции Пример
Один продукт 90-95% В пределах 10-15% Яблоко, банан, кусок пиццы
Простое блюдо (2-3 продукта) 85-92% В пределах 15-20% Курица-гриль с рисом и брокколи
Сложное блюдо (4+ продукта) 80-88% В пределах 20-25% Жаркое с несколькими овощами и соусом
Смешанные блюда (ингредиенты смешаны) 70-85% В пределах 25-35% Запеканки, карри, густые супы
Упакованные продукты с этикетками 95%+ (штрих-код) Почти точно (соответствие базе данных) Любой продукт с штрих-кодом

Эти цифры реальны и задокументированы. У них также есть четкие ограничения, которые любое честное оценивание должно учитывать.

Где распознавание пищи с помощью ИИ терпит неудачи

Прозрачность в отношении ограничений — это то, что отличает настоящую технологию от уловок. Распознавание пищи с помощью ИИ сталкивается с определенными, предсказуемыми проблемами:

Скрытые ингредиенты. ИИ не может увидеть, что смешано в соусе, уложено в сэндвиче или растворено в супе. Соус на основе сливок выглядит похоже на масляный, но разница в калориях значительна.

Неоднозначность метода приготовления. Куриная грудка на гриле и куриная грудка, жареная на сковороде, могут выглядеть идентично на фотографии, но разница в калориях из-за впитанного масла может составлять 100-200 калорий.

Однородные смешанные блюда. Когда несколько ингредиентов смешиваются в одно блюдо — запеканки, смузи, густые рагу — ИИ не может визуально отделить компоненты, которые физически неразделимы.

Оценка глубины порции. Чаша супа может содержать 200 мл или 500 мл — ИИ видит только поверхность, но оценка глубины по одному изображению приводит к значительной ошибке.

Необычные или региональные продукты. Модели ИИ обучаются на наборах данных, которые склоняются к распространенной западной пище. Менее представленные кухни могут иметь более низкую точность распознавания.

Это реальные ограничения. Любой, кто утверждает 99% точности для распознавания пищи с помощью ИИ во всех сценариях, продает шумиху, а не технологию.

ИИ-один против ИИ + Проверенная база данных: Критическое различие

Здесь разговор становится действительно важным для всех, кто оценивает инструменты отслеживания калорий. Существует два принципиально разных подхода к распознаванию пищи с помощью ИИ на рынке:

Подход 1: ИИ-один (без проверки базы данных)

Некоторые приложения — включая Cal AI и SnapCalorie — полагаются в основном на оценку ИИ без обширной проверенной базы данных продуктов, стоящей за распознаванием. Когда ИИ идентифицирует "куриную грудку", он может генерировать оценку питательной ценности на основе своих обучающих данных, а не извлекать проверенные данные из курируемой базы данных.

Проблема: Когда ИИ ошибается — а он будет ошибаться в 5-30% случаев в зависимости от сложности блюда — нет сети безопасности. Пользователь получает неверную оценку без легкой возможности исправить ее на основе проверенных данных.

Подход 2: ИИ + Проверенная база данных (Подход Nutrola)

Nutrola решает проблему точности, используя распознавание пищи с помощью ИИ в качестве входного слоя и проверенную базу данных из 1,8 миллиона записей в качестве слоя данных. Когда ИИ идентифицирует "куриную грудку на гриле", он не генерирует оценку калорий на основе обучающих данных — он извлекает проверенный питательный профиль из записи базы данных, которая была проверена профессионалами в области питания.

Почему это важно: Когда классификация ИИ верна (85-95% случаев для простых блюд), пользователь получает проверенные данные о питательной ценности. Когда классификация ИИ неверна, пользователь может быстро найти правильный элемент в проверенной базе данных. ИИ снижает усилия; база данных обеспечивает точность.

Функция Приложения ИИ-один ИИ + Проверенная база данных (Nutrola)
Скорость регистрации Быстро (фото) Быстро (фото)
Источник данных для информации о питании Оценка, сгенерированная ИИ Проверенная база данных (1,8M+ записей)
Когда ИИ прав Разумная оценка Проверенные точные данные
Когда ИИ ошибается Нет надежного пути для исправления Полная проверенная база данных для ручного исправления
Охват питательных веществ Обычно только калории + макросы 100+ питательных веществ
Последовательность данных Варьируется между оценками Последовательные проверенные значения

Это различие является самым важным фактором при оценке того, является ли функция отслеживания калорий с помощью ИИ уловкой или настоящим улучшением по сравнению с ручным отслеживанием.

Является ли это уловкой? Рамки для оценки

Вместо однозначного "да" или "нет", вот как оценить, является ли конкретная реализация отслеживания пищи с помощью ИИ содержательной или уловкой:

Признаки уловки

  • Утверждения о точности 99%+ для всех типов пищи
  • Отсутствие резервного варианта в виде проверенной базы данных, когда ИИ ошибается
  • Оценки питательной ценности, полностью сгенерированные ИИ без курируемого источника данных
  • Отсутствие возможности редактировать или исправлять результаты ИИ
  • Маркетинг сосредоточен на "магии" ИИ, а не на точности результатов
  • Ограниченный охват питательных веществ (только калории, без макросов или микронутриентов)

Признаки настоящей технологии

  • Прозрачность в отношении диапазонов точности и ограничений
  • ИИ служит методом ввода, проверенная база данных предоставляет данные о питательной ценности
  • Пользователи могут легко исправлять неверные идентификации ИИ
  • Комплексный охват питательных веществ (макросы + микронутриенты)
  • Постоянное улучшение модели на основе данных исправлений
  • Несколько методов ввода (фото, голос, штрих-код, ручной поиск) для различных ситуаций

Как ИИ сравнивается с человеческой оценкой

Самый важный контекст для оценки точности ИИ — это не совершенство, а сравнение с альтернативой. А альтернативой для большинства людей является человеческая оценка, которая, как показывают исследования, оказывается удивительно плохой:

  • Lichtman и др. (1992) выяснили, что участники недооценивали свое потребление калорий в среднем на 47%, опубликовано в New England Journal of Medicine
  • Wansink и Chandon (2006) продемонстрировали, что ошибки в оценке размера порции увеличиваются с размером блюда и калорийной плотностью
  • Schoeller и др. (1990) показали с помощью метода двойной меченой воды, что самоотчет о потреблении систематически недооценивался на 20-50%
Метод оценки Средняя точность Тенденция
Человеческая оценка (необученная) 50-60% Систематическая недооценка
Человеческая оценка (обученная в области питания) 70-80% Умеренная недооценка
Распознавание пищи с помощью ИИ (простые блюда) 85-95% Случайная ошибка, без систематического смещения
ИИ + проверенная база данных (простые блюда) 90-95% Исправляемая случайная ошибка
Весы для пищи + проверенная база данных 95-99% Почти точное измерение

Распознавание пищи с помощью ИИ с точностью 85% и проверенной базой данных не идеально. Но оно значительно более точно, чем 50-60%, которые большинство людей достигает только с помощью оценки. Соответствующее сравнение не "ИИ против совершенства", а "ИИ против того, что я бы сделал без него".

Технология реальна, но реализация имеет значение

Распознавание пищи с помощью ИИ не является уловкой. Это законное применение компьютерного зрения, которое было подтверждено в рецензируемых исследованиях и внедрено в коммерческие продукты, используемые миллионами. Основная технология надежна.

Но не все реализации равны. Ценность распознавания пищи с помощью ИИ полностью зависит от того, что стоит за ним: качество базы данных, механизмы исправления, охват питательных веществ и честность в отношении ограничений.

Nutrola сочетает в себе распознавание фотографий с ИИ с проверенной базой данных из 1,8 миллиона записей, голосовым вводом на 15 языках, сканированием штрих-кодов и возможностью отслеживать более 100 питательных веществ. ИИ делает регистрацию быстрой. Проверенная база данных обеспечивает точность. Это сочетание решает законную проблему, что ИИ сам по себе недостаточно надежен, чтобы ему доверять.

С бесплатной пробной версией и €2.50 в месяц после — без рекламы — вы можете протестировать, соответствует ли технология своим обещаниям, не полагаясь на чье-либо слово.

Часто задаваемые вопросы

Как распознавание пищи с помощью ИИ сравнивается со сканированием штрих-кодов по точности?

Сканирование штрих-кодов более точно для упакованных продуктов, так как оно сопоставляет конкретный продукт с конкретной записью в базе данных. Распознавание пищи с помощью ИИ вводит оценку как для идентификации, так и для размера порции. Для упакованных продуктов всегда используйте сканирование штрих-кодов. Для приготовленных блюд, свежих продуктов и ресторанных блюд распознавание пищи по фотографии является самым практичным доступным методом ввода.

Может ли ИИ распознавать домашние блюда?

Да, с оговорками. ИИ может с высокой точностью идентифицировать видимые компоненты домашнего блюда (куриная грудка, приготовленная на пару брокколи, рис). Он испытывает трудности с скрытыми ингредиентами, такими как масла для приготовления, соусы, смешанные в блюдах, и приправы, которые добавляют калории без видимых признаков. Для домашней кухни фотографирование блюда и последующая корректировка на основе жиров для приготовления и скрытых ингредиентов дает наилучшие результаты.

Улучшается ли ИИ со временем?

Да. Современные системы распознавания пищи используют непрерывное обучение, при котором исправления пользователей улучшают точность модели для будущих распознаваний. ИИ Nutrola улучшается по мере того, как его база пользователей из более чем 2 миллионов человек предоставляет данные для исправления. Кроме того, проверенная база данных постоянно расширяется, улучшая уровень соответствия между распознаванием ИИ и записями базы данных.

Достаточно ли точен ИИ для серьезных фитнес-целей?

Для точности на уровне бодибилдинга (отслеживание с погрешностью в 50 калорий в день) распознавание пищи по фотографии с помощью ИИ недостаточно — весы для пищи с проверенной базой данных остаются золотым стандартом. Для общего фитнеса, потери веса и отслеживания здоровья (с погрешностью в 10-15%) распознавание пищи с помощью ИИ и проверенной базы данных более чем достаточно и значительно более устойчиво, чем взвешивание каждой еды.

Почему некоторые счетчики калорий с ИИ дают совершенно разные результаты для одной и той же фотографии?

Это показывает разницу между реализациями ИИ. Приложения, которые генерируют оценки питательной ценности на основе обучающих данных ИИ (а не извлекают из проверенной базы данных), будут варьироваться в зависимости от их обучающих данных и алгоритмов оценки. Приложения, которые используют ИИ для идентификации пищи, а затем извлекают данные из проверенной базы данных, будут давать более последовательные результаты, поскольку источник данных о питательной ценности стандартизирован.

Может ли ИИ распознавать продукты из разных кухонь?

Точность распознавания варьируется в зависимости от кухни в зависимости от представительности обучающих данных. Распространенные западные продукты обычно имеют наивысшую точность. Восточноазиатская, южноазиатская, ближневосточная и африканская кухни все чаще представлены в обучающих наборах данных, но могут иметь более низкую точность для менее распространенных блюд. Поддержка Nutrola для 15 языков и растущая база данных международных продуктов решает эту проблему, но это остается областью постоянного улучшения в отрасли.

Готовы трансформировать отслеживание питания?

Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!