Сравнение краудсорсинговых, проверенных и оцененных ИИ баз данных продуктов: точность, стоимость и компромиссы
Сравнительный анализ трех подходов к созданию баз данных продуктов для приложений отслеживания калорий: краудсорсинг, профессиональная проверка и оценка ИИ. Включает данные тестирования точности для 20 распространенных продуктов, анализ плюсов и минусов, а также рекомендации по методологии.
В индустрии отслеживания калорий используются три принципиально разных подхода к созданию баз данных продуктов: краудсорсинг от пользователей, профессиональная проверка на основе авторитетных источников и оценка ИИ на основе изображений продуктов. Это не просто незначительные вариации одного и того же. Это разные методологии, которые дают существенно разные результаты по точности, и выбор подхода является самым важным фактором, определяющим, насколько надежно число калорий на вашем экране.
В этой статье представлен прямой сравнительный анализ всех трех подходов с использованием данных о точности, анализа стоимости и структурированной оценки сильных и слабых сторон каждого метода.
Определение трех подходов
Краудсорсинговые базы данных
В модели краудсорсинга любой пользователь приложения может добавить запись о продукте, введя значения питательных веществ с упаковки, оценив их по памяти или скопировав данные с веб-сайта. Эти записи обычно становятся доступными всем пользователям сразу или после минимальной автоматической проверки. Контроль качества зависит от других пользователей, которые отмечают ошибки, и от модераторов, работающих на добровольной основе или с небольшой нагрузкой, которые проверяют отмеченные записи.
Основной пример: MyFitnessPal, который накопил более 14 миллионов записей благодаря открытым пользовательским вкладам.
Профессионально проверенные базы данных
Проверенные базы данных строятся на основе авторитетных источников (в первую очередь государственных баз данных о питании, таких как USDA FoodData Central) и дополняются записями, которые проходят проверку профессиональных диетологов или специалистов по продуктам питания. Каждая запись имеет документированное происхождение, а значения проверяются на соответствие известным диапазонам составов для данной категории продуктов.
Основной пример: Nutrola, которая сопоставляет данные из USDA FoodData Central с национальными базами данных о питании и применяет проверку диетологов к своим 1.8 миллиона записей. Cronometer, который курирует данные из USDA и NCCDB с профессиональным контролем, является еще одним примером.
Оцененные ИИ базы данных
Подходы, основанные на оценке ИИ, используют компьютерное зрение (сверточные нейронные сети, трансформеры) для идентификации продуктов по фотографиям и оценки размеров порций с помощью оценки глубины или масштабирования по эталонным объектам. Идентифицированные продукты и оцененные порции затем сопоставляются с эталонной базой данных для получения оценки калорийности.
Основной пример: Cal AI, который использует оценку на основе фотографий в качестве основного метода отслеживания.
Сравнение точности: 20 распространенных продуктов
Следующая таблица сравнивает точность трех подходов для 20 распространенных продуктов, используя лабораторно проанализированные значения из USDA FoodData Central в качестве эталона. Значения из краудсорсинговых баз данных представляют собой диапазон, найденный среди нескольких записей для одного и того же продукта в репрезентативной краудсорсинговой базе данных. Проверенные значения представляют собой единственную запись из проверенной базы данных, основанной на USDA. Значения, оцененные ИИ, представляют собой типичные диапазоны из опубликованных исследований оценки продуктов с помощью компьютерного зрения, включая данные из Thames et al. (2021) и Meyers et al. (2015).
| Продукт (100г) | Эталон USDA (ккал) | Диапазон краудсорсинга (ккал) | Ошибка краудсорсинга | Проверенное значение (ккал) | Ошибка проверки | Диапазон оценки ИИ (ккал) | Ошибка ИИ |
|---|---|---|---|---|---|---|---|
| Куриная грудка, жареная | 165 | 130–231 | -21% до +40% | 165 | 0% | 140–210 | -15% до +27% |
| Белый рис, вареный | 130 | 110–170 | -15% до +31% | 130 | 0% | 110–180 | -15% до +38% |
| Банан, сырой | 89 | 85–135 | -4% до +52% | 89 | 0% | 75–120 | -16% до +35% |
| Цельнозерновой хлеб | 247 | 220–280 | -11% до +13% | 247 | 0% | 200–300 | -19% до +21% |
| Чеддер | 403 | 380–440 | -6% до +9% | 403 | 0% | 350–480 | -13% до +19% |
| Лосось, вареный | 208 | 180–260 | -13% до +25% | 208 | 0% | 170–270 | -18% до +30% |
| Брокколи, сырое | 34 | 28–55 | -18% до +62% | 34 | 0% | 25–50 | -26% до +47% |
| Греческий йогурт, натуральный | 59 | 50–130 | -15% до +120% | 59 | 0% | 50–90 | -15% до +53% |
| Миндаль, сырой | 579 | 550–640 | -5% до +11% | 579 | 0% | 500–680 | -14% до +17% |
| Оливковое масло | 884 | 800–900 | -10% до +2% | 884 | 0% | N/A (жидкость) | N/A |
| Батат, запеченный | 90 | 80–120 | -11% до +33% | 90 | 0% | 75–130 | -17% до +44% |
| Говядина, 85% постная | 250 | 220–280 | -12% до +12% | 250 | 0% | 200–310 | -20% до +24% |
| Авокадо | 160 | 140–240 | -13% до +50% | 160 | 0% | 130–220 | -19% до +38% |
| Яйцо, целое, вареное | 155 | 140–185 | -10% до +19% | 155 | 0% | 130–200 | -16% до +29% |
| Овсянка, вареная | 71 | 55–130 | -23% до +83% | 71 | 0% | 60–110 | -15% до +55% |
| Яблоко, сырое | 52 | 47–72 | -10% до +38% | 52 | 0% | 40–75 | -23% до +44% |
| Паста, вареная | 131 | 110–200 | -16% до +53% | 131 | 0% | 100–180 | -24% до +37% |
| Тофу, твердый | 144 | 70–176 | -51% до +22% | 144 | 0% | 100–190 | -31% до +32% |
| Коричневый рис, вареный | 123 | 110–160 | -11% до +30% | 123 | 0% | 100–170 | -19% до +38% |
| Арахисовое масло | 588 | 560–640 | -5% до +9% | 588 | 0% | N/A (паста) | N/A |
Ключевые наблюдения из таблицы:
Диапазон краудсорсинга шире всего для продуктов, которые имеют множество разновидностей (греческий йогурт, овсянка, тофу), поскольку пользователи часто путают разные способы приготовления, процент жира или размеры порций. Проверенная база данных дает значения, идентичные эталону USDA, потому что она напрямую ссылается на этот источник. Оценка ИИ показывает постоянную изменчивость, вызванную в первую очередь ошибками в оценке размера порции, а не в идентификации продуктов.
Комплексный анализ плюсов и минусов
Краудсорсинговые базы данных
| Аспект | Оценка |
|---|---|
| Широта охвата | Отличная — миллионы записей, включая региональные, ресторанные и брендовые продукты |
| Скорость добавления новых данных | Очень быстрая — новые продукты становятся доступными в течение нескольких часов после подачи пользователем |
| Точность макронутриентов | Плохая до умеренной — средние ошибки составляют 15-30% (Tosi et al., 2022) |
| Точность микронутриентов | Плохая — большинство краудсорсинговых записей не содержат данных о микронутриентах |
| Управление дубликатами | Плохое — обширные дубликаты с противоречивыми значениями |
| Происхождение данных | Отсутствует — источник значений не документирован |
| Стоимость создания | Почти нулевая — пользователи вносят данные бесплатно |
| Стоимость обслуживания | Низкая — сообщество само модерирует с минимальным профессиональным контролем |
| Подходящесть для исследований | Ограниченная — Evenepoel et al. (2020) отметили проблемы с точностью для использования в исследованиях |
Профессионально проверенные базы данных
| Аспект | Оценка |
|---|---|
| Широта охвата | Хорошая — 1-2 миллиона записей, охватывающих распространенные и брендовые продукты |
| Скорость добавления новых данных | Умеренная — проверка добавляет время в процесс |
| Точность макронутриентов | Высокая — в пределах 5-10% от лабораторных значений |
| Точность микронутриентов | Высокая — записи, основанные на USDA, включают более 80 питательных веществ |
| Управление дубликатами | Отличное — одна каноническая запись на продукт |
| Происхождение данных | Полное — источник документирован и проверяем |
| Стоимость создания | Высокая — требует труда профессиональных диетологов |
| Стоимость обслуживания | Умеренная — постоянная проверка новых записей и обновлений |
| Подходящесть для исследований | Высокая — методология соответствует инструментам для исследований |
Оцененные ИИ базы данных
| Аспект | Оценка |
|---|---|
| Широта охвата | Теоретически неограниченная — может оценивать любые сфотографированные продукты |
| Скорость добавления новых данных | Мгновенная — не требуется запись в базу данных |
| Точность макронутриентов | Плохая до умеренной — совокупная ошибка от идентификации + оценки порции |
| Точность микронутриентов | Очень плохая — ИИ не может оценить микронутриенты по внешнему виду |
| Управление дубликатами | Не применимо — оценки генерируются для каждой фотографии |
| Происхождение данных | Алгоритмическое — веса модели, данные не отслеживаются |
| Стоимость создания | Высокая первоначальная (обучение модели), почти нулевая предельная |
| Стоимость обслуживания | Умеренная — требуется периодическое переобучение модели |
| Подходящесть для исследований | Ограниченная — Thames et al. (2021) зафиксировали значительные вариации в оценках |
Гибридные подходы: лучшее из обоих миров
Некоторые приложения комбинируют несколько подходов, чтобы смягчить слабости каждого отдельного метода.
Логирование ИИ + проверенная база данных (подход Nutrola). Nutrola использует распознавание продуктов по фотографиям и голосовое логирование в качестве удобного слоя для идентификации продуктов, затем сопоставляет идентифицированные продукты с профессионально проверенной базой данных из 1.8 миллиона записей. Эта комбинация сохраняет скорость и удобство логирования ИИ, обеспечивая при этом, чтобы данные о питательных веществах за каждым идентифицированным продуктом были сопоставлены с USDA FoodData Central и проверены диетологами. Пользователь получает выгоду от удобства ИИ и точности проверенных данных.
Краудсорсинговая база данных + алгоритмическая корректировка (подход MacroFactor). MacroFactor использует кураторскую базу данных, дополненную пользовательскими данными, но применяет алгоритм, который корректирует цели по калориям на основе фактических тенденций веса с течением времени. Это частично компенсирует ошибки отдельных записей базы данных, используя тело пользователя в качестве окончательного эталона.
Кураторская база данных + маркировка источников (подход Cronometer). Cronometer маркирует каждую запись о продукте ее источником данных (USDA, NCCDB или производитель), позволяя знающим пользователям предпочитать записи из самых авторитетных источников.
Как ошибки накапливаются в ежедневном отслеживании
Практическое влияние подхода к базе данных становится очевидным, когда ошибки накапливаются за полный день отслеживания.
Представьте пользователя, который регистрирует 15 записей о продуктах в день (пять приемов пищи и закусок, каждая из которых содержит в среднем три продукта):
С краудсорсинговой базой данных (средняя ошибка ±20%):
- Каждая запись отклоняется от фактического значения в среднем на ±20%.
- При случайном распределении ошибок, ежедневная оценка может отклоняться от фактического потребления на 200-400 калорий при диете в 2000 калорий.
- За неделю накопленная ошибка может составить 1400-2800 калорий, что эквивалентно всему дефициту, необходимому для потери 0.5-1 фунта веса.
С проверенной базой данных (средняя ошибка ±5%):
- Каждая запись отклоняется от фактического значения в среднем на ±5%.
- Ежедневная оценка отклонения: примерно 50-100 калорий при диете в 2000 калорий.
- Недельная накопленная ошибка: 350-700 калорий, что управляемо в рамках типичных целевых дефицитов.
С оценкой ИИ (средняя ошибка ±25-35%):
- Совокупная ошибка от идентификации продуктов и оценки порции.
- Ежедневная оценка отклонения: 250-500+ калорий.
- Недельная накопленная ошибка: 1750-3500+ калорий.
Freedman et al. (2015), публикуя в American Journal of Epidemiology, продемонстрировали, что ошибки в базах данных о составе продуктов являются основным фактором, способствующим общей ошибке оценки рациона, часто превышая вклад ошибок в оценке размера порции. Это открытие прямо указывает на методологию базы данных как на самый значимый фактор в точности отслеживания.
Почему большинство приложений отдают предпочтение краудсорсингу
Несмотря на ограничения по точности, краудсорсинг доминирует в индустрии отслеживания калорий по простым экономическим причинам.
Нулевая предельная стоимость. Каждая запись, отправленная пользователем, ничего не стоит приложению. Проверенные записи стоят от 5 до 15 долларов за время профессиональной проверки. При большом объеме эта разница в стоимости становится огромной.
Быстрая охватность. Краудсорсинговая база данных может добавлять новые продукты в течение нескольких часов после их выхода на рынок. Проверенная база данных может занять дни или недели.
Восприятие полноты. Пользователи ассоциируют "большее количество записей" с "лучшим приложением". База данных из 14 миллионов записей выглядит более полной, чем база данных из 1.8 миллиона записей, даже если меньшая база более точна по каждой записи.
Сетевые эффекты. По мере того как все больше пользователей вносят записи, база данных кажется более полной, привлекая больше пользователей, которые вносят еще больше записей. Этот цикл вознаграждает масштабирование, а не точность.
В результате на рынке самые популярные приложения (MFP, FatSecret) используют наименее точную методологию, а самые точные приложения (Nutrola, Cronometer) имеют меньшие, но более надежные базы данных. Осведомленные пользователи, понимающие этот компромисс, постоянно выбирают точность вместо размера.
Будущее: сближение подходов
Различие между краудсорсинговыми, проверенными и оцененными ИИ базами данных может размываться по мере развития технологий.
Проверка с помощью ИИ. Модели машинного обучения могут быть обучены отмечать краудсорсинговые записи, которые отклоняются от ожидаемых диапазонов составов, автоматически выявляя вероятные ошибки для профессиональной проверки. Это может привести к точности уровня проверки для более крупных баз данных.
Компьютерное зрение с проверенной базой данных. Текущий подход Nutrola, использующий ИИ для идентификации продуктов в сочетании с проверенной базой данных для данных о питательных веществах, представляет собой текущую лучшую практику. По мере улучшения моделей распознавания продуктов эта гибридная модель станет все более бесшовной.
Автоматизированное перекрестное сопоставление. Процесс перекрестного сопоставления записей о продуктах с несколькими национальными базами данных может быть частично автоматизирован, что снизит стоимость многоисточниковой проверки, сохраняя при этом преимущества точности.
Эти тенденции предполагают, что будущее баз данных для отслеживания калорий будет заключаться в разумных комбинациях удобства ИИ и проверенной точности, а не в зависимости от какого-либо одного подхода.
Часто задаваемые вопросы
Какой подход к базе данных наиболее точен для отслеживания калорий?
Профессионально проверенные базы данных, основанные на данных, анализируемых государственными органами (USDA FoodData Central), являются наиболее точными, с типичными ошибками макронутриентов в пределах 5-10 процентов от лабораторных значений. Краудсорсинговые базы данных показывают ошибки в 15-30 процентов (Tosi et al., 2022), а оценка ИИ показывает совокупные ошибки в 20-40 процентов (Thames et al., 2021). Nutrola использует проверенную базу данных, основанную на USDA, с перекрестной проверкой диетологов.
Почему у MyFitnessPal так много дублирующих записей?
Открытая модель краудсорсинга MyFitnessPal позволяет любому пользователю добавлять записи без проверки на существующие дубликаты. Когда несколько пользователей каждый отправляют свою версию "куриной грудки, вареной", база данных накапливает множество записей для одного и того же продукта с разными значениями питательных веществ. Без систематического процесса удаления дубликатов эти дубликаты сохраняются и создают путаницу для пользователей, которым приходится выбирать между противоречивыми записями.
Может ли оценка калорий ИИ заменить отслеживание на основе базы данных?
На данный момент — нет. Оценка на основе фотографий ИИ вводит совокупные ошибки из-за неопределенности идентификации продуктов и неопределенности в оценке размера порции. Thames et al. (2021) сообщили об ошибках в оценке порции в 20-40 процентов. Тем не менее, логирование ИИ наиболее эффективно, когда используется как удобный метод ввода в сочетании с проверенной базой данных, что и является подходом Nutrola: ИИ идентифицирует продукт, а проверенная база данных предоставляет точные данные о питательных веществах.
Как Nutrola сочетает ИИ и проверенные данные?
Nutrola использует распознавание продуктов по фотографиям и голосовое логирование в качестве удобных функций для идентификации продуктов. Когда пользователь фотографирует блюдо или описывает его голосом, ИИ идентифицирует продукты. Эти идентифицированные продукты затем сопоставляются с базой данных Nutrola из 1.8 миллиона записей, проверенных диетологами, взятых из USDA FoodData Central и перекрестно проверенных с международными базами данных. Эта архитектура обеспечивает удобство ИИ без ущерба для точности базы данных.
Является ли меньшая проверенная база данных лучше, чем большая краудсорсинговая база данных?
Для точности отслеживания — да. Проверенная база данных из 1.8 миллиона записей с документированным происхождением и профессиональной проверкой будет давать более точные оценки калорий, чем краудсорсинговая база данных из 14 миллионов записей, содержащая обширные дубликаты и непроверенные записи. Точность каждой записи важнее общего количества записей. Если продукт присутствует в обеих базах данных, проверенная запись почти всегда будет более точной.
Готовы трансформировать отслеживание питания?
Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!