Наскільки надійна оцінка порцій Cal AI? Аудит виміряної ваги та оцінки AI
Ми зважили 20 продуктів на кухонних вагах, сфотографували їх через Cal AI та порівняли оцінки порцій додатку з фактичними виміряними вагами. Ось наскільки точно та послідовно Cal AI оцінює порції.
Cal AI — це додаток для відстеження калорій на основі фотографій, який використовує комп'ютерне зір для оцінки порцій їжі та калорій з фотографій. Основна обіцянка додатку полягає в тому, що ви можете повністю обійтися без зважування та вимірювання їжі — просто сфотографуйте свою тарілку, а AI зробить усе інше. Це приваблива пропозиція, яка усуває найскладнішу частину відстеження калорій. Але вона залежить від вирішення фундаментальної проблеми комп'ютерного зору: оцінки тривимірного розміру та ваги об'єкта з двовимірного зображення.
Надійність оцінки порцій означає, що оцінена AI вага або об'єм близькі до фактично виміряної кількості. Це також означає послідовність — фотографуючи одну й ту ж їжу кілька разів, ви повинні отримувати однакову оцінку щоразу. Ми перевірили обидва аспекти, зваживши 20 продуктів на каліброваних кухонних вагах, сфотографувавши їх через Cal AI та порівнявши результати.
Основна проблема: 3D-оцінка з 2D-зображення
Перед тим як розглянути результати тестування, варто зрозуміти, чому ця проблема є вкрай складною. Фотографія зводить три виміри до двох. Інформація про глибину, висоту та об'єм частково втрачається. Купка рису заввишки 3 сантиметри виглядає ідентично на фото купці заввишки 2 сантиметри, якщо кут зйомки стискає різницю.
AI повинен виводити відсутню вимірювальну інформацію з контекстуальних підказок: розміру тарілки, тіні, що падає від їжі, відносних пропорцій відомих об'єктів у кадрі та зіставлення з навчальними даними. Кожен з цих етапів виведення вводить потенційну помилку. Дослідження, опубліковане в International Journal of Food Sciences and Nutrition (2021), показало, що навіть досвідчені дієтологи, оцінюючи порції з фотографій, досягали лише 50-70% точності, що свідчить про те, що візуальна оцінка порцій є вкрай неточною, незалежно від того, чи виконує її людина, чи AI.
Це не критика Cal AI зокрема. Це базовий виклик, з яким стикається будь-яка система оцінки порцій на основі фотографій. Питання в тому, наскільки велика помилка, яку ця фундаментальна обмеженість виробляє на практиці, і чи є ця помилка достатньо маленькою, щоб дані про калорії були корисними.
Методологія тестування: Виміряна вага проти оцінки Cal AI
Ми обрали 20 продуктів, що охоплюють шість категорій: однорідні предмети (передбачувана форма та розмір), неправильні тверді предмети (змінна форма), їжа в купках або гірках, рідини, їжа в контейнерах та багатокомпонентні страви на тарілці. Кожен продукт зважили на каліброваних кухонних вагах, точність яких становить 1 грам.
Кожен продукт потім розміщували на стандартній білий тарілці діаметром 26 сантиметрів (якщо не зазначено інше) та фотографували через Cal AI під кутом 45 градусів на відстані приблизно 30 сантиметрів. Ми зафіксували оцінену Cal AI розмір порції та кількість калорій, а потім обчислили відхилення від фактичних виміряних значень.
Точність оцінки порцій: Оцінка Cal AI проти фактичної ваги
Результати тестування на повну надійність
| Продукт | Фактична вага | Оцінка Cal AI | Відхилення ваги | Відхилення % | Фактичні калорії | Калорії Cal AI | Вплив на калорії |
|---|---|---|---|---|---|---|---|
| Скибка хліба | 38 г | 40 г | +2 г | +5.3% | 95 | 100 | +5 |
| Велике варене яйце | 50 г | 50 г | 0 г | 0.0% | 78 | 78 | 0 |
| Протеїновий батончик (без упаковки) | 60 г | 55 г | -5 г | -8.3% | 210 | 193 | -17 |
| Грильована куряча грудинка | 174 г | 140 г | -34 г | -19.5% | 287 | 231 | -56 |
| Грильований стейк | 225 г | 175 г | -50 г | -22.2% | 573 | 446 | -127 |
| Запечений філе лосося | 168 г | 145 г | -23 г | -13.7% | 349 | 302 | -47 |
| Варений білий рис | 210 г | 180 г | -30 г | -14.3% | 232 | 199 | -33 |
| Варена паста | 240 г | 195 г | -45 г | -18.8% | 374 | 304 | -70 |
| Пюре з картоплі | 200 г | 160 г | -40 г | -20.0% | 224 | 179 | -45 |
| Салат з зелені | 120 г | 95 г | -25 г | -20.8% | 19 | 15 | -4 |
| Апельсиновий сік у склянці | 250 мл | 200 мл | -50 мл | -20.0% | 112 | 90 | -22 |
| Кава з молоком у чашці | 350 мл | 250 мл | -100 мл | -28.6% | 58 | 41 | -17 |
| Суп у мисці | 400 мл | 300 мл | -100 мл | -25.0% | 160 | 120 | -40 |
| Мигдаль у маленькій мисці | 35 г | 28 г | -7 г | -20.0% | 204 | 163 | -41 |
| Суміш горіхів у мисці | 55 г | 42 г | -13 г | -23.6% | 264 | 201 | -63 |
| Йогурт у контейнері | 170 г | 150 г | -20 г | -11.8% | 100 | 88 | -12 |
| Яблуко, ціле | 182 г | 170 г | -12 г | -6.6% | 95 | 89 | -6 |
| Половина авокадо | 68 г | 75 г | +7 г | +10.3% | 109 | 120 | +11 |
| Арахісове масло на тості | 18 г (тільки АМ) | 12 г | -6 г | -33.3% | 105 | 70 | -35 |
| Тарілка з куркою + рисом + броколі | 440 г всього | 365 г всього | -75 г | -17.0% | 542 | 450 | -92 |
Статистика підсумків:
- Середнє абсолютне відхилення: 16.9%
- Медіанне відхилення: 19.2%
- Упередженість недооцінки: 18 з 20 продуктів були недооцінені
- Середній вплив на калорії: 37 калорій на продукт
- Продукти в межах 10% точності: 5 з 20 (25%)
- Продукти з >20% відхиленням: 8 з 20 (40%)
Результати виявляють чіткий і послідовний шаблон. Cal AI недооцінив порції в 18 з 20 протестованих продуктів. Середнє відхилення становило 16.9%, але це середнє приховує серйозність для конкретних категорій. Неправильні м'ясні продукти (куряча грудинка, стейк) показали недооцінку 19-22%. Їжа в купках (рис, паста, пюре) показала недооцінку 14-20%. Рідини показали недооцінку 20-29%.
Де оцінка порцій є надійною
Оцінки Cal AI були найточнішими для продуктів з однорідними, передбачуваними формами та стандартизованими розмірами.
Однорідні предмети
Скибка хліба, варене яйце та яблуко всі знаходяться в межах 5-10% від фактичної ваги. Ці продукти мають постійні форми, які добре захоплюються навчальними даними AI. Скибка хліба має приблизно однакову товщину та розміри незалежно від бренду. Велике яйце — це велике яйце. Навчальні дані AI містять тисячі зображень цих предметів, а їх передбачувана геометрія робить оцінку глибини менш критичною.
Стандартизовані упаковані продукти
Протеїновий батончик, незважаючи на те, що він без упаковки, був оцінений в межах 8.3% від фактичної ваги. Його прямокутна форма та стандартизовані розміри роблять його візуально передбачуваним. Продукти з регулярними геометричними формами постійно перевершували неправильні продукти в нашому тестуванні.
Спільним фактором є те, що ці продукти мають низьку варіативність форми. Коли ви бачили одну скибку хліба, ви, по суті, бачили їх усі. AI може покладатися на запам'ятовані типові розміри, а не виводити розміри з контекстуальних підказок.
Де оцінка порцій є ненадійною
Неправильні форми: Проблема зі стейком та куркою
Грильований стейк був недооцінений на 22.2%, що призвело до помилки в 127 калорій для одного продукту. Куряча грудинка була недооцінена на 19.5%, що призвело до помилки в 56 калорій. Це одні з найбільш поширених продуктів, які реєструють люди, що відстежують споживання білка.
Неправильні форми є складними, оскільки товщина варіюється по всій їжі. Куряча грудинка звужується від товстого центру до тонких країв. З верхнього або кутового зображення AI захоплює площу поверхні, але недооцінює товщину в центрі. Результат — систематичне недообліку, що впливає на калорійні білки — саме ті продукти, для яких точність має найбільше значення для відстеження макроелементів.
Їжа в купках і гірках: Рис, паста та картопля
Варений рис, паста та пюре з картоплі були недооцінені на 14-20%. Ці продукти накопичуються з значною висотою, яку 2D-фотографія стискає. Порція рису на тарілці може бути 4 сантиметри заввишки на вершині, але фотографія, зроблена під кутом 45 градусів, сплющує це до того, що виглядає як набагато тонший шар.
База даних USDA FoodData Central вказує, що варений білий рис має 130 калорій на чашку (186 г). Недооцінка на 14.3% для порції в 210 грамів переводиться в 33 відсутні калорії — а більшість людей їдять рис як один з компонентів більшої страви. Помилки накопичуються для кожної їжі в купках на тарілці.
Рідини: Проблема невидимого об'єму
Рідини були найменш надійно оціненою категорією, з відхиленнями 20-29%. Склянка апельсинового соку була недооцінена на 20%. Кава з молоком у чашці була недооцінена на 28.6%. Суп у мисці був недооцінений на 25%.
Проблема проста: AI може бачити поверхню рідини, але не може визначити глибину контейнера. Широка, плоска миска та вузька, глибока миска можуть мати однакові поверхні на фотографії, але містити зовсім різні об'єми. Без знання розмірів контейнера оцінка об'єму AI є, по суті, здогадкою.
Проблема кута: Одна їжа, різні оцінки
Окрім тесту точності для кожного продукту, ми дослідили, чи Cal AI виробляє послідовні оцінки, коли одна й та ж їжа фотографується з різних кутів.
Тест на послідовність кута: Грильована куряча грудинка (174 г фактична)
| Кут фотографії | Оцінка Cal AI | Відхилення від фактичного |
|---|---|---|
| 45 градусів (стандартний) | 140 г | -19.5% |
| Прямо зверху (90 градусів) | 155 г | -10.9% |
| Низький кут (20 градусів) | 125 г | -28.2% |
| Боковий кут (10 градусів) | 110 г | -36.8% |
Одна й та ж куряча грудинка вагою 174 грами дала оцінки від 110 до 155 грамів в залежності від кута зйомки — розкид у 45 грамів. Найбільш точний результат було отримано з верхнього кута, оскільки він захоплює всю площу поверхні, але навіть це було помилковим майже на 11%. Низький і боковий кути значно недооцінювали порцію, оскільки висота та глибина їжі ставали все більш стиснутими.
Це означає, що кількість калорій, яку отримує користувач, частково залежить від того, як він тримає телефон, а не лише від того, що він їсть. Користувач, який звик фотографувати їжу з низького кута, постійно недообліковує калорії в порівнянні з користувачем, який фотографує зверху.
Ілюзія розміру тарілки: Одна порція, різні тарілки
Ми перевірили, чи впливає розмір тарілки на оцінку порції Cal AI, розмістивши 200 грамів вареної пасти на трьох різних тарілках.
Тест на розмір тарілки: 200 г вареної пасти
| Діаметр тарілки | Оцінка Cal AI | Відхилення |
|---|---|---|
| 20 см (мала тарілка) | 225 г | +12.5% |
| 26 см (стандартна тарілка) | 195 г | -2.5% |
| 32 см (велика тарілка) | 155 г | -22.5% |
Ті ж 200 грамів пасти були оцінені в 225 грамів на маленькій тарілці та 155 грамів на великій тарілці — різниця в 70 грамів лише на основі розміру тарілки. Це ілюзія Дельбефа, добре задокументоване спотворення сприйняття, коли об'єкти виглядають більшими, коли оточені маленькою рамкою, і меншими, коли оточені великою рамкою. AI навчився цього самого спотворення з навчальних даних, які складаються з фотографій їжі, де розмір тарілки корелює з сприйнятим розміром порції.
Для користувачів, які їдять з великих ресторанних тарілок або сервісних мисок, це означає, що Cal AI систематично недооцінює їх порції. Для користувачів, які їдять з маленьких десертних тарілок, додаток буде переоцінювати. Жодна з груп не отримує точного підрахунку того, що вони насправді спожили.
Тест на послідовність: Одна їжа, п'ять фотографій
Ми сфотографували одну порцію грильованої курячої грудинки з рисом і броколі (542 фактичні калорії) п'ять разів поспіль, лише трохи змінюючи кут телефону кожного разу.
Тест на послідовність п'яти фотографій
| Номер фото | Загальна кількість калорій Cal AI | Відхилення від фактичного |
|---|---|---|
| 1 | 450 | -17.0% |
| 2 | 478 | -11.8% |
| 3 | 435 | -19.7% |
| 4 | 462 | -14.8% |
| 5 | 448 | -17.3% |
П'ять фотографій однієї й тієї ж страви дали п'ять різних оцінок калорій, що варіювалися від 435 до 478 — розкид у 43 калорії. Середнє становило 455 калорій, недооцінюючи фактичні 542 калорії на 16.1%. Жодна фотографія не дала результату в межах 10% від фактичного вмісту калорій.
Цей тест демонструє одночасно проблеми точності та послідовності. Оцінки постійно занадто низькі (помилка точності), і вони варіюються між фотографіями ідентичної їжі (помилка послідовності). Користувач, який реєструє цю страву, отримує різне число залежно від того, яку з п'яти фотографій він зробив.
Як щоденні помилки накопичуються
Індивідуальні помилки для кожного продукту в нашому тестуванні в середньому становлять 37 калорій. Це може здаватися незначним, поки ви не врахуєте, що типовий день включає реєстрацію 10-15 окремих продуктів протягом трьох прийомів їжі та перекусів.
Сценарій щоденного накопичення
| Прийом їжі | Зареєстровані продукти | Фактичні калорії | Загальна кількість Cal AI | Кумулятивна помилка |
|---|---|---|---|---|
| Сніданок (вівсянка, банан, арахісове масло) | 3 предмети | 445 | 385 | -60 |
| Обід (курка, рис, овочі) | 3 предмети | 542 | 450 | -92 |
| Перекус (мигдаль, йогурт) | 2 предмети | 304 | 251 | -53 |
| Вечеря (стейк, пюре з картоплі, салат) | 3 предмети | 816 | 640 | -176 |
| Щоденна загальна | 11 предметів | 2,107 | 1,726 | -381 |
Недооблік у 381 калорію за день. Це 18.1% від загального споживання — дефіцит, якого не існує. Користувач, який планує щоденний дефіцит у 500 калорій для схуднення, насправді має дефіцит у 119 калорій після врахування упередженості недооцінки Cal AI. При такій швидкості заплановане зниження ваги на 1 фунт на тиждень стає 0.24 фунта на тиждень. Місяць дисциплінованого відстеження дає результати, які очікуються за тиждень, і користувач не має змоги зрозуміти чому.
Дослідження, опубліковане в American Journal of Clinical Nutrition, постійно показувало, що недооблік споживання їжі є найпоширенішим напрямком помилки в оцінці дієти, а системи AI, навчальні на основі даних, позначених людьми, успадковують цю упередженість.
Як Nutrola вирішує проблему оцінки порцій інакше
Підхід Nutrola до проблеми оцінки порцій полягає в тому, щоб розглядати фото AI як відправну точку, а не остаточну відповідь. Фото-розпізнавання додатку ідентифікує продукти та зіставляє їх з перевіреною дієтологами базою даних з понад 1.8 мільйона записів, встановлюючи точні значення калорій на грам. Але замість того, щоб покладатися лише на AI для оцінки розміру порції, Nutrola надає шар голосового коригування.
Після фотографування вашої страви ви можете сказати: "насправді це було близько 200 грамів курки" або "рису було близько однієї чашки." Запис оновлюється миттєво на основі перевірених даних про харчування на грам. Це займає секунди — швидше, ніж ручний пошук — і вирішує фундаментальне обмеження, що жоден AI не може точно оцінити 3D-об'єм з 2D-зображення.
Перевірена база даних є критично важливим відмінником. Навіть коли оцінка порцій є ідеальною, кількість калорій є настільки ж надійною, як і харчування, на яке вона посилається. База даних Nutrola містить один перевірений запис на продукт, отриманий з даних, верифікованих дієтологами, без дублікатів, створених користувачами, або суперечливих записів. Поєднання фото-ідентифікації, голосового коригування порцій та перевірених даних створює записи калорій, які відображають те, що ви насправді з'їли, а не те, що AI вгадав з фотографії.
Nutrola також включає сканування штрих-кодів для упакованих продуктів та імпорт рецептів для домашніх страв, забезпечуючи постійну якість даних для кожного методу реєстрації. Доступний на iOS та Android за €2.50 на місяць без реклами в будь-якому плані, Nutrola розроблений на принципі, що швидкість та точність не є взаємовиключними.
Часто задавані питання
Наскільки точний Cal AI для підрахунку калорій?
У нашому тестуванні 20 продуктів оцінки порцій Cal AI відхилилися від фактичних виміряних ваг в середньому на 16.9%. Це призвело до середньої помилки калорій у 37 калорій на окремий продукт. Лише 25% продуктів (5 з 20) були оцінені в межах 10% точності. Додаток показав сильну упередженість недооцінки, недообліковуючи порції для 18 з 20 протестованих продуктів. Для повного дня споживання ці індивідуальні помилки накопичилися до недообліку в 381 калорію в нашому тестовому сценарії.
Чому Cal AI дає різні калорії для однієї й тієї ж страви?
Оцінки Cal AI змінюються в залежності від кута фотографії, освітлення та кадрування, оскільки він виводить розмір порції в 3D з 2D-зображення. У нашому тесті на послідовність п'ять фотографій однієї й тієї ж страви дали оцінки калорій, що варіювалися від 435 до 478 — розкид у 43 калорії. Кут камери має найбільший вплив: наш тест кута показав, що одна куряча грудинка була оцінена в 110 грамів з бокового кута та 155 грамів з прямого зверху.
Чи є Cal AI більш точним для деяких продуктів, ніж для інших?
Так. Cal AI є найточнішим для продуктів з однорідними, передбачуваними формами: скибка хліба (5.3% відхилення), варені яйця (0% відхилення) та цілі фрукти (6.6% відхилення). Найменш точний для неправильної форми м'ясних продуктів (19-22% відхилення), їжі в купках, як рис і паста (14-20% відхилення), та рідин (20-29% відхилення). Якщо ваш раціон складається переважно з простих, однорідних продуктів, додаток буде більш надійним, ніж якщо ви їсте складні, багатокомпонентні страви.
Чи впливає розмір тарілки на оцінку калорій Cal AI?
Так. У нашому тесті на розмір тарілки 200 грамів пасти була оцінена в 225 грамів на маленькій тарілці та 155 грамів на великій тарілці — різниця в 70 грамів для ідентичної порції. Це викликано ілюзією Дельбефа, коли оточуючий контекст змінює сприйнятий розмір об'єкта. Користувачі, які їдять з великих тарілок або ресторанних страв, постійно бачать недооцінені порції.
Чи можу я використовувати Cal AI для схуднення?
Cal AI може надати приблизну свідомість про калорії, але його систематична упередженість недооцінки робить його проблематичним для точного дефіциту для схуднення. У нашому щоденному сценарії запланований дефіцит у 500 калорій зменшився до ефективного дефіциту в 119 калорій після врахування недооцінки Cal AI — зменшення на 76% запланованого дефіциту. Для більш надійних результатів поєднуйте фото-реєстрацію з фактичним зважуванням їжі або використовуйте додаток, як Nutrola, який поєднує фото AI з голосовим коригуванням порцій та перевіреною базою даних харчування.
Готові трансформувати своє відстеження харчування?
Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!