База даних MyFitnessPal переповнена неправильними записами — чому це важливо більше, ніж ви думаєте
База даних MyFitnessPal, що формується на основі внесків користувачів, містить тисячі неточних записів. Дізнайтеся, як неправильні дані про калорії накопичуються протягом днів і тижнів, чому цю проблему не можна повністю вирішити, і які альтернативи використовують перевірені дані.
Якщо ви введете "куряча грудинка" у MyFitnessPal, ви знайдете щонайменше десяток записів з різними значеннями калорій. Один з них вказує на 165 калорій на порцію. Інший — 128. Третій — 231. Четвертий — 187, але вказує розмір порції як "1 шматок", не уточнюючи вагу. Ви обираєте один, записуєте його і йдете далі, вважаючи, що це число достатньо близьке до істини. Але чи так це насправді?
Відповідно до досліджень про бази даних продуктів, що формуються на основі внесків користувачів, відповідь може бути негативною. І різниця між тим, що ви думаєте, що їсте, і тим, що ви насправді споживаєте, може бути настільки великою, що повністю зруйнує ваші цілі в харчуванні.
Наскільки серйозна проблема бази даних MyFitnessPal?
Як виглядає пошук звичайних продуктів?
Ось що може повернути реальний пошук звичайних продуктів у MFP. Це реальні приклади різниці, з якою користувачі стикаються щодня.
| Пошук продукту | Запис 1 (кал) | Запис 2 (кал) | Запис 3 (кал) | Запис 4 (кал) | Запис 5 (кал) | Фактичне (USDA) |
|---|---|---|---|---|---|---|
| Банан (середній) | 89 | 105 | 121 | 72 | 110 | 105 |
| Куряча грудинка (100г, приготована) | 165 | 128 | 231 | 187 | 196 | 165 |
| Коричневий рис (1 чашка, приготований) | 216 | 248 | 180 | 232 | 195 | 216 |
| Авокадо (ціле) | 234 | 322 | 160 | 280 | 250 | 240 |
| Оливкова олія (1 ст. ложка) | 119 | 100 | 130 | 90 | 140 | 119 |
| Грецький йогурт, натуральний (170г) | 100 | 130 | 89 | 150 | 95 | 100 |
Для деяких записів різниця становить 50-100 калорій для одного продукту. Коли ви записуєте 15-20 продуктів на день, ці помилки не скасовуються — вони накопичуються.
Чому так багато неправильних записів?
MyFitnessPal використовує модель бази даних, що формується на основі внесків користувачів. Це означає, що будь-який користувач може подати запис про продукт, і ці записи доступні для всіх інших користувачів. База даних зросла до понад 14 мільйонів продуктів, що звучить вражаюче, поки ви не усвідомите, що значна частина цих записів є дублікатами з суперечливими даними, записами з неправильними значеннями калорій або макронутрієнтів, записами з неоднозначними розмірами порцій ("1 порція", "1 шматок", "1 чаша"), застарілими записами для продуктів, які були реформульовані, та записами з різних країн, що використовують різні стандарти вимірювання.
Немає жодного дієтолога, який би перевіряв кожен внесок. Немає автоматизованої системи, яка надійно виявляє помилки. База даних постійно зростає, але її точність не покращується з такою ж швидкістю.
Як неправильні записи накопичуються з часом?
Що таке "калійний дрейф"?
Калійний дрейф — це кумулятивний ефект невеликих помилок у базі даних, які накопичуються через кілька днів і тижнів. Кожна окрема помилка може здаватися незначною — 20 калорій тут, 30 калорій там. Але вони накопичуються таким чином, що можуть повністю підривати ваше відстеження.
Ось реалістичний приклад того, як працює калійний дрейф протягом одного дня.
Приклад щоденного калійного дрейфу
| Прийом їжі | Продукт | Використаний запис MFP | Фактичні калорії | Помилка |
|---|---|---|---|---|
| Сніданок | 2 яйця | 140 | 156 | -16 |
| Сніданок | Тост з маслом | 160 | 195 | -35 |
| Сніданок | Кава з молоком | 30 | 45 | -15 |
| Обід | Курячий салат | 350 | 420 | -70 |
| Обід | Заправка (2 ст. ложки) | 80 | 130 | -50 |
| Перекус | Яблуко | 72 | 95 | -23 |
| Перекус | Арахісове масло (1 ст. ложка) | 90 | 96 | -6 |
| Вечеря | Паста з соусом | 480 | 560 | -80 |
| Вечеря | Пармезан (щіпка) | 20 | 42 | -22 |
| Всього за день | 1,422 | 1,739 | -317 |
У цьому прикладі MFP зафіксував 1,422 калорії, тоді як фактичне споживання становило 1,739 калорій — різниця в 317 калорій, або близько 18%. Користувач вважає, що він у значному дефіциті калорій. Але це не так.
Як це накопичується за тиждень і місяць?
| Період часу | Записані калорії | Фактичні калорії | Кумулятивна помилка |
|---|---|---|---|
| 1 день | 1,422 | 1,739 | 317 калорій |
| 1 тиждень | 9,954 | 12,173 | 2,219 калорій |
| 1 місяць (30 днів) | 42,660 | 52,170 | 9,510 калорій |
Протягом місяця кумулятивна помилка в 9,510 калорій еквівалентна приблизно 1.2 кг (2.7 фунтів) жирової маси, яку потрібно було б втратити, але не було. Це цілком пояснює, чому хтось, хто "ідеально" відстежує в MFP, не бачить результатів на вагах.
Прикро, що користувач робить все правильно. Він записує кожен прийом їжі. Сканує штрих-коди. Вимірює порції. Проблема не в їхній дисципліні — це проблема джерела даних.
Чому база даних, що формується на основі внесків користувачів, ніколи не може бути повністю виправлена?
Чи можливо очистити 14 мільйонів записів?
Теоретично — так. Практично — ні. Ось чому.
Масштаб. З понад 14 мільйонами продуктів, ручна перевірка та виправлення кожного з них вимагала б тисяч годин роботи дієтологів. Навіть при темпі одного запису за хвилину, перевірка всієї бази даних займе приблизно 27 років роботи на повну ставку.
Безперервне забруднення. Поки записи перевіряються і виправляються, нові неправильні записи щодня подаються користувачами. База даних є живою системою, яка накопичує помилки швидше, ніж їх можна виправити.
Регіональні відмінності. "Куряча грудинка" в США має різні харчові значення, ніж "куряча грудинка" в Німеччині чи Японії через різницю в методах вирощування, кормах та породах. Один "правильний" запис не може представляти всі версії продукту.
Реформулювання продуктів. Виробники упакованих продуктів регулярно змінюють свої рецепти, розміри порцій і харчові етикетки. Записи, створені користувачами в 2019 році, можуть бути неправильними для версії 2026 року того ж продукту, і жодна автоматизована система надійно не виявляє ці зміни.
Відсутність відповідальності. Коли будь-який анонімний користувач може подати запис, немає відповідальності за точність. Користувач може подати "піца — 200 калорій", тому що так він хоче, а не тому, що це насправді.
Що з перевіреними записами MFP?
У MFP є деякі перевірені записи, і вони розширили цю програму з часом. Однак перевірені записи становлять невелику частку від загальної бази даних. Користувачі постійно стикаються з неперевіреними записами, і додаток не завжди чітко розрізняє між перевіреними та поданими користувачами даними. Програма перевірки також вимагає підписки Premium для пріоритетного відображення в результатах пошуку.
Як працюють перевірені бази даних?
Що робить базу даних продуктів "перевіреною"?
Перевірена база даних продуктів має принципово інший підхід до формування даних, ніж краудсорсинг. Замість того, щоб дозволяти будь-якому користувачеві подавати записи, перевірені бази даних мають професійних дієтологів, які перевіряють кожен запис перед його публікацією.
Це означає меншу базу даних, але більш точну. Замість 14 мільйонів записів з непередбачуваною точністю ви отримуєте кураторську базу даних, де кожен запис відповідає професійному стандарту.
Підходи перевірених баз даних
| Підхід | Використовується | Як це працює | Рівень точності |
|---|---|---|---|
| 100% перевірено дієтологами | Nutrola | Кожен запис перевіряється професіоналами з харчування перед публікацією | Найвищий — професійний стандарт |
| Державна база даних (USDA/NCCDB) | Cronometer | Використовує дані, протестовані в лабораторіях державних установ | Дуже високий — протестовано в лабораторії |
| Краудсорсинг з перевіреним підмножиною | MyFitnessPal | Багато записів, поданих користувачами, невелика перевірена підмножина для користувачів Premium | Змінний — залежить від вибраного запису |
| Краудсорсинг з модерацією спільноти | FatSecret, Lose It | Записи, подані користувачами, з можливістю спільноти позначати помилки | Середній — помилки виявляються нерегулярно |
Недоліком перевірених баз даних зазвичай є менша загальна кількість записів. Ви можете не знайти кожен незвичайний брендований продукт або регіональну їжу. Але записи, які ви знайдете, є точними, що має набагато більше значення для ваших результатів.
Як дізнатися, чи є ваші дані для відстеження надійними?
Які ознаки неточної інформації про продукти?
Є кілька червоних прапорців, які вказують на те, що база даних вашого трекера калорій надає вам погану інформацію.
Багато записів для одного й того ж продукту з різними значеннями калорій. Якщо ви шукаєте звичайний продукт і бачите більше 2-3 записів з істотно різними значеннями, база даних є краудсорсинговою і ненадійною для цього продукту.
Записи з нечіткими розмірами порцій. Розміри порцій, такі як "1 порція", "1 шматок" або "1 чаша" без ваги в грамах, майже безкорисні. "Чаша" рису може важити 150г або 400г.
Зупинка втрати ваги незважаючи на постійне відстеження. Якщо ваші записані калорії показують дефіцит, але вага не знижується після 3-4 тижнів, систематичні помилки в даних, ймовірно, є винуватцем.
Сканування штрих-кодів повертає неправильні продукти. Якщо сканування продукту повертає інший товар або явно неправильні дані про харчування, зв'язок між штрих-кодом і продуктом ненадійний.
Круглі числа скрізь. Реальні харчові дані містять непарні числа (165 калорій, 31г білка). Якщо ви бачите багато записів з підозріло круглими числами (200 калорій, 30г білка, 50г вуглеводів), ймовірно, вони були оцінені, а не отримані з реальних етикеток або лабораторних даних.
Що робити з цим?
Як перейти на більш точний трекер калорій?
Найбільш значущою зміною, яку ви можете зробити для покращення точності вашого відстеження, є перехід на трекер калорій з перевіреною базою даних.
Nutrola підтримує 100% перевірену базу даних продуктів, що означає, що кожен запис був перевірений професіоналом з харчування перед його публікацією. У поєднанні з AI-фото відстеженням (яке забезпечує другий пункт даних для оцінки порцій), голосовим введенням для швидкості та імпортом рецептів з соціальних мереж, це вирішує як проблему точності, так і проблему зручності введення. За €2.50/місяць без реклами на будь-якому рівні, це також значно дешевше, ніж MFP Premium. Доступно на iOS та Android.
Cronometer використовує дані, протестовані в лабораторіях USDA та NCCDB, які є дуже точними для цільних продуктів і звичайних інгредієнтів. Його безкоштовний рівень включає доступ до перевіреної бази даних. Для упакованих продуктів і товарів з брендами база даних менша, ніж у MFP, але надійніша.
Чи можна продовжувати використовувати MFP, але покращити точність?
Якщо ви віддаєте перевагу залишитися з MFP, ви можете покращити свою точність, завжди звіряючи записи MFP з базою даних USDA FoodData Central, обираючи записи, позначені як "перевірені", коли це можливо, уникаючи записів з нечіткими розмірами порцій, зважуючи їжу на кухонних вагах для забезпечення правильного введення порцій і створюючи власні користувацькі записи на основі даних з етикеток.
Цей підхід працює, але додає значний час до кожної сесії введення. Для більшості користувачів перехід на перевірену базу даних є більш практичним, ніж ручна перевірка кожного запису в краудсорсинговій базі.
Головний висновок
Проблема бази даних не є незначним незручністю. Це основа всього, що робить ваш трекер калорій. Кожен розрахунок — ваша щоденна сума, розподіл макронутрієнтів, середнє за тиждень, оцінка дефіциту — є настільки ж точним, як і окремі записи про продукти, з яких він складається.
Коли ці записи неправильні, кожен висновок, який ви робите на основі ваших даних, також є неправильним. І найпідступніша частина полягає в тому, що ви не можете це помітити. Додаток показує впевнені числа, які виглядають точними. Немає жодної зірочки, яка б вказувала: "це число може бути помилковим на 20%".
Ви заслуговуєте на інструмент для відстеження, де числа, які ви бачите, є числами, яким ви можете довіряти. Чи це база даних Nutrola, перевірена дієтологами, дані Cronometer з USDA, чи інше перевірене джерело, перехід від краудсорсингових здогадок є єдиною найбільш значущою зміною, яку ви можете зробити для покращення точності вашого відстеження.
Часті запитання
Наскільки неточна база даних продуктів MyFitnessPal?
Пошуки звичайних продуктів, таких як куряча грудинка, можуть повертати записи з різними значеннями — від 128 до 231 калорії на 100г порцію. При 15-20 записаних продуктах щодня ці помилки накопичуються — реалістичний щоденний дрейф може становити 200-300+ калорій, що може призвести до понад 9,000 калорій кумулятивної помилки за місяць, достатньо, щоб повністю зупинити втрату ваги.
Чому у MyFitnessPal так багато дублікатів записів з різними калоріями?
MFP використовує краудсорсингову модель, де будь-який користувач може подавати записи про продукти без професійної перевірки. З понад 14 мільйонами записів база даних накопичила величезну кількість дублікатів з суперечливими даними, неоднозначними розмірами порцій та застарілою інформацією про харчування від реформульованих продуктів.
Чи може краудсорсингова база даних MyFitnessPal коли-небудь бути виправлена?
Практично — ні. Перевірка 14 мільйонів записів при темпі одного запису за хвилину займе приблизно 27 років роботи на повну ставку. Тим часом нові неправильні записи подаються щодня, а реформулювання продуктів постійно роблять існуючі записи застарілими. Швидкість забруднення перевищує швидкість виправлення.
Що таке перевірена база даних продуктів і чому це важливо?
Перевірена база даних продуктів має кожен запис, перевірений професіоналом з харчування перед його публікацією. Це забезпечує меншу, але послідовно точну базу даних. Nutrola використовує 100% перевірені дані дієтологів, а Cronometer використовує дані, протестовані в лабораторіях USDA/NCCDB — обидва значно надійніші, ніж краудсорсингові альтернативи.
Як дізнатися, чи є дані мого трекера калорій точними?
Червоні прапорці включають багато записів для одного й того ж продукту з різними значеннями калорій, нечіткі розміри порцій, такі як "1 порція" або "1 чаша" без ваги в грамах, зупинку втрати ваги незважаючи на постійне відстеження, а також записи з підозріло круглими числами. Якщо ви часто бачите ці шаблони, база даних вашого трекера, ймовірно, ненадійна.
Готові трансформувати своє відстеження харчування?
Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!