Чому в Lose It є дублікатні продукти?

База даних Lose It переповнена дублікатами, оскільки подання від користувачів не підлягають ретельній дедуплікації. Дізнайтеся, чому виникають дублікати, як знайти правильний запис і чому перевірена база даних, як Nutrola, обходить цю проблему.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

У Lose It є дублікатні записи, оскільки користувачі можуть швидше додавати нові продукти, ніж модератори можуть їх перевіряти та об'єднувати. Ось як знайти правильний запис або повністю уникнути дублікатів за допомогою додатку з перевіреною базою даних.

Якщо ви коли-небудь вводили "куряча грудинка" у Lose It і дивилися на дванадцять версій одного й того ж продукту — кожна з яких має трохи різні значення калорій, розміри порцій і форматування — ви відчули основний компроміс дизайну краудсорсингової бази даних харчування. Подання від спільноти дозволяють базі даних швидко зростати та охоплювати рідкісні продукти, але без суворої дедуплікації кожен популярний продукт отримує довгий ряд майже дублікатних записів, які користувачі змушені переглядати під час кожного прийому їжі.

Цей посібник пояснює, чому в Lose It з'являються дублікати, як вибрати правильний запис, коли ви його використовуєте, які реальні витрати дубліката протягом тижнів і місяців, а також які трекери калорій — включаючи Nutrola — використовують перевірений підхід, щоб уникнути цієї проблеми з самого початку.


Чому в Lose It є дублікатні записи

Подання від спільноти перевищують модерацію

Lose It значною мірою покладається на продукти, подані користувачами. Будь-який учасник може додати новий запис для продукту, ресторанної страви або домашнього рецепту. Подання підлягають легкій модерації, але обсяги величезні — тисячі нових записів щодня по всьому світу. Модератори не можуть реально перевіряти, об'єднувати та підтверджувати кожен запис, тому нові подання з'являються в системі навіть тоді, коли вже існує майже ідентичний запис.

Протягом років це накопичується. Продукт, такий як "банан", може мати десятки подань: "банан", "Банан", "банан середній", "банан 1 середній", "банан Chiquita", "органічний банан", кожен створений різними користувачами, які ввели те, що здавалося природним у той момент, замість того, щоб спочатку пошукати в базі даних.

Відсутність суворої дедуплікації

Деякі бази даних виконують процедури дедуплікації, які групують майже схожі записи та об'єднують їх у канонічні записи. Процес Lose It історично схилявся до збереження окремих записів, а не агресивного об'єднання, частково через те, що об'єднання може зламати історичні записи для користувачів, які вибрали тепер видалений запис. В результаті навіть очевидні дублікати — той самий продукт, та сама марка, той самий розмір порції — залишаються окремими записами.

Регіональні варіації стають новими записами замість варіантів

Кока-Кола, що продається в США, має трохи інші харчові властивості, ніж та, що продається в Німеччині або Мексиці, через різні підсолоджувачі, розміри порцій і стандарти маркування. У добре структурованій базі даних ці варіації були б частинами одного канонічного запису. У краудсорсинговій базі даних кожна регіональна версія подається окремо, часто користувачами, які не усвідомлюють, що інші версії вже існують. Помножте це на кожен глобальний бренд, і кількість дублікатів зростає.

Застарілі записи зберігаються безкінечно

Бренди змінюють рецептуру. Розміри порцій зменшуються. Етикетки оновлюються. Коли упакований продукт змінюється, старий запис залишається в базі даних назавжди, якщо хтось не позначить або не оновить його. Нові користувачі подають нову версію, стара версія залишається, і ви отримуєте два записи для одного й того ж продукту — один актуальний, інший — кілька років застарілий — поряд один з одним у результатах пошуку.

Інтерфейс подання заохочує створення замість пошуку

Коли ви не можете швидко знайти продукт, найшвидший шлях — створити новий. Інтерфейс Lose It робить "Створити новий продукт" помітним, що зручно, коли продукт дійсно відсутній у базі даних. Але це також спокушає користувачів пропустити етап пошуку зовсім і створити дублікат, замість того, щоб переглядати результати, щоб знайти існуючий запис. Кожен з цих записів стає ще одним майже дублікатом для наступного користувача.


Як вибрати правильний дублікат

Якщо ви залишаєтеся на Lose It, вам знадобиться швидка рутина для вибору правильного запису з списку дублікатів. Декілька звичок значно прискорять цей процес.

Шукайте перевірений значок

Lose It позначає частину записів як перевірені — зазвичай це записи, подані брендами або перевірені співробітниками. Це найнадійніші варіанти, коли вони доступні. Перевірені записи зазвичай мають правильну назву бренду, точні розміри порцій і харчові дані, які відповідають етикетці. Якщо в результатах пошуку є будь-який перевірений запис для вашого продукту, обирайте його за замовчуванням.

Перевірте, наскільки нещодавно був створений запис

Нещодавні записи, як правило, більше відповідають актуальним формулюванням продуктів. Запис, створений три місяці тому, ймовірніше, відповідатиме етикетці сьогодні, ніж запис, створений у 2014 році. Більшість виглядів у Lose It показують дату створення або останнього оновлення — скористайтеся цим.

Порівняйте з етикеткою продукту

Витягніть упаковку та порівняйте. Правильний запис має точну назву бренду, точний варіант продукту (Оригінальний, Зменшений цукор, Нульовий) та відповідний розмір порції. Якщо запис говорить "1 порція (240 мл)", а ваша пляшка говорить "1 порція (250 мл)", це неправильний запис, навіть якщо назва виглядає правильно. Невеликі відмінності в розмірах порцій серед дублікатів — це те, де більшість калорійних відхилень непомітно з'являється.

Перевірте з USDA або перевіреним джерелом

Для непозначених цільних продуктів — куряча грудинка, коричневий рис, броколі — перевірте запис Lose It з USDA FoodData Central або перевіреною базою даних. Якщо калорії та макронутрієнти відрізняються на кілька відсотків, запис вважається прийнятним. Якщо вони відрізняються на 20–30%, ви вибрали поганий дублікат і повинні продовжити пошук.

Вибирайте записи з вищими показниками використання

Багато записів Lose It відображають кількість використання спільноти — скільки користувачів зареєстрували цей запис. Записи з високим використанням, як правило, є канонічними, на які люди зупинилися, що не робить їх автоматично правильними, але робить їх більш перевіреними, ніж нове подання з трьома загальними використаннями.

Зберігайте свої канонічні вибори в обраних

Якщо ви знайшли правильний запис для продукту, який часто вживаєте, відразу додайте його в обрані. Це підніме його на верхню позицію в майбутніх пошуках і означає, що вам потрібно буде проходити процес сортування дублікатів лише один раз для кожного продукту, а не щоразу під час реєстрації.


Реальні витрати дублікатів

Варіація калорій більша, ніж люди думають

Два дублікатні записи одного й того ж продукту можуть відрізнятися на 10%, 20% або навіть більше. Запис "куряча грудинка, 100 г" може показувати 165 калорій в одному записі та 195 в іншому — різниця в 30 калорій на 100 грамів. Помножте це на кожне джерело білка, кожну крупу, кожен фрукт, який ви реєструєте за день, і варіація між двома повними днями реєстрації з використанням різних дублікатів може легко перевищити 200 калорій. Для тих, хто перебуває в свідомому дефіциті або надлишку, це різниця між прогресом і стагнацією.

Довіра знижується, коли накопичуються розбіжності

Коли користувачі помічають, що одна й та ж страва, зареєстрована двічі, дає різні підсумки, вони починають сумніватися в даних. Дехто реагує на це, перевіряючи кожен запис, що робить реєстрацію виснажливою. Інші перестають довіряти додатку зовсім і віддаляються від трекінгу. У будь-якому випадку, тертя дублікатів відштовхує користувачів від додатку — проблема для тих, хто намагається сформувати звичку трекінгу на довгий термін.

Час, витрачений на вибір запису

Вибір "правильного" запису під час кожного прийому їжі займає реальний час. Якщо сортування дублікатів займає 15 додаткових секунд на продукт, а ви реєструєте шість продуктів на день, це 90 секунд щодня — близько 45 хвилин на місяць — витрачених на сортування записів замість фактичного трекінгу. У перевіреній базі даних цей час зникає, оскільки є лише один запис для вибору.

Порівнянність історичних даних страждає

Якщо ви зареєстрували ту ж курячу грудинку як інший дублікат минулого місяця, ніж цього, ваша історична тенденція калорій не порівнює подібні дані. Ви можете подивитися на дані з січня та дані з квітня і подумати, що ваш прийом змінився, коли насправді ви просто вибрали інший дублікат з трохи іншими цифрами.


Альтернативи без дублікатів

Cronometer — база даних, перевірена USDA

Cronometer побудував свій продукт на протилежній філософії до Lose It. Основна база даних курирується з USDA FoodData Central, NCCDB та невеликої кількості інших перевірених джерел, а подання користувачів зберігаються окремо та чітко позначені. Дублікати існують у шарі, поданому спільнотою, але в основній перевіреній базі їх практично немає. Якщо ви реєструєте в основному цільні продукти та обмежений набір брендових основ, перевірений шар Cronometer близький до бездублікованого.

Компроміс полягає в обсязі бази даних. Cronometer менший за Lose It або MyFitnessPal, тому рідкісні регіональні бренди та ресторанні страви менш імовірно будуть знайдені — що означає більше ручного введення, коли ви їсте незвичні продукти.

Nutrola — перевірена дієтологом і дедуплікована

Nutrola йде далі в підході з перевіреною базою даних. Кожен запис перевіряється дієтологом перед публікацією, а процес постійної дедуплікації об'єднує майже схожі записи, а не дозволяє їм накопичуватися. В результаті є один канонічний запис на продукт, з чіткими назвами, послідовними розмірами порцій і цифрами, перевіреними за кількома національними базами даних. Жоден користувач не дивиться на дванадцять версій курячої грудинки, оскільки є лише один.

База даних охоплює понад 1,8 мільйона продуктів по всіх глобальних брендах, регіональних продуктах, ресторанних позиціях та цільних продуктах, з локалізацією на 14 мовах. AI-фото логування ідентифікує продукти з фото менш ніж за три секунди та автоматично витягує перевірені дані, тому навіть етап пошуку є необов'язковим.


Як Nutrola уникає дублікатів

  • Один перевірений запис на продукт. Один канонічний запис на продукт. Жодних майже дублікатів з трохи різними цифрами, що конкурують за один і той же пошук.
  • Перевірка дієтологом перед публікацією. Кожен новий продукт перевіряється кваліфікованим дієтологом на точність, назву та повноту.
  • Постійний процес дедуплікації. Виявлення майже схожих записів виконується постійно в базі даних. Дублікати, які з'являються, об'єднуються в канонічний запис, зберігаючи історичні дані.
  • Перевірка з кількома національними базами даних. Харчові дані перевіряються з USDA, EFSA та іншими національними базами даних для підтвердження точності перед публікацією.
  • Послідовні стандарти розміру порцій. Розміри порцій відповідають стандартам етикеток і стандартизовані для подібних продуктів, щоб порівняння залишалося значущим.
  • Регіональні варіанти обробляються як варіанти, а не нові записи. Кока-Кола, що продається в різних регіонах, моделюється як варіанти одного канонічного запису, а не як окремі продукти, що захаращують результати пошуку.
  • Оновлення записів при реформуляціях. Коли бренд змінює свій рецепт, існуючий запис Nutrola оновлюється, а не замінюється, щоб історичні дані залишалися зрозумілими.
  • 100+ поживних речовин на запис. Калорії, макронутрієнти, вітаміни, мінерали, клітковина, натрій та інше — все заповнюється з перевірених даних, а не вгадуються під час подання.
  • AI-фото логування обходить пошук зовсім. Зробіть фото, нехай AI ідентифікує продукт, і зареєструйте перевірений запис менш ніж за три секунди. Жодного пошуку в базі даних, жодного вибору дублікатів.
  • Голосове та штрих-кодове логування як резерв. Логування природною мовою та сканування штрих-кодів повертають лише перевірений канонічний запис, а не список поданих користувачами.
  • 14 мов з правильною локалізацією. Назви продуктів ретельно перекладаються на кожну підтримувану мову, щоб пошук працював вашою рідною мовою без створення нових дублікатів під час перекладу.
  • Жодної реклами на всіх рівнях. Немає тиску з боку реклами, щоб максимізувати час перебування в додатку через тертя, як-от сортування дублікатів. Інтерфейс спроектовано так, щоб ви могли швидко зареєструватися та вийти.

Порівняння бази даних калорій

Додаток Дублікати Перевірка Кількість записів
Lose It Часті Переважно подані спільнотою, деякі перевірені Велика, краудсорсингова
MyFitnessPal Дуже часті Мінімальна перевірка Найбільша, сильно краудсорсингова
Cronometer Рідкісні в перевіреній основі Перевірено USDA/NCCDB Менша, перевірена
Nutrola Активно дедуплікована Перевірена дієтологом, крос-перевірена 1.8M+ перевірених

Компроміс очевидний. Краудсорсингові бази даних оптимізують для охоплення та швидкості зростання, за рахунок дублікованого бруду та непослідовної точності. Перевірені бази даних оптимізують для точності та послідовності, за рахунок повільнішого зростання та іноді вужчого охоплення. Підхід Nutrola — перевірка даних плюс AI-фото логування для заповнення прогалин без відкриття шлюзів для неперевірених подань — намагається захопити найкраще з обох світів.


Чи варто змінювати додатки через це?

Справедливо: це залежить від того, наскільки дублікати впливають на ваш трекінг.

Якщо ви в основному реєструєте цільні продукти та невеликий набір звичних брендів, і вже додали в обрані правильні записи для продуктів, які часто вживаєте, проблема дублікатів у Lose It рідко виникає. Ви обираєте свої улюблені, швидко реєструєте, і довгий ряд дублікатів у базі даних ніколи не торкається вашого щоденного робочого процесу. У такому випадку витрати на перехід — відновлення улюблених, повторне навчання інтерфейсу, міграція даних — ймовірно, не варті зусиль.

Якщо ви щодня стикаєтеся з дублікатами, особливо якщо у вас різноманітний раціон, ви подорожуєте, часто пробуєте нові продукти або сильно покладаєтеся на пошук ресторанних страв і регіональних брендів, тертя накопичується. Сортування записів під час кожного прийому їжі, переживання, чи вибрали ви правильний, і спостереження за тим, як загальні калорії коливаються в залежності від того, який дублікат ви вибрали — це реальний податок на вашу звичку трекінгу. У такому випадку перехід на додаток з перевіреною базою даних, ймовірно, вартий зусиль.

Якщо точність має особливе значення — ви в свідомому дефіциті, готуєтеся до змагань, управляєте медичним станом або працюєте з дієтологом — перевірена база даних не є варіантом. Лише варіація дублікатів може зруйнувати точність, яку ці випадки вимагають, і перехід на Cronometer або Nutrola зазвичай окупає себе в якості даних протягом тижня.

Безкоштовний рівень Nutrola покриває основний трекінг з перевіреною базою даних, AI-фото логуванням та трекінгом основних поживних речовин, тому ви можете протестувати досвід без дублікатів без фінансових зобов'язань. Преміум становить €2.50/місяць, якщо ви вирішите, що перевірений робочий процес вартий збереження.


Часті запитання

Чому в Lose It так багато дублікатів продуктів?

Тому що Lose It покладається на подання спільноти і не агресивно об'єднує майже схожі записи. Користувачі можуть додавати нові продукти швидше, ніж модератори можуть їх перевіряти та дедуплікувати, тому база даних накопичує багато майже ідентичних записів для тих самих продуктів з часом.

Як дізнатися, який запис Lose It правильний?

Вибирайте записи з перевіреним значком. Перевірте, щоб дата створення була нещодавньою, назва бренду та варіант точно відповідали вашому продукту, а розмір порції відповідав етикетці. Для цільних продуктів перевірте цифри з USDA FoodData Central. Додайте правильні записи в обрані, щоб робити це лише один раз для кожного продукту.

Чи важливо, якщо я виберу неправильний дублікат?

Так. Дублікати одного й того ж продукту можуть відрізнятися на 10–30% в калоріях і макронутрієнтах. Протягом повного дня реєстрації ця варіація може скласти понад 200 калорій, що достатньо, щоб суттєво спотворити свідомий дефіцит або надлишок.

Чому додатки просто не дедуплікують базу даних?

Об'єднання записів може зламати історичні дані для користувачів, які вибрали тепер видалений запис, тому багато краудсорсингових додатків залишають дублікати. Дедуплікація, яка зберігає історичні дані — об'єднуючи, а не видаляючи — є більш складною і вимагає спеціального процесу перевірки.

Чи має MyFitnessPal ту ж проблему?

Так, навіть більше. MyFitnessPal має найбільшу краудсорсингову базу даних у цій категорії, а щільність дублікатів у його базі даних зазвичай вища, ніж у Lose It. Ті ж стратегії — перевірені значки, нещодавні записи, відповідність етикетці, додавання в обрані — застосовуються.

Чи дійсно база даних Nutrola без дублікатів?

Nutrola активно дедуплікує. Записи перевіряються дієтологом перед публікацією, а процес постійного об'єднання консолідує майже схожі записи в єдині канонічні записи. Жодна база даних ніколи не буде абсолютно без дублікатів назавжди, але робочий процес Nutrola підтримує низький рівень, тому користувачі рідко стикаються з дублікатами на практиці.

Скільки коштує Nutrola?

Nutrola має безкоштовний рівень з основними функціями трекінгу, перевіреною базою даних з понад 1,8 мільйона продуктів, AI-фото логуванням та базовим трекінгом поживних речовин. Преміум коштує €2.50/місяць і включає трекінг 100+ поживних речовин, розширену аналітику, повний імпорт рецептів, необмежене голосове логування та пріоритетну підтримку. Жодної реклами на жодному рівні.


Остаточний вердикт

Lose It має дублікатні продукти, оскільки її модель подання спільноти дозволяє базі даних зростати швидше, ніж модератори можуть перевіряти та об'єднувати записи. Це компроміс: більше охоплення, швидше зростання і більше дублікатів за рахунок послідовності. Якщо ви додали в обрані записи, які використовуєте найчастіше, і рідко стикаєтеся з пошуком, проблема невелика. Якщо ви щодня сортуєте дублікати, спостерігаєте за тим, як загальні калорії коливаються між записами, або покладаєтеся на базу даних для точного трекінгу, тертя є реальним — і додаток з перевіреною базою даних, як Cronometer або Nutrola, заощадить вам час і покращить точність з першого дня. Почніть безкоштовно з перевіреної бази даних Nutrola з понад 1,8 мільйона продуктів, AI-фото логуванням та записами, перевіреними дієтологами, і подивіться, чи змінить трекінг без дублікатів вашу звичку.

Готові трансформувати своє відстеження харчування?

Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!