Як Voice Logging AI Розуміє Природну Мову для Відстеження Харчування
Глибоке технічне занурення в NLP-процес, що стоїть за голосовим відстеженням харчування — від автоматичного розпізнавання мови та розпізнавання іменованих сутностей до розрізнення продуктів, нормалізації кількостей та оцінки впевненості.
Сказати "Я щойно з'їв два яєчка з чеддером на цільнозерновому тості" у свій телефон і спостерігати, як це з'являється як повністю зареєстроване харчування з точними макросами, здається майже магічним. За цим безперебійним досвідом стоїть складна система обробки природної мови, яка перетворює сирий аудіосигнал на структуровані дані про харчування менш ніж за дві секунди. Розуміння цієї системи пояснює, чому голосове ведення стало одним з найшвидших і найточніших способів відстеження того, що ви їсте.
Voice logging AI використовує багатоступеневу NLP-систему — автоматичне розпізнавання мови (ASR), класифікацію намірів, розпізнавання іменованих сутностей (NER), розрізнення продуктів, нормалізацію кількостей, зіставлення з базою даних та оцінку впевненості — для перетворення усних описів страв на точні, перевірені записи про харчування.
Ця стаття проходить через кожен етап цієї системи, пояснює основні технології та показує, як одне усне речення перетворюється на повний запис харчування.
Сімступенева NLP-система для голосового відстеження харчування
Голосове відстеження харчування — це не єдиний алгоритм. Це ланцюг спеціалізованих моделей, кожна з яких вирішує різну частину проблеми. Коли ви вимовляєте опис страви, ваші слова проходять через сім різних етапів обробки, перш ніж запис про харчування з'явиться у вашому журналі.
Таблиця нижче відстежує одне висловлювання через всю систему:
| Етап | Процес | Вхід | Вихід |
|---|---|---|---|
| 1. ASR | Перетворення мови в текст | Аудіосигнал | "два яєчка з чеддером на цільнозерновому тості" |
| 2. Визначення наміру | Класифікація наміру користувача | Сирий транскрипт | Намір: food_logging (впевненість 0.97) |
| 3. NER | Витягнення продуктів | Класифікований транскрипт | [яєчка, чеддер, цільнозерновий тост] |
| 4. Розрізнення | Вирішення неоднозначних сутностей | Сирі продукти | [яєчка (USDA: 01132), сир чеддер (USDA: 01009), цільнозерновий хліб, підсмажений (USDA: 20090)] |
| 5. Нормалізація кількості | Стандартизація обсягів | "два", стандартна порція | [2 великі яйця (100г), 1 скибочка чеддера (28г), 2 скибочки тосту (56г)] |
| 6. Зіставлення з базою даних | Зіставлення з перевіреними записами | Розрізнені сутності + кількості | Повні профілі харчування з калоріями, білками, жирами, вуглеводами, мікроелементами |
| 7. Оцінка впевненості | Оцінка впевненості | Всі виходи системи | Загальна впевненість: 0.94 — запис автоматично |
Кожен етап спирається на різні методи машинного навчання, і невдачі на будь-якому етапі впливають на наступні. Правильна робота всієї системи — це те, що відрізняє надійне голосове ведення від розчарувального вгадування.
Етап 1: Автоматичне Розпізнавання Мови (ASR) — Перетворення Аудіо в Текст
Перше завдання — перетворити сирий аудіосигнал на текст. Сучасні системи ASR використовують архітектури на основі трансформерів — ту ж родину моделей, що стоять за великими мовними моделями, такими як GPT і Claude — навчені на сотнях тисяч годин багатомовних аудіоданих.
Як ASR Працює для Описів Їжі
Моделі ASR обробляють аудіо в три етапи:
Витягнення ознак: Сирий аудіосигнал перетворюється на спектрограму, візуальне представлення частот аудіо з часом. Спектрограма ділиться на перекриваючі фрейми, зазвичай шириною 25 мілісекунд з кроком 10 мілісекунд.
Обробка кодувальником: Кодувальник трансформера обробляє фрейми спектрограми, вивчаючи контекстуальні зв'язки між звуками. Модель розуміє, наприклад, що послідовність фонем для "чеддер" більш імовірна в контексті харчових висловлювань, ніж "чеддер" або "чекер".
Генерація декодером: Декодер трансформера генерує найбільш імовірну текстову послідовність, використовуючи пошук по променях для одночасної оцінки кількох гіпотез. Декодер застосовує ймовірності мовної моделі для вирішення акустичних неоднозначностей.
Сучасні системи ASR, такі як Whisper (OpenAI, 2022), досягають показників помилок слів нижче 5 відсотків для чистої англійської мови. Для специфічної термінології їжі, доопрацювання на описах страв може підвищити точність ще більше, з показниками помилок слів нижче 3 відсотків для загальних харчових термінів.
Виклик Харчового Словника
Харчовий словник представляє унікальні виклики для ASR:
- Запозичені слова та іноземні терміни: Слова, такі як "гнoccі", "цaцiкi" та "акаї", дотримуються правил вимови з їхніх мов походження.
- Омоніми: "Квітка" проти "борошна", "порей" проти "витоку", "мідія" проти "м'яза".
- Брендові назви: Тисячі власних назв харчових продуктів, які можуть не з'являтися в загальних навчальних даних.
- Регіональні вимови: "Пекан" вимовляється по-різному в різних англомовних регіонах.
Доопрацювання моделей ASR на наборах даних, пов'язаних з їжею — зазвичай містять від 5,000 до 50,000 годин аудіо, пов'язаного з їжею — вирішує ці виклики, навчаючи модель статистичним закономірностям, специфічним для описів страв.
Етап 2: Визначення Намірів — Чи Це Запит на Ведення Харчування?
Не все, що говорить користувач у додатку для харчування, є описом страви. Визначення намірів класифікує транскрипт на одну з кількох категорій:
| Намір | Приклад висловлювання | Дія |
|---|---|---|
| food_logging | "Я з'їв курячий салат Цезар на обід" | Перенаправити до NER-системи |
| water_logging | "Я випив два склянки води" | Записати споживання води |
| питання | "Скільки калорій в авокадо?" | Перенаправити до AI-асистента |
| виправлення | "Насправді це був коричневий рис, а не білий" | Виправити попередній запис |
| видалення | "Видалити мою останню страву" | Видалити запис |
Класифікація намірів зазвичай використовує доопрацьовану модель трансформера, яка обробляє повний транскрипт і виводить ймовірнісне розподілення серед усіх можливих намірів. Для ведення харчування поріг встановлюється високим — зазвичай вище 0.90 впевненості — щоб уникнути випадкового запису випадкового згадування їжі.
Дослідження Асоціації обчислювальної лінгвістики (ACL, 2023) показали, що класифікатори намірів, специфічні для домену, досягають показників F1 вище 0.96, коли доопрацьовані на всього 10,000 позначених прикладах, що робить це одним з найбільш надійних етапів у системі.
Етап 3: Розпізнавання Іменованих Сутностей (NER) — Витягнення Продуктів
Розпізнавання іменованих сутностей — це етап, на якому AI ідентифікує та витягує конкретні продукти, кількості та модифікатори з речення. Це основний лінгвістичний виклик голосового ведення харчування.
Типи Сутностей у Харчовому NER
Модель NER, специфічна для їжі, навчається розпізнавати кілька типів сутностей:
| Тип Сутності | Тег | Приклади |
|---|---|---|
| Продукт | FOOD | яєчка, куряча грудинка, коричневий рис |
| Кількість | QTY | два, 200 грамів, чашка, половина |
| Модифікатор | MOD | грильований, з чеддером, нежирний, органічний |
| Бренд | BRAND | Chobani, Barilla, Kirkland |
| Контекст страви | MEAL | на сніданок, як закуска, після тренування |
| Контейнер | CONT | чаша з, тарілка з, склянка з |
Для прикладу висловлювання "два яєчка з чеддером на цільнозерновому тості" модель NER виробляє:
[QTY: два] [FOOD: яєчка] [MOD: з чеддером] [MOD: на цільнозерновому тості]
Компонентні Описання Їжі
Одним з найскладніших викликів NER є компонентні описи їжі — страви, описані як комбінації інгредієнтів, а не під назвою однієї страви. Коли хтось каже "курячий стір-фрай з брокколі, болгарським перцем і соєвим соусом на жасминовому рисі", модель повинна визначити, чи це одна складна страва, чи п'ять окремих продуктів.
Сучасні системи NER справляються з цим, використовуючи схему тегування BIO (Початок, Всередині, Ззовні), доповнену парсингом залежностей. Парсер залежностей ідентифікує синтаксичні зв'язки між словами, тому "курячий стір-фрай" розуміється як одна страва, тоді як "брокколі, болгарський перець і соєвий соус" розпізнаються як його складові, а "жасминовий рис" ідентифікується як окремий супровід.
Бенчмарк продуктивності на харчових наборах даних NER, таких як FoodBase (2019) та TAC-KBP food entity corpus, показує показники F1 від 0.89 до 0.93 для витягнення харчових сутностей, з помилками, зосередженими на рідкісних або регіональних стравах.
Етап 4: Розрізнення Сутностей Їжі — Що Саме Ви Мали на Увазі?
Після витягнення харчових сутностей система повинна вирішити неоднозначності. Природна мова сповнена слів, які можуть стосуватися різних продуктів залежно від контексту, регіону або особистих звичок.
Загальні Виклики Розрізнення
| Неоднозначний Термін | Можливі Інтерпретації | Сигнал для Вирішення |
|---|---|---|
| Чіпси | Картопляні чіпси (США), картопля фрі (Великобританія), чіпси з тортильї, бананові чіпси | Локалізація користувача, попередні модифікатори, контекст страви |
| Бісквіт | Печиво (Великобританія), хлібоподібне тісто (Південь США), крекер (частини Азії) | Локалізація користувача, супутні продукти |
| Джем | Желатиновий десерт (США), фруктовий джем (Великобританія) | Контекст страви (на тості проти як десерт) |
| Пудинг | Кремовий десерт (США), запечена страва, така як йоркширський пудинг (Великобританія) | Контекст страви, модифікатори |
| Кукурудза | Кукурудза на качані, консервована кукурудза, кукурудзяне борошно, попкорн | Модифікатори, контекст приготування |
| Тост | Скибка хліба, тост на пиві | Класифікація наміру (вже вирішена) |
Розрізнення спирається на кілька сигналів:
- Локалізація користувача: Налаштування мови та регіону програми надають сильний пріоритет. Австралійський користувач, кажучи "чіпси", швидше за все, має на увазі товсті картопляні фрі; американський користувач, швидше за все, має на увазі тонкі картопляні чіпси.
- Контекстуальні модифікатори: "Чіпси з кетчупом" вказують на картопляні фрі; "чіпси з сальсою" вказують на чіпси з тортильї; "пакет чіпсів" вказує на упаковані картопляні чіпси.
- Історія страв: Якщо користувач регулярно веде облік британських страв, модель розрізнення відповідно коригує свої пріоритети.
- Схожість векторів: Вектори на основі трансформерів розміщують продукти в семантичному просторі, де контекстуально схожі продукти групуються разом, що дозволяє моделі вибрати інтерпретацію, яка найкраще підходить до навколишнього мовного контексту.
Етап 5: Нормалізація Кількості — Перетворення Природної Мови на Грами
Люди майже ніколи не описують кількість їжі в грамах. Вони кажуть "чашка", "жменя", "велика чаша", "дві скибочки" або просто нічого не кажуть (маючи на увазі одну стандартну порцію). Нормалізація кількості перетворює ці природні описи на стандартизовані метричні кількості, які можна зіставити з записами в базі даних.
Загальні Вирази Кількості та Їх Нормалізовані Значення
| Природний Вираз | Контекст Їжі | Нормалізоване Значення | Джерело |
|---|---|---|---|
| Чашка | Варений рис | 186г | Стандартна довідка USDA |
| Чашка | Молоко | 244г (244мл) | Стандартна довідка USDA |
| Жменя | Суміш горіхів | 28–30г | Консенсус досліджень з харчування |
| Жменя | Чорниця | 40–50г | Оцінка порцій USDA |
| Скибка | Хліб | 25–30г | Середнє значення в галузі |
| Скибка | Піца (велика, 14") | 107г | Стандартна довідка USDA |
| Чаша | Злаки з молоком | 240–300г всього | Довідковий обсяг FDA |
| Шматок | Куряча грудинка | 120–174г | Стандартні порції USDA |
| Крапля | Оливкова олія | 5–7мл | Кулінарний стандарт |
| Пшик | Соєвий соус | 5мл | Кулінарний стандарт |
Складність тут полягає в тому, що "чашка" рису (186г) має дуже іншу вагу, ніж "чашка" шпинату (30г) або "чашка" борошна (125г). Нормалізація кількості повинна бути обізнаною про їжу, а не лише про одиниці.
Сучасні підходи використовують таблиці для добре визначених одиниць (чашка, столова ложка, чайна ложка) в поєднанні з навчальними регресійними моделями для нечітких кількостей (жменя, крапля, велика чаша). Ці регресійні моделі навчаються на наборах даних про розміри порцій з Бази даних продуктів і поживних речовин USDA (FNDDS) та подібних джерел.
Коли кількість не вказана — як у "Я з'їв яєчка та тост" — система за замовчуванням використовує стандартні порції USDA, які представляють кількість, що зазвичай споживається за один прийом їжі.
Етап 6: Зіставлення з Базою Даних — Зіставлення Сутностей з Перевіреними Даними про Харчування
З розрізненими харчовими сутностями та нормалізованими кількостями в руках система повинна зіставити кожен продукт з конкретним записом у базі даних харчування. Тут NLP-система зустрічається з базою даних харчової науки.
Процес Зіставлення
Зіставлення з базою даних використовує комбінацію:
- Точне зіставлення рядків: Прямий пошук назви продукту в базі даних. Швидко та надійно для загальних продуктів.
- Нечітке зіставлення рядків: Відстань Левенштейна та подібні алгоритми обробляють варіації написання, скорочені назви та незначні помилки транскрипції. "Скремблед eggs" все ще відповідає "scrambled eggs."
- Семантичний пошук: Вектори речень на основі трансформерів дозволяють зіставлення на основі значення, а не точного формулювання. "Sunny side up" відповідає запису в базі даних для "смаженого яйця, а не скремблед" навіть якщо слова майже не збігаються.
- Ієрархічне резервування: Якщо точного збігу продукту немає, система переходить до найближчої батьківської категорії. "Спеціальний м'ясний хлібець бабусі" буде зіставлено з "м'ясним хлібцем, домашнім" у базі даних USDA.
Якість бази даних на цьому етапі критично важлива. Перевірена база даних харчування з записами, отриманими з державних таблиць складу продуктів (USDA FoodData Central, EFSA, FSANZ) та перевіреними дієтологами, забезпечує набагато надійніші результати, ніж бази даних, подані користувачами, де будь-хто може додати записи.
Nutrola використовує перевірену базу даних харчування з записами, які перехресно перевіряються з офіційними даними про склад продуктів, що означає, що остаточні значення калорій та макросів, повернуті системою голосового ведення, ґрунтуються на лабораторно проаналізованих даних про харчування, а не на оцінках, отриманих від користувачів. У поєднанні з скануванням штрих-кодів, яке охоплює понад 95 відсотків упакованих продуктів, етап зіставлення досягає високих показників відповідності як для цільних продуктів, так і для упакованих товарів.
Етап 7: Оцінка Впевненості — Коли Записувати, а Коли Запитувати
Останній етап агрегує оцінки впевненості з кожного попереднього етапу в загальний показник впевненості. Ця оцінка визначає, чи система автоматично реєструє страву, запитує підтвердження у користувача або просить уточнення.
Пороги Впевненості та Дії
| Загальна Впевненість | Дія | Приклад Сценарію |
|---|---|---|
| 0.95–1.00 | Автоматично зареєструвати | Загальна страва, чіткі кількості, точне зіставлення з базою даних |
| 0.80–0.94 | Зареєструвати з підтвердженням | Трохи неоднозначна кількість або варіант їжі |
| 0.60–0.79 | Показати 2–3 найкращі варіанти для вибору користувача | Неоднозначна назва їжі або кілька можливих відповідностей |
| Нижче 0.60 | Запитати користувача перефразувати або надати більше деталей | Нечітка мова, невідома їжа або дуже неоднозначний опис |
Оцінка впевненості — це не одне число, а зважена комбінація підрахунків:
- Впевненість ASR: Наскільки впевнений був модель перетворення мови в текст? (Вимірюється ймовірністю декодованої послідовності)
- Впевненість NER: Наскільки чітко були ідентифіковані харчові сутності? (Вимірюється F1 для меж сутностей)
- Впевненість розрізнення: Чи була чітка перемога серед можливих інтерпретацій? (Вимірюється різницею ймовірності між найкращими кандидатами)
- Впевненість відповідності базі даних: Наскільки близьким було відповідність до перевіреного запису в базі даних? (Вимірюється косинусною подібністю векторів)
Ця багаторівнева система впевненості дозволяє голосовому веденню бути як швидким, так і точним. Інтерпретації з високою впевненістю реєструються миттєво, тоді як випадки з низькою впевненістю викликають цілеспрямовані запитання для уточнення, а не загальні повідомлення про помилки.
Як Трансформерні Моделі та Великі Мовні Моделі Покращують Голосове Ведення Харчування
Вся описана вище система була трансформована завдяки появі архітектур трансформерів (Vaswani et al., 2017) та великих мовних моделей (LLMs). Старі системи голосового ведення використовували окремі, незалежно навчені моделі для кожного етапу. Сучасні системи все частіше використовують єдині моделі трансформерів, які обробляють кілька етапів одночасно.
Ключові Досягнення
- End-to-end ASR: Моделі ASR на основі трансформерів, такі як Whisper, обробляють аудіо безпосередньо в текст без проміжних представлень фонем, зменшуючи поширення помилок.
- Контекстуальне NER: Попередньо навчені мовні моделі, такі як BERT та його варіанти, розуміють терміни їжі в контексті, що суттєво покращує витягнення сутностей для компонентних описів.
- Zero-shot розрізнення: Великі мовні моделі можуть розрізняти терміни їжі, яких вони ніколи не бачили в навчальних даних, використовуючи свої широкі знання про світ. Модель, яка прочитала мільйони рецептів і описів їжі, розуміє, що "чіпси та гуакамоле" означають чіпси з тортильї з гуакамоле, навіть не будучи явно навченими на цій фразі.
- Каскадне виправлення: LLM дозволяють природні подальші розмови. Якщо AI реєструє "білий рис", а користувач каже "насправді це був рис з цвітної капусти", модель розуміє це як виправлення та відповідно оновлює запис.
AI Дієтолог Nutrola використовує ці можливості, дозволяючи користувачам не лише реєструвати страви голосом, але й ставити подальші запитання, запитувати зміни та отримувати харчові інсайти через природну розмову.
Реальна Точність: Як Голосове Ведення Порівнюється з Іншими Методами
Природне питання — як точність голосового ведення порівнюється з ручним введенням тексту, скануванням штрих-кодів та веденням харчування на основі фотографій.
| Метод Ведення | Середня Точність Калорій | Середній Час на Запис | Зусилля Користувача |
|---|---|---|---|
| Ручний текстовий пошук | 85–90% (залежить від вибору користувача) | 45–90 секунд | Високе |
| Сканування штрих-кодів | 97–99% (тільки упаковані продукти) | 5–10 секунд | Низьке |
| Ведення на основі фотографій (AI) | 85–92% (варіюється залежно від складності їжі) | 3–8 секунд | Низьке |
| Голосове ведення (AI) | 88–94% (варіюється залежно від чіткості опису) | 5–15 секунд | Дуже низьке |
Перевага точності голосового ведення полягає в багатстві природної мови. Фотографія не може розрізнити між цільним молоком і знежиреним, але усний опис може. Фотографія має труднощі з багатошаровими стравами, такими як буріто, але усний опис — "курячий буріто з чорними бобами, сальсою, сметаною та гуакамоле" — надає AI чітку інформацію про інгредієнти.
Поєднання голосового ведення з веденням на основі фотографій покриває слабкі сторони кожного методу. Голос надає деталі інгредієнтів; фотографії забезпечують візуальну оцінку порцій. Використання обох разом, як підтримується в багатофункціональній системі ведення Nutrola поряд зі скануванням штрих-кодів, забезпечує найвищу практичну точність для щоденного відстеження харчування.
Конфіденційність та Обробка на Пристрої
Голосові дані є вкрай особистими. Сучасні системи голосового ведення вирішують питання конфіденційності через кілька архітектурних рішень:
- ASR на пристрої: Перетворення мови в текст відбувається на пристрої користувача, тому сирий аудіосигнал ніколи не залишає телефон.
- Передача лише тексту: Тільки транскрибований текст надсилається на сервери для NER та зіставлення з базою даних.
- Без зберігання аудіо: Аудіозаписи видаляються відразу після транскрипції.
- Зашифрований канал: Всі дані, що передаються між етапами обробки, використовують шифрування з кінця в кінець.
Ці заходи гарантують, що зручність голосового ведення не йде на шкоду конфіденційності. Nutrola обробляє голосові дані з цими принципами конфіденційності, синхронізуючи результати харчування з Apple Health та Google Fit без розкриття сирих аудіоданих.
Часто Задавані Питання
Наскільки точним є голосове ведення харчування в порівнянні з ручним введенням продуктів?
Голосове ведення харчування досягає 88 до 94 відсотків точності калорій в середньому, що порівнянно або трохи краще за ручний текстовий пошук (85 до 90 відсотків). Перевага голосу полягає в тому, що користувачі, як правило, надають більш детальні описи природно — включаючи методи приготування, приправи та специфіку інгредієнтів — що дає AI більше інформації для роботи, ніж простий запит текстового пошуку.
Чи може AI голосового ведення зрозуміти описи їжі з кількома продуктами в одному реченні?
Так. Сучасні моделі NER навчені витягувати кілька харчових сутностей з одного висловлювання. Сказавши "грильований курячий салат з авокадо, червоними помідорами та бальзамічною заправкою", буде отримано чотири або п'ять окремих харчових сутностей, кожна з яких зіставляється зі своїм записом у базі даних з індивідуальними значеннями калорій та макросів.
Що відбувається, коли AI не впевнений у тому, що я сказав?
Система використовує багаторівневу оцінку впевненості. Якщо загальна впевненість падає нижче 0.80, ви побачите запит на підтвердження, що показує найкращу інтерпретацію AI. Нижче 0.60 програма запитає вас уточнити — наприклад, "Ви мали на увазі картопляні чіпси чи картоплю фрі?" Цей підхід мінімізує як помилкові записи, так і непотрібні перерви.
Чи працює голосове ведення без підключення до Інтернету?
Сучасні моделі ASR на пристрої можуть перетворювати мову в текст без підключення до Інтернету. Однак етапи зіставлення з базою даних та розрізнення зазвичай вимагають з'єднання з сервером для доступу до повної бази даних харчування. Деякі програми, включаючи Nutrola, кешують часто ведені продукти локально, щоб ваші найпоширеніші страви могли бути зареєстровані голосом навіть без підключення.
Як голосове ведення обробляє акценти та не рідних англомовних спікерів?
Сучасні моделі ASR, такі як Whisper, навчені на різноманітних багатомовних аудіоданих, що охоплюють широкий спектр акцентів. Показники помилок слів для акцентованої англійської зазвичай на 2 до 5 відсотків вищі, ніж для рідних спікерів, але термінологія їжі — яка в основному стандартизована — зазвичай розпізнається надійніше, ніж загальна мова. Доопрацювання на аудіо, пов'язаному з їжею, ще більше звужує розрив у точності.
Яка технологія NLP забезпечує голосове ведення харчування?
Система використовує моделі на основі трансформерів на майже кожному етапі. Автоматичне розпізнавання мови використовує трансформери кодувальника-декодера (схожі на архітектуру Whisper). Визначення намірів та NER використовують доопрацьовані моделі сімейства BERT. Розрізнення та зіставлення з базою даних використовують вектори речень для семантичної схожості. Великі мовні моделі забезпечують каскадне виправлення та нульове розуміння нових описів їжі.
Чи можу я виправити записану голосом страву після факту?
Так. Системи голосового ведення з асистентами на основі LLM підтримують природні виправлення. Ви можете сказати "змінити рис на рис з цвітної капусти" або "видалити сир з моєї останньої страви", і AI зрозуміє це як виправлення та оновить існуючий запис, а не створить новий. AI Дієтолог Nutrola підтримує цей розмовний робочий процес редагування.
Наскільки швидко відбувається голосове ведення від мови до запису?
Загальний час затримки для типового опису страви становить від 1.5 до 3 секунд. ASR займає від 0.3 до 0.8 секунд для короткого висловлювання. NER та розрізнення додають від 0.2 до 0.5 секунд. Зіставлення з базою даних та оцінка впевненості займають ще від 0.3 до 0.7 секунд. Мережева затримка становить решту. Результат — ведення, яке відчувається майже миттєвим.
Чи краще голосове ведення, ніж ведення на основі фотографій для відстеження калорій?
Жоден метод не є універсально кращим. Голосове ведення перевершує, коли ви можете точно описати інгредієнти — для домашніх страв, змішаних страв і продуктів, які виглядають схоже, але відрізняються за харчуванням (наприклад, цільне молоко проти знежиреного). Ведення на основі фотографій перевершує для візуально відмінних продуктів, де основним змінним є розмір порції. Використання обох методів разом забезпечує найповніше відстеження, тому Nutrola підтримує ведення на основі фотографій, голосу, штрих-кодів та ручного введення в одному додатку, починаючи з лише 2.50 євро на місяць з триденним безкоштовним випробуванням.
Готові трансформувати своє відстеження харчування?
Приєднуйтесь до тисяч, які трансформували свою подорож до здоров'я з Nutrola!