Как голосовая запись делает отслеживание калорий доступным для людей с ограниченными возможностями

Традиционные приложения для отслеживания калорий создают преграды для людей с двигательными нарушениями, когнитивными проблемами, дислексией и временными травмами. Голосовая запись полностью устраняет эти преграды.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

По данным Всемирной организации здравоохранения, почти 1,3 миллиарда человек в мире — 16% населения — живут с серьезными ограничениями. Многие из них ставят перед собой цели в области питания и получают рекомендации от врачей, диетологов или терапевтов отслеживать свой рацион. Однако подавляющее большинство из них сталкивается с тем, что приложения для отслеживания калорий не учитывают их особенности.

Голосовая запись устраняет основные физические, когнитивные и литературные барьеры, которые делают традиционное отслеживание калорий недоступным. Вместо того чтобы набирать текст, прокручивать, искать и регулировать порции, пользователи просто говорят, что они съели: "Я съел два яйца всмятку и кусок хлеба с маслом", а ИИ обрабатывает остальное. Этот единственный переход к голосовому вводу открывает возможность отслеживания калорий для миллионов людей, которые ранее были исключены.

Это не узкая проблема. Ограниченные возможности касаются всех демографических групп, которым необходимо отслеживание питания: спортсмены, восстанавливающиеся после травм, пожилые люди с хроническими заболеваниями, люди с аутоиммунными расстройствами, соблюдающие диеты, и все, чье тело функционирует иначе, чем предполагали разработчики приложений, создавая маленькие кнопки и перегруженные интерфейсы.

Двигательные нарушения: когда набор текста и прокрутка становятся преградой

Масштаб проблемы

Приблизительно 1 из 7 взрослых во всем мире имеет двигательное или подвижностное нарушение. Это включает такие состояния, как ревматоидный артрит (более 17,6 миллиона человек по всему миру), синдром запястного канала (3–6% взрослого населения), эссенциальный тремор (около 2,2% людей старше 40 лет), болезнь Паркинсона, рассеянный склероз, травмы спинного мозга и церебральный паралич.

Традиционное отслеживание калорий требует значительного контроля мелкой моторики. Рассмотрим, что нужно для записи одного приема пищи:

  1. Нажать кнопку "Добавить пищу" (маленькая зона касания)
  2. Ввести название продукта на клавиатуре (точное размещение пальцев)
  3. Прокрутить результаты поиска (длительное касание пальцем с контролируемым движением)
  4. Нажать на правильный результат (точное нажатие)
  5. Отрегулировать размер порции с помощью ползунка или текстового поля (очень тонкая моторика)
  6. Повторить для каждого продукта в приеме пищи

Для человека с тремором при болезни Паркинсона пятый шаг — перетаскивание ползунка для указания "1.5 порции" — может быть практически невозможен. А для человека с ревматоидным артритом, у которого воспалены суставы пальцев, постоянные нажатия в течение дня могут вызвать такую боль, что привычка отслеживать калории становится невыносимой.

Как голосовая запись устраняет преграды

С помощью голосового отслеживания пищи весь вышеописанный процесс сводится к одному действию: произнесению. Пользователь с сильными треморами говорит: "Я съел тарелку овсянки с бананом и столовой ложкой арахисового масла", а ИИ распознает каждый элемент, оценивает стандартные порции и фиксирует запись. Никаких нажатий. Никакой прокрутки. Никакой манипуляции с ползунками.

Голосовая запись Nutrola обрабатывает естественную речь, поэтому пользователям не нужно следовать строгому формату. Фраза "примерно чашка риса с курицей на гриле, может быть, шесть унций, и на пару приготовленный брокколи" работает так же хорошо, как и перечисление продуктов по отдельности. ИИ обрабатывает распознавание, а пользователи могут проверить и подтвердить запись одним нажатием или голосовой командой.

Тип нарушения Преграда традиционного отслеживания Решение голосовой записи
Ревматоидный артрит Болезненные повторяющиеся нажатия и набор текста в 15–20 взаимодействиях за прием пищи Одна голосовая команда за прием пищи, без нагрузки на пальцы
Синдром запястного канала Длительное удержание телефона, повторяющиеся движения большим пальцем усугубляют состояние Телефон может лежать на столе; требуется только голосовое взаимодействие
Эссенциальный тремор Невозможность точно нажимать на маленькие зоны касания или перетаскивать ползунки Не требуется точное нажатие
Болезнь Паркинсона Треморы, ригидность и брадикардия делают многоступенчатые взаимодействия крайне медленными Одно естественное предложение заменяет десятки касаний
Травма спинного мозга (C5–C7) Ограниченная или отсутствующая функция рук; может использоваться специальное устройство для касания Голос — это естественный и самый быстрый способ ввода
Церебральный паралич (влияет на верхние конечности) Непроизвольные движения делают точное взаимодействие с экраном ненадежным Речь часто более контролируема, чем мелкая моторика
Временные гипсы или иммобилизация Одноручное управление неудобно; доминирующая рука может быть повреждена Полностью безрукое отслеживание

Низкое зрение и слепота: голос как основной интерфейс

Мы уже подробно писали о том, как ИИ и голосовая запись помогают пользователям с нарушениями зрения в нашей специализированной статье о отслеживании калорий при нарушении зрения. Кратко: традиционные приложения полагаются на плотные визуальные интерфейсы, мелкий текст, цветные диаграммы и сканирование штрих-кодов, что не подходит пользователям с низким зрением или слепотой.

Голосовая запись полностью обходит визуальный интерфейс. Пользователю, который слеп, не нужно читать результаты поиска, визуально сравнивать размеры порций или выравнивать камеру с штрих-кодом. Они описывают, что съели, на естественном языке, а ИИ интерпретирует и фиксирует это.

Ключевые моменты для сообщества с низким зрением и слепотой:

  • Совместимость с экранными считывателями. Голосовая запись должна работать без сбоев с VoiceOver (iOS) и TalkBack (Android). Это означает наличие правильных ARIA-меток на экранах подтверждения и доступный вывод зарегистрированных данных о питании.
  • Аудиообратная связь. После голосовой записи приложение должно озвучивать, что было зафиксировано: "Зарегистрировано: два яйца всмятку, 182 калории, 12 граммов белка." Этот цикл подтверждения предотвращает ошибки.
  • Минимум информации только для визуалов. Питательные резюме должны быть доступны в виде текстовых списков, а не только в виде круговых диаграмм или прогресс-колец, которые экранные считыватели не могут интерпретировать.

Для более глубокого изучения этой темы, включая реальные пользовательские опыты и конкретные проблемы сканирования штрих-кодов и оценки порций для слепых пользователей, смотрите нашу полную статью: Отслеживание калорий при нарушении зрения: как ИИ и голос делают это возможным.

Дислексия и проблемы с грамотностью: говорить проще, чем писать

Преграда, скрывающаяся на виду

Дислексия затрагивает примерно 5–10% населения мира, а по некоторым оценкам, это число может достигать 17%, если учитывать более легкие формы. Это одно из самых распространенных нарушений обучения и одно из наименее обсуждаемых в контексте технологий здоровья.

Рассмотрим, что традиционное отслеживание калорий требует от человека с дислексией:

  • Правильное написание названий продуктов. Поиск в базе данных продуктов требует ввода "киноа", "брускетта", "вустершир" или "асаи" — слов, которые сложно написать даже людям без дислексии. Ошибка в написании приводит к отсутствию результатов или неправильным результатам.
  • Чтение и сравнение плотного текста. Результаты базы данных продуктов представляют несколько похожих вариантов в мелком тексте. Различить "Куриное бедро с косточкой, запеченное, 4 унции" и "Куриное бедро без косточки, без кожи, на гриле, 100 г" требует внимательного чтения.
  • Обработка питательных этикеток. Цифры и единицы измерения (ккал, г, мг, унции, мл) могут быть перепутаны или неправильно прочитаны.

Для человека с дислексией это не мелкие неудобства. Это именно те текстовые задачи, требующие точности, которые данное состояние делает действительно сложными. В результате многие люди с дислексией отказываются от отслеживания калорий не из-за отсутствия мотивации, а потому что интерфейс на каждом шаге создает им трудности.

Как голосовая запись помогает

Голосовой ввод полностью устраняет проблему с написанием. Пользователю не нужно знать, как написать "киноа" — достаточно просто произнести это слово. Естественная обработка языка ИИ справляется с распознаванием, включая акцентированные произношения и региональные названия продуктов.

Это также устраняет необходимость читать и сравнивать результаты поиска. Вместо того чтобы просматривать список из 20 вариантов курицы, пользователь говорит "куриное бедро на гриле, без кожи, примерно четыре унции", и ИИ выбирает лучший вариант напрямую. Умственные усилия переключаются с декодирования текста на простое описание того, что было на тарелке — задача, не требующая грамотности.

Когнитивные нарушения: упрощение ментальной модели

Когнитивная нагрузка традиционного отслеживания

Отслеживание калорий, как это реализовано в большинстве приложений, представляет собой многоступенчатый процесс принятия решений. Для каждого продукта пользователь должен:

  1. Определить, как искать (по названию, бренду, штрих-коду или недавним продуктам)
  2. Сформулировать поисковый запрос
  3. Оценить результаты и выбрать лучший вариант
  4. Определить размер порции и, если необходимо, конвертировать единицы
  5. Подтвердить и повторить

Исследования, опубликованные в Journal of Medical Internet Research, показали, что многоступенчатые цифровые задачи в области здоровья создают непропорциональные барьеры для людей с интеллектуальными нарушениями, приобретенными травмами мозга и состояниями, такими как СДВГ, которые влияют на исполнительные функции. Каждая точка принятия решения может стать причиной отказа.

Для человека с синдромом Дауна, травматической черепно-мозговой травмой или умеренной СДВГ четвертый шаг — "Это одна чашка или полторы? Должен ли я записывать в граммах или унциях? 'Средний' — это то же самое, что и то, что я съел?" — может быть когнитивно перегружающим настолько, что они отказываются от записи.

Голосовая запись как более простая ментальная модель

Голосовая запись сводит ментальную модель к одной концепции: сказать, что вы съели. Нет необходимости выбирать стратегию поиска, оценивать результаты, выполнять конвертацию единиц. Единственное, что нужно пользователю — описать свой прием пищи своими словами.

"Я съел сэндвич с индейкой и сыром и немного чипсов" — это полное, пригодное для записи сообщение. ИИ обрабатывает расшифровку, оценку порций и поиск питательной информации. Когнитивная нагрузка переходит от пользователя к технологии — именно туда, куда она и должна быть.

Это особенно полезно для:

  • Пользователей с интеллектуальными нарушениями, которым могут помогать опекуны в управлении целями питания
  • Пользователей с СДВГ, которым необходимо, чтобы процесс записи был достаточно быстрым, чтобы завершить его до того, как внимание переключится
  • Пользователей, восстанавливающихся после травм мозга, которые испытывают усталость от многоступенчатых цифровых задач
  • Пожилых людей с легкими когнитивными нарушениями, которым полезно отслеживание питания, но которые сталкиваются с трудностями в сложных интерфейсах приложений

Временные травмы: незамеченная необходимость в доступности

Не все ограничения являются постоянными. Каждый год миллионы людей сталкиваются с временными состояниями, которые затрудняют традиционное взаимодействие с телефоном:

  • Перелом запястья или руки. В США ежегодно происходит около 1,7 миллиона переломов запястья. Восстановление обычно требует 6–8 недель в гипсе.
  • Послеоперационное восстановление. Операции на плече, локте или руке могут ограничить использование рук на недели или месяцы.
  • Ожоги или кожные заболевания. Тяжелая экзема, контактный дерматит или ожоги на руках могут сделать длительное взаимодействие с экраном болезненным.
  • Травмы от повторяющихся нагрузок. Тендинит, "щелкающий палец" или теносиновит Де Кервена могут потребовать избегания повторяющегося использования телефона.

Для этих пользователей голосовая запись не просто более доступна — это часто единственный практичный способ ввода во время восстановления. Вместо того чтобы отказываться от целей в области питания в период, когда восстановление особенно важно, они могут продолжать отслеживание, не используя руки вовсе.

Комбинация голосовой записи и ИИ-фото записи от Nutrola означает, что даже если речь временно затруднена (например, после операции на челюсти), остается возможность использовать фото, и наоборот. Множественные способы ввода создают резерв, так что всегда есть путь вперед.

Соответствие стандартам WCAG и что означает "доступность"

Руководящие принципы по доступности веб-контента (WCAG) 2.2, опубликованные W3C, определяют четыре принципа доступного цифрового контента: воспринимаемость, управляемость, понятность и надежность. Голосовая запись напрямую поддерживает несколько критериев успеха WCAG:

  • WCAG 2.2 SC 2.5.1 (Указания для указателей). Все функции должны быть управляемыми с помощью простых указательных вводов. Голосовая запись полностью устраняет необходимость в сложных жестах.
  • WCAG 2.2 SC 2.1.1 (Доступность с клавиатуры). Все функции должны быть доступны без необходимости в конкретных способах ввода. Голос предоставляет альтернативу как клавиатуре, так и касанию.
  • WCAG 2.2 SC 3.3.2 (Ярлыки или инструкции). Поля ввода должны иметь четкие инструкции. Голосовая запись заменяет структурированные поля ввода естественным языком, уменьшая необходимость в инструкциях.
  • WCAG 2.2 SC 2.5.8 (Минимальный размер цели). Интерактивные элементы должны иметь размер не менее 24x24 пикселей CSS. Голос полностью устраняет зависимость от маленьких зон касания.

Доступность — это не функция, которую можно добавить после запуска. Это принцип проектирования, который определяет, служит ли продукт всем пользователям или только некоторым. Ввод с помощью голоса — одно из самых значительных решений по доступности, которое может принять приложение для питания.

Что предлагает Nutrola: доступность через множество способов ввода

Nutrola не была разработана как "приложение для доступности". Это приложение для отслеживания питания, которое по умолчанию является доступным, поскольку предлагает несколько способов записи пищи:

  • Голосовая запись. Опишите свой прием пищи на естественном языке. ИИ обрабатывает описание, определяет продукты и порции и фиксирует запись.
  • ИИ-фото запись. Сделайте фото своей тарелки. ИИ определяет продукты и визуально оценивает порции. Полезно, когда речь затруднена или когда трудно описать еду.
  • Сканирование штрих-кодов. Сканируйте упакованные продукты с точностью более 95% из проверенной базы данных.
  • Ручной поиск. Традиционный текстовый поиск для пользователей, которые предпочитают его.
  • ИИ-диетический помощник. Задавайте вопросы о своем питании на разговорном языке.

Этот многомодальный подход означает, что независимо от профиля способностей пользователя — будь то постоянные, временные или ситуационные — существует способ ввода, который подходит именно им. Nutrola начинается с €2.50 в месяц после 3-дневной бесплатной пробной версии, без рекламы на любом уровне. Отсутствие рекламы само по себе является аспектом доступности: межстраничные объявления мешают экранным считывателям, затрудняют восприятие контента для пользователей с увеличением и добавляют когнитивную нагрузку для пользователей с проблемами внимания или обработки информации.

Интеграция с Apple Health и Google Fit позволяет зарегистрированным данным поступать в более широкие экосистемы здоровья без необходимости дополнительного ручного ввода — еще одно снижение нагрузки на взаимодействие, которое выгодно всем пользователям, особенно тем, для кого каждое взаимодействие требует больше усилий.

Часто задаваемые вопросы

Могут ли люди с двигательными нарушениями использовать голосовую запись, не касаясь телефона вообще?

В большинстве случаев да. Как только приложение открыто, голосовая запись может быть активирована с минимальным касанием или через голосовых помощников на уровне устройства. Пользователи с тяжелыми двигательными нарушениями, использующие доступ с помощью переключателей или специальных устройств, обычно могут активировать кнопку микрофона как одну большую зону касания. На iOS и Android пользователи также могут использовать системный голосовой контроль для навигации в приложении полностью без рук.

Работает ли голосовая запись с экранными считывателями, такими как VoiceOver и TalkBack?

Голосовая запись как метод ввода отделена от вывода экранного считывателя, и оба работают вместе. Пользователь может использовать VoiceOver для навигации в приложении и слышать подтверждение зарегистрированных записей, при этом используя голосовой ввод для описания своих приемов пищи. Ключевое требование заключается в том, чтобы элементы интерфейса приложения — кнопки, экраны подтверждения, питательные резюме — были правильно помечены для совместимости с экранными считывателями.

Насколько точна голосовая запись по сравнению с ручным вводом текста?

Для стандартных приемов пищи, описанных на естественном языке, голосовая запись через ИИ Nutrola достигает точности, сопоставимой с аккуратным ручным вводом. ИИ сопоставляет данные с проверенной базой данных о питательных веществах и обрабатывает распространенные вариации в том, как люди описывают еду. Точность может варьироваться при использовании очень необычных продуктов или слишком расплывчатых описаний, таких как "немного мяса и чего-то еще" — но такая же неопределенность приведет к неточным результатам с любым методом ввода.

Полезна ли голосовая запись для людей с дислексией?

Да, и она напрямую решает основную проблему. Дислексия в первую очередь затрагивает чтение и письмо, а не речь. Голосовая запись устраняет необходимость в написании названий продуктов, чтении результатов поиска или анализе плотного питательного текста. Пользователи описывают свои приемы пищи вслух, а ИИ обрабатывает все текстовые данные. Это превращает отслеживание калорий из задачи, требующей грамотности, в разговорную.

А что насчет людей с речевыми нарушениями — могут ли они все еще использовать Nutrola?

Пользователи, чье нарушение больше затрагивает речь, чем моторные функции, могут использовать ИИ-фото запись или сканирование штрих-кодов. Именно поэтому многомодальный ввод имеет значение. Ни один метод ввода не является универсально доступным, но предложение голосового, фото, штрих-кода и ручного ввода вместе означает, что существует жизнеспособный путь для почти каждого профиля способностей.

Соответствует ли Nutrola стандартам доступности WCAG?

Голосовая запись Nutrola и подход с многомодальным вводом напрямую поддерживают несколько критериев успеха WCAG 2.2, особенно тех, которые касаются независимости способов ввода, размера цели и уменьшения зависимости от сложных жестов. Дизайн без рекламы на всех уровнях цен также устраняет распространенную преграду доступности, поскольку межстраничные и баннерные объявления часто мешают экранным считывателям и инструментам увеличения.

Может ли голосовая запись помочь пожилым пользователям, которые испытывают трудности с приложениями для смартфонов?

Абсолютно. Возрастные изменения, влияющие на мелкую моторику, зрение и скорость обработки информации, делают традиционные приложения для отслеживания калорий более сложными в использовании. Голосовая запись сводит взаимодействие к чему-то знакомому и естественному — описанию приема пищи словами. Для пожилых людей, управляющих такими состояниями, как диабет или сердечно-сосудистые заболевания, где отслеживание питания имеет медицинское значение, этот более низкий барьер для входа может стать решающим.

Сколько стоит Nutrola, и есть ли бесплатный вариант?

Nutrola начинается с €2.50 в месяц, с 3-дневной бесплатной пробной версией для тестирования всех функций, включая голосовую запись, ИИ-фото запись и ИИ-диетического помощника. Постоянного бесплатного уровня нет, но на всех планах также нет рекламы — это осознанный выбор, который приносит пользу всем пользователям, особенно тем, кто использует вспомогательные технологии.

Готовы трансформировать отслеживание питания?

Присоединяйтесь к тысячам тех, кто изменил свой путь к здоровью с Nutrola!