语音记录如何让残障人士轻松追踪卡路里

传统的卡路里追踪应用对运动障碍、认知挑战、阅读障碍和临时伤害的人群造成了障碍。语音记录则完全消除了这些障碍。

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

根据世界卫生组织2023年发布的《残障人士健康公平全球报告》,全球约有13亿人(占全球人口的16%)生活在显著的残障中。许多人都有营养目标,医生、营养师或治疗师也常常建议他们追踪饮食。然而,绝大多数人发现,卡路里追踪应用并没有考虑到他们的身体或心理需求。

语音记录消除了传统卡路里追踪中存在的主要身体、认知和识字障碍。用户只需说出他们吃了什么——“我吃了两个炒鸡蛋和一片涂了黄油的酸面包”——AI会处理其余的内容。这一输入方式的改变,让数百万之前被排除在外的人也能参与到卡路里追踪中。

这不仅是一个小众问题。残障与每一个受益于营养追踪的人群都有交集:从受伤恢复的运动员,到管理慢性病的老年人,再到需要遵循排除饮食的自身免疫疾病患者,以及任何身体运作方式与应用设计者假设的不同的人。

运动障碍:打字和滚动成为障碍

问题的规模

全球约有七分之一的成年人生活在运动或行动相关的残障中。这包括类风湿性关节炎(全球超过1760万人受影响)、腕管综合症(影响3%至6%的成年人)、本质性震颤(40岁以上人群中约2.2%受影响)、帕金森病、多发性硬化、脊髓损伤和脑性瘫痪等。

传统的卡路里追踪需要大量的精细运动控制。想象一下记录一餐所需的步骤:

  1. 点击“添加食物”按钮(小触控目标)
  2. 在键盘上输入食物名称(精确的手指放置)
  3. 滚动搜索结果(持续的手指接触和控制移动)
  4. 点击正确的结果(精确的目标选择)
  5. 使用滑块或文本框调整份量(极其精细的运动控制)
  6. 对每一项食物重复以上步骤

对于一个患有震颤性帕金森病的人来说,仅仅是第五步——拖动滑块以表示“1.5份”——可能就几乎不可能完成。对于一个类风湿性关节炎患者来说,整天的点击累积起来会造成足够的疼痛,使得这一习惯无法持续。

语音记录如何消除障碍

使用语音基础的食物记录,以上所有步骤都简化为一个动作:说出食物。一个手部震颤严重的用户说:“我吃了一碗燕麦粥,配了一根香蕉和一汤匙花生酱”,AI会解析每一项食物,估算标准份量并记录。这无需点击、滚动或滑动。

Nutrola的语音记录处理自然语言,因此用户不需要遵循严格的格式。说“差不多一杯米饭,配一些烤鸡,可能六盎司,还有蒸西兰花”同样有效,AI会处理解析,用户只需通过一次点击或语音确认进行审核。

残障类型 传统追踪障碍 语音记录解决方案
类风湿性关节炎 每餐15至20次痛苦的重复点击和打字 每餐一个语音命令,无需手指压力
腕管综合症 持续握持手机,重复的拇指动作加重正中神经 手机可以放在桌子上;只需语音交互
本质性震颤 无法准确点击小触控目标或拖动滑块 无需精确目标选择
帕金森病 震颤、僵硬和运动迟缓使得多步骤触控交互极其缓慢 一句自然的句子替代数十次触控交互
脊髓损伤(C5-C7) 手功能有限或缺失;可能使用口腔棒或辅助设备进行触控 语音是最自然、最快的输入方式
脑性瘫痪(影响上肢) 不自主运动使得精确的屏幕交互不可靠 语音通常比精细运动更可控
临时石膏或固定 单手操作笨拙;主手可能受影响 完全免手操作的记录

低视力和失明:语音作为主要界面

我们在专门的文章中详细讨论了AI和语音记录如何为视觉障碍用户服务,文章标题为视觉障碍下的卡路里追踪。简而言之:传统应用依赖于密集的视觉界面、小字体、颜色编码的图表和视觉引导的条形码扫描——这些都无法满足低视力或失明用户的需求。

语音记录完全绕过了视觉界面。失明用户无需阅读搜索结果、视觉比较份量或对准相机扫描条形码。他们只需用自然语言描述自己吃了什么,AI便会解析并记录。

针对低视力和失明人群的关键考虑:

  • 屏幕阅读器兼容性。 语音记录必须与VoiceOver(iOS)和TalkBack(Android)无缝配合。这意味着在确认屏幕上需要适当的ARIA标签,以及可访问的营养数据输出。
  • 音频反馈。 语音记录后,应用应读出记录的内容:“记录:两个炒鸡蛋,182卡路里,12克蛋白质。”这一确认循环可以防止无声错误。
  • 最小化视觉信息。 营养摘要应以文本列表形式提供,而不仅仅是饼图或进度环,这些屏幕阅读器无法解析。

有关此主题的深入探讨,包括真实用户体验和视觉障碍用户在条形码扫描和份量估算方面的具体挑战,请参阅我们的完整文章:视觉障碍下的卡路里追踪:AI和语音如何使其成为可能

阅读障碍和识字挑战:说话比拼写更容易

隐藏在明面上的障碍

阅读障碍影响全球约5%至10%的人口,某些估计甚至高达17%(包括轻微形式)。这是最常见的学习差异之一,但在健康技术领域却鲜有讨论。

想象一下传统卡路里追踪对阅读障碍者的要求:

  • 正确拼写食物名称。 搜索食物数据库需要输入“藜麦”、“意式面包”、“伍斯特酱”或“阿萨伊”等词汇——这些词对没有阅读障碍的人来说也很具挑战性。拼写错误的搜索将返回无结果或错误结果。
  • 阅读和比较密集文本。 食物数据库结果以小字体呈现多个相似选项。区分“带骨鸡腿,烤制,4盎司”和“去骨鸡腿,去皮,烤制,100克”需要仔细阅读。
  • 处理营养标签。 数字和单位(千卡、克、毫克、盎司、毫升)可能会被调换或误读。

对于阅读障碍者来说,这些并不是小麻烦,而是该状况使其真正困难的文本密集型、依赖精确度的任务。因此,许多阅读障碍者并不是因为缺乏动力而放弃卡路里追踪,而是因为界面在每一步都惩罚他们。

语音记录如何帮助

语音输入完全消除了拼写障碍。用户无需知道“藜麦”的拼写——只需说出这个词。AI的自然语言处理负责识别,包括带口音的发音和地方食物名称。

它还消除了阅读和比较搜索结果的需要。用户只需说出“去皮的烤鸡腿,大约四盎司”,AI会直接选择最佳匹配。思维的努力从解码文本转移到简单地描述盘子上的食物——这根本不需要识字能力。

认知障碍:简化思维模型

传统追踪的认知负担

大多数应用实施的卡路里追踪是一个多步骤的决策过程。对于每一种食物,用户必须:

  1. 决定如何搜索(名称、品牌、条形码或最近的食物)
  2. 形成搜索查询
  3. 评估结果并选择最佳匹配
  4. 确定份量大小并在必要时转换单位
  5. 确认并重复

《医学互联网研究杂志》上发表的研究表明,多步骤的数字健康任务对智力障碍、获得性脑损伤以及影响执行功能的ADHD患者造成了不成比例的障碍。每一个决策点都是潜在的放弃点。

对于患有唐氏综合症、创伤性脑损伤或中度ADHD的人来说,仅仅是第四步——“那是一杯还是一杯半?我应该用克还是盎司记录?‘中等’和我吃的东西是一样的吗?”——可能会让人感到认知负担过重,从而放弃记录。

语音记录作为更简单的思维模型

语音记录将思维模型简化为一个概念:说出你吃了什么。 用户无需选择搜索策略,无需评估结果,无需进行单位转换。用户唯一需要做的就是用自己的话描述他们的餐点。

“我吃了一个火鸡奶酪三明治和一些薯片”就是一个完整的可记录输入。AI负责消歧义、估算份量和查找营养信息。认知负担从用户转移到技术上——正是它应该在的地方。

这对以下用户特别有价值:

  • 有智力障碍的用户,可能需要照顾者帮助他们管理营养目标
  • 有ADHD的用户,需要快速记录以便在注意力转移之前完成
  • 从脑损伤中恢复的用户,在多步骤数字任务中容易感到疲惫
  • 轻度认知障碍的老年用户,受益于营养追踪但对复杂的应用界面感到困难

临时伤害:被忽视的可及性需求

并非所有残障都是永久性的。每年,数百万人经历临时状况,使得传统手机交互变得困难:

  • 手腕或手部骨折。 每年在美国约有170万例腕部骨折。恢复通常需要6至8周的石膏固定。
  • 手术后的恢复。 肩部、肘部或手部手术可能限制手臂和手的使用数周到数月。
  • 烧伤或皮肤病。 严重的湿疹、接触性皮炎或手部烧伤可能使得长时间接触屏幕变得疼痛。
  • 重复性劳损伤害。 腱炎、触发手指或德奎尔万氏腱鞘炎可能需要避免重复的手机使用。

对于这些用户来说,语音记录不仅更可及——在恢复期间,它往往是唯一实用的输入方法。为了在营养恢复期间继续追踪,而不需要使用双手,他们可以完全依赖语音记录。

Nutrola结合了语音记录和AI照片记录,即使在言语暂时受损(例如,颌部手术)时,照片选项仍然可用,反之亦然。多种输入方式创造了冗余,因此总有一条前进的道路。

WCAG合规性及“可及性”的真正含义

W3C发布的《网页内容无障碍指南》(WCAG)2.2定义了可及数字内容的四个原则:可感知、可操作、可理解和稳健。语音记录直接支持多个WCAG成功标准:

  • WCAG 2.2 SC 2.5.1(指针手势)。 所有功能应可通过简单的指针输入操作。语音记录完全消除了对复杂手势的需求。
  • WCAG 2.2 SC 2.1.1(键盘可访问)。 所有功能应在不要求特定输入方式的情况下可访问。语音提供了键盘和触控的替代方案。
  • WCAG 2.2 SC 3.3.2(标签或说明)。 输入字段应有明确的说明。语音记录用自然语言替代了结构化输入字段,减少了说明的需求。
  • WCAG 2.2 SC 2.5.8(目标尺寸最小)。 交互元素应至少为24x24 CSS像素。语音完全消除了对小触控目标的依赖。

可及性并不是在发布后添加的功能,而是决定产品是否服务于所有用户或仅服务于部分用户的设计原则。语音优先输入是营养应用可以做出的最具影响力的可及性决策之一。

Nutrola提供的服务:通过多种输入方式实现可及性

Nutrola并不是作为“可及性应用”设计的。它是一款营养追踪应用,默认情况下具有可及性,因为它提供多种记录食物的方式:

  • 语音记录。 用自然语言描述你的餐点。AI处理描述,识别食物项和份量,并记录输入。
  • AI照片记录。 拍摄你的盘子照片。AI视觉识别食物并估算份量。当言语困难或食物难以描述时非常有用。
  • 条形码扫描。 从经过验证的数据库中以95%以上的准确率扫描包装食品。
  • 手动搜索。 传统的基于文本的搜索,适合喜欢这种方式的用户。
  • AI饮食助手。 用对话语言询问有关营养的问题。

这种多模态的方法意味着无论用户的能力特征如何——无论是永久性、临时性还是情境性——都有适合他们的输入方式。Nutrola的起价为每月2.50欧元,提供为期3天的免费试用,所有套餐均无广告。没有广告本身就是一种可及性考虑:插播广告会干扰屏幕阅读器,遮挡放大用户的内容,并为注意力或处理能力有差异的用户增加认知负担。

与Apple Health和Google Fit的集成意味着记录的数据可以无缝流入更广泛的健康生态系统,而无需额外的手动输入——这又减少了交互负担,惠及所有用户,尤其是那些每次交互都需要更多努力的用户。

常见问题

运动障碍人士能否在不触碰手机的情况下使用语音记录?

在大多数情况下,可以。一旦应用打开,语音记录可以通过最小的触碰或设备级的语音助手激活。严重运动障碍的用户通常可以通过一个大的触控目标激活麦克风按钮,使用口腔棒或辅助设备进行导航。在iOS和Android上,用户还可以利用系统级的语音控制完全免手操作地导航应用。

语音记录是否与VoiceOver和TalkBack等屏幕阅读器兼容?

语音记录作为一种输入方式与屏幕阅读器输出是分开的,两者可以协同工作。用户可以在使用语音输入描述餐点的同时,运行VoiceOver来导航应用并听取记录条目的确认。关键要求是应用的界面元素——按钮、确认屏幕、营养摘要——需要正确标记以确保屏幕阅读器的兼容性。

语音记录的准确性与手动文本输入相比如何?

对于用自然语言描述的标准餐点,Nutrola的语音记录的准确性与仔细的手动输入相当。AI会交叉参考经过验证的营养数据库,并处理人们描述食物时的常见变体。准确性可能在非常不寻常的食物或模糊描述(如“某种肉和其他东西”)时有所不同——但这种模糊性在任何输入方式下都会产生不准确的结果。

语音记录对阅读障碍者特别有用吗?

是的,它直接解决了核心挑战。阅读障碍主要影响阅读和写作,而不是说话。语音记录消除了拼写食物名称、阅读搜索结果或解析密集营养文本的需要。用户可以大声描述他们的餐点,AI处理所有基于文本的处理。这将卡路里追踪从一个依赖识字的任务转变为一个对话式的任务。

对于言语障碍者,Nutrola是否仍然可用?

对言语的影响大于运动功能的用户可以使用Nutrola的AI照片记录或条形码扫描。这正是多模态输入的重要性所在。没有单一的输入方式是普遍可及的,但提供语音、照片、条形码和手动输入的组合意味着几乎每种能力特征都有可行的路径。

Nutrola是否符合WCAG可及性标准?

Nutrola的语音记录和多模态输入方法直接支持多个WCAG 2.2成功标准,特别是与输入方式独立性、目标尺寸和减少对复杂手势的依赖相关的标准。所有定价层级的无广告设计也消除了一个常见的可及性障碍,因为插播广告和横幅广告常常干扰屏幕阅读器和放大工具。

语音记录能否帮助在智能手机应用方面有困难的老年用户?

当然可以。与年龄相关的精细运动控制、视力和认知处理速度的下降使得传统的卡路里追踪应用变得更加困难。语音记录将交互简化为一个熟悉且自然的过程——用语言描述一餐。对于管理糖尿病或心脏病等需要营养追踪的老年人来说,这种较低的进入门槛可能是追踪与否的关键。

Nutrola的费用是多少?是否有免费选项?

Nutrola的起价为每月2.50欧元,提供为期3天的免费试用,用户可以测试包括语音记录、AI照片记录和AI饮食助手在内的所有功能。没有永久免费的套餐,但所有计划均无广告——这是一个有意的选择,有利于所有用户,尤其是使用辅助技术的用户。

准备好改变您的营养追踪方式了吗?

加入成千上万已通过 Nutrola 改变健康之旅的用户!