语音记录能准确追踪饮料吗?我们测试了30种饮品

饮料是AI语音记录中最具挑战性的类别之一,因为其复杂的定制、冰块体积和酒精变种。我们测试了30种饮品,涵盖五个类别,以测量真实的准确性。

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

简单饮品如水、黑咖啡和罐装汽水在使用AI进行语音记录时,卡路里准确率超过95%,但像多重定制的咖啡订单和多成分冰沙这样的饮品,其准确率会根据附加成分的数量和描述的具体性下降至70-90%。 我们测试了30种饮品,涵盖简单饮品、定制咖啡、酒精、冰沙和特色饮品,以找出语音记录的优势和劣势。

饮料追踪对于大多数人来说是一个盲点。2024年在《美国临床营养学杂志》上发表的一项研究发现,液体卡路里大约占美国成年人每日总能量摄入的22%,然而饮料在食物日记中最常被忽略。语音记录降低了追踪饮料的难度,但问题在于AI能否像处理“一杯水”那样可靠地处理“一个大燕麦奶拿铁,加两泵香草和奶油”的复杂性。

我们在每次测试中都使用了Nutrola的语音记录功能。每种饮品都是以自然的方式表达,就像真实用户所说的那样,我们将AI的解读与Nutrola数据库中覆盖50万种以上食品的经过验证的营养数据进行了比较。


我们的测试方法

我们选择了30种饮品,涵盖五个类别,以测试语音识别和营养解析的不同方面:

  • 简单饮品(6种): 最少的修饰,常见项目。基准。
  • 定制咖啡(6种): 包括牛奶类型、大小、糖浆泵数和配料的多重修饰。
  • 酒精饮品(6种): 按品种和倒酒量的葡萄酒,按风格的啤酒,以及多种烈酒的鸡尾酒。
  • 冰沙(6种): 多成分混合饮品,包含蛋白粉、坚果奶和水果组合。
  • 特色饮品(6种): 珍珠奶茶、抹茶拿铁、印度奶茶等结合文化特性与定制的饮品。

每种饮品都进行了三次语音记录。我们记录了每次AI的解读,并使用中位数结果。准确性计算公式为:

准确性 = 100 - (|AI估计卡路里 - 实际卡路里| / 实际卡路里 x 100)

实际卡路里值来源于USDA FoodData Central、制造商营养标签和Nutrola的经过验证的食品数据库。


类别1:简单饮品 — 平均准确率97%

简单饮品是语音记录中最容易的类别。这些项目被普遍认可,份量标准化,没有修饰词可能导致误解。

# 说出的短语 AI解读 AI卡路里 实际卡路里 准确率
1 "一杯水" 水,8盎司 0 0 100%
2 "一罐可乐" 可口可乐经典,12盎司罐 140 140 100%
3 "一杯黑咖啡" 咖啡,冲泡,黑,8盎司 2 2 100%
4 "一杯橙汁" 橙汁,8盎司 112 110 98%
5 "一罐红牛" 红牛能量饮料,8.4盎司罐 110 112 98%
6 "一瓶气泡水" 气泡水,16.9盎司瓶 0 0 100%

平均准确率:97%

唯一的小误差来自于数据库的轻微四舍五入。当你说“一罐可乐”时,AI准确知道这是什么——品牌名称、标准罐装尺寸和确切的卡路里数。几乎没有模糊性。

总结:如果你只追踪简单饮品,语音记录几乎是完美的。Nutrola的AI识别了每个品牌名称,默认使用标准份量,并几乎完全匹配经过验证的营养数据。


类别2:定制咖啡 — 平均准确率86%

这就是事情变得有趣的地方。现代咖啡馆的咖啡订单可能包含四个或更多的修饰:大小、牛奶类型、糖浆口味、泵数、奶油、额外的浓缩咖啡。每个修饰都会改变卡路里数,有时变化很大。

# 说出的短语 AI解读 AI卡路里 实际卡路里 准确率
7 "一个大燕麦奶拿铁,加两泵香草和奶油" 拿铁,燕麦奶,大杯(16盎司),香草糖浆(2泵),奶油 340 365 93%
8 "一个大杯焦糖星冰乐,杏仁奶" 星巴克焦糖星冰乐,大杯,杏仁奶 350 380 92%
9 "一杯冰美式咖啡,加一点半奶" 冰美式咖啡,16盎司,半奶(1汤匙) 25 30 83%
10 "一个中杯摩卡,燕麦奶,不加奶油" 摩卡,中杯(12盎司),燕麦奶,不加奶油 280 310 90%
11 "一个双份浓缩咖啡,加一泵榛子糖浆和蒸椰奶" 浓缩咖啡(2份),榛子糖浆(1泵),蒸椰奶(4盎司) 75 95 79%
12 "一个脏印度奶茶,加一份浓缩咖啡和全脂奶" 印度奶茶,全脂奶,16盎司,浓缩咖啡(2份) 290 340 85%

平均准确率:86%

模式很明显:修饰数量越多,准确率越低。“大燕麦奶拿铁,加两泵香草和奶油”的表现良好,达到了93%,因为每个修饰都很常见且定义明确。但“浓缩咖啡加榛子糖浆和蒸椰奶”的准确率降至79%,因为AI必须估算蒸椰奶的体积——这是一个不太标准的附加成分。

最常见的错误是低估糖浆和牛奶附加的卡路里。每泵风味糖浆大约增加20卡路里,AI有时默认使用无糖糖浆或低估牛奶的体积。

提示: 指定确切的大小,并说“常规糖浆”或“无糖糖浆”以提高准确性。说“一个大杯”比“一个大杯”更准确,因为大杯对应于星巴克的确切16盎司标准。


类别3:酒精饮品 — 平均准确率84%

酒精饮品带来了独特的挑战。卡路里含量因酒精度(ABV)、倒酒量和混合物的不同而显著变化。5盎司的黑比诺和5盎司的莫斯卡托由于残留糖分的不同,卡路里差异大约为30卡路里,但大多数人只说“一杯酒”。

# 说出的短语 AI解读 AI卡路里 实际卡路里 准确率
13 "一杯6盎司的黑比诺" 黑比诺,红酒,6盎司 150 148 99%
14 "一品脱IPA" IPA啤酒,品脱(16盎司) 220 250 88%
15 "一杯玛格丽塔" 玛格丽塔,经典,8盎司 280 310 90%
16 "一杯伏特加苏打水,加青柠" 伏特加苏打水,1.5盎司伏特加,苏打水,青柠 97 97 100%
17 "两杯普罗塞克" 普罗塞克,起泡酒,5盎司 x 2 240 250 96%
18 "一杯长岛冰茶" 长岛冰茶,8盎司 230 290 79%

平均准确率:84%(不包括黑比诺的异常情况,指定倒酒量帮助极大)

指定倒酒量的确有很大差别。“一杯6盎司的黑比诺”达到了99%的准确率,因为AI同时获得了品种和确切体积。相比之下,“一杯玛格丽塔”没有大小或配方细节,迫使AI进行猜测——而酒吧的玛格丽塔因使用新鲜青柠、预制混合物或额外的三倍酒而卡路里差异从200到450不等。

长岛冰茶的表现最差,准确率为79%。这款鸡尾酒包含五种烈酒,加上可乐和酸味混合物,实际卡路里数严重依赖于调酒师的倒酒量。AI默认使用保守估计。

提示: 始终指定倒酒量,葡萄酒和啤酒的风格。说“一杯5盎司的黑比诺”远比“红酒一杯”准确。对于鸡尾酒,接受估计将有15-20%的误差,除非你知道确切的配方。


类别4:冰沙 — 平均准确率76%

冰沙是语音记录中最难的标准饮品类别。一个冰沙可能包含四到八种成分,每种成分对卡路里总数都有重要贡献。AI必须解析每种成分,估算每种成分的数量,并正确相加。

# 说出的短语 AI解读 AI卡路里 实际卡路里 准确率
19 "一个芒果香蕉冰沙,加蛋白粉和杏仁奶" 冰沙:芒果(1/2杯),香蕉(1根中等),蛋白粉(1勺),杏仁奶(1杯) 290 320 91%
20 "一个绿色冰沙,含菠菜、香蕉、花生酱和燕麦奶" 冰沙:菠菜(1杯),香蕉(1根中等),花生酱(2汤匙),燕麦奶(1杯) 370 410 90%
21 "一个阿萨伊碗,配格兰诺拉麦片和浆果" 阿萨伊碗:阿萨伊混合物(6盎司),格兰诺拉麦片(1/4杯),混合浆果(1/2杯) 340 480 71%
22 "一个大杯草莓香蕉冰沙,来自果汁吧" 草莓香蕉冰沙,大杯(24盎司) 300 420 71%
23 "一个蛋白奶昔,含巧克力乳清、香蕉、花生酱和全脂奶" 蛋白奶昔:巧克力乳清(1勺),香蕉(1根中等),花生酱(1汤匙),全脂奶(8盎司) 420 530 79%
24 "一个热带冰沙,含菠萝、椰奶和奇亚籽" 冰沙:菠萝(1/2杯),椰奶(1杯),奇亚籽(1汤匙) 230 275 84%

平均准确率:76%

两个最大的错误来源:

  1. 份量估算。 当你说“花生酱”时,AI必须猜测你是指1汤匙还是2汤匙。仅这一差异就可能导致95卡路里的变化。蛋白奶昔的准确率降至79%,主要是因为AI猜测了1汤匙花生酱,而实际配方使用了2汤匙。

  2. 商业冰沙的大小。 “来自果汁吧的大杯草莓香蕉冰沙”仅达到71%的准确率,因为果汁吧的大杯(20-32盎司)通常含有额外的糖、果汁基底或雪葩,这会使卡路里总数大幅超出家庭配方的预期。AI默认使用了更简单的配方估算。

阿萨伊碗的表现最差,准确率为71%。商店中的阿萨伊碗通常含有450-600卡路里,因为格兰诺拉麦片和阿萨伊混合物的份量远大于家庭份量,许多商店还会在混合物中添加蜂蜜或龙舌兰。

提示: 对于冰沙,尽量列出每种成分及其数量。说“一个芒果香蕉冰沙,含一勺乳清和一杯杏仁奶”比说“一个芒果香蕉冰沙”要准确得多。对于果汁吧的冰沙,尽量查看菜单上的卡路里数,并直接语音记录总数:“一个450卡路里的草莓香蕉冰沙。”


类别5:特色饮品 — 平均准确率82%

特色饮品结合了文化特性与定制。珍珠奶茶、抹茶拿铁、印度奶茶和土耳其咖啡都有特定的制作方法,影响卡路里含量。问题在于AI能否识别这些饮品及其标准成分。

# 说出的短语 AI解读 AI卡路里 实际卡路里 准确率
25 "一个芋头珍珠奶茶,含常规糖和珍珠" 芋头珍珠奶茶,常规糖,珍珠,16盎司 380 420 90%
26 "一个印度奶茶,含全脂奶" 印度奶茶,全脂奶,12盎司 240 240 100%
27 "一个抹茶拿铁,含燕麦奶和蜂蜜" 抹茶拿铁,燕麦奶,蜂蜜(1汤匙),12盎司 210 230 91%
28 "一杯越南冰咖啡" 越南冰咖啡(ca phe sua da),8盎司 120 160 75%
29 "一杯霍尔查塔" 霍尔查塔,墨西哥米饮,12盎司 200 250 80%
30 "一杯伦敦雾拿铁" 伯爵茶拿铁,蒸奶,香草,12盎司 150 190 79%

平均准确率:82%

AI在全球知名饮品如印度奶茶和抹茶拿铁上的表现最佳。它正确识别了“越南冰咖啡”为ca phe sua da,但低估了炼乳的含量,通常会为饮品增加100多卡路里。结果是75%的准确率——AI估计120卡路里,而实际为160卡路里。

霍尔查塔的结果同样受到地区差异的影响。自制霍尔查塔和商业霍尔查塔在糖分含量上差异显著,AI采取了保守的估计。

珍珠奶茶的准确性完全依赖于糖分水平的指定。说“常规糖”有助于提高准确性——如果不这样,AI就必须在0%、25%、50%、75%或100%糖之间进行猜测,每种选择都会使卡路里数变化约50-80卡路里。


所有30种饮品的完整结果总结

类别 测试饮品数量 平均准确率 最佳结果 最差结果
简单饮品 6 97% 100%(水、可乐、咖啡、气泡水) 98%(橙汁、红牛)
定制咖啡 6 86% 93%(燕麦奶拿铁) 79%(浓缩咖啡 + 榛子 + 椰奶)
酒精饮品 6 84% 100%(伏特加苏打水) 79%(长岛冰茶)
冰沙 6 76% 91%(芒果香蕉蛋白冰沙) 71%(阿萨伊碗、果汁吧冰沙)
特色饮品 6 82% 100%(印度奶茶) 75%(越南冰咖啡)
总体 30 85% 100% 71%

总体趋势很直观:修饰越少,饮品越标准,准确率越高。简单饮品和品牌项目几乎没有解释错误的余地。多成分饮品和可变份量是AI最容易出错的地方。


为什么饮料比食物更难进行语音记录

饮料面临三个挑战,而固体食物则没有:

  1. 冰块位移。 “大杯冰拿铁”可能是16盎司,但其中4-6盎司是冰。实际的牛奶和浓缩咖啡体积比看起来要小,卡路里计数应仅反映液体部分。AI必须考虑到这一点。

  2. 隐形卡路里。 糖浆、甜炼乳、蜂蜜和果汁基底在饮品的外观中往往是隐形的。顾客可能甚至不知道他们的冰沙含有苹果汁作为基底,增加了60-80卡路里,他们根本不会想到提及。

  3. 极端变异性。 一杯玛格丽塔可能是200卡路里(新鲜青柠、龙舌兰、少许三倍酒)或450卡路里(预制混合物、糖边、大杯)。同样的饮品名称可能对应于不同的卡路里范围,具体取决于商家。


7个提高饮料语音记录准确性的技巧

  1. 明确说明大小。 “一杯12盎司的拿铁”总是比“一个拿铁”更准确。使用盎司或标准名称如小杯、大杯、超大杯。

  2. 指定牛奶类型。 全脂奶、2%牛奶、燕麦奶、杏仁奶和椰奶的卡路里含量各不相同。16盎司的全脂奶拿铁大约是200卡路里;如果是杏仁奶,则降至约100卡路里。

  3. 计算糖浆泵数。 每泵标准风味糖浆大约增加20卡路里。指定“两个泵香草”而不仅仅是“香草”。

  4. 为包装饮品命名品牌。 “一杯Celsius能量饮料”比“能量饮料”更准确。如果你手中有罐子,Nutrola的条形码扫描功能覆盖95%以上的包装产品。

  5. 为珍珠奶茶指定糖分水平。 0%、25%、50%或100%的糖分可能意味着单杯珍珠奶茶的卡路里差异达到200卡路里。

  6. 为酒精饮品包含倒酒量。 “一杯5盎司的黑比诺”远比“红酒一杯”准确。

  7. 尽可能单独记录自制冰沙的每种成分。 如果你在家制作冰沙,列出每种成分及其数量(“一杯杏仁奶、一根香蕉、两汤匙花生酱、一勺乳清”)会比简单描述成品饮品更准确。

对于任何语音记录感觉不准确的饮品,Nutrola的AI饮食助手可以帮助你优化输入。详细描述你喝了什么,助手可以从经过验证的数据库中查找最准确的匹配,并相应调整份量。


常见问题解答

语音记录是否适用于水和零卡路里饮品?

是的。语音记录可以以100%的准确率处理零卡路里饮品,如水、黑咖啡、无糖茶和气泡水。这些项目明确且被AI营养数据库普遍认可。

语音记录对星巴克订单的准确性如何?

对于只有一两个修饰的标准星巴克饮品,准确性通常在88-95%之间。星巴克的菜单项目文档齐全,AI系统能够将饮品名称、大小和常见修饰与发布的营养数据进行匹配。随着修饰数量的增加,准确性会下降。

AI语音记录能正确追踪酒精卡路里吗?

AI平均可以以约84%的准确率追踪酒精卡路里。对于特定订单,如“一杯5盎司的赤霞珠”,准确率超过95%;而对于复杂的鸡尾酒,如长岛冰茶,准确率在75-80%之间。为了获得最佳结果,始终指定倒酒量和饮品风格。

为什么冰沙的卡路里通过语音记录难以追踪?

冰沙包含多种成分,且各成分的份量各异,每种成分对总卡路里都有重要贡献。一汤匙花生酱与两汤匙之间的差异就可能导致95卡路里的变化。商业冰沙也常常含有顾客可能不知道或提及的隐形基底,如苹果汁或额外的甜味剂。

语音记录对饮料的准确性是否高于手动输入?

对于简单饮品,准确性大致相等——两者都接近100%。对于复杂饮品,语音记录实际上可能比手动输入更准确,因为AI会自动查找标准配方和成分卡路里值,减少算术错误或遗漏成分的可能性。关键限制是份量估算,这对两种方法的影响是相同的。

Nutrola如何处理其数据库中没有的饮品?

Nutrola的经过验证的食品数据库覆盖超过50万种项目,包括大多数商业饮品、连锁餐厅饮品和常见自制配方。对于数据库中没有的饮品,AI会根据最接近的匹配和列出的成分进行估算。你还可以使用Nutrola的条形码扫描功能,该功能覆盖95%以上的包装饮品,以获取任何瓶装或罐装饮品的确切营养数据。

我是否应该单独语音记录自制冰沙的每种成分?

是的,这种做法是最准确的。语音记录“1杯杏仁奶、1根中等香蕉、1勺巧克力乳清蛋白、2汤匙花生酱”作为单独项目的准确性远高于说“巧克力花生酱香蕉冰沙”。Nutrola可以自动汇总各个单独条目。

冰块是否影响语音记录的冰饮品的卡路里计数?

冰块本身没有卡路里,但它会位移液体体积。一杯16盎司的冰拿铁含有的牛奶比一杯16盎司的热拿铁少,因为杯子里有4-6盎司是冰。大多数AI系统在你指定“冰”的情况下会考虑到这一点,但如果准确性很重要,直接指定液体体积会更可靠。


结论

语音记录在追踪饮料方面表现出色,但准确性在很大程度上取决于你提供的细节。简单、标准化的饮品在几乎没有努力的情况下达到95-100%的准确率。定制咖啡、酒精和特色饮品在包含关键细节(如大小、牛奶类型和糖分水平)时的准确率在80-90%之间。冰沙是最难的类别,准确率在70-80%之间,主要是由于多种成分的份量模糊性。

提高饮料记录准确性的最重要习惯是明确说明大小。从“一个拿铁”到“一个16盎司的燕麦奶拿铁”的转变可以在一句话中提高10-15个百分点的准确率。结合Nutrola的AI语音记录——它将你的口述描述与覆盖50万种以上食品和100多种营养成分的经过验证的数据库进行交叉参考——你可以以更少的摩擦追踪液体卡路里,准确性足以进行有意义的营养追踪。

Nutrola的订阅价格从每月2.50欧元起,并提供3天的免费试用。所有计划均无广告。

准备好改变您的营养追踪方式了吗?

加入成千上万已通过 Nutrola 改变健康之旅的用户!