音声だけでカロリーを正確に追跡できる？50種類の食事をテストしました

2026年4月4日

Nutrolaの音声記録機能に50種類の食事を話しかけ、AIによるカロリー推定を実際の計量されたポーションと比較しました。結果、精度、音声追跡の信頼性や不信頼性の要因について詳しくご紹介します。

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

50種類の食事をテストした結果、Nutrolaの音声記録は、具体的な量を述べた場合に92.4%のカロリー精度を達成しましたが、詳細が中程度の場合は78.1%、曖昧な入力では54.3%に低下しました。正確な音声記録と不正確な音声記録の違いは、ほとんどが食事の説明方法に起因しており、技術自体の問題ではありません。以下に、テストしたすべての食事の結果、AIが正確だった点、誤っていた点、最大限の精度を得るための食事の話し方を示します。

テストの実施方法

私たちは、制御されたキッチン環境で50種類の食事を準備しました。すべての材料は、1グラム単位で正確なキャリブレーション済みの食品スケールで計量されました。各食事の総カロリーは、USDA FoodData Centralの参照値を使用して計算されました。その後、Nutrolaの音声記録機能に自然な会話形式で各食事を話しかけました — 実際のユーザーが食べたものを説明する方法です。特別なフレーズやAI認識のために最適化されたスクリプトを読むことはありませんでした。

各食事は、以下の5つの具体性レベルのいずれかに分類されました：

具体的な量を伴うシンプルな食事 — 明確なポーションの基本的な食事（例："2つのスクランブルエッグ"）
具体的な量を伴う複雑な食事 — 複数の材料を含む料理で、量が明記されている（例："200gの鶏肉、1カップのブロッコリー、半カップのご飯、2杯の照り焼きソースの鶏 stir fry"）
量なしのシンプルな食事 — ポーションが明記されていない基本的な食事（例："スクランブルエッグ"）
曖昧な説明 — 最小限の詳細でポーションがない（例："タイ料理のランチ"）
非英語の食べ物名 — 母国語で説明された料理（例："豆腐入りパッシーイウ"）

50種類の食事テストの完全結果

カテゴリ1: 具体的な量を伴うシンプルな食事 (10食)

#	話した説明	AIの解釈	AIカロリー	実際のカロリー	精度
1	"バター入りのスクランブルエッグ2つ"	スクランブルエッグ2つ、バター1杯	214	220	97.3%
2	"ハチミツ1杯入りのオートミール1カップ"	調理済みオートミール1カップ、ハチミツ1杯	218	230	94.8%
3	"200グラムのグリルチキン胸肉"	皮なしグリルチキン胸肉200g	330	330	100%
4	"中くらいのバナナ1本"	中くらいのバナナ1本（118g）	105	105	100%
5	"ピーナッツバター入り全粒粉トースト3枚"	全粒粉パン3枚、ピーナッツバター3杯	555	520	93.3%
6	"ブルーベリー入りギリシャヨーグルト150グラム"	プレーンギリシャヨーグルト150g、ブルーベリー50g	148	155	95.5%
7	"大きなリンゴ1個"	大きなリンゴ1個（223g）	116	116	100%
8	"アーモンドバター30グラム入りライスケーキ2つ"	プレーンライスケーキ2つ、アーモンドバター30g	264	258	97.7%
9	"水に浸したツナ缶1個（排水済み）"	水に浸したツナ缶1個（142g）、排水済み	179	179	100%
10	"全乳300ml"	全乳300ml	183	186	98.4%

カテゴリ1の平均精度: 97.7%

カテゴリ2: 具体的な量を伴う複雑な食事 (10食)

#	話した説明	AIの解釈	AIカロリー	実際のカロリー	精度
11	"鶏肉200g、ブロッコリー1カップ、パプリカ半カップ、白ご飯1カップ、照り焼きソース2杯の鶏の炒め物"	すべてのアイテムが正しく解析されました	628	645	97.4%
12	"スパゲッティボロネーゼ100gの乾燥パスタ、150gの挽肉、半カップのマリナーラ、パルメザン1杯"	すべてのアイテムが解析され、80/20の挽肉が使用されました	702	735	95.5%
13	"180gのサーモンフィレをオリーブオイル1杯で焼き、200gのサツマイモと蒸しアスパラガス1カップ"	すべてのアイテムが正しく解析されました	658	670	98.2%
14	"30gのチェダーチーズ、50gのマッシュルーム、30gのほうれん草をバターで調理した2つの卵オムレツ"	すべてのアイテムが解析され、バターは1杯と仮定されました	384	395	97.2%
15	"サワードウのターキーサンドイッチ、レタス、トマト、100gのスライスターキー、スイスチーズ1枚、マスタード"	すべてのアイテムが正しく解析されました	418	430	97.2%
16	"バナナ1本、冷凍イチゴ1カップ、ホエイプロテイン1杯、アーモンドミルク200ml、チアシード1杯のスムージー"	すべてのアイテムが正しく解析されました	372	365	98.1%
17	"鶏肉150g、黒豆半カップ、玄米半カップ、サルサ1/4カップ、アボカド50g、サワークリームのブリトーボウル"	すべてのアイテムが解析され、サワークリームは2杯と仮定されました	648	680	95.3%
18	"250gのローストポテトと150gの蒸しブロッコリーをオリーブオイル1杯で調理した200gのビーフサーロイン"	すべてのアイテムが正しく解析されました	692	705	98.2%
19	"アサイーボウル、アサイー1パケット、バナナ1本、オレンジジュース100ml、グラノーラ30g、ココナッツフレーク20gをトッピング"	すべてのアイテムが正しく解析されました	445	460	96.7%
20	"トルティーヤ3枚、120gの挽きターキー、千切りレタス、刻んだトマト、チーズ40g、サルサのタコプレート"	すべてのアイテムが正しく解析されました	525	540	97.2%

カテゴリ2の平均精度: 97.1%

カテゴリ3: 量なしのシンプルな食事 (10食)

#	話した説明	AIの解釈	AIカロリー	実際のカロリー	精度
21	"スクランブルエッグ"	大きなスクランブルエッグ2つ（標準のサービングを仮定）	182	274（3つの卵）	66.4%
22	"オートミールのボウル"	調理済みオートミール1カップ	154	230（1.5カップ + ハチミツ）	67.0%
23	"鶏胸肉"	中くらいの鶏胸肉（170g）、グリル	281	330（200g）	85.2%
24	"ピーナッツバター入りのトースト"	白いトースト2枚、ピーナッツバター2杯	378	520（全粒粉3枚 + ピーナッツバター3杯）	72.7%
25	"フルーツ入りギリシャヨーグルト"	ギリシャヨーグルト170g、ミックスベリー75g	168	210（ヨーグルト200g + バナナ）	80.0%
26	"プロテインシェイク"	ホエイプロテイン1杯、水250ml	120	365（ホエイ + バナナ + ピーナッツバター + 牛乳）	32.9%
27	"ご飯と鶏肉"	調理済みご飯1カップ、鶏胸肉150g	440	530（ご飯1.5カップ + 鶏肉200g + 油）	83.0%
28	"サラダ"	ミックスグリーンサラダ（200g）と軽いドレッシング	85	350（シーザーサラダ、クルトン、チーズ、ドレッシング）	24.3%
29	"サンドイッチ"	白パンのターキーサンドイッチ	320	480（ダブルミートクラブ + マヨネーズ）	66.7%
30	"パスタ"	マリナーラソースのスパゲッティ1カップ	310	735（乾燥パスタ200g + ボロネーゼ）	42.2%

カテゴリ3の平均精度: 62.0%

カテゴリ4: 曖昧な説明 (10食)

#	話した説明	AIの解釈	AIカロリー	実際のカロリー	精度
31	"タイ料理のランチ"	解析できず — 詳細を求められました	N/A	780	N/A
32	"昨日食べたあのもの"	解析できず — 詳細を求められました	N/A	550	N/A
33	"大きな朝食"	大きな朝食プレートの推定	650	920（フルイングリッシュ）	70.7%
34	"残り物の夕食"	解析できず — 詳細を求められました	N/A	610	N/A
35	"スターバックスの何か"	飲み物/食べ物のアイテムを指定するように促されました	N/A	420	N/A
36	"いくつかのスナック"	解析できず — 詳細を求められました	N/A	340	N/A
37	"ファーストフードのコンボミール"	一般的なファーストフードバーガーコンボ	980	1,150（ウェンディーズのベーコンネイターコンボ）	85.2%
38	"ピザのいくつか"	チーズピザ2スライス（推定）	540	880（大きなペパロニピザ3スライス）	61.4%
39	"ヘルシーボウル"	穀物ボウルの推定（キヌア、野菜、鶏肉）	450	620（スウィートグリーンのハーベストボウル）	72.6%
40	"バーの食べ物とビール"	ビール2杯を含む推定バー食事	1,050	1,480（ウィング、フライ、3つのIPA）	70.9%

カテゴリ4の平均精度: 54.3%（Nutrolaが正しく明確化を求めた解析不能なエントリを除外）

カテゴリ5: 非英語の食べ物名 (10食)

#	話した説明	AIの解釈	AIカロリー	実際のカロリー	精度
41	"豆腐入りパッシーイウ"	パッシーイウ（タイの炒め麺）と豆腐、1サービング	410	440	93.2%
42	"ナン付きチキンティッカマサラ"	チキンティッカマサラ（1サービング） + ナン1枚	620	680	91.2%
43	"ビビンバ（牛肉入り）"	韓国のビビンバ（牛肉入り）、1ボウル	550	590	93.2%
44	"フォーボ"	ベトナムの牛肉フォー、1大ボウル	480	520	92.3%
45	"シャクシュカ（卵2個入り）"	シャクシュカ（トマトとパプリカのソース） + 卵2個	310	340	91.2%
46	"トンカツとご飯"	パン粉をまぶした豚カツ（トンカツ） + ご飯1カップ	680	750	90.7%
47	"ダルマカニとロティ"	ダルマカニ（1カップ） + ロティ2枚	430	485	88.7%
48	"セビーチェ"	魚のセビーチェ、1サービング（200g）	180	210	85.7%
49	"グーラッシュ"	牛肉のグーラッシュ、1サービング	350	410	85.4%
50	"フェイジョアーダ"	ブラジルの黒豆シチュー（豚肉入り）、1サービング	480	570	84.2%

カテゴリ5の平均精度: 89.6%

まとめ: 具体性レベル別の精度

カテゴリ	説明	テストした食事数	平均精度	範囲
1	具体的な量を伴うシンプルな食事	10	97.7%	93.3 – 100%
2	具体的な量を伴う複雑な食事	10	97.1%	95.3 – 98.2%
3	量なしのシンプルな食事	10	62.0%	24.3 – 85.2%
4	曖昧な説明	10	54.3%*	61.4 – 85.2%
5	非英語の食べ物名	10	89.6%	84.2 – 93.2%
全体（50食すべて）		50	80.1%	24.3 – 100%
具体的な量が示された場合（カテゴリ1+2）		20	97.4%	93.3 – 100%

*カテゴリ4は、AIが正しく推測を拒否し、明確化を求めた6つのエントリを除外しています — これは正確な行動です。

最も一般的な誤解の5つ

音声記録がどこで間違うかを理解することで、これらのミスを避けることができます：

誤解	なぜ起こるのか	カロリーへの影響	修正方法
数字なしで「スクランブルエッグ」と言うと2つにデフォルト化	数量なしの「スクランブルエッグ」は標準のサービングを引き起こす	-90 kcalの過小評価	常に卵の数を述べる
水ベースのプロテインシェイクを仮定	「プロテインシェイク」だけでは、粉と水のみがデフォルト	-245 kcalの過小評価	すべての材料をリストする： "ホエイ、バナナ、牛乳、ピーナッツバター"
一般的なサラダとボリュームサラダの違い	「サラダ」と言うと、軽いドレッシングのシンプルなグリーンがデフォルト	-265 kcalの過小評価	サラダの種類を名付ける： "クルトンとパルメザン入りのシーザーサラダ"
パスタのポーションを過小評価	デフォルトのサービングは1カップ調理済み; 多くの人は2-3カップ食べる	-200から-425 kcalの過小評価	調理済みパスタの乾燥重量またはカップの測定を述べる
炒め物に油を加えない	AIは材料を記録するが、脂肪を加えないと仮定することがある	-120 kcalの過小評価	「オリーブオイル1杯で調理」または「バターで焼いた」と言う

これらの結果が実際の使用に与える意味

データは明確なパターンを示しています：音声記録の精度は、入力の具体性に依存し、AIの限界ではありません。 ユーザーが量を提供すると、NutrolaのAIは97%以上の精度を達成します。これは、手動のデータベース検索と選択と同等であり、私たちの内部テストでは、ユーザーの食品重量への慣れに応じて95-98%の精度を記録しています。

重要な洞察は、カテゴリ3と4 — 量なしで説明された食事は、実際には音声記録の問題ではなく、ポーションの認識の問題です。「サラダ」とテキスト検索バーに入力した場合、同じ曖昧さに直面します。音声記録は、ユーザーが自分の食べ物についてどれだけ具体的に考えているかのギャップを露呈します。

Nutrolaの曖昧な入力への対応方法は注目に値します：AIは静かに推測するのではなく（これがカテゴリ4で見られる不正確な数字を生む）、明確化を求めます。10の曖昧な説明のうち6つがフォローアップの質問を引き起こしました — 「タイ料理で何を注文しましたか？」や「どんなスナックですか？」などです。これは推測よりも正確であり、曖昧な入力に対する責任あるアプローチです。

最大限の音声記録精度を得るための7つのヒント

50食のテストに基づき、最も正確なログを生成するための実践を以下に示します：

任意の単位で量を述べる — グラム、カップ、大さじ、スライス、個数。「鶏肉200g」と「ご飯1カップ」はどちらも有効です。AIは単位の変換を自動的に処理します。
調理方法と脂肪を含める — 「グリルチキン」と「フライドチキン」では同じポーションでも100カロリー以上の違いがあります。常に「オリーブオイルで焼いた」または「油なしで焼いた」と述べてください。
パッケージ食品のブランド名を指定する — 「チョバニバニラギリシャヨーグルト」と言うと、正確な栄養データが引き出されます。「ギリシャヨーグルト」と言うと、特定の製品と異なる場合がある20-50カロリーの一般的な推定が得られます。
アイテムの数を指定する — 「卵3つ」と言うのではなく「卵」と言わないでください。「ピザ2スライス」と言うのではなく「ピザのいくつか」と言わないでください。近似のカウント（「約1カップのご飯」など）でも、数量を述べないよりはるかに良いです。
複合食事を構成要素で説明する — 「ブリトー」と言うのではなく、「鶏肉、黒豆、ご飯、チーズ、サワークリーム、ガカモレの小麦トルティーヤ」と言ってください。これにより、AIは確認済みのデータベースから正確に価格を付けるための個々のアイテムを得ることができます。
レストランやメニューアイテム名を使用する — 「チポトレのチキンブリトーボウル」と言うと、同じ食事を一般的に説明するよりも正確です。Nutrolaはチェーンの公表された栄養データを直接引き出すことができます。
明確化のプロンプトに応じる — Nutrolaがフォローアップの質問をした場合は、それに答えてください。その3秒の追加が55%の正確な推測を95%の正確なログに変えます。

Nutrolaの確認済みデータベースが音声精度を向上させる方法

これらの結果において重要な要素は、AIの解釈を支えるデータベースです。Nutrolaは、クラウドソースされたエントリではなく、100%栄養士によって確認された食品データベースを使用しています。これにより、AIが「チキンティッカマサラ」を正しく特定した場合、返されるカロリーデータは栄養専門家によってレビューされ、検証されたものであり、誤った値を入力したランダムなユーザーによって提出されたものではありません。

クラウドソースされたデータベース（多くの競合アプリが使用）には、同じ食品に対して異なるカロリー値を持つ重複エントリが含まれていることがよくあります。「鶏胸肉」と音声記録した場合、アルゴリズムが選択する重複によって165から350カロリーの範囲で一致する可能性があります。Nutrolaの確認済みデータベースはこの変動を排除するため、音声記録と手動記録の間の精度のギャップが大幅に縮小されます。

バーコードスキャン（パッケージ食品の95%以上の製品認識率）、視覚的な食事のためのAIフォトログ、ハンズフリーの状況での音声記録と組み合わせることで、Nutrolaはすべて同じ確認済みデータソースから引き出す複数の入力方法を提供します。プランは月額€2.50から始まり、3日間の無料トライアルがあり、すべての機能 — 無制限の音声記録を含む — はすべてのティアで利用可能で、広告は一切ありません。

よくある質問

音声カロリー追跡は手動入力と比べてどれくらい正確ですか？

私たちの50食のテストでは、具体的な量を伴う音声記録が97.4%の精度を達成し、手動データベース検索の95-98%の精度と一致またはそれを超えています。重要な変数は説明の具体性であり、入力方法ではありません。

音声記録が私の言ったことを理解できない場合はどうなりますか？

Nutrolaは推測するのではなく、明確化の質問をします。私たちのテストでは、曖昧な説明のうち6つがフォローアップのプロンプトを引き起こしました。これは意図的なものであり、正確な「もう少し情報が必要です」という反応は、静かな500カロリーの誤推定よりも優れています。

音声記録は自家製の食事にも対応していますか？

はい、そして、個々の材料を量とともに説明することで最も効果的です。「鶏ひき肉200g、キドニービーンズ1缶、刻んだトマト1缶、オリーブオイル1杯の自家製チリ」と言うと、私たちのテストで96%以上の精度を得ました。自家製の食事を単一のアイテム（「チリ」）として説明すると、精度が大幅に低下します。

音声記録はフォー、ビビンバ、シャクシュカのような非英語の食べ物名に対応していますか？

はい。私たちのテストには10種類の非英語料理が含まれ、平均精度は89.6%でした。Nutrolaのデータベースには、数十の料理にわたる国際的な料理が含まれています。よく知られた料理（パッシーイウ、ティッカマサラ、ビビンバ）は90%以上のスコアを得ました。あまり一般的でない料理（フェイジョアーダ、グーラッシュ）は84-86%でやや低いスコアでしたが、依然として有用な範囲内でした。

"サラダ"が24.3%の精度しか得られなかったのはなぜですか？

シンプルなサイドサラダ（85カロリー）とクルトン、パルメザン、クリーミードレッシング入りのボリュームサラダ（350カロリー）の間には大きなギャップがあるからです。AIは基本的なサラダをデフォルトとして仮定したため、実際の食事には誤った仮定がされました。「クルトンとドレッシング入りのシーザーサラダ」と言えば90%以上のスコアが得られたでしょう。

80%の全体的な精度はカロリー追跡にとって十分ですか？

80.1%の全体的な数値には、意図的に曖昧で解析不能な入力が含まれています。基本的な量を提供した場合の精度は97.4%です。80%でも、音声記録は記録しないよりも正確です — 研究によれば、記録されていない食事は実質的に0%の精度であり、日々の合計に見えなくなります。大まかな推定は、エントリが欠落するよりも常に良いです。

すぐに音声記録の精度を改善するにはどうすればよいですか？

最も影響力のある変更は、量を述べることです。私たちのデータは、任意の量を追加することで — たとえ「約1カップ」や「中くらいのポーション」のような推定でも — 精度が62%から97%に改善されることを示しています。2番目に影響力のある変更は、調理脂肪の名前を挙げることです：「オリーブオイルで調理」や「バターで揚げた」と言ってください。

Nutrolaの音声記録は、私の習慣に応じて時間とともに改善されますか？

Nutrolaは、最近の食事や一般的な食パターンを学習します。同じ朝食をほとんど毎日食べる場合、AIはあなたの説明を解析する際により迅速かつ正確になります。頻繁に記録されたアイテムは解釈の優先順位が高くなり、定期的に食べる食事の曖昧さが減少します。

栄養追跡を革新する準備はできていますか？

Nutrolaで健康の旅を変えた数千人に参加しましょう！

Download on theApp Store

GET IT ONGoogle Play