لماذا يعد تسجيل الصوت مستقبل تتبع السعرات الحرارية (ولماذا لا تحتوي معظم التطبيقات على هذه الميزة)

تسجيل الصوت أسرع من الكتابة 3-4 مرات لتتبع الطعام، ومع ذلك لا تزال معظم تطبيقات السعرات الحرارية لا تقدم هذه الميزة. اكتشف لماذا يعد الصوت الحدود الجديدة في تتبع التغذية وما يجعل من الصعب بناؤه.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

معظم الأشخاص الذين يحاولون تتبع السعرات الحرارية يتوقفون عن ذلك خلال أسبوعين. السبب ليس نقص الدافع، ولا لأنهم لا يهتمون بصحتهم، بل هو الاحتكاك. كل وجبة تتحول إلى مهمة شاقة: فتح الهاتف، فتح التطبيق، البحث عن كل عنصر غذائي، التمرير عبر عشرات النتائج المشابهة، تعديل حجم الحصة، وتكرار ذلك لكل مكون في الوجبة. قد يستغرق تسجيل غداء بسيط من 2-3 دقائق. إذا ضربت ذلك في ثلاث وجبات ووجبتين خفيفتين يوميًا، فإنك تقضي من 10-15 دقيقة يوميًا في إدخال البيانات.

تسجيل الصوت يقضي تمامًا على هذا الاحتكاك ويمثل أكبر تقدم في تتبع السعرات الحرارية منذ مسح الباركود. التحدث عن وصف الوجبة أسرع 3-4 مرات من الكتابة والبحث، ويعمل بدون استخدام اليدين، ولا يتطلب أي منحنى تعليمي، ويعكس الطريقة التي يصف بها البشر الطعام بشكل طبيعي. ومع ذلك، فإن أقل من 5% من تطبيقات تتبع السعرات الحرارية تقدم تسجيل الصوت الحقيقي في عام 2026. السبب ليس نقص الطلب، بل إن بناء تسجيل صوتي دقيق للتغذية يعد من أصعب التحديات التقنية في تكنولوجيا الصحة الاستهلاكية.

ميزة السرعة: التحدث مقابل الكتابة مقابل المسح

المقياس الأكثر أهمية لأي طريقة لتتبع السعرات الحرارية هو الوقت اللازم للتسجيل. كل ثانية من الاحتكاك تقلل من احتمال تسجيل المستخدم بشكل منتظم. إليك كيف يقارن تسجيل الصوت بكل طريقة إدخال أخرى:

طريقة التسجيل متوسط الوقت لكل وجبة الخطوات المطلوبة بدون استخدام اليدين تعمل مع الوجبات المعقدة
تسجيل الصوت 8-15 ثانية 1 (تحدث) نعم نعم
تسجيل الصور بالذكاء الاصطناعي 10-20 ثانية 2 (التقاط + تأكيد) لا نعم
مسح الباركود 5-10 ثوانٍ لكل عنصر 2 لكل عنصر (مسح + تأكيد) لا لا (للمنتجات المعبأة فقط)
البحث اليدوي 45-90 ثانية 4-6 لكل عنصر (كتابة، بحث، اختيار، تعديل) لا ممل
الإضافة السريعة / المفضلات 5-10 ثوانٍ 2 (اختيار + تأكيد) لا فقط للوجبات المحفوظة

تسجيل الصوت ليس أسرع فقط من الإدخال اليدوي، بل هو نموذج تفاعل مختلف تمامًا. بدلاً من تحويل وجبتك إلى سلسلة من التفاعلات داخل التطبيق، يمكنك ببساطة وصف ما تناولته كما لو كنت تخبر صديقًا. "تناولت طبقًا كبيرًا من السباغيتي بولونيز مع خبز الثوم وكوب من النبيذ الأحمر." انتهى. جملة واحدة. الذكاء الاصطناعي يتولى كل شيء آخر.

بالنسبة لغداء مكون من ثلاثة عناصر، يستغرق البحث اليدوي والتسجيل في المتوسط من 90-120 ثانية. بينما يستغرق تسجيل الصوت من 10-15 ثانية. هذا تحسين في السرعة بمعدل 8-10 مرات. على مدار شهر، يوفر المتتبع المنتظم حوالي 2-3 ساعات باستخدام الصوت بدلاً من الإدخال اليدوي.

لماذا يعد الصوت أكثر وصولاً من أي طريقة إدخال أخرى

السرعة هي الفائدة الرئيسية، لكن إمكانية الوصول قد تكون المحرك الأكثر أهمية لاعتماد الصوت على المدى الطويل.

إمكانية الوصول البدنية

يتطلب تسجيل الطعام اليدوي تحكمًا دقيقًا في الحركات: الكتابة على لوحة مفاتيح صغيرة، التمرير عبر القوائم، النقر على عناصر واجهة المستخدم بدقة. بالنسبة للأشخاص الذين يعانون من التهاب المفاصل، أو الارتعاش، أو ضعف البصر، أو إصابات اليد المؤقتة، فإن هذا الأمر يكون صعبًا أو مستحيلًا. بينما يتطلب تسجيل الصوت فقط القدرة على التحدث. إنه يفتح مجال تتبع السعرات الحرارية لملايين الأشخاص الذين تم استبعادهم فعليًا من واجهات اللمس.

إمكانية الوصول في المواقف

حتى بالنسبة للمستخدمين القادرين تمامًا، هناك العشرات من المواقف اليومية حيث يكون تسجيل اللمس غير عملي:

  • الطبخ: الأيدي مبللة أو دهنية أو مغطاة بالدقيق. لمس الهاتف غير صحي وغير مريح.
  • القيادة: يجب ألا تكتب على هاتفك أثناء القيادة، لكن يمكنك بأمان التحدث عن وصف الوجبة (كما لو كنت تتحدث إلى راكب).
  • ممارسة الرياضة: تسجيل الطعام بعد التمرين بأيدٍ متعرقة أو مغطاة بالطباشير غير مريح.
  • تناول الطعام مع الآخرين: إخراج الهاتف وقضاء دقيقتين في التسجيل أثناء وجودك في مطعم أو على مائدة العشاء أمر محرج اجتماعيًا. بينما يستغرق وصف سريع تحت أنفاسك ثوانٍ.
  • حمل الأشياء: المشي إلى المنزل مع أكياس البقالة، أو حمل طفل، أو حمل الوجبة نفسها.

العمر ومعرفة التكنولوجيا

كبار السن والأشخاص الأقل راحة مع تطبيقات الهواتف الذكية غالبًا ما يواجهون صعوبة في عملية تسجيل الطعام اليدوي متعددة الخطوات. التحدث هو أمر بديهي. الجميع يعرف كيف يصف ما تناوله. لا يوجد منحنى تعليمي، ولا واجهة للتنقل، ولا صياغة بحث لفهمها.

ميزة اللغة الطبيعية

لقد وصف البشر الطعام شفهيًا منذ آلاف السنين. نحن نفعل ذلك في المطاعم ("سأطلب السلمون المشوي مع سلطة جانبية")، في المنزل ("حضرت قدرًا كبيرًا من حساء الدجاج مع المعكرونة")، وفي المحادثات ("لقد تناولت للتو أفضل بوريتو مع غواكامولي وجبنة إضافية").

هذه الطلاقة اللفظية مع الطعام هي السبب في أن تسجيل الصوت يبدو سهلاً. أنت لا تتعلم مهارة جديدة. أنت تستخدم مهارة لديك بالفعل. قارن هذا بالتسجيل اليدوي، الذي يتطلب منك:

  1. تحليل وجبتك إلى عناصر فردية قابلة للبحث
  2. معرفة تسميات التطبيق (هل هو "صدر دجاج" أم "دجاج، صدر، منزوع العظم"؟)
  3. تقدير الحصص بالجرامات أو الأوقيات أو الأكواب بدلاً من اللغة الطبيعية ("حصة كبيرة")
  4. التنقل في قاعدة البيانات لكل عنصر على حدة

تسجيل الصوت يسمح لك بتجاوز كل هذا. تصف الوجبة بشكل طبيعي، ويتولى الذكاء الاصطناعي تحليلها، وتسمية العناصر، وتقدير الحصص، والبحث في قاعدة البيانات. يتحول العبء المعرفي من المستخدم إلى الآلة، وهو المكان الذي يجب أن يكون فيه.

لماذا لا تقدم معظم تطبيقات تتبع السعرات الحرارية تسجيل الصوت

إذا كان تسجيل الصوت أسرع وأكثر وصولاً وطبيعيًا، فلماذا لا تحتوي أقل من 5% من تطبيقات تتبع السعرات الحرارية على هذه الميزة؟ لأن بناءها بشكل صحيح يعد أمرًا صعبًا للغاية. إليك السبب.

التحدي 1: معالجة اللغة الطبيعية الخاصة بالطعام ليست مجرد تحويل الكلام إلى نص

تحويل الكلام إلى نص هو مشكلة تم حلها. تقدم Apple وGoogle وOpenAI جميعًا واجهات برمجة تطبيقات تحويل الكلام إلى نص بدقة عالية. لكن تحويل الكلام إلى بيانات غذائية هيكلية يعد تحديًا مختلفًا تمامًا.

عندما يقول المستخدم "تناولت حبة بطاطا حلوة متوسطة مع ملعقة كبيرة من الزبدة ورشة من القرفة"، يحتاج النظام إلى:

  • تحديد ثلاثة عناصر متميزة: البطاطا الحلوة، الزبدة، القرفة
  • تحليل الكمية لكل منها: متوسطة (البطاطا الحلوة)، ملعقة كبيرة (الزبدة)، رشة (القرفة)
  • فهم الصفات: "متوسطة" هي حجم، وليست طريقة طهي
  • التعامل مع الهيكل العلاقي: الزبدة والقرفة إضافات للبطاطا الحلوة، وليست أطباق منفصلة
  • ربط "رشة" بكمية تقريبية (حوالي 0.5-1 جرام)

هذا هو التعرف على الكيانات المسماة (NER) الخاصة بالطعام، مع استخراج الكمية وتحليل العلاقات. النماذج العامة لمعالجة اللغة الطبيعية لا تتعامل مع هذا بشكل جيد لأنها لم تُدرب على الأنماط الخاصة بلغة الطعام.

التحدي 2: معيار الدقة صارم للغاية

في معظم تطبيقات الذكاء الاصطناعي الصوتية، يكون الخطأ الصغير مقبولًا. إذا سمع مساعد صوتي عبارة "شغل موسيقى الجاز" بشكل خاطئ على أنها "شغل قائمة موسيقى الجاز"، لا يزال المستخدم يحصل على موسيقى الجاز. يكفي.

في تتبع السعرات الحرارية، يمكن أن يؤدي سوء التفسير الطفيف إلى بيانات خاطئة بشكل كبير. الخلط بين "ملعقة كبيرة من زيت الزيتون" (120 سعرة حرارية) و"كوب من زيت الزيتون" (1,900 سعرة حرارية) هو خطأ بمعدل 16x. تسجيل "دجاج مقلي" بدلاً من "دجاج مشوي" يضيف حوالي 100 سعرة حرارية لكل حصة. سوء فهم "لم أتناول الخبز" على أنه تسجيل الخبز هو إيجابية خاطئة تفسد بيانات اليوم.

المستخدمون الذين يرون إدخالات غير دقيقة يفقدون الثقة على الفور. ومتى ما فقدت الثقة، يتوقفون عن استخدام تسجيل الصوت تمامًا ويعودون إلى الإدخال اليدوي، أو على الأرجح، يتوقفون عن التتبع تمامًا. معيار الدقة لتسجيل الصوت الغذائي أعلى بكثير من مساعدي الصوت العامين، وتلبية هذا المعيار تتطلب نماذج متخصصة واختبارات شاملة.

التحدي 3: جودة قاعدة البيانات تحدد كل شيء

تسجيل الصوت جيد فقط بقدر جودة قاعدة البيانات الغذائية التي يرتبط بها. إليك المشكلة: معظم تطبيقات تتبع السعرات الحرارية تستخدم قواعد بيانات تعتمد على المساهمات الجماعية حيث يمكن لأي شخص تقديم إدخالات. تحتوي هذه القواعد على:

  • إدخالات مكررة لنفس الطعام مع قيم سعرات حرارية مختلفة
  • إدخالات مقدمة من المستخدمين تحتوي على بيانات غذائية غير صحيحة
  • إدخالات غير مكتملة تفتقر إلى المغذيات الكبيرة أو الدقيقة
  • صراعات في التسميات الإقليمية (مثل "بسكويت" في الولايات المتحدة مقابل المملكة المتحدة)

عندما يحدد نظام الصوت "دجاج تيكا ماسالا"، يحتاج إلى الربط بإدخال دقيق واحد. إذا كانت قاعدة البيانات تحتوي على 47 إدخالًا مختلفًا لـ "دجاج تيكا ماسالا" تتراوح من 250 إلى 650 سعرة حرارية لكل حصة، فإن نظام الصوت يكون في حالة تخمين. يحصل المستخدم على بيانات غير موثوقة بغض النظر عن مدى جودة الذكاء الاصطناعي الصوتي.

لهذا السبب تستخدم Nutrola قاعدة بيانات غذائية تم التحقق منها من قبل أخصائي التغذية بدلاً من الإدخالات الجماعية. عندما يحدد الذكاء الاصطناعي عنصرًا غذائيًا، فإنه يرتبط بإدخال موثوق واحد مع بيانات سعرات حرارية ومغذيات دقيقة تم التحقق منها. قاعدة البيانات هي الأساس. بدون قاعدة موثوقة، ينتج تسجيل الصوت نتائج تبدو واثقة ولكنها غير دقيقة.

التحدي 4: معالجة اللغة الطبيعية في الوقت الحقيقي مكلفة

معالجة اللغة الطبيعية في الوقت الحقيقي، وتحديد الكيانات الغذائية، وتحليل الكميات، وحل الغموض، والربط بقاعدة بيانات تتطلب موارد حوسبة كبيرة لكل طلب. بالنسبة لتطبيق يخدم مئات الآلاف من المستخدمين الذين يسجلون عدة وجبات يوميًا، فإن تكلفة البنية التحتية تكون كبيرة.

تعمل معظم تطبيقات تتبع السعرات الحرارية على هوامش ربح ضيقة أو نماذج مدعومة بالإعلانات. إضافة معالجة اللغة الطبيعية في الوقت الحقيقي لكل تسجيل وجبة يمكن أن تزيد من تكاليف الخادم بمعدل 5-10 مرات مقارنة بعمليات البحث البسيطة في قاعدة البيانات. هذه هي إحدى الأسباب الرئيسية التي تجعل التطبيقات المجانية المدعومة بالإعلانات لا تستطيع تبرير الاستثمار. لا تعمل الاقتصاديات الوحدوية عندما تكون إيراداتك لكل مستخدم جزءًا من سنت من إعلانات البانر.

يدعم نموذج اشتراك Nutrola بسعر 2.5 يورو في الشهر (مع عدم وجود إعلانات في جميع الفئات) البنية التحتية المطلوبة لتسجيل الصوت والصورة المدعوم بالذكاء الاصطناعي. تمول التسعيرة الموارد الحاسوبية، وقاعدة البيانات الموثوقة، والتحسينات المستمرة للنموذج التي تحافظ على الدقة عالية.

كيف بنت Nutrola تسجيل الصوت كميزة تنافسية

تطلب بناء تسجيل الصوت لتتبع السعرات الحرارية حل جميع التحديات الأربعة في وقت واحد: معالجة اللغة الطبيعية الخاصة بالطعام، ومعايير الدقة العالية، وقاعدة بيانات موثوقة، وبنية تحتية قابلة للتوسع. إليك كيف اقتربت Nutrola من ذلك.

تدريب الذكاء الاصطناعي الخاص بالطعام: الذكاء الاصطناعي الصوتي في Nutrola ليس نموذج لغة عام مع إضافة موجه غذائي. بل تم تدريبه خصيصًا على أوصاف الطعام، وسياقات الوجبات، وأنماط اللغة الغذائية. يفهم أن "رشة" تختلف عن "كوب"، وأن "دجاج" يعني عدم وجود صلصة، وأن "بطاطا مشوية محشوة" تعني الزبدة، والكريمة الحامضة، والجبن، واللحم المقدد.

تكامل قاعدة البيانات الموثوقة: كل عنصر غذائي يحدده الذكاء الاصطناعي الصوتي يتصل بقاعدة بيانات Nutrola الموثوقة من قبل أخصائي التغذية. لا يوجد غموض حول أي إدخال لـ "سلطة دجاج سيزر" يجب استخدامه لأن قاعدة البيانات لا تحتوي على 50 إصدارًا متضاربًا. إدخال موثوق واحد. بيانات دقيقة.

التسجيل متعدد الوسائط: يعمل تسجيل الصوت جنبًا إلى جنب مع تسجيل الصور بالذكاء الاصطناعي، ومسح الباركود (تغطية تزيد عن 95% من المنتجات)، والبحث اليدوي. يمكن للمستخدمين اختيار أسرع طريقة لكل موقف. وجبة معبأة؟ امسح الباركود. وجبة مطبوخة في المنزل؟ التقط صورة أو وصفها بالصوت. طبق من مطعم؟ عادةً ما يكون الصوت هو الأسرع.

حلقة تحسين مستمرة: كل إدخال تسجيل صوتي يوفر إشارة تدريب. عندما يصحح المستخدم نتيجة تم تحليلها، فإن هذا التصحيح يحسن الدقة المستقبلية. يتحسن النظام مع مرور الوقت، مما يعني أن الاستثمار المبكر في تسجيل الصوت يتراكم إلى ميزة دقة متزايدة على المنافسين الذين لم يبدأوا بعد.

تخلق هذه المجموعة من القدرات خندقًا تنافسيًا حقيقيًا. يحتاج المنافس الذي يقرر اليوم إضافة تسجيل الصوت إلى 12-18 شهرًا لبناء وتدريب نظام معالجة لغة طبيعية خاص بالطعام، وتجميع قاعدة بيانات موثوقة، والتكرار على الدقة. بحلول ذلك الوقت، سيكون نظام Nutrola قد تحسن أكثر.

تطور تتبع السعرات الحرارية: من الإدخال اليدوي إلى الأوتوماتيكي

تسجيل الصوت ليس الحالة النهائية لتكنولوجيا تتبع السعرات الحرارية. إنه الخطوة الأخيرة في مسار تطوري واضح:

العصر الأول: الإدخال اليدوي (2005-2012)

كانت أول تطبيقات تتبع السعرات الحرارية عبارة عن دفاتر طعام رقمية. كنت تكتب اسم الطعام، تبحث في قاعدة البيانات، تختار الإدخال الصحيح، وتعدل الحصة. كان أفضل من تتبع القلم والورق، لكنه لا يزال مملًا. كانت معدلات الالتزام منخفضة لأن الوقت المستغرق لكل وجبة كان مرتفعًا.

العصر الثاني: مسح الباركود (2012-2018)

حول مسح الباركود تتبع الطعام للمنتجات المعبأة. امسح الباركود، أكد الإدخال، انتهى. هذا قلل من وقت التسجيل بشكل كبير للمنتجات ذات الباركود، لكنه لم يفعل شيئًا للوجبات المطبوخة في المنزل، أو طعام المطاعم، أو المنتجات الطازجة. يغطي ماسح الباركود في Nutrola أكثر من 95% من المنتجات المعبأة، مما يجعله الأفضل في هذا الاستخدام.

العصر الثالث: تسجيل الصور (2020-2024)

يستخدم تسجيل الصور المدعوم بالذكاء الاصطناعي رؤية الكمبيوتر لتحديد الطعام من الصور. التقط صورة لطبقك، ويحدد الذكاء الاصطناعي الأطعمة ويقدر الحصص. كانت هذه قفزة كبيرة للوجبات المطبوخة في المنزل وطعام المطاعم. يمكن لتسجيل الصور في Nutrola تحديد عناصر متعددة على الطبق وتقدير الحصص بدقة معقولة.

العصر الرابع: تسجيل الصوت (2024-الحاضر)

يضيف تسجيل الصوت السرعة وإمكانية الاستخدام بدون اليدين. إنه قوي بشكل خاص للوجبات التي يصعب تصويرها (الحساء، العصائر، الأطباق المختلطة) والمواقف التي لا يمكنك فيها استخدام يديك. تسجيل الصوت والصورة تكميليان، وليس متنافسين، والتطبيقات التي تقدم كلاهما تمنح المستخدمين أكبر قدر من المرونة.

العصر الخامس: تتبع أوتوماتيكي كامل (المستقبل)

الهدف النهائي هو تتبع السعرات الحرارية بشكل سلبي: أجهزة استشعار قابلة للارتداء، أطباق ذكية، أجهزة مطبخ متصلة، وذكاء اصطناعي يمكنه تقدير مدخولك دون أي إدخال يدوي. لا يزال هذا بعيدًا عن جاهزية المستهلك، لكن المسار واضح. كل عصر يقلل من جهد المستخدم. تسجيل الصوت هو الحدود الحالية، ويقربنا من تجربة تتبع خالية من الاحتكاك تجعل عد السعرات الحرارية فعلاً سهلاً.

البيانات: لماذا يعد تقليل الاحتكاك مهمًا للامتثال

تظهر الأبحاث حول سلوك الصحة باستمرار أن تقليل الاحتكاك يزيد من الامتثال. وجدت دراسة عام 2024 نُشرت في مجلة أبحاث الإنترنت الطبية أن الالتزام بتتبع السعرات الحرارية ينخفض بنسبة تقارب 50% بعد الأسبوع الأول عند استخدام التطبيقات التي تعتمد فقط على الإدخال اليدوي. أظهر المستخدمون الذين كان لديهم وصول إلى طريقة إدخال بديلة واحدة على الأقل (مسح الباركود، تسجيل الصور، أو تسجيل الصوت) معدلات احتفاظ أعلى بنسبة 30-40% على مدار 30 يومًا.

الآلية بسيطة: كل ثانية إضافية من وقت التسجيل تزيد من احتمال تخطي المستخدم لوجبة. الوجبات المتخطاة تؤدي إلى إجماليات يومية غير دقيقة. الإجماليات غير الدقيقة تقوض الثقة في البيانات. فقدان الثقة يؤدي إلى التخلي.

يستهدف تسجيل الصوت هذه السلسلة عند أول حلقة فيها. من خلال تقليل الوقت اللازم للتسجيل إلى أقل من 15 ثانية حتى للوجبات المعقدة، فإنه يقلل من اللحظات التي يفكر فيها المستخدم "سأقوم بتسجيلها لاحقًا" (ولا يفعل).

بالنسبة للأشخاص الذين يتتبعون السعرات الحرارية من أجل إدارة الوزن، أو الحالات الطبية مثل السكري، أو الأداء الرياضي، أو الوعي الصحي العام، فإن التتبع المستمر هو الفارق بين تحقيق الأهداف وعدمها. طريقة الإدخال تهم أكثر مما يدركه معظم الناس.

من يستفيد أكثر من تسجيل الصوت

تسجيل الصوت مفيد للجميع، لكن بعض الفئات تستفيد بشكل غير متناسب:

الأشخاص الذين يطبخون في المنزل بشكل متكرر. تعتبر الوجبات المطبوخة في المنزل هي الأصعب للتسجيل يدويًا لأنها تتضمن مكونات متعددة بكميات متفاوتة. يسمح لك تسجيل الصوت بوصف الوجبة بشكل طبيعي دون تفكيكها إلى عمليات بحث فردية في قاعدة البيانات.

المحترفون المشغولون. إذا كنت تتناول الطعام بين الاجتماعات، أو تسجل بين المهام، أو تتتبع في جدول زمني ضيق، فإن ميزة السرعة في الصوت تكون كبيرة. خمس عشرة ثانية مقابل دقيقتين تتراكم عبر كل وجبة.

الأشخاص ذوو الإعاقات أو القيود الحركية. يجعل تسجيل الصوت تتبع السعرات الحرارية متاحًا للأشخاص الذين يواجهون صعوبة في واجهات اللمس بسبب التهاب المفاصل، أو الارتعاش، أو ضعف البصر، أو حالات أخرى.

الآباء. يعد تسجيل الطعام أثناء إدارة الأطفال، أو حمل طفل، أو إعداد وجبات مناسبة للأطفال بجانب وجبتك الخاصة أسهل بكثير باستخدام الصوت مقارنة بالإدخال اليدوي.

الرياضيون وعشاق اللياقة البدنية. تسجيل الطعام بعد التمرين بأيدٍ متعرقة أو مغطاة بالطباشير، أو تسجيل الطعام أثناء إعداد الوجبات للأسبوع، أو التقاط وجبة خفيفة قبل التمرين في طريقك إلى الصالة الرياضية كلها تفضل إدخال الصوت.

كبار السن. تجعل الطبيعة الخالية من منحنى التعلم لتسجيل الصوت منه أسهل طريقة تتبع للأشخاص الذين يشعرون بعدم الارتياح في التنقل عبر واجهات التطبيقات المعقدة.

كيفية البدء في تسجيل الصوت على Nutrola

تسجيل الصوت في Nutrola متاح على كل من iOS وAndroid. إليك كيفية البدء:

  1. قم بتنزيل Nutrola وابدأ تجربتك المجانية لمدة 3 أيام
  2. افتح شاشة تسجيل الوجبات واضغط على أيقونة الميكروفون
  3. تحدث بشكل طبيعي عن ما تناولته — وصف الوجبة كاملة في جملة واحدة أو عدة جمل
  4. راجع النتائج المحللة: تعرض Nutrola كل عنصر غذائي محدد مع السعرات الحرارية والمغذيات
  5. أكد أو عدل أي عناصر، ثم احفظ الإدخال

نصائح للحصول على أفضل النتائج:

  • اذكر الكميات المحددة عندما تعرفها ("200 جرام من الدجاج"، "تفاحة كبيرة"، "ملعقتان كبيرتان من زبدة الفول السوداني")
  • أدرج طرق الطهي ("مشوي"، "مقلي"، "مبخر") لأنها تؤثر على السعرات الحرارية
  • اذكر العلامات التجارية عند الاقتضاء ("زبادي يوناني Chobani"، "قهوة مسطحة من Starbucks")
  • وصف الوجبة كاملة دفعة واحدة بدلاً من تسجيل العناصر واحدة تلو الأخرى

يعمل تسجيل الصوت جنبًا إلى جنب مع تسجيل الصور بالذكاء الاصطناعي، ومسح الباركود، ومساعد النظام الغذائي بالذكاء الاصطناعي، ومزامنة Apple Health / Google Fit. اختر الطريقة التي تناسب اللحظة.

الأسئلة الشائعة

ما مدى دقة تسجيل الصوت مقارنة بمسح الباركود؟

يعد مسح الباركود الطريقة الأكثر دقة للمنتجات المعبأة لأنه يقرأ المنتج الدقيق مع بيانات غذائية مقدمة من الشركة المصنعة. بينما يعد تسجيل الصوت هو الطريقة الأكثر عملية للوجبات غير المعبأة، والمطبوخة في المنزل، وطعام المطاعم حيث لا يوجد باركود. بالنسبة للوجبات القياسية ذات المكونات الشائعة، تكون دقة تسجيل الصوت قابلة للمقارنة مع الإدخال اليدوي عند دعمه بقاعدة بيانات موثوقة مثل Nutrola.

هل يمكن لتسجيل الصوت التعامل مع الوجبات بلغات متعددة؟

يدعم تسجيل الصوت في Nutrola أوصاف الطعام التي تتضمن أسماء الأطباق الدولية، والمصطلحات الغذائية الإقليمية، والمفردات الخاصة بالمطابخ. سواء قلت "رامن"، "فوه"، "موساكا"، أو "فيجوادا"، يتعرف الذكاء الاصطناعي على هذه الأطباق ويربطها بالبيانات الغذائية المناسبة. تم تصميم النظام للتعامل مع الطريقة التي يصف بها الناس الطعام في الواقع، والتي غالبًا ما تتضمن مصطلحات غير إنجليزية بغض النظر عن اللغة التي يتحدثون بها.

لماذا لا تحتوي التطبيقات المجانية لتتبع السعرات الحرارية على تسجيل الصوت؟

يتطلب تسجيل الصوت الحقيقي نماذج معالجة لغة طبيعية خاصة بالطعام، وقواعد بيانات موثوقة، وبنية تحتية لمعالجة البيانات في الوقت الحقيقي. هذه مكلفة للبناء والتشغيل. تعتمد التطبيقات المجانية على إيرادات الإعلانات، التي تولد أقل بكثير لكل مستخدم مقارنة بتكاليف معالجة الصوت المدعومة بالذكاء الاصطناعي. لهذا السبب، غالبًا ما يوجد تسجيل الصوت في التطبيقات المدفوعة مثل Nutrola (ابتداءً من 2.5 يورو شهريًا) بدلاً من البدائل المجانية المدعومة بالإعلانات.

هل يعمل تسجيل الصوت بدون اتصال بالإنترنت؟

عادةً ما يتطلب تسجيل الصوت اتصالاً بالإنترنت لأن تحويل الكلام إلى نص ومعالجة اللغة الطبيعية الغذائية تحدث على خوادم سحابية. يضمن ذلك أعلى دقة باستخدام أحدث نماذج الذكاء الاصطناعي وأحدث قاعدة بيانات غذائية. في الحالات التي لا يوجد فيها اتصال، يقدم مسح الباركود والبحث اليدوي طرق تسجيل بديلة.

كيف يتعامل تسجيل الصوت مع أوصاف الطعام الغامضة؟

عندما يواجه الذكاء الاصطناعي غموضًا، فإنه يقوم بعمل افتراضات معقولة بناءً على التفسيرات الشائعة ويعرض النتائج لمراجعتك. على سبيل المثال، "القهوة" تعود بشكل افتراضي إلى القهوة السوداء، ويمكنك تعديلها لإضافة الحليب أو السكر. "سلطة" تحفز النظام لطرح سؤال أو افتراض نوع سلطة شائع. دائمًا ما ترى النتائج المحللة قبل التأكيد، لذا يمكنك تصحيح أي سوء تفسير قبل حفظه.

هل تسجيل الصوت أسرع من التقاط صورة لوجبتي؟

في معظم الحالات، نعم. يستغرق تسجيل الصوت من 8-15 ثانية بما في ذلك وقت المراجعة. بينما يستغرق تسجيل الصورة من 10-20 ثانية ويتطلب منك ترتيب وجبتك بصريًا وإضاءة جيدة. ومع ذلك، يمكن أن يكون تسجيل الصورة أسرع للوجبات المميزة بصريًا حيث تلتقط صورة واحدة كل شيء، ويتطلب وصفًا لفظيًا أقل. تقدم Nutrola كلا الطريقتين، والعديد من المستخدمين يتنقلون بينهما حسب الموقف.

ما أنواع الوجبات التي يصعب على تسجيل الصوت التعامل معها؟

يمكن أن تكون الوجبات المخصصة للغاية مع العديد من التعديلات (مثل "بوريتو مع نصف كمية الأرز العادية، وفاصوليا إضافية، بدون جبن، وكريمة حامضة خفيفة، ودجاج مزدوج") تحديًا لأي نظام صوتي. قد تتطلب الوجبات التي تحتوي على أطعمة غير عادية أو محلية جدًا ليست في قاعدة البيانات أيضًا إدخال يدوي. ومع ذلك، يتعامل الذكاء الاصطناعي الصوتي في Nutrola مع الغالبية العظمى من الوجبات اليومية، وطلبات المطاعم، والأطباق المطبوخة في المنزل بدقة عالية.

هل يمكنني تعديل إدخال تم تسجيله بالصوت بعد حفظه؟

نعم. يمكن تعديل كل إدخال تم تسجيله بالصوت في Nutrola بالكامل بعد الحفظ. يمكنك تعديل الكميات، أو تبديل العناصر الغذائية، أو إضافة مكونات مفقودة، أو حذف الإدخالات غير الصحيحة. تم تصميم تسجيل الصوت ليجعلك تصل إلى 90% من النتيجة في ثوانٍ، مع تحسين يدوي سهل للتفاصيل المتبقية عند الحاجة.

مستعد لتحويل تتبع تغذيتك؟

انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!