هل يمكن لـ Gemini AI تتبع السعرات الحرارية؟ اختبرناه مقابل تطبيق مخصص

طلبنا من Gemini وChatGPT تقدير السعرات الحرارية لـ 30 وجبة، ثم قارنا النتائج مع Nutrola ومرجعيات الطعام الموزونة. كانت الفجوة في الدقة أكبر مما توقعنا.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

مع دخول روبوتات الدردشة الذكية إلى حياتنا اليومية، يطرح سؤال طبيعي: هل يمكنك فقط أن تطلب من Gemini أو ChatGPT تتبع السعرات الحرارية بدلاً من استخدام تطبيق تغذية مخصص؟ قمنا باختبار ذلك بشكل مباشر. على مدار أسبوعين، طلبنا من Google Gemini وOpenAI ChatGPT تقدير محتوى السعرات الحرارية والمغذيات لـ 30 وجبة مختلفة، تتراوح بين أطعمة بسيطة ذات مكون واحد إلى أطباق مطاعم معقدة. قارنا تقديراتهم مع معيارين: بيانات Nutrola الغذائية الموثوقة ومرجعيات الطعام الموزونة المحسوبة باستخدام قيم USDA FoodData Central.

تظهر النتائج قيودًا أساسية في استخدام روبوتات الدردشة العامة لتتبع التغذية، وهي قيود هيكلية وليست مؤقتة، مما يعني أنه من غير المحتمل أن يتم حلها بالكامل من خلال تحديثات النماذج المستقبلية.

هل يمكنني استخدام Gemini لحساب السعرات الحرارية؟

يمكنك أن تطلب من Gemini تقدير السعرات الحرارية في وجبة، وسيوفر لك إجابة. السؤال هو ما إذا كانت تلك الإجابة دقيقة ومتسقة بما يكفي لدعم إدارة النظام الغذائي الفعلية. بناءً على اختباراتنا، فإن الإجابة هي لا لأي حالة استخدام تتطلب موثوقية.

منهجية الاختبار: قمنا بتحضير أو شراء 30 وجبة تغطي مجموعة من التعقيدات. تم وزن كل وجبة على ميزان مطبخ معاير، وتم حساب قيم السعرات المرجعية باستخدام بيانات USDA FoodData Central الغذائية. ثم وصفنا كل وجبة لـ Gemini (مساعد الذكاء الاصطناعي من Google) بلغة طبيعية، بنفس الطريقة التي سيفعلها المستخدم الحقيقي، وسجلنا تقدير السعرات الحرارية. أجرينا نفس الاختبار مع ChatGPT (GPT-4o) وسجلنا كل وجبة في Nutrola باستخدام التعرف على الصور والبحث في قاعدة البيانات.

تعريف الدقة: عرفنا التقدير بأنه "دقيق" إذا كان يقع ضمن 10 في المئة من القيمة المرجعية الموزونة، وهو معيار مستخدم في أبحاث تقييم النظام الغذائي (Subar et al., The Journal of Nutrition, 2015).

ما مدى دقة روبوتات الدردشة الذكية في حساب السعرات الحرارية؟

كانت النتائج متسقة عبر فئات الوجبات: توفر روبوتات الدردشة العامة تقديرات تقريبية ليست موثوقة بما يكفي للأنظمة الغذائية التي تتطلب التحكم في السعرات الحرارية.

المقياس Gemini ChatGPT (GPT-4o) Nutrola المرجع الموزون
الوجبات ضمن 10% من المرجع 11/30 (37%) 13/30 (43%) 25/30 (83%) 30/30 (100%)
متوسط الخطأ المطلق 127 kcal 108 kcal 38 kcal 0 kcal
متوسط نسبة الخطأ 22.4% 18.6% 6.1% 0%
أكبر تقدير زائد فردي +340 kcal (طبق مكرونة) +285 kcal (طبق مقلي) +95 kcal (وجبة مطعم) N/A
أكبر تقدير ناقص فردي -290 kcal (سلطة مع صلصة) -315 kcal (وعاء جرانولا) -72 kcal (شوربة منزلية) N/A
اتساق عبر الاستفسارات المتكررة لا (تفاوت بين 50-200 kcal) لا (تفاوت بين 30-150 kcal) نعم (مؤمن بقاعدة البيانات) N/A

النتيجة الرئيسية: متوسط الخطأ المطلق البالغ 108 إلى 127 سعرة حرارية لكل وجبة يترجم إلى 324 إلى 381 سعرة حرارية من الخطأ التراكمي عبر ثلاث وجبات في اليوم. بالنسبة لشخص يستهدف عجزًا قدره 500 سعرة حرارية لفقدان الوزن، يمكن أن يؤدي هذا المستوى من عدم الدقة إلى إلغاء 65 إلى 76 في المئة من العجز المستهدف، مما يعيق التقدم بشكل فعال.

لماذا تخطئ روبوتات الدردشة الذكية في حساب السعرات الحرارية؟

لم تكن الأخطاء التي لاحظناها عشوائية. بل اتبعت أنماطًا متوقعة تكشف عن قيود هيكلية في استخدام نماذج اللغة الكبيرة لتقدير التغذية.

المشكلة 1: عدم وجود قاعدة بيانات موثوقة. لا تبحث Gemini وChatGPT عن الأطعمة في قاعدة بيانات غذائية منظمة عندما تطلب منهما تقديرات السعرات الحرارية. بل يقومان بتوليد ردود بناءً على الأنماط في بياناتهما التدريبية، والتي تشمل مزيجًا من بيانات USDA الدقيقة، ومحتوى تم إنشاؤه بواسطة المستخدمين، وتقديرات مدونات الطعام، ومواد تسويقية. يمكن أن يكون لقيمة غذائية واحدة قيم سعرات حرارية مختلفة تمامًا عبر هذه المصادر، وليس لدى النموذج آلية لتحديد أي مصدر هو الصحيح.

تستخدم Nutrola وغيرها من تطبيقات التغذية المخصصة قواعد بيانات غذائية موثوقة. تحتوي قاعدة بيانات Nutrola على أكثر من 1.8 مليون إدخال تم التحقق منها ضد بيانات USDA FoodData Central، وملصقات التغذية الخاصة بالشركات المصنعة، وتحليلات مختبرية مستقلة. عندما تسجل "صدر دجاج مشوي، 150 جرام"، فإن القيمة المعادة هي نقطة بيانات موثوقة، وليست متوسط إحصائي لكل ما قيل عن الدجاج على الإنترنت.

المشكلة 2: عدم وجود أساس لحجم الحصة. عندما تخبر روبوت الدردشة الذكي أنك تناولت "وعاء من المكرونة"، يجب عليه تخمين ما يعنيه "وعاء". هل هو 200 جرام من المكرونة المطبوخة أم 400 جرام؟ الفرق هو 250 سعرة حرارية أو أكثر. تعتمد روبوتات الدردشة الذكية على افتراضات حجم الحصة المتوسطة ثقافيًا والتي قد لا تتطابق مع الحصة الفعلية الخاصة بك.

في اختباراتنا، كانت أخطاء حساب حجم الحصة هي أكبر مصدر للخطأ. حيث قدرت Gemini وعاء جرانولا بأقل من 210 سعرة حرارية لأنها افترضت حصة أصغر مما تم تناوله فعليًا. بينما بالغت ChatGPT في تقدير طبق مقلي بـ 285 سعرة حرارية لأنها افترضت أحجام حصص مطعم بينما كانت الوجبة محضرة في المنزل.

تتعامل Nutrola مع هذا من خلال آليات متعددة: يربط مسح الباركود مباشرة بأحجام الحصص المدرجة من قبل الشركات المصنعة، ويقدر التعرف على الصور حجم الحصة من الصورة، ويمكن للمستخدمين تعديل الحصص بالجرام باستخدام ميزان مطبخ لتحقيق أقصى دقة.

المشكلة 3: عدم وجود ذاكرة بين الجلسات. هذه ربما تكون أكبر قيود تتبع السعرات الحرارية المستمرة. لا تحتفظ روبوتات الدردشة الذكية بسجل دائم لما تناولته. تبدأ كل محادثة من الصفر. لا يوجد إجمالي يومي، ولا اتجاه أسبوعي، ولا تحليل مستمر للمغذيات.

يتطلب تتبع السعرات الحرارية الفعّال بيانات تراكمية. تحتاج إلى معرفة ليس فقط السعرات الحرارية في غداءك، بل إجمالي يومك، ومتوسط أسبوعك، وتوزيع المغذيات لديك، واتجاه وزنك على مر الزمن. يوفر روبوت الدردشة تقديرات نقطية معزولة دون أي استمرارية.

المشكلة 4: تقديرات غير متسقة للاستفسارات المتطابقة. طلبنا من كل من Gemini وChatGPT تقدير السعرات الحرارية لنفس وصف الوجبة ثلاث مرات في أيام مختلفة. تفاوتت النتائج بين 50 إلى 200 سعرة حرارية عبر الاستفسارات. حيث أعادت "سلطة سيزر متوسطة مع دجاج مشوي" تقديرات قدرها 380، 450، و520 سعرة حرارية من Gemini عبر ثلاث محادثات منفصلة. هذه عدم الاتساق هو جزء من كيفية توليد نماذج اللغة للردود. فهي مولدات نصوص احتمالية، وليست أنظمة بحث في قاعدة البيانات.

المشكلة 5: بيانات غذائية متخيلة. في 4 من أصل 30 تقدير وجبة، قدمت ChatGPT تحليلات غذائية تبدو دقيقة لكنها مختلقة. على سبيل المثال، ذكرت أن علامة تجارية معينة من ألواح البروتين تحتوي على 22 جرام من البروتين و210 سعرة حرارية، بينما يقرأ الملصق الفعلي 20 جرام من البروتين و190 سعرة حرارية. كانت الأرقام قريبة بما يكفي لتبدو معقولة لكنها خاطئة بما يكفي لتكون مهمة على المدى الطويل. تُعرف هذه الظاهرة، المعروفة بالهلوسة في أبحاث الذكاء الاصطناعي، بأنها خطيرة بشكل خاص في التغذية لأن الأخطاء تبدو موثوقة.

هل ChatGPT دقيق في حساب السعرات الحرارية؟

أدى ChatGPT أداءً أفضل قليلاً من Gemini في اختباراتنا، حيث كانت 43 في المئة من التقديرات تقع ضمن 10 في المئة من المرجع مقابل 37 في المئة لـ Gemini. ومع ذلك، فإن هذا الفرق ليس له معنى عملي. كلا الروبوتين أقل بكثير من عتبة الدقة المطلوبة لإدارة النظام الغذائي بشكل موثوق.

المعيار الأكاديمي لأدوات تقييم النظام الغذائي، كما حدده باحثون مثل Subar et al. وThompson et al. في المعهد الوطني للسرطان، يتطلب أن تظهر الأداة أقل من 10 في المئة من الخطأ المتوسط لتعتبر صالحة لمراقبة النظام الغذائي على مستوى الفرد. يتجاوز كلا الروبوتين هذه العتبة بفارق كبير.

يبدو أن ميزة ChatGPT على Gemini جاءت من افتراضات حجم الحصة الأفضل قليلاً للأطعمة الأمريكية الشائعة، مما يعكس على الأرجح تكوين بيانات تدريبه. بالنسبة للأطعمة الدولية، والأطباق الإقليمية، والوجبات المنزلية، انخفضت الدقة بشكل كبير لكلا النموذجين.

مقارنة شاملة بين روبوت الدردشة الذكي وتطبيق التغذية لتتبع النظام الغذائي

بعيدًا عن الدقة الخام، تمتد الفروق الوظيفية بين روبوت الدردشة وتطبيق التغذية المخصص عبر عدة أبعاد تؤثر على قابلية الاستخدام في العالم الحقيقي.

الميزة Gemini / ChatGPT Nutrola
دقة السعرات الحرارية (مقابل المرجع الموزون) 18-22% متوسط خطأ 6% متوسط خطأ
قاعدة بيانات غذائية موثوقة لا نعم، 1.8 مليون+ إدخال
مسح الباركود لا نعم
التعرف على الطعام من الصور محدود (يتطلب تحميل) التعرف الذكي المدمج
تسجيل الصوت غير مباشر (تحويل الصوت إلى نص) تسجيل صوتي مدمج
سجل يومي دائم لا نعم، تلقائي
إجماليات يومية/أسبوعية متواصلة لا (يجب جمعها يدويًا) نعم، في الوقت الحقيقي
تحليل المغذيات مقدر لكل استفسار متتبع لكل طعام، يوميًا، أسبوعيًا
تتبع المغذيات الدقيقة غير متسق 100+ مغذيات
تتبع اتجاه الوزن لا نعم، مع رسم بياني
تكامل مع Apple Watch لا نعم
أهداف السعرات الحرارية التكيفية لا نعم، تتكيف مع اتجاهاتك
تقديرات متسقة لا (تتفاوت حسب الاستفسار) نعم (مؤمن بقاعدة البيانات)
الوصول دون اتصال لا نعم
التكلفة مجانية (مع اشتراك للميزات المتقدمة) من €2.50/شهر
الإعلانات تتفاوت حسب المنصة صفر إعلانات

ما هي الاستخدامات الجيدة لروبوتات الدردشة الذكية في التغذية؟

على الرغم من قيودها في تتبع السعرات الحرارية، فإن روبوتات الدردشة العامة لديها حالات استخدام غذائية مشروعة يجب الاعتراف بها.

التعليم الغذائي العام. عادةً ما ينتج عن سؤال Gemini أو ChatGPT لشرح الفرق بين الدهون المشبعة وغير المشبعة، أو لوصف كيفية عمل تخليق البروتين، ردود دقيقة ومنظمة جيدًا. بالنسبة للأسئلة المفاهيمية التي تتفق عليها العلوم، تؤدي روبوتات الدردشة بشكل جيد.

توليد أفكار الوجبات. تتفوق روبوتات الدردشة في توليد أفكار الوصفات بناءً على قيود مثل "وجبات غنية بالبروتين تحت 500 سعرة حرارية مع الدجاج والبروكلي." قد لا تكون السعرات الحرارية المحددة دقيقة، لكن مفاهيم الوجبات تعتبر نقاط انطلاق مفيدة.

مقارنة أنماط النظام الغذائي. يؤدي سؤال روبوت الدردشة لمقارنة الأنظمة الغذائية المتوسطية، والكيتونية، والنباتية إلى إنتاج ملخصات معقولة للأدلة لكل نهج.

حيث تفشل روبوتات الدردشة هو في المهمة الكمية، المستمرة، والمعتمدة على الدقة لتتبع السعرات والمغذيات اليومية. هذه مشكلة قاعدة بيانات وتسجيل، وليست مشكلة توليد لغة.

لماذا تتفوق تطبيقات التغذية المخصصة على روبوتات الدردشة العامة؟

السبب الأساسي هو الهيكلية. تم بناء تطبيق تتبع التغذية حول قاعدة بيانات منظمة، وملف مستخدم دائم، ومنطق تراكم. بينما تم بناء روبوت الدردشة حول توقعات الرموز التالية من نموذج لغوي. هذه أدوات مختلفة تمامًا مُحسّنة لمهام مختلفة تمامًا.

الاستمرارية. تحتفظ Nutrola بسجل كامل لكل طعام تسجله، وإجمالياتك اليومية والأسبوعية، واتجاهات المغذيات لديك، وتاريخ وزنك. هذه البيانات الطولية هي ما يجعل تتبع السعرات فعّالًا. تقدير السعرات الحرارية في نقطة واحدة، مهما كانت دقيقًة، يكون عديم الفائدة دون سياق إجمالي يومك ونمطك الأسبوعي.

البيانات الموثوقة. إدخال قاعدة بيانات لـ "زبادي يوناني من Chobani، عادي، 150 جرام" في Nutrola مستمد من ملصق التغذية الخاص بالشركة المصنعة وتم التحقق منه وفقًا لمعايير USDA. عندما يقدر روبوت الدردشة نفس العنصر، فإنه ي averages المعلومات من آلاف المصادر على الويب ذات موثوقية متفاوتة، مما ينتج عنه رقم يبدو معقولًا ولكنه غير موثق.

التكامل مع الأجهزة القابلة للارتداء. تتغذى بيانات Apple Watch مباشرة إلى Nutrola، مما يوفر تقديرات دقيقة للسعرات الحرارية الناتجة عن النشاط يتم دمجها مع تسجيل الطعام لحساب توازن الطاقة الصافي. لا يمكن لأي روبوت دردشة الوصول إلى بيانات جهازك القابل للارتداء لضبط توصيات السعرات الحرارية بناءً على حركتك اليومية الفعلية.

السرعة والراحة. يستغرق التقاط صورة لطبقك، أو مسح باركود، أو التحدث عن وجبتك أقل من 30 ثانية. بينما يستغرق كتابة وصف وجبة مفصل إلى روبوت دردشة، وانتظار الرد، ثم تسجيل التقدير يدويًا في مكان ما وقتًا أطول بكثير وينتج عنه نتيجة أقل دقة.

هل يمكن أن تتحسن روبوتات الدردشة الذكية بما يكفي لتحل محل تطبيقات التغذية؟

هذا سؤال يتعلق بالهيكل الأساسي، وليس فقط قدرة النموذج. حتى مع دقة تقدير السعرات الحرارية المثالية (التي لا تزال النماذج الحالية بعيدة عن تحقيقها)، ستظل روبوتات الدردشة تفتقر إلى التسجيل الدائم، والتتبع التراكمي، والتكامل مع الأجهزة القابلة للارتداء، والتحقق من قاعدة البيانات المنظمة التي تتطلبها تتبع التغذية.

يمكن أن تتضمن أنظمة الذكاء الاصطناعي المستقبلية هذه الميزات نظريًا. ولكن في هذه الحالة، ستكون في الأساس تطبيقات تغذية مع واجهة محادثة، وليست روبوتات دردشة عامة. الميزات التي تجعل تتبع السعرات الحرارية يعمل، مثل قاعدة بيانات موثوقة، وسجلات مستخدم دائمة، وتكامل مع الأجهزة، وخوارزميات تكيفية، هي أنظمة هندسية، وليست قدرات لغوية.

المستقبل الأكثر احتمالًا ليس "استبدال روبوتات الدردشة لتطبيقات التغذية" بل "دمج تطبيقات التغذية للذكاء الاصطناعي المحادثاتي." يحدث هذا بالفعل. يجلب التعرف على الصور المدعوم بالذكاء الاصطناعي والتسجيل الصوتي في Nutrola راحة التفاعل المحادثاتي إلى موثوقية قاعدة بيانات تغذية موثوقة. تحصل على التفاعل الطبيعي مع الذكاء الاصطناعي مع دقة واستمرارية نظام تتبع مصمم خصيصًا.

ماذا يحدث عندما تطلب من الذكاء الاصطناعي تتبع السعرات الحرارية الخاصة بك؟

لتوضيح الفرق العملي، إليك كيف يبدو يوم نموذجي من تتبع السعرات الحرارية مع كل نهج.

باستخدام Gemini أو ChatGPT: تطلب من روبوت الدردشة تقدير إفطارك. يعطيك رقمًا. تكتبه في مكان ما أو تحاول تذكره. في الغداء، تبدأ محادثة جديدة (لا يتذكر الروبوت إفطارك) وتحصل على تقدير آخر. تضيف الرقمين في ذهنك. بحلول العشاء، لديك إجمالي تقريبي قد يكون خاطئًا بمقدار 200 إلى 400 سعرة حرارية، وليس لديك تحليل للمغذيات، ولا سجل دائم، ولا اتجاه أسبوعي.

باستخدام Nutrola: تلتقط صورة لإفطارك. يتعرف الذكاء الاصطناعي على الأطعمة، ويطابقها مع إدخالات قاعدة البيانات الموثوقة، ويسجلها تلقائيًا. يتم تحديث إجمالي يومك في الوقت الحقيقي. في الغداء، تقوم بمسح باركود على عبوة ساندويتشك، ويتم إضافة بيانات التغذية الدقيقة الخاصة بالشركة المصنعة إلى سجلك. بحلول العشاء، لديك إجمالي دقيق، وتحليل للمغذيات، وتاريخ للوجبات الذي يغذي اتجاهاتك الأسبوعية والشهرية. يتم ضبط هدف السعرات الحرارية الخاص بك بناءً على بيانات اتجاه وزنك الفعلية المتزامنة من Apple Watch.

الفرق ليس طفيفًا. إنه الفرق بين التخمين ونظام متكامل.

النقاط الرئيسية

روبوتات الدردشة العامة مثل Gemini وChatGPT هي أدوات مثيرة للإعجاب للعديد من المهام، لكن تتبع السعرات الحرارية ليس واحدة منها. وجدت اختباراتنا لـ 30 وجبة أخطاء متوسطة تتراوح بين 108 إلى 127 سعرة حرارية لكل وجبة، ونتائج غير متسقة عبر الاستفسارات المتكررة، وعدم وجود قدرة على التسجيل الدائم، وعدم التكامل مع قواعد البيانات الغذائية أو الأجهزة القابلة للارتداء. هذه القيود هي هيكلية، وليست عرضية. إنها تنبع من الفرق الأساسي بين نموذج لغوي ونظام تتبع تغذية.

بالنسبة لأي شخص جاد في إدارة تغذيته، يبقى التطبيق المخصص مع قاعدة بيانات موثوقة، وتسجيل دائم، وأهداف تكيفية أمرًا أساسيًا. تجمع Nutrola بين راحة الذكاء الاصطناعي المدعوم (التعرف على الصور، التسجيل الصوتي، مسح الباركود) مع دقة واستمرارية منصة تغذية منظمة، كل ذلك مقابل 2.50 يورو في الشهر مع عدم وجود إعلانات. عندما يتعلق الأمر بتتبع السعرات الحرارية، السؤال ليس ما إذا كان الذكاء الاصطناعي متضمنًا. بل هو ما إذا كان الذكاء الاصطناعي مدعومًا بالهيكل الصحيح لهذه المهمة.

مستعد لتحويل تتبع تغذيتك؟

انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!