هل يمكنني الوثوق بتقديرات السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي؟ بيانات الدقة حسب التطبيق ونوع الوجبة

قمنا بمقارنة تقديرات السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي عبر التطبيقات الرائدة وأنواع الوجبات. تتراوح الدقة من 85-95% للوجبات البسيطة إلى 55-75% للأطباق المعقدة. إليك ما يحدد ما إذا كان يمكنك الوثوق بالرقم.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي انتقل من الخيال العلمي إلى ميزة قياسية في أقل من خمس سنوات. كل ما عليك فعله هو توجيه هاتفك نحو طبق الطعام، الضغط على زر، وستخبرك التطبيق بعدد السعرات الحرارية. لكن إلى أي مدى يمكنك الوثوق بهذا الرقم؟ يعتمد الجواب على ثلاثة عوامل: التطبيق الذي تستخدمه، ما تأكله، وما إذا كان الذكاء الاصطناعي يربط تحديده ببيانات التغذية الموثوقة.

إليك ما تظهره بيانات الدقة فعليًا عبر التطبيقات الرئيسية وأنواع الوجبات.

كيف يعمل تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي

تتبع كل تطبيقات تقدير السعرات الحرارية المعتمدة على الصور نفس خط الأنابيب المكون من ثلاث خطوات. فهم هذه الخطوات يساعدك على معرفة أين يمكن أن تحدث الأخطاء.

الخطوة 1: اكتشاف الكائنات. يقوم الذكاء الاصطناعي بتحديد الأطعمة الموجودة على الطبق. يقوم بتقسيم الصورة إلى مناطق ويصنف كل منطقة كعنصر غذائي محدد. يحصل طبق يحتوي على دجاج، أرز، وبروكلي على ثلاث تصنيفات منفصلة.

الخطوة 2: تقدير الحصة. يقدر الذكاء الاصطناعي كمية كل نوع من الطعام الموجود. هنا تكمن أكبر التحديات. الصورة ثنائية الأبعاد للطعام ثلاثي الأبعاد تفقد معلومات العمق. لا يمكن للذكاء الاصطناعي رؤية مدى سمك قطعة الدجاج، أو عمق وعاء الأرز، أو كمية الصلصة المخفية تحت الطعام المرئي.

الخطوة 3: مطابقة قاعدة البيانات. يتم مطابقة الطعام المحدد والكمية المقدرة مع قاعدة بيانات التغذية لحساب السعرات الحرارية والمغذيات. غالبًا ما يتم تجاهل هذه الخطوة، لكنها مهمة للغاية. حتى إذا حدد الذكاء الاصطناعي "سمك مشوي، حوالي 150 جرامًا" بشكل صحيح، فإن الناتج من السعرات الحرارية يعتمد تمامًا على دقة إدخال قاعدة البيانات التي يربطها بها.

كل خطوة تقدم إمكانية حدوث خطأ. الدقة الإجمالية للتقدير هي ناتج دقة كل مرحلة.

الدقة حسب التطبيق ونوع الوجبة

قمنا بتقييم أربعة تطبيقات رائدة في تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي عبر ثلاث فئات من تعقيد الوجبات. تم اختبار كل تطبيق مع 30 وجبة (10 لكل فئة)، وتمت مقارنة تقديرات الذكاء الاصطناعي مع القيم المحسوبة يدويًا باستخدام بيانات مرجعية من USDA.

التطبيق الوجبات البسيطة الوجبات المعقدة وجبات المطاعم الإجمالي
Nutrola 90-95% 75-85% 70-80% 80-87%
Cal AI 85-92% 65-78% 60-72% 70-81%
Foodvisor 83-90% 63-75% 58-70% 68-78%
SnapCalorie 80-88% 60-73% 55-68% 65-76%

الوجبات البسيطة تضمنت أطباق تحتوي على عنصر واحد مع أطعمة واضحة: صدر دجاج مشوي مع خضار مطبوخة على البخار، وعاء من الشوفان مع التوت، وسلطة بسيطة مع إضافات مرئية.

الوجبات المعقدة تضمنت أطباق متعددة المكونات مع مكونات متداخلة أو مختلطة: أطباق مقلي، مكرونة مع صلصة وإضافات، بوريتو محشو، أطباق متعددة الطبقات.

وجبات المطاعم تضمنت أطباق من مطاعم الجلوس مع صلصات، زينة، وأحجام غير موحدة.

فجوة الدقة بين الوجبات البسيطة والمعقدة متسقة عبر جميع التطبيقات. هذه ليست مشكلة جودة برمجية، بل هي قيد أساسي في تقدير حجم الطعام ثلاثي الأبعاد من صورة ثنائية الأبعاد.

القيد الأساسي: صور ثنائية الأبعاد لطعام ثلاثي الأبعاد

لا يمكن لأي ذكاء اصطناعي التغلب على المشكلة الفيزيائية في جوهر تقدير الصور. تلتقط الصورة المساحة السطحية ولكن لا تلتقط الحجم. هذا يخلق نقاط عمياء محددة تشترك فيها كل التطبيقات.

الطبقات المخفية. وعاء البوريتو المصور من الأعلى يظهر الطبقة العليا من الإضافات. الأرز، الفاصولياء، والبروتين تحتها مخفية جزئيًا أو كليًا. يمكن للذكاء الاصطناعي تقدير ما لا يمكنه رؤيته فقط.

العمق والسمك. قد تبدو صدور الدجاج متطابقة من الأعلى ولكن يمكن أن تختلف بنسبة 50% في الوزن إذا كانت واحدة منها ضعف سمك الأخرى. وعاء ضحل ووعاء عميق من الحساء قد يبدو متشابهًا في الصورة ولكنهما يحتويان على أحجام مختلفة تمامًا.

الصلصات والزيوت. الزيوت المستخدمة في الطهي الممتصة في الطعام، والصلصات الممزوجة في السلطات، والصلصات تحت البروتينات تكون غالبًا غير مرئية. صدر دجاج مشوي مدهون بالزبدة يبدو مشابهًا تقريبًا لواحد مطبوخ جاف، لكن الفرق في السعرات يمكن أن يكون 100 أو أكثر.

اختلاف الكثافة. كوب من الأرز المعبأ بإحكام يحتوي على سعرات حرارية أكثر بكثير من كوب من الأرز المعبأ بشكل فضفاض. الصورة لا يمكنها تمييز الكثافة.

دراسة نُشرت في عام 2023 في Nutrients اختبرت أنظمة التعرف على الطعام باستخدام الذكاء الاصطناعي ووجدت أن تقدير حجم الحصة كان المصدر الأكبر للخطأ، حيث يمثل 60-70% من إجمالي عدم دقة تقدير السعرات الحرارية. كانت دقة تحديد الطعام مرتفعة نسبيًا عند 85-95% للأطعمة الشائعة، ولكن خطوة تقدير الحصة تدهورت النتائج الإجمالية بشكل كبير.

متى يكون تقدير السعرات الحرارية من الصور موثوقًا

على الرغم من القيود، هناك سيناريوهات حيث تكون تقديرات السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي دقيقة بشكل موثوق.

الوجبات ذات العنصر الواحد مع حدود واضحة. صدر دجاج مشوي على طبق، وعاء من الشوفان، تفاحة كاملة. عندما يكون للطعام شكل محدد ولا توجد مكونات مخفية، تكون تقديرات الذكاء الاصطناعي باستمرار ضمن 10% من القيم الفعلية.

الوجبات مع صور مضاءة جيدًا من الأعلى. تؤثر الإضاءة بشكل كبير على الدقة. وجدت دراسة في عام 2024 في Food Chemistry أن دقة التعرف على الطعام باستخدام الذكاء الاصطناعي انخفضت بنسبة 12-18% في ظروف الإضاءة المنخفضة مقارنة بالبيئات المضيئة. توفر الزوايا العلوية تمثيلًا أكثر اتساقًا للمساحة السطحية.

الأطعمة ذات الكثافة الموحدة. شريحة من الخبز، قطعة من الفاكهة، بيضة مسلوقة. الأطعمة التي تحتوي على كثافة متسقة في جميع أنحاء حجمها أسهل للتقدير من قبل الذكاء الاصطناعي لأن المساحة السطحية تتوافق بشكل أكثر موثوقية مع الكتلة.

الوجبات المتكررة التي قمت بالتحقق منها. إذا قمت بتصوير نفس الغداء الذي تتناوله ثلاث مرات في الأسبوع وتحقق من تقدير الذكاء الاصطناعي مرة واحدة باستخدام ميزان الطعام، يمكنك الوثوق بالذكاء الاصطناعي للوجبات المتطابقة التالية.

السيناريو الدقة المتوقعة التوصية
عنصر واحد، إضاءة جيدة 90-95% ثق في التقدير
وجبة بسيطة على طبق، 2-3 عناصر 85-90% ثق مع تعديلات طفيفة
وعاء أو طبق متعدد العناصر 70-80% تحقق من العناصر الرئيسية باستخدام الميزان
طبق مختلط (مقلي، كسرولة) 60-75% استخدمه كتقدير تقريبي فقط
إضاءة خافتة أو طبق جزئي 55-70% أعد التصوير أو سجل يدويًا

متى لا يجب الوثوق بتقديرات السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي

تنتج بعض السيناريوهات بشكل موثوق تقديرات غير دقيقة عبر جميع التطبيقات.

الإضاءة الخافتة أو الاصطناعية. الإضاءة المنخفضة تقلل من تباين الصورة وتجعل تحديد الطعام أكثر صعوبة. الإضاءة الملونة في المطاعم يمكن أن تغير اللون الظاهر للطعام، مما يؤدي إلى تحديد خاطئ.

الأطباق المختلطة والكسرولات. عندما يتم دمج مكونات متعددة في كتلة واحدة، لا يمكن للذكاء الاصطناعي فصل وتقدير كل مكون بشكل موثوق. الكسرولة، الكاري، أو الحساء تعتبر صندوقًا أسود للكاميرا.

الأطعمة المليئة بالصلصات. تغطي الصلصة الطعام تحتها وتضيف سعرات حرارية خاصة بها. طبق من المعكرونة مع صلصة المارينارا يبدو مشابهًا سواء كان يحتوي على ملعقتين كبيرتين أو نصف كوب من الصلصة. يمكن أن يكون الفرق في السعرات 100-200 سعرة حرارية.

الأطباق الجزئية والطعام المأكول. إذا كنت قد بدأت بالفعل في الأكل، فإن الذكاء الاصطناعي لديه بيانات بصرية أقل للعمل معها. علامات العض، الأجزاء المفقودة، والطعام المعاد ترتيبه تقلل من الدقة بشكل كبير.

الأطعمة المقلية. امتصاص الزيت أثناء القلي يضيف سعرات حرارية كبيرة لا يمكن رؤيتها في الصورة. قطعة من الدجاج المقلي تمتص 15-30% من وزنها في الزيت أثناء القلي العميق، وفقًا لأبحاث نُشرت في Journal of Food Engineering. يرى الذكاء الاصطناعي الدجاج ولكنه لا يمكنه قياس الزيت الممتص.

الأطعمة في حاويات غير شفافة. العصائر في الأكواب، الحساء في الأوعية ذات الفتحات الضيقة، والأطعمة المغلفة مثل البوريتو أو اللفائف تمنع الذكاء الاصطناعي من رؤية المحتوى الفعلي للطعام.

لماذا تعتبر قاعدة البيانات خلف الذكاء الاصطناعي أكثر أهمية مما تعتقد

تركز معظم المناقشات حول دقة السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي على خطوات التعرف على الصورة وتقدير الحصة. لكن خطوة مطابقة قاعدة البيانات مهمة بنفس القدر وغالبًا ما يتم تجاهلها.

إليك السبب. تخيل أن الذكاء الاصطناعي يحدد وجبتك بشكل مثالي كـ "سمك مشوي، حوالي 170 جرامًا." إذا ربط هذا التحديد بإدخال قاعدة بيانات غير موثوق يقول إن السمك المشوي يحتوي على 150 سعرة حرارية لكل 100 جرام بدلاً من 208 سعرة حرارية الصحيحة لكل 100 جرام (بيانات مرجعية من USDA)، سيكون تقديرك 255 سعرة حرارية بدلاً من 354 سعرة حرارية. هذا خطأ بنسبة 28% تم إدخاله بالكامل بواسطة قاعدة البيانات، وليس نظام رؤية الذكاء الاصطناعي.

هنا يكمن الفرق بين التطبيقات. الذكاء الاصطناعي الذي يحدد الطعام بشكل صحيح ولكنه يربط بقاعدة بيانات تعتمد على المستخدمين تحتوي على أخطاء، تكرارات، وإدخالات غير موثوقة سيقدم تقديرات نهائية أسوأ من الذكاء الاصطناعي الذي لديه تقدير حصة أقل دقة ولكنه يعتمد على قاعدة بيانات موثوقة.

مكون الدقة التأثير على التقدير النهائي مصدر الأخطاء
تحديد الطعام عالي الأطعمة غير الشائعة، الأطباق المختلطة، الإضاءة السيئة
تقدير الحصة عالي جدًا العمق، الكثافة، الطبقات المخفية
دقة قاعدة البيانات عالية إدخالات غير موثوقة، بيانات قديمة، أحجام تقديم خاطئة

يجب أن تكون جميع المكونات دقيقة لكي يكون تقدير السعرات الحرارية النهائي موثوقًا. السلسلة قوية بقدر أضعف حلقاتها.

كيف يختلف نهج Nutrola

يستخدم تقدير الصور في Nutrola نفس خط أنابيب رؤية الكمبيوتر الأساسي مثل التطبيقات الأخرى، لكنه يختلف في شيء حاسم: كل تحديد للطعام يرتبط بقاعدة بيانات موثوقة من قبل أخصائي تغذية تحتوي على أكثر من 1.8 مليون إدخال.

هذا يعني أنه حتى عندما يكون تقدير حصة الذكاء الاصطناعي به اختلاف طفيف، وهو أمر لا مفر منه مع أي تقدير من 2D إلى 3D، فإن بيانات التغذية لكل جرام تكون دقيقة. إذا قدر ذكاء Nutrola 160 جرامًا من صدر الدجاج بدلاً من 170 جرامًا الفعلية، فإنك تكون بعيدًا بمقدار 10 جرامات. لكن كثافة السعرات (165 سعرة حرارية لكل 100 جرام) صحيحة لأنها تأتي من مصدر موثوق، وليس من إدخال مستخدم مجهول.

يدعم Nutrola أيضًا تسجيل الصوت وقراءة الرموز الشريطية كطرق إدخال مكملة. بالنسبة للوجبات التي تعرف فيها الكميات الدقيقة، مثل الوجبات المطبوخة في المنزل حيث قمت بوزن المكونات، فإن تسجيل الصوت ("200 جرام من صدر الدجاج، كوب من الأرز البني") يرتبط مباشرة ببيانات موثوقة دون تقدير. تعمل ميزة الصور بشكل أفضل للوجبات التي يكون فيها الوزن غير عملي، مثل وجبات المطاعم أو الوجبات المعدة من قبل شخص آخر.

بسعر 2.50 يورو في الشهر بدون إعلانات في أي مستوى، يوفر Nutrola طبقة البيانات الموثوقة التي تجعل تقدير السعرات الحرارية من الصور أكثر دقة بشكل ملموس في الممارسة العملية، وليس فقط في النظرية.

كيف تحصل على أكثر تقديرات دقيقة للسعرات الحرارية من الصور باستخدام الذكاء الاصطناعي

بغض النظر عن التطبيق الذي تستخدمه، فإن هذه الممارسات تحسن دقة تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي.

التصوير قبل البدء في الأكل. طبق كامل يعطي الذكاء الاصطناعي أقصى قدر من البيانات البصرية.

استخدم إضاءة طبيعية أو ساطعة من الأعلى. تجنب الظلال، الأضواء الملونة، والإضاءة الخلفية.

التقط الصورة من مباشرة فوق. زاوية 90 درجة من الأعلى توفر تمثيلًا أكثر اتساقًا للمساحة السطحية وهي ما تم تدريب معظم نماذج الذكاء الاصطناعي عليه.

افصل الأطعمة على الطبق عند الإمكان. إذا كان الدجاج الخاص بك فوق الأرز، فلا يمكن للذكاء الاصطناعي رؤية أو تقدير الأرز بدقة.

تحقق باستخدام ميزان الطعام للوجبات الجديدة أو غير المعتادة. استخدم الذكاء الاصطناعي للراحة في الوجبات المألوفة وتحقق باستخدام الميزان عندما تواجه شيئًا جديدًا.

سجل الصلصات، التتبيلات، والزيوت بشكل منفصل. حتى إذا حدد الذكاء الاصطناعي سلطتك، أضف يدويًا التتبيلة كإدخال منفصل للحصول على دقة أفضل.

الخلاصة

تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي هو أداة مفيدة حقًا، لكنه ليس أداة دقيقة. بالنسبة للوجبات البسيطة، المضيئة، ذات العنصر الواحد، يمكنك الوثوق بالتقدير ضمن 10%. بالنسبة للوجبات المعقدة، المختلطة، أو وجبات المطاعم، اعتبر الرقم كدليل تقريبي وتحقق عندما تكون الدقة مهمة.

أكبر عامل تمييز بين التطبيقات ليس تقنية رؤية الذكاء الاصطناعي نفسها، بل قاعدة البيانات التي يرتبط بها. تطبيق يحدد طعامك بشكل صحيح ولكنه يرتبط ببيانات غير موثوقة سيعطيك إجابة خاطئة بثقة. قواعد البيانات الموثوقة تحول تحديد الذكاء الاصطناعي الجيد إلى تقديرات سعرات حرارية جيدة.

الأسئلة الشائعة

ما مدى دقة تقديرات السعرات الحرارية من صور الطعام؟

تختلف الدقة حسب تعقيد الوجبة. بالنسبة للوجبات البسيطة ذات العنصر الواحد التي تم تصويرها في إضاءة جيدة، تحقق التطبيقات الرائدة دقة تتراوح بين 85-95%. بالنسبة للوجبات المعقدة التي تحتوي على مكونات متعددة، أو أطباق مختلطة، أو أطباق من المطاعم، تنخفض الدقة إلى 55-80%. المصادر الرئيسية الثلاثة للأخطاء هي تحديد الطعام بشكل خاطئ، تقدير حجم الحصة من الصور ثنائية الأبعاد، وإدخالات قاعدة البيانات غير الدقيقة التي يرتبط بها الذكاء الاصطناعي.

أي تطبيق لتتبع السعرات الحرارية لديه أكثر دقة في الذكاء الاصطناعي للصور؟

في الاختبارات المقارنة، حقق Nutrola دقة إجمالية تتراوح بين 80-87% عبر الوجبات البسيطة، المعقدة، ووجبات المطاعم. تأتي هذه الميزة بشكل أساسي من ربط تحديدات الذكاء الاصطناعي بقاعدة بيانات موثوقة من قبل أخصائي تغذية تحتوي على أكثر من 1.8 مليون إدخال. تستخدم تطبيقات أخرى مثل Cal AI (70-81%)، Foodvisor (68-78%)، وSnapCalorie (65-76%) تقنيات رؤية ذكاء اصطناعي مشابهة ولكنها ترتبط بقاعدة بيانات أقل موثوقية.

هل يمكن للذكاء الاصطناعي أن يخبرك بعدد السعرات الحرارية في وجبة مطعم من صورة؟

يمكن للذكاء الاصطناعي تقديم تقدير تقريبي لسعرات وجبة المطعم من صورة، عادة ضمن 20-40% من القيم الفعلية. تعتبر وجبات المطاعم تحديًا بشكل خاص بسبب الأحجام غير الموحدة، والزيوت المخفية، والصلصات، ومشكلة تقدير العمق الموجودة في التصوير ثنائي الأبعاد. بالنسبة لوجبات المطاعم، تكون تقديرات الصور باستخدام الذكاء الاصطناعي أكثر موثوقية من التخمين ولكن أقل موثوقية من بيانات السعرات الحرارية القياسية المنشورة من سلاسل كبيرة.

لماذا تعطي التطبيقات المختلفة قيم سعرات حرارية مختلفة لنفس الصورة؟

تستخدم التطبيقات المختلفة نماذج ذكاء اصطناعي مختلفة، وخوارزميات تقدير حصة مختلفة، والأهم من ذلك، قواعد بيانات تغذية مختلفة. حتى عندما تحدد تطبيقات اثنان الطعام نفسه بشكل صحيح، قد يرتبطان بإدخالات قاعدة بيانات مختلفة تحتوي على قيم سعرات حرارية مختلفة. تنتج التطبيقات التي تستخدم قواعد بيانات موثوقة نتائج أكثر اتساقًا ودقة لأنه لا يوجد سوى إدخال واحد لكل عنصر غذائي، مما يلغي التباين الذي تسببه البيانات المعتمدة على المستخدمين.

هل يجب أن أستخدم ميزان طعام بدلاً من تقدير السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي؟

يعتبر ميزان الطعام أكثر دقة من أي تقدير للسعرات الحرارية من الصور باستخدام الذكاء الاصطناعي للوجبات المطبوخة في المنزل حيث تتحكم في المكونات. يوفر ميزان الطعام المقترن بقاعدة بيانات تغذية موثوقة مثل Nutrola أعلى دقة ممكنة. تكون تقديرات السعرات الحرارية من الصور باستخدام الذكاء الاصطناعي أكثر قيمة في الحالات التي يكون فيها ميزان الطعام غير عملي، مثل وجبات المطاعم، أو الوجبات المعدة من قبل الآخرين، أو عندما تحتاج إلى تسجيل سريع. أفضل نهج هو استخدام كليهما: ميزان في المنزل وتقدير السعرات الحرارية من الصور عند تناول الطعام خارج المنزل.

مستعد لتحويل تتبع تغذيتك؟

انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!