اختبرت تتبع السعرات الحرارية بالصور على 100 وجبة — ما مدى دقته؟

صورت 100 وجبة وقارنت تقديرات السعرات الحرارية من الذكاء الاصطناعي بالقيم الموزونة والمقاسة. أفضل تقدير من الذكاء الاصطناعي كان قريبًا بنسبة 8% من السعرات الفعلية. إليك تفاصيل الدقة الكاملة.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

هل يمكنك حقًا تصوير طعامك والحصول على تقدير دقيق للسعرات الحرارية؟ اختبرت ذلك من خلال تصوير 100 وجبة، وزنت كل مكون على ميزان المطبخ، وحسبت المحتوى الحقيقي للسعرات الحرارية، ثم قارنت ذلك بتقدير الذكاء الاصطناعي. كانت النتائج مفاجئة — سواء من حيث مدى تطور التكنولوجيا أو الأماكن التي لا تزال تعاني من نقص.

كيف صممت اختبار الصور لـ 100 وجبة؟

استخدمت ميزة التعرف على الصور بالذكاء الاصطناعي من Nutrola كموضوع رئيسي للاختبار، حيث إنها واحدة من التطبيقات القليلة لتتبع السعرات الحرارية التي تحتوي على نظام ذكاء اصطناعي مخصص مبني على قاعدة بيانات غذائية معتمدة من أخصائيي التغذية. كما قمت بمقارنة النتائج مع الإدخال اليدوي (البحث وتسجيل كل مكون بشكل فردي) للإجابة على سؤال عملي: هل الصورة سريعة ودقيقة بما يكفي لتحل محل التسجيل اليدوي؟

تم تقسيم الوجبات الـ 100 إلى أربع فئات:

  • 30 وجبة منزلية — مطبوخة من الصفر مع وزن كل مكون
  • 30 وجبة من المطاعم — تناول داخل المطعم وخدمات التوصيل من سلاسل ومطاعم مستقلة
  • 20 وجبة معبأة/جاهزة — عشاء مجمد، مجموعات وجبات، أطعمة من ديل
  • 20 وجبة متعددة المكونات — أطباق تحتوي على 4 عناصر مميزة أو أكثر (مثل الأرز، الدجاج، السلطة، الصلصة، الخبز)

لكل وجبة، سجلت تقدير الذكاء الاصطناعي للسعرات الحرارية، والمحتوى الفعلي للسعرات الحرارية (المحتسب من المكونات الموزونة أو من ملصقات التغذية المعتمدة)، والوقت المستغرق للتسجيل عبر الصورة مقابل الإدخال اليدوي.

ما مدى دقة تتبع السعرات الحرارية بالذكاء الاصطناعي حسب نوع الوجبة؟

إليك البيانات الأساسية من جميع الوجبات الـ 100:

نوع الوجبة عدد الوجبات المختبرة متوسط خطأ السعرات معدل الخطأ ضمن 10% ضمن 20%
منزلية 30 ±47 kcal 8.2% 73% 93%
مطاعم 30 ±89 kcal 12.6% 47% 80%
معبأة/جاهزة 20 ±22 kcal 4.1% 90% 100%
متعددة المكونات 20 ±71 kcal 10.8% 55% 85%
المجموع الكلي 100 ±58 kcal 9.1% 66% 89%

كان متوسط الخطأ العام 9.1%، مما يعني تقريبًا 58 سعرًا حراريًا لكل وجبة. للمقارنة، وجدت دراسة عام 2024 في مجلة أكاديمية التغذية والحمية أن التسجيل اليدوي للطعام من قبل المتعقبين ذوي الخبرة له معدل خطأ متوسط يتراوح بين 10-15%. وهذا يعني أن تقدير الذكاء الاصطناعي كان مطابقًا أو أفضل قليلاً من دقة التسجيل اليدوي النموذجية.

كانت الوجبات المعبأة هي الأسهل على الذكاء الاصطناعي — عشاء مجمد في علبته مميز بصريًا ومحدد الحصة. تعرف الذكاء الاصطناعي من Nutrola بشكل صحيح على 18 من أصل 20 عنصرًا معبأً وسحب البيانات الغذائية الدقيقة من قاعدة بياناته المعتمدة.

كانت وجبات المطاعم هي الأصعب، ولسبب وجيه.

لماذا تعتبر وجبات المطاعم الأصعب بالنسبة للذكاء الاصطناعي؟

تتميز أطعمة المطاعم بثلاث خصائص تتحدى أي نظام تقدير للسعرات، سواء كان بشريًا أو بالذكاء الاصطناعي:

  1. الدهون والزيوت المخفية. صدر الدجاج المشوي في المطعم غالبًا ما يحتوي على 50-100 سعر حراري أكثر من نفس الدجاج في المنزل بسبب الزبدة أو الزيت المستخدم أثناء الطهي. هذا غير مرئي في الصورة.

  2. أحجام الحصص المتغيرة. يمكن أن يختلف نفس الطبق من نفس المطعم بنسبة 20-30% في حجم الحصة اعتمادًا على من هو في المطبخ. وجدت دراسة عام 2023 من جامعة تافتس أن تباين الحصص في 10 مطاعم سلسلة كان بمعدل 18%.

  3. الصلصات والتتبيلات المعقدة. ملعقة كبيرة من تتبيلة الرانش تحتوي على 73 سعرًا حراريًا. يمكن أن تؤدي كمية كبيرة مقابل كمية خفيفة إلى تغيير السلطة بمقدار 150 سعرًا حراريًا، ومن الصعب الحكم على الفرق من صورة علوية.

على الرغم من هذه التحديات، تمكن الذكاء الاصطناعي من Nutrola من الاقتراب من 20% في 80% من وجبات المطاعم. يستخدم الذكاء الاصطناعي إشارات بصرية — حجم الطبق، عمق الطعام، توزيع الصلصة — جنبًا إلى جنب مع قاعدة بياناته المعتمدة من أخصائيي التغذية لعناصر المطاعم. عندما يتعرف على طبق معين من مطعم سلسلة (مثل وعاء بوريتو من Chipotle، أو ساندويتش Subway 6-inch، إلخ)، فإنه يسحب البيانات الغذائية الدقيقة بدلاً من تقديرها من الصورة فقط.

دقة وجبات المطاعم: سلاسل مقابل مطاعم مستقلة

نوع المطعم عدد الوجبات المختبرة متوسط الخطأ ضمن 10% ضمن 20%
مطاعم سلسلة 18 ±68 kcal (9.8%) 56% 89%
مطاعم مستقلة 12 ±121 kcal (16.8%) 33% 67%

كانت مطاعم السلسلة أسهل بكثير لأن عناصر قائمتها موحدة وتوجد في قاعدة بيانات Nutrola. عندما صورت وعاء Chipotle، تعرف الذكاء الاصطناعي عليه كوعاء بوريتو من Chipotle وطلب مني تأكيد المكونات. كان تقدير السعرات ضمن 6% مما حسبته من بيانات التغذية المنشورة من Chipotle.

كانت المطاعم المستقلة أكثر صعوبة. لا يزال الذكاء الاصطناعي يتعرف على المكونات العامة بشكل صحيح (سمك مشوي، أرز بيلاف، خضار مشوية)، ولكنه كان مضطرًا لتقدير أحجام الحصص وطرق التحضير. وهنا جاء متوسط الخطأ البالغ 16.8%.

كيف تتوزع دقة الوجبات المنزلية؟

أعطتني الوجبات المنزلية أكثر البيانات تحكمًا، حيث وزنت كل مكون قبل الطهي. إليك كيف أدت أداء الذكاء الاصطناعي عبر أنواع مختلفة من الوجبات المنزلية:

نوع الوجبة المنزلية عدد الوجبات متوسط الخطأ أفضل حالة أسوأ حالة
طبق واحد (قلي، مكرونة) 10 ±38 kcal (6.5%) 2 kcal off 82 kcal off
بروتين + جوانب 10 ±41 kcal (7.1%) 5 kcal off 91 kcal off
حساء ويخنات 5 ±67 kcal (12.4%) 18 kcal off 112 kcal off
سلطات وأطباق 5 ±52 kcal (9.8%) 8 kcal off 95 kcal off

كانت الأطعمة الحساء واليخنات هي الفئة الأضعف. هذا منطقي — لا يمكن للذكاء الاصطناعي رؤية ما تحت سطح وعاء من الفلفل الحار. يقوم بالتقدير بناءً على المكونات المرئية والوصفات النموذجية، لكن الفلفل الحار المنزلي قد يتراوح بين 250 إلى 500 سعر حراري لكل وعاء اعتمادًا على نسبة اللحم، محتوى الفاصوليا، وما إذا كانت الجبنة أو الكريمة الحامضة مدفونة تحت السطح.

جاءت أفضل النتائج من الأطباق الواضحة بصريًا: صدر دجاج بجانب البروكلي والأرز، وعاء مكرونة مع صلصة مرئية. عندما يتمكن الذكاء الاصطناعي من رؤية العناصر الغذائية المميزة وتقدير أحجامها، تتحسن الدقة بشكل كبير.

Nutrola هو تطبيق لتتبع السعرات الحرارية يستخدم التعرف على الصور بالذكاء الاصطناعي جنبًا إلى جنب مع تسجيل الصوت وقراءة الرموز الشريطية. هذه الطريقة المتعددة المدخلات تعني أنه عندما لا تلتقط الصورة الصورة الكاملة — مثل يخنة مع مكونات مخفية — يمكنك إضافة ملاحظة صوتية ("أضفت أيضًا ملعقتين كبيرتين من زيت الزيتون ونصف كوب من الجبنة الشيدر") لتحسين التقدير.

كيف تعمل دقة الوجبات متعددة المكونات؟

تختبر الوجبات متعددة المكونات — طبق يحتوي على أربعة عناصر مميزة أو أكثر — ما إذا كان الذكاء الاصطناعي يمكنه تقسيم وتحديد كل طعام بشكل منفصل.

المكونات على الطبق عدد الوجبات متوسط الخطأ دقة التعرف
4 عناصر 8 ±54 kcal (8.3%) 94% من العناصر تم التعرف عليها
5 عناصر 7 ±72 kcal (11.2%) 89% من العناصر تم التعرف عليها
6+ عناصر 5 ±96 kcal (14.1%) 82% من العناصر تم التعرف عليها

النمط واضح: المزيد من العناصر على الطبق يعني المزيد من مجال الخطأ. مع 4 عناصر، تعرف الذكاء الاصطناعي على 94% من مكونات الطعام الفردية بشكل صحيح. عند وجود 6 عناصر أو أكثر، انخفضت دقة التعرف إلى 82%. كانت أكثر الأخطاء شيوعًا هي الزينة الصغيرة والتوابل — جانب من الحمص مخفي جزئيًا تحت خبز البيتا، أو رشّة من الطحينة فوق وعاء الحبوب.

نصيحة عملية: لتحسين دقة الصور للأطباق المعقدة، فإن التقاط الصورة من الأعلى مباشرة (من منظور الطائر) يحسن دقة التعرف بحوالي 10% مقارنة باللقطات المائلة. يحتاج الذكاء الاصطناعي إلى رؤية كل عنصر بوضوح لتقديره بدقة.

كيف تقارن دقة الذكاء الاصطناعي في الصور بالإدخال اليدوي من حيث السرعة؟

حتى لو كانت دقة الذكاء الاصطناعي في الصور أقل قليلاً، فقد يكون من المجدي استخدامه إذا كان يوفر وقتًا كبيرًا. إليك مقارنة السرعة:

طريقة التسجيل متوسط الوقت لكل وجبة الوقت ل4 وجبات/يوم الإجمالي الشهري
الذكاء الاصطناعي بالصور (Nutrola) 12 ثانية 48 ثانية 24 دقيقة
البحث اليدوي + الإدخال 2 دقيقة و15 ثانية 9 دقائق 4.5 ساعات
قراءة الرمز الشريطي (للمعبأة فقط) 8 ثواني 32 ثانية 16 دقيقة

كان تسجيل الصور أسرع بـ 11 مرة من الإدخال اليدوي. هذا الفرق — 24 دقيقة في الشهر مقابل 4.5 ساعات — كبير بما يكفي لتغيير السلوك. وجدت أبحاث من المجلة الدولية للتغذية السلوكية والنشاط البدني (2024) أن طرق التسجيل التي تستغرق أكثر من 5 دقائق في اليوم كانت لها معدل انسحاب لمدة 60 يومًا بنسبة 68%، بينما كانت طرق أقل من دقيقتين في اليوم لها معدل انسحاب بنسبة 23%.

مع 48 ثانية في اليوم لأربع وجبات، يقع تسجيل الصور ضمن نطاق الالتزام العالي.

كيف تقارن دقة الذكاء الاصطناعي في الصور بدقة الإدخال اليدوي؟

هذا هو السؤال الأكثر أهمية. قمت بتسجيل 40 من الوجبات الـ 100 باستخدام كلا الطريقتين — الذكاء الاصطناعي بالصور والإدخال اليدوي — وقارنت كلاهما بالقيم الفعلية الموزونة.

الطريقة متوسط خطأ السعرات معدل الخطأ الوقت لكل وجبة
الذكاء الاصطناعي بالصور (Nutrola) ±58 kcal 9.1% 12 ثانية
الإدخال اليدوي (مستخدم ذو خبرة) ±52 kcal 8.4% 2 دقيقة و15 ثانية
الإدخال اليدوي (مبتدئ) ±94 kcal 14.7% 3 دقائق و40 ثانية

بالنسبة للمتعقبين ذوي الخبرة، كان الإدخال اليدوي أكثر دقة قليلاً (8.4% مقابل 9.1%) لكنه استغرق 11 مرة أطول. بالنسبة للمبتدئين، كان الإدخال اليدوي أقل دقة من الذكاء الاصطناعي بالصور — على الأرجح لأن المبتدئين يختارون إدخالات قاعدة بيانات خاطئة، ويخطئون في تقدير أحجام الحصص، وينسون المكونات.

هذا يتماشى مع دراسة عام 2025 في علم السمنة والممارسة التي وجدت أن تسجيل الطعام بمساعدة الذكاء الاصطناعي قلل من خطأ تقدير السعرات بنسبة 18% في المشاركين الذين لديهم أقل من 3 أشهر من خبرة التسجيل مقارنة بالإدخال اليدوي غير المدعوم.

ما هي قيود تتبع السعرات الحرارية بالصور؟

تعتبر الشفافية مهمة. إليك السيناريوهات التي لا يزال الذكاء الاصطناعي يعاني فيها:

  • المكونات المخفية. الزبدة المذابة في المعكرونة، الزيت الذي يغطي شريحة لحم مشوية، السكر المذاب في صلصة. إذا لم تتمكن الذكاء الاصطناعي من رؤيتها، فقد يقدر بشكل أقل.
  • الأطعمة الكثيفة والمتجانسة. وعاء من الشوفان قد يحتوي على 250 أو 500 سعر حراري اعتمادًا على ما تم خلطه. تبدو الصورة متشابهة في كلتا الحالتين.
  • حصص صغيرة جدًا من الأطعمة الغنية بالسعرات. ملعقة كبيرة من زبدة الفول السوداني (94 kcal) مقابل ملعقتين كبيرتين (188 kcal) هي اختلاف بصري طفيف مع تأثير كبير على السعرات.
  • الإضاءة أو الزوايا السيئة. الصور الملتقطة في مطاعم ذات إضاءة خافتة أو من زوايا حادة تقلل من دقة التعرف بحوالي 15-20%.

نصائح لتحسين دقة تسجيل الصور

النصيحة تحسين الدقة
تصوير من الأعلى مباشرة +8-12% دقة التعرف
استخدام إضاءة طبيعية أو ساطعة +5-10% دقة
فصل العناصر على الطبق +6-8% للوجبات متعددة المكونات
إضافة ملاحظة صوتية للمكونات المخفية +15-20% للوجبات المعقدة
تضمين عنصر مرجعي (شوكة، يد) +3-5% لتقدير الحصة

هل تتبع السعرات الحرارية بالصور دقيق بما يكفي للاستخدام اليومي؟

استنادًا إلى اختبار 100 وجبة، الجواب هو نعم — مع بعض التحفظات. متوسط خطأ 9.1% يعني أنه في يوم يحتوي على 2000 سعر حراري، قد يكون الذكاء الاصطناعي بالصور بعيدًا بحوالي 180 سعرًا حراريًا إجمالاً عبر جميع الوجبات. وهذا ضمن هامش الخطأ لمعظم الأهداف الغذائية.

للمقارنة، تسمح إدارة الغذاء والدواء بوجود خطأ في ملصقات التغذية يصل إلى 20%. يمكن أن تختلف حسابات السعرات الحرارية في المطاعم قانونيًا بنسبة 20% أيضًا. خطأ بنسبة 9.1% من صورة هو أكثر دقة من المعلومات الغذائية التي يعتمد عليها معظم الناس في نظامهم الغذائي.

الاستنتاج العملي: تسجيل الصور عبر تطبيق مثل Nutrola يمنحك دقة مشابهة للتسجيل اليدوي الدقيق، في جزء من الوقت. بالنسبة لأي شخص توقف عن تتبع السعرات الحرارية لأنه يستغرق وقتًا طويلاً، فإن الذكاء الاصطناعي بالصور يزيل الحاجز الرئيسي أمام الاستمرارية.

يبدأ Nutrola من €2.50 شهريًا بدون إعلانات في أي فئة. ميزة الذكاء الاصطناعي بالصور متاحة على كل من iOS وAndroid، وتعمل جنبًا إلى جنب مع قارئ الرموز الشريطية وتسجيل الصوت لتجربة تسجيل مرنة وسهلة.

الأسئلة الشائعة

ما مدى دقة تتبع السعرات الحرارية بالذكاء الاصطناعي؟

عبر 100 وجبة تم اختبارها، كان لتتبع السعرات الحرارية بالذكاء الاصطناعي (Nutrola) متوسط خطأ قدره 9.1%، أو حوالي 58 سعرًا حراريًا لكل وجبة. هذا قابل للمقارنة أو أفضل قليلاً من تسجيل الطعام اليدوي من قبل المتعقبين ذوي الخبرة، والذي يبلغ متوسط خطأه 10-15% وفقًا لدراسة عام 2024 في مجلة أكاديمية التغذية والحمية.

ما أنواع الوجبات التي يعمل تتبع السعرات الحرارية بالصور بشكل أفضل؟

كانت الوجبات المعبأة والجاهزة هي الأكثر دقة بمتوسط خطأ قدره 4.1% (90% من الوجبات ضمن 10% من السعرات الفعلية). كانت الوجبات المنزلية بمتوسط خطأ 8.2%. كانت وجبات المطاعم الأقل دقة بمتوسط خطأ 12.6% بسبب الدهون المخفية، وأحجام الحصص المتغيرة، والصلصات المعقدة. كانت عناصر مطاعم السلسلة أكثر دقة بكثير من المطاعم المستقلة.

هل تتبع السعرات الحرارية بالصور دقيق بما يكفي لفقدان الوزن؟

نعم. خطأ بنسبة 9.1% في يوم يحتوي على 2000 سعر حراري يعني تقريبًا 180 سعرًا حراريًا من الانحراف الكلي — ضمن هامش الخطأ لمعظم الأهداف الغذائية. للمقارنة، تسمح إدارة الغذاء والدواء بوجود خطأ في ملصقات التغذية يصل إلى 20%. كما أن تتبع الصور يحسن بشكل كبير من الالتزام: مع 12 ثانية لكل وجبة مقابل أكثر من دقيقتين للإدخال اليدوي، من المرجح أن يتتبع المستخدمون بانتظام.

هل يمكن للتعرف على الطعام بالذكاء الاصطناعي التعرف على عناصر متعددة في طبق واحد؟

نعم، لكن الدقة تنخفض مع زيادة عدد العناصر. مع 4 عناصر على الطبق، تم التعرف على 94% من مكونات الطعام بشكل صحيح. عند وجود 6 عناصر أو أكثر، انخفضت الدقة إلى 82%. تحسين دقة التعرف بحوالي 10% مقارنة باللقطات المائلة.

كيف يقارن تتبع السعرات الحرارية بالصور بالإدخال اليدوي؟

كان الذكاء الاصطناعي بالصور أسرع بـ 11 مرة (12 ثانية مقابل 2 دقيقة و15 ثانية لكل وجبة) مع دقة أقل قليلاً للمتعقبين ذوي الخبرة (9.1% مقابل 8.4% خطأ). بالنسبة للمبتدئين، كان الذكاء الاصطناعي بالصور أكثر دقة من الإدخال اليدوي (9.1% مقابل 14.7% خطأ) لأن المبتدئين غالبًا ما يختارون إدخالات قاعدة بيانات خاطئة ويخطئون في تقدير الحصص.

مستعد لتحويل تتبع تغذيتك؟

انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!