كيف تحدد تقنية الذكاء الاصطناعي في Nutrola طعامك من صورة واحدة: خلف الكواليس
تلتقط صورة لغداءك وتخبرك Nutrola أنه يحتوي على 640 سعرة حرارية و38 جرامًا من البروتين. لكن كيف؟ إليك ما يحدث بالضبط في الثواني بين صورتك وبيانات التغذية الخاصة بك.
تفتح تطبيق Nutrola، وتوجه كاميرتك نحو طبق من السلمون المشوي مع الخضار المحمصة والكينوا، ثم تضغط على زر الغالق. بعد أقل من ثلاث ثوانٍ، يخبرك التطبيق أن الوجبة تحتوي على حوالي 640 سعرة حرارية، و38 جرامًا من البروتين، و42 جرامًا من الكربوهيدرات، و28 جرامًا من الدهون. كما يقوم بتفصيل السلمون والخضار والكينوا كعناصر منفصلة.
يبدو الأمر وكأنه سحر. لكن وراء هذه التجربة السلسة يوجد خط أنابيب مدروس بعناية من عمليات الذكاء الاصطناعي، حيث يتولى كل منها جزءًا محددًا من اللغز. تستعرض هذه المقالة كل خطوة من هذا الخط، بدءًا من لحظة دخول الضوء إلى مستشعر كاميرا هاتفك وحتى ظهور أرقام السعرات الحرارية على شاشتك. لا تحتاج إلى درجة في التعلم الآلي لفهم ذلك.
الصورة العامة: خط أنابيب من ست خطوات
قبل الغوص في كل مرحلة، إليك الرحلة الكاملة في لمحة:
- معالجة الصور - يتم تنظيف صورتك وتوحيدها لتتمكن تقنية الذكاء الاصطناعي من العمل عليها.
- كشف الطعام وتقسيمه - يقوم الذكاء الاصطناعي بتحديد أماكن كل عنصر غذائي على الطبق.
- تصنيف الطعام - يتم التعرف على كل منطقة تم اكتشافها كنوع معين من الطعام.
- تقدير حجم الحصة - يقوم الذكاء الاصطناعي بتقدير كمية كل نوع من الطعام.
- مطابقة قاعدة البيانات الغذائية - يتم مطابقة الأطعمة المحددة والأحجام مع بيانات التغذية الموثوقة.
- تقييم الثقة وتأكيد المستخدم - يخبرك الذكاء الاصطناعي بمستوى ثقته ويتيح لك إجراء التصحيحات.
تتغذى كل خطوة على الأخرى. تخيل الأمر كخط تجميع في مصنع: المواد الخام تدخل من طرف، والمنتج النهائي يخرج من الطرف الآخر. إذا قامت أي محطة واحدة بعملها بشكل سيء، فإن المنتج النهائي سيتأثر. لهذا السبب تم تصميم كل مرحلة واختبارها وتحسينها بعناية كبيرة.
دعنا نستعرضها واحدة تلو الأخرى.
الخطوة 1: معالجة الصور
أول شيء يحدث بعد الضغط على زر الغالق ليس له علاقة بالتعرف على الطعام. بل يتعلق بإعداد الصورة نفسها.
لماذا الصور الخام ليست جاهزة للذكاء الاصطناعي
تلتقط كاميرا هاتفك صورًا بدقة عالية، غالبًا 12 ميجابكسل أو أكثر. هذه كمية كبيرة من البيانات تفوق ما يحتاجه نموذج الذكاء الاصطناعي، ومعالجة كل ذلك ستكون بطيئة وغير فعالة. قد تكون الصورة أيضًا قد التقطت في إضاءة سيئة، أو بزاوية غريبة، أو مع فوضى في الخلفية.
فكر في الأمر كما لو كنت تحضر المكونات قبل الطهي. الطاهي لا يرمي جزرًا غير مغسول في القدر. بل يغسله، ويقشره، ويقطعه إلى الحجم المناسب أولاً. معالجة الصور هي النسخة الخاصة بالذكاء الاصطناعي من "التحضير".
ماذا يحدث أثناء معالجة الصور
إعادة الحجم والتوحيد: يتم تقليص الصورة إلى حجم قياسي، عادةً بضع مئات من البيكسلات على كل جانب. يتم توحيد قيم البيكسل بحيث تقع السطوع والتباين ضمن نطاق متسق. هذا يضمن أن النموذج يتصرف بنفس الطريقة سواء التقطت الصورة تحت ضوء الشمس الساطع أو في إضاءة مطعم خافتة.
تصحيح الألوان: يتم إجراء تعديلات دقيقة لتصحيح تأثيرات الألوان الناتجة عن مصادر الضوء المختلفة. يمكن أن يؤدي التوهج البرتقالي الدافئ لعشاء مضاء بالشموع أو التدرج الأزرق للإضاءة الفلورية في المكتب إلى إرباك الذكاء الاصطناعي حول ما ينظر إليه. يقلل تصحيح الألوان من هذه التشوهات.
توجيه وقص: يكتشف النظام ما إذا كان الهاتف ممسكًا عموديًا أو أفقيًا ويقوم بتدوير الصورة وفقًا لذلك. إذا اكتشف الذكاء الاصطناعي أن الطعام يشغل جزءًا صغيرًا فقط من الإطار، فقد يقوم بقص المنطقة ذات الصلة لتقليل الضوضاء من الخلفية.
تقليل الضوضاء: غالبًا ما تحتوي الصور الملتقطة في إضاءة منخفضة على ضوضاء بصرية، تلك النقاط الصغيرة التي تجعل الصورة تبدو غير واضحة. تمر عملية تقليل الضوضاء بشكل خفيف لتنعيم هذه العيوب دون تشويش التفاصيل المهمة للطعام.
كل هذا يحدث في جزء من الثانية. بحلول الوقت الذي تصل فيه الصورة إلى المرحلة التالية، تكون قد أصبحت مدخلاً نظيفًا وموحدًا يمكن لنموذج الذكاء الاصطناعي تفسيره بشكل موثوق.
الخطوة 2: كشف الطعام وتقسيمه
الآن يواجه الذكاء الاصطناعي أول تحدٍ حقيقي له: معرفة مكان الطعام في الصورة ورسم حدود حول كل عنصر مميز.
الكشف: العثور على الطعام في الإطار
يقوم نموذج الكشف بمسح الصورة بالكامل وتحديد المناطق التي تحتوي على الطعام. هذا أكثر تعقيدًا مما يبدو. يحتاج النموذج إلى تمييز طبق المعكرونة الخاص بك عن المفرش تحتها، وكوب الماء بجانبها، والمناديل في الزاوية. كما يحتاج إلى التعامل مع الأطباق التي تكون جزئيًا مخفية، أو متداخلة، أو مقطوعة عند حافة الإطار.
تستخدم أنظمة الكشف الحديثة تقنية تُسمى كشف الكائنات، حيث يتنبأ النموذج في الوقت نفسه بموقع وفئة كل كائن يتعرف عليه. تخيل نادلًا ذو خبرة يمكنه إلقاء نظرة على طاولة وتحديد كل طبق على الفور، حتى في مطعم مزدحم. تم تدريب الذكاء الاصطناعي لتطوير غريزة مشابهة، إلا أنه تعلم تلك الغريزة من خلال دراسة ملايين الصور الغذائية.
التقسيم: رسم حدود دقيقة
يخبر الكشف الذكاء الاصطناعي بوجود طعام في منطقة معينة من الصورة. يذهب التقسيم إلى أبعد من ذلك من خلال رسم الشكل الدقيق لكل عنصر غذائي، بكسل بكسل.
هذا التمييز مهم. اعتبر طبقًا يحتوي على دجاج مشوي يجلس على سرير من الأرز، مع جانب من البروكلي المطبوخ على البخار. ستلتقط مربعًا بسيطًا حول الدجاج أيضًا بعض الأرز تحته. يقوم التقسيم برسم حدود دقيقة حول الدجاج فقط، والأرز فقط، والبروكلي فقط، حتى في الأماكن التي تتداخل فيها.
تعتبر هذه الدقة على مستوى البيكسل حاسمة للخطوات التالية لأن الذكاء الاصطناعي يحتاج إلى معرفة بالضبط كم تشغل كل مادة غذائية من المساحة المرئية. إذا كانت حدود الدجاج تتضمن عن طريق الخطأ قطعة من الأرز، فإن تقدير الحصة لكل من العنصرين سيكون خاطئًا.
التعامل مع الأطباق المعقدة
الوجبات في العالم الحقيقي فوضوية. تتداخل الأطعمة، وتنتشر الصلصات عبر عناصر متعددة، والأطباق المختلطة مثل الأطباق المقلية أو السلطات تحتوي على عشرات المكونات الصغيرة الممزوجة معًا. يتعامل نموذج التقسيم مع هذه الحالات من خلال تعيين احتمال لكل بكسل ينتمي إلى كل فئة غذائية. في طبق مقلي، يتم تعيين بكسل يبدو أنه يمكن أن يكون دجاجًا أو توفو احتمالات لكليهما، ويقوم النظام بحل الغموض باستخدام السياق من البيكسلات المحيطة.
الخطوة 3: تصنيف الطعام
مع عزل كل عنصر غذائي، يحتاج الذكاء الاصطناعي الآن للإجابة على السؤال الأساسي: ما هو هذا الطعام؟
كيف يتعرف الذكاء الاصطناعي على الأطعمة المحددة
نموذج التصنيف هو شبكة عصبية عميقة تم تدريبها على مجموعة بيانات ضخمة من صور الطعام الموصوفة. خلال التدريب، شاهد ملايين الأمثلة لآلاف الأطعمة المختلفة. مع مرور الوقت، تعلم ربط أنماط بصرية معينة بتسميات غذائية محددة.
يعمل هذا بشكل مشابه لكيفية تعلمك التعرف على الأطعمة كطفل. لم تحفظ كل مظهر ممكن للتفاحة. بل، من خلال التعرض المتكرر، بنى عقلك نموذجًا داخليًا لـ "التفاح"، وهو مزيج من اللون، والشكل، والحجم، والملمس الذي يسمح لك بالتعرف على التفاحة سواء كانت حمراء أو خضراء، كاملة أو مقطعة، جالسة على منضدة أو متدلية من شجرة.
يبني الذكاء الاصطناعي نموذجًا داخليًا مشابهًا، إلا أنه يقوم بذلك من خلال دوال رياضية بدلاً من الخلايا العصبية البيولوجية. يتعلم أن السلمون المشوي يميل إلى أن يكون له لون وردي-برتقالي محدد مع علامات شواء داكنة، وملمس متفتت، وشكل نموذجي معين. يتعلم أن الكينوا لها نمط حبة صغيرة مستديرة مميز يختلف عن الأرز أو الكسكس.
تحدي الأطعمة المتشابهة في المظهر
بعض الأطعمة تبدو متشابهة بشكل ملحوظ. الأرز الأبيض وأرز القرنبيط. المعكرونة العادية والمعكرونة الخالية من الغلوتين. الزبادي اليوناني والكريمة الحامضة. برغر الديك الرومي وبرغر اللحم البقري.
يتعامل نموذج التصنيف مع هذه الحالات من خلال النظر إلى إشارات بصرية دقيقة يستخدمها معظم البشر أيضًا. الشفافية الطفيفة للأرز الأبيض المطبوخ مقابل الملمس الأكثر غموضًا وعدم الانتظام لأرز القرنبيط. الفرق الذي يكاد يكون غير ملحوظ في لمعان السطح بين الزبادي اليوناني والكريمة الحامضة.
عندما لا تكون الإشارات البصرية كافية، يأخذ النموذج أيضًا السياق في الاعتبار. إذا حددت خطوة التقسيم الأرز بجانب ما يبدو أنه صلصة الصويا وعيدان تناول الطعام، فقد يزيد النموذج من ثقته بأن الحبة هي أرز أبيض بدلاً من أرز القرنبيط.
التصنيف متعدد التسميات للأطباق المختلطة
بعض الأطعمة لا تناسب فئة واحدة فقط. يحتوي البوريتو على تورتيلا، وأرز، وفاصوليا، ولحم، وجبنة، وصوص، وربما أكثر. بدلاً من تصنيف البوريتو بالكامل كعنصر واحد، يمكن للذكاء الاصطناعي التعرف عليه كطبق مركب وتقدير التغذية للبوريتو بالكامل أو تفكيكه إلى مكوناته المحتملة بناءً على ما هو مرئي وما يوجد عادةً في ذلك الطبق.
الخطوة 4: تقدير حجم الحصة
مع معرفة أن طبقك يحتوي على سلمون مشوي، فهذا مفيد، لكن ليس كافيًا لحساب السعرات الحرارية. يحتاج الذكاء الاصطناعي أيضًا إلى تقدير كمية السلمون الموجودة. هل هي شريحة بوزن 100 جرام أم 200 جرام؟ الفرق في السعرات الحرارية كبير.
كيف يقدر الذكاء الاصطناعي الحجم دون ميزان
يعتبر تقدير الحصة من أصعب المشكلات في الذكاء الاصطناعي الغذائي. لا يمكن للنظام وزن طعامك فعليًا، لذا يعتمد على إشارات بصرية ونقاط مرجعية.
تحليل الحجم النسبي: يستخدم الذكاء الاصطناعي كائنات معروفة في الإطار كنقاط مرجعية. يبلغ قطر طبق العشاء القياسي حوالي 26 سنتيمترًا. يبلغ طول الشوكة حوالي 19 سنتيمترًا. إذا تمكن النموذج من تحديد هذه الكائنات، يمكنه تقدير الحجم الفعلي للطعام بالنسبة لها. فكر في الأمر كاستخدام مسطرة موجودة بالفعل على الطاولة.
تقدير العمق: يمكن لنماذج الذكاء الاصطناعي الحديثة تقدير الهيكل ثلاثي الأبعاد لمشهد من صورة ثنائية الأبعاد واحدة. هذا يسمح للنظام بتقدير ليس فقط مدى عرض قطعة الطعام، بل تقريبًا مدى سمكها أو ارتفاعها. قطعة رقيقة من صدور الدجاج المشوي لها محتوى سعرات حرارية مختلف تمامًا عن قطعة سميكة، حتى لو بدت بنفس الحجم من الأعلى.
النماذج الإحصائية السابقة: يعرف الذكاء الاصطناعي، من بيانات تدريبه، أن حصة السلمون النموذجية في المطاعم تتراوح بين 140 و200 جرام، بينما قد تكون حصة المنزل المطبوخة حوالي 100 إلى 170 جرام. تساعد هذه المعايير الإحصائية النموذج على إجراء تقديرات معقولة حتى عندما تكون الإشارات البصرية غامضة.
نماذج الكثافة المتعلمة: تحتوي الأطعمة المختلفة على كثافات مختلفة. كوب من الخضار الورقية يزن أقل بكثير من كوب من البطاطس المهروسة، حتى لو كانا يشغلان نفس الحجم. لقد تعلم الذكاء الاصطناعي هذه العلاقات الكثافية ويأخذها في الاعتبار في تقديراته للوزن.
لماذا تعتبر هذه الخطوة هي الأصعب
يعتبر تقدير الحصة هو المكان الذي تميل فيه أكبر الأخطاء إلى الحدوث، وهذا صحيح أيضًا بالنسبة للبشر. أظهرت الأبحاث باستمرار أن الناس سيئون للغاية في تقدير أحجام الحصص بصريًا. وجدت دراسات نشرت في مجلات علوم التغذية أن كل من أخصائيي التغذية المدربين والمستهلكين العاديين يخطئون في تقدير الحصص بنسبة تتراوح بين 20 إلى 50 في المئة.
لا يقضي الذكاء الاصطناعي على هذه الصعوبة، لكنه يطبق منهجية مدربة ومتسقة بدلاً من الاعتماد على الحدس. عبر عدد كبير من الوجبات، يؤدي هذا الاتساق إلى دقة أفضل بكثير من التقدير اليدوي البشري.
الخطوة 5: مطابقة قاعدة البيانات الغذائية
في هذه المرحلة، يعرف الذكاء الاصطناعي ما هي الأطعمة الموجودة على الطبق وكمية كل منها تقريبًا. الخطوة النهائية هي تحويل هذه المعلومات إلى أرقام تغذية فعلية.
الاتصال بقواعد بيانات غذائية موثوقة
تحافظ Nutrola على قاعدة بيانات غذائية شاملة مبنية من مصادر موثوقة، بما في ذلك قواعد بيانات تكوين الأغذية الحكومية، وبيانات الشركات المصنعة الموثوقة، والتحليلات المخبرية. عندما يحدد الذكاء الاصطناعي طعامًا كـ "سلمون مشوي، حوالي 170 جرامًا"، يبحث النظام عن الملف الغذائي للسلمون الأطلسي المشوي ويقوم بتعديل القيم وفقًا لحجم الحصة المقدرة.
تعتبر هذه العملية أكثر تعقيدًا من مجرد البحث في جدول بسيط. يأخذ النظام في الاعتبار طريقة التحضير لأن شريحة سلمون مشوية في الفرن وشريحة سلمون مقلية في الزبدة لها محتوى سعرات حرارية مختلف، حتى عند نفس الوزن. يأخذ في الاعتبار الاختلافات الإقليمية الشائعة: قد يتم تحضير السلمون المقدم في مطعم ياباني بشكل مختلف عن السلمون في مطعم متوسطي. عندما تكون تفاصيل التحضير المحددة غامضة، يستخدم النظام أكثر طرق التحضير شيوعًا إحصائيًا للطبق المحدد.
التعامل مع الأطباق المركبة والمخصصة
بالنسبة لطعام يحتوي على مكون واحد مثل الموز، يكون البحث في قاعدة البيانات مباشرًا. لكن بالنسبة لطبق مكون من عدة عناصر، يقوم النظام بتجميع البيانات الغذائية من كل مكون تم تحديده. يصبح طبقك من السلمون مع الكينوا والخضار المحمصة مجموعًا من ماكروز السلمون، وماكروز الكينوا، وماكروز خضار المزيج، مع تعديلها لأي صلصات أو زيوت أو تتبيلات مرئية.
بالنسبة للأطباق المعروفة مثل "سلطة دجاج سيزر" أو "تاكو لحم البقر"، تتضمن قاعدة البيانات أيضًا إدخالات مسبقة التركيب تأخذ في الاعتبار نسب المكونات الشائعة وطرق التحضير. يقوم الذكاء الاصطناعي بمقارنة تحليله على مستوى المكونات مع هذه الإدخالات الكاملة للطبق لإنتاج التقدير الأكثر دقة.
الخطوة 6: تقييم الثقة وتأكيد المستخدم
لا يوجد نظام ذكاء اصطناعي يكون صحيحًا بنسبة 100 في المئة، وقد تم تصميم Nutrola لتكون شفافة بشأن مستوى ثقتها.
كيف يعمل تقييم الثقة
كل توقع يقوم به الذكاء الاصطناعي يأتي مع درجة ثقة داخلية، وهي رقم يمثل مدى تأكد النموذج من تصنيفه وتقدير حجمه. إذا كان النموذج واثقًا بنسبة 95 في المئة بأنه ينظر إلى سلمون مشوي، فإنه يقدم النتيجة دون تردد. إذا كان واثقًا بنسبة 70 في المئة فقط، فقد يقدم أفضل تخمين له بينما يقدم أيضًا احتمالات بديلة.
فكر في تقييم الثقة كطبيب يقول "أنا متأكد إلى حد ما أن هذا هو X، لكن قد يكون أيضًا Y. دعني أؤكد." إنها علامة على نظام مصمم بشكل جيد، وليست عيبًا.
حلقة تأكيد المستخدم
عندما يقدم الذكاء الاصطناعي تحليله، لديك الفرصة لمراجعته وتعديله. إذا حدد الذكاء الاصطناعي الكينوا على أنها كسكس، يمكنك تصحيح ذلك بلمسة. إذا بدا أن تقدير الحصة مرتفع جدًا أو منخفض جدًا، يمكنك تعديل حجم الحصة. تخدم هذه التصحيحات غرضين: تمنحك بيانات دقيقة لتلك الوجبة المحددة، وتساهم في تحسين النظام لتوقعات مستقبلية.
تم تصميم هذا النظام الذي يتضمن الإنسان عن عمد. يتولى الذكاء الاصطناعي الجزء الأكبر من العمل، لكنك تبقى في السيطرة على النتيجة النهائية. إنها شراكة وليست صندوقًا أسود.
أين يواجه الذكاء الاصطناعي صعوبات: قيود صادقة
لا توجد تقنية مثالية، والصدق الفكري بشأن القيود أكثر فائدة من الادعاءات التسويقية عن الكمال. إليك السيناريوهات التي تواجه فيها الذكاء الاصطناعي الغذائي، بما في ذلك Nutrola، تحديات حقيقية.
المكونات المخفية
يمكن للذكاء الاصطناعي تحليل ما يمكنه رؤيته فقط. يمكن أن تكون صلصة السلطة التي تم امتصاصها في الأوراق، أو الزبدة المذابة في البطاطس المهروسة، أو السكر المذاب في صلصة غير مرئية للكاميرا. يمكن أن تتراكم هذه السعرات الحرارية المخفية بشكل كبير. تضيف ملعقة كبيرة من زيت الزيتون حوالي 120 سعرة حرارية، وقد لا يكتشفها الذكاء الاصطناعي إذا تم امتصاصها بالكامل في الطعام.
تخفف Nutrola من ذلك باستخدام نماذج إحصائية لطرق التحضير النموذجية. إذا قمت بالتقاط صورة لطبق من المعكرونة في مطعم، يفترض النظام أنه تم استخدام كمية معقولة من الزيت أو الزبدة في التحضير، حتى لو لم تكن مرئية. لكن هذه تخمين مدروس، وليست قياسًا دقيقًا.
الأطعمة المتشابهة بصريًا مع ملفات غذائية مختلفة
بعض الأطعمة لا يمكن تمييزها تقريبًا في صورة. الزبادي كامل الدسم والزبادي الخالي من الدسم يبدوان متشابهين. المشروبات الغازية العادية والمشروبات الغازية الخالية من السكر في كوب متطابقتان أمام الكاميرا. السكر الأبيض والمحلي الصناعي في عبوة يمكن أن تكون غامضة. في هذه الحالات، يعتمد الذكاء الاصطناعي على النسخة الأكثر شيوعًا ولكنه قد يخمن بشكل خاطئ.
الأطباق غير العادية أو الإقليمية
يؤدي الذكاء الاصطناعي أفضل أداءً مع الأطعمة التي تم تمثيلها جيدًا في بيانات تدريبه. يتم التعرف على الأطباق الشائعة من المأكولات الكبرى بشكل موثوق. لكن التخصصات الإقليمية الدقيقة من بلدة صغيرة، أو وصفة عائلية بمكونات غير عادية، أو طبق جديد تمامًا قد لا يكون في مفردات النموذج. في هذه الحالات، يعود الذكاء الاصطناعي إلى أقرب تطابق معروف، والذي قد يكون غير دقيق.
الإضاءة أو الزوايا المتطرفة
بينما تصحح خطوة معالجة الصور العديد من مشكلات الإضاءة والزوايا، لا تزال الحالات المتطرفة تسبب مشاكل. قد تؤدي الوجبة الملتقطة في ظلام شبه كامل، تحت إضاءة ملونة بشدة، أو من زاوية جانبية شديدة إلى إرباك النموذج. تنتج اللقطات من الأعلى في إضاءة معقولة أفضل النتائج باستمرار.
الأطعمة المكدسة أو المتعددة الطبقات
تقدم الأطعمة ذات الطبقات المخفية تحديًا خاصًا. يُظهر السندويش الملتقط من الأعلى فقط الشريحة العلوية من الخبز. تُظهر اللازانيا الطبقة العلوية فقط. يُظهر البوريتو فقط التورتيلا. يقدر الذكاء الاصطناعي المحتويات الداخلية بناءً على ما يحتويه الطبق عادةً، لكنه لا يمكنه الرؤية من خلال الطعام الصلب.
كيف تصبح Nutrola أكثر ذكاءً مع مرور الوقت
أحد أقوى جوانب الذكاء الاصطناعي الحديث هو قدرته على التحسن باستمرار. لا تبقى تقنية التعرف على الطعام في Nutrola ثابتة بعد الإطلاق. تصبح أفضل بشكل ملحوظ مع مرور كل شهر.
التعلم من التصحيحات
في كل مرة يقوم فيها المستخدم بتصحيح تحديد طعام أو تعديل تقدير حصة، تصبح تلك التصحيح نقطة بيانات. عندما يقوم الآلاف من المستخدمين بإجراء تصحيحات مماثلة، يصبح النمط واضحًا ويمكن تحديث النموذج. إذا كان الذكاء الاصطناعي يخطئ باستمرار في نوع خبز إقليمي معين، فإن تصحيحات المستخدمين تشير إلى المشكلة ويمكن لفريق التدريب إضافة المزيد من أمثلة الخبز الصحيح إلى مجموعة بيانات التدريب.
تضمن هذه الحلقة الراجعة أن دقة التطبيق تتحسن مباشرة من خلال المجتمع الذي يستخدمه. يساعد المستخدمون الأوائل في تدريب النظام للمستخدمين اللاحقين، وتستمر الدورة.
توسيع قاعدة بيانات الطعام
يضيف فريق Nutrola باستمرار أطعمة جديدة إلى قاعدة البيانات: أطباق جديدة من المأكولات الناشئة، وعناصر موسمية، وأصناف جديدة من قوائم المطاعم، ومنتجات جديدة تم إصدارها. كل إضافة توسع نطاق الوجبات التي يمكن للذكاء الاصطناعي التعرف عليها بدقة.
إعادة تدريب النموذج وتحسينات الهيكل
يتم إعادة تدريب نموذج الذكاء الاصطناعي دوريًا على مجموعات بيانات محدثة وموسعة. مع تقدم الأبحاث في الرؤية الحاسوبية والتعلم العميق، يتم دمج هذه التطورات في Nutrola. النموذج المدرب اليوم أكثر دقة بشكل ملحوظ من النموذج المدرب قبل عامين، حتى على نفس مجموعة صور الطعام.
التكيف الإقليمي
مع نمو قاعدة مستخدمي Nutrola في أجزاء مختلفة من العالم، تتراكم المزيد من البيانات حول المأكولات وأنماط الأكل الإقليمية. يسمح ذلك للنموذج بأن يصبح أكثر دقة بشكل متزايد للأطعمة المحلية التي قد لا تكون ممثلة جيدًا في بيانات التدريب السابقة. يستفيد المستخدم في سيول من آلاف صور الوجبات الكورية التي قام بتسجيلها مستخدمون آخرون في سيول بالفعل.
المقارنة: تتبع الصور بالذكاء الاصطناعي مقابل مسح الباركود مقابل البحث اليدوي
تمتلك طرق تسجيل الطعام المختلفة نقاط قوة وضعف مختلفة. إليك كيف تقارن عبر الأبعاد الأكثر أهمية للتتبع اليومي.
| العامل | تتبع الصور بالذكاء الاصطناعي | مسح الباركود | البحث اليدوي |
|---|---|---|---|
| السرعة | 3 إلى 5 ثوانٍ | 5 إلى 10 ثوانٍ | 30 إلى 90 ثانية |
| يعمل مع الوجبات المنزلية | نعم | لا | نعم، لكن متعب |
| يعمل مع الوجبات في المطاعم | نعم | لا | جزئيًا |
| يعمل مع الأطعمة المعبأة | نعم | نعم، بدقة عالية | نعم |
| يتعامل مع عناصر متعددة في وقت واحد | نعم | لا، عنصر واحد في كل مرة | لا، عنصر واحد في كل مرة |
| الدقة للأطعمة البسيطة | عالية | عالية جدًا | تعتمد على المستخدم |
| الدقة للوجبات المعقدة | معتدلة إلى عالية | غير قابلة للتطبيق | منخفضة إلى معتدلة |
| يتطلب قراءة الملصقات | لا | نعم، للتأكيد | نعم |
| مستوى الاحتكاك | منخفض جدًا | منخفض | مرتفع |
| خطر تقليل المستخدم للتقديرات | منخفض | منخفض | مرتفع |
| متاح للأطعمة غير المعبأة | نعم | لا | نعم |
الاستنتاج الرئيسي هو أنه لا توجد طريقة واحدة هي الأفضل في كل سيناريو. يتفوق تتبع الصور بالذكاء الاصطناعي في الوجبات المنزلية والمطاعم حيث لا توجد رموز شريطية. يعد مسح الباركود لا يُهزم للأطعمة المعبأة التي تحتوي على بيانات دقيقة من الشركات المصنعة. يعد البحث اليدوي وسيلة موثوقة احتياطية عندما تكون الطرق الأخرى غير متاحة. تدعم Nutrola جميع الطرق الثلاث بدقة لأن كل واحدة تغطي الفجوات التي تتركها الأخرى.
الأسئلة الشائعة
ما مدى دقة التعرف على الطعام بالذكاء الاصطناعي مقارنةً بالتسجيل اليدوي؟
أظهرت الدراسات المنضبطة التي تقارن تسجيل الطعام بمساعدة الذكاء الاصطناعي بالتسجيل اليدوي أن الطرق المدعومة بالذكاء الاصطناعي تقلل من أخطاء تقدير السعرات الحرارية بحوالي 25 إلى 40 في المئة في المتوسط. تكون التحسينات أكثر وضوحًا للوجبات المعقدة متعددة المكونات حيث يكون التقدير اليدوي صعبًا بشكل خاص. بالنسبة للأطعمة البسيطة ذات المكون الواحد، فإن الفرق في الدقة أصغر لأن كلا الطريقتين تؤديان بشكل معقول جيدًا.
هل يعمل الذكاء الاصطناعي مع جميع المأكولات؟
تم تدريب الذكاء الاصطناعي في Nutrola على مجموعة بيانات متنوعة وعالمية تغطي آلاف الأطباق من المأكولات حول العالم. ومع ذلك، تكون دقة التعرف عمومًا أعلى للأطباق الأكثر شيوعًا في بيانات التدريب. إذا كنت تتناول بانتظام أطباقًا من مطبخ يتعامل معه الذكاء الاصطناعي بشكل أقل ثقة، فإن تصحيحاتك تساعد بالفعل في تحسين الدقة لذلك المطبخ مع مرور الوقت.
ماذا يحدث إذا أخطأ الذكاء الاصطناعي؟
يمكنك دائمًا تعديل اقتراح الذكاء الاصطناعي. اضغط على أي عنصر غذائي محدد لتغييره، أو تعديل حجم الحصة، أو إضافة عناصر فاتتها الذكاء الاصطناعي. يتم تطبيق هذه التصحيحات على سجلك على الفور وتساهم أيضًا في تحسين النظام لتوقعات المستقبل.
هل تترك الصورة هاتفي؟
يتم إرسال الصورة إلى خوادم Nutrola للمعالجة لأن نماذج الذكاء الاصطناعي كبيرة ومعقدة جدًا بحيث لا يمكن تشغيلها بالكامل على جهاز محمول. تتم معالجة الصورة، ويتم إرجاع النتائج، وتتحكم سياسة الخصوصية في Nutrola في كيفية التعامل مع بيانات الصورة. لا يتم مشاركة أي صور مع أطراف ثالثة.
لماذا تظهر أحيانًا عدة تطابقات محتملة؟
عندما تكون ثقة النموذج أقل من عتبة معينة، فإنه يقدم أفضل المرشحين بدلاً من الالتزام بإجابة واحدة. هذا عن قصد. من الأفضل أن تظهر لك ثلاثة خيارات وتدعك تختار الصحيح بدلاً من الالتزام بصمت بالإجابة الخاطئة. تضمن هذه الطريقة الشفافة أنك تظل في السيطرة وتضمن دقة سجلك.
هل يمكن للذكاء الاصطناعي اكتشاف الزيوت أو الصلصات أو التتبيلات؟
يمكن غالبًا اكتشاف الصلصات والتتبيلات المرئية، مثل رذاذ من صلصة الرانش على سلطة أو بركة من صلصة الصويا على طبق. ومع ذلك، فإن الزيوت والدهون التي تم امتصاصها في الطعام أثناء الطهي تكون غير مرئية إلى حد كبير للكاميرا. تعوض Nutrola عن ذلك من خلال أخذ طرق التحضير النموذجية في الاعتبار. على سبيل المثال، إذا قمت بالتقاط صورة لطبق من الخضار المقلية، يفترض النظام أنه تم استخدام كمية معقولة من زيت الطهي.
هل سيكون الذكاء الاصطناعي يومًا ما دقيقًا بنسبة 100 في المئة؟
واقعيًا، لا. حتى أخصائيي التغذية المحترفين الذين يستخدمون معدات مختبرية يقبلون هوامش الخطأ. الهدف ليس الكمال النظري ولكن الدقة العملية: قريبة بما يكفي لتكون مفيدة حقًا لتتبع الاتجاهات، والحفاظ على عجز أو فائض السعرات الحرارية، واتخاذ قرارات غذائية مستنيرة يومًا بعد يوم. بالنسبة لأغلب المستخدمين، يوفر تتبع الصور بالذكاء الاصطناعي دقة أكثر من كافية لدعم التقدم الملحوظ نحو أهدافهم الصحية.
الصورة الأكبر
تتقدم التكنولوجيا وراء الذكاء الاصطناعي في التعرف على الطعام بسرعة. ما كان يعتبر في يوم من الأيام في طليعة التطور قد تم تجاوزه عدة مرات. تصبح النماذج أصغر وأسرع وأكثر دقة. تصبح مجموعات التدريب أكبر وأكثر تنوعًا. وتؤدي حلقات التغذية الراجعة التي أنشأها الملايين من المستخدمين اليوميين إلى تسريع التحسين بطرق لن تكون ممكنة في مختبرات البحث وحدها.
بالنسبة لك كمستخدم، فإن النتيجة العملية بسيطة: تلتقط صورة، تحصل على بيانات التغذية الخاصة بك، وتتابع يومك. يحدث خط الأنابيب الذي يعمل خلف هذه التجربة، معالجة الصور، والكشف، والتصنيف، وتقدير الحصة، ومطابقة قاعدة البيانات، وتقييم الثقة، كل ذلك في غضون ثوانٍ.
فهم كيفية عمله ليس شرطًا لاستخدامه. لكن معرفة ما يحدث خلف الكواليس يمكن أن يبني ثقة جيدة في التكنولوجيا ويساعدك على استخدامها بشكل أكثر فعالية. عندما تعرف أن الصور الملتقطة من الأعلى في إضاءة جيدة تنتج أفضل النتائج، تبدأ بشكل طبيعي في التقاط صور طعام أفضل. عندما تعرف أن المكونات المخفية هي نقطة عمياء، تتذكر إضافة ملعقة زيت الزيتون الإضافية يدويًا. وعندما تعرف أن تصحيحاتك تجعل النظام أكثر ذكاءً، تشعر بالدافع لقضاء ثانيتين لتصحيح تخمين خاطئ.
هذه هي القوة الحقيقية لفهم التكنولوجيا: إنها تحولك من مستخدم سلبي إلى شريك مطلع في تتبع تغذيتك.
مستعد لتحويل تتبع تغذيتك؟
انضم إلى الآلاف الذين حولوا رحلتهم الصحية مع Nutrola!