האם Gemini AI יכול לעקוב אחרי הקלוריות שלך? בדקנו את זה מול אפליקציה ייעודית

ביקשנו מ-Gemini ומ-ChatGPT להעריך קלוריות ל-30 ארוחות, ולאחר מכן השווינו את התוצאות ל-Nutrola ולמקורות מזון מדודים. הפער בדיוק היה גדול מהצפוי.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

כשהצ'אטבוטים של AI הופכים לחלק מהחיים היומיומיים, עולה שאלה טבעית: האם אפשר פשוט לבקש מ-Gemini או ChatGPT לעקוב אחרי הקלוריות שלך במקום להשתמש באפליקציית תזונה ייעודית? בדקנו את זה ישירות. במשך שבועיים, ביקשנו מ-Google Gemini ומ-OpenAI ChatGPT להעריך את תכולת הקלוריות והמאקרו-נוטריינטים של 30 ארוחות שונות, החל ממזונות פשוטים עם רכיב אחד ועד מנות מורכבות במסעדות. השווינו את ההערכות שלהם לשני מדדים: רשומות מאגר המזון המאומת של Nutrola ומקורות מזון מדודים שחושבו בעזרת ערכי USDA FoodData Central.

התוצאות חושפות מגבלות בסיסיות בשימוש בצ'אטבוטים של AI למעקב תזונתי, מגבלות שהן מבניות ולא זמניות, כלומר סביר להניח שלא ייפתרו לחלוטין בעדכוני מודל עתידיים.

האם אני יכול להשתמש ב-Gemini לספירת קלוריות?

אתה יכול לבקש מ-Gemini להעריך את הקלוריות בארוחה, והוא יספק תשובה. השאלה היא אם התשובה הזו מדויקת ועקבית מספיק כדי לתמוך בניהול תזונתי אמיתי. על פי הבדיקות שלנו, התשובה היא לא לכל מקרה שדורש אמינות.

מתודולוגיית הבדיקה: הכנו או רכשנו 30 ארוחות שמכסות מגוון רמות מורכבות. כל ארוחה נמדדה על משקל מטבח מכויל, וערכי הקלוריות הושגו בעזרת נתוני תזונה של USDA FoodData Central. לאחר מכן תיארנו כל ארוחה ל-Gemini (העוזר הווירטואלי של גוגל) בשפה טבעית, בדיוק כמו שמשתמש אמיתי היה עושה, ורשמנו את הערכת הקלוריות שלו. ערכנו את אותה בדיקה עם ChatGPT (GPT-4o) ורשמנו כל ארוחה ב-Nutrola באמצעות זיהוי תמונה וחיפוש במאגר.

הגדרת דיוק: הגדרנו הערכה כ"מדויקת" אם היא נפלה בטווח של 10 אחוזים מהערך המדוד, סף סטנדרטי שמשמש במחקרי הערכת תזונה (Subar et al., The Journal of Nutrition, 2015).

כמה מדויקים צ'אטבוטים של AI בספירת קלוריות?

התוצאות היו עקביות בין קטגוריות הארוחות: צ'אטבוטים של AI מספקים הערכות גסות שאינן אמינות מספיק לדיאטות מבוקרות קלוריות.

מדד Gemini ChatGPT (GPT-4o) Nutrola מקור מדוד
ארוחות בטווח של 10% מהערך המדוד 11/30 (37%) 13/30 (43%) 25/30 (83%) 30/30 (100%)
שגיאה מוחלטת ממוצעת 127 קלוריות 108 קלוריות 38 קלוריות 0 קלוריות
שגיאה אחוזית ממוצעת 22.4% 18.6% 6.1% 0%
ההערכה הגדולה ביותר +340 קלוריות (מנה פסטה) +285 קלוריות (מנה מוקפצת) +95 קלוריות (מנה במסעדה) N/A
ההערכה הקטנה ביותר -290 קלוריות (סלט עם רוטב) -315 קלוריות (קערת גרנולה) -72 קלוריות (מרק ביתי) N/A
עקביות בין שאילתות חוזרות לא (שונה ב-50-200 קלוריות) לא (שונה ב-30-150 קלוריות) כן (נעול במאגר) N/A

ממצא מרכזי: השגיאה המוחלטת הממוצעת של 108 עד 127 קלוריות לכל ארוחה מתורגמת ל-324 עד 381 קלוריות של שגיאה מצטברת על פני שלוש ארוחות ביום. עבור מישהו שמטרתו היא חיסכון של 500 קלוריות לירידה במשקל, רמת חוסר הדיוק הזו יכולה לחסל 65 עד 76 אחוזים מהחיסכון המיועד, ובכך לעכב את ההתקדמות.

מדוע צ'אטבוטים של AI טועים בספירת קלוריות?

השגיאות שצפינו לא היו אקראיות. הן עקבו אחרי דפוסים צפויים שמגלים מגבלות מבניות בשימוש במודלים של שפה גדולה להערכה תזונתית.

בעיה 1: אין מאגר נתונים מאומת. Gemini ו-ChatGPT אינם מחפשים מזונות במאגר תזונה מובנה כאשר אתה מבקש מהם הערכות קלוריות. הם מייצרים תגובות על סמך דפוסים בנתוני האימון שלהם, הכוללים תמהיל של נתוני USDA מדויקים, תוכן שנוצר על ידי משתמשים, הערכות של בלוגי מזון וחומרי שיווק. פריט מזון אחד יכול להיות בעל ערכי קלוריות שונים מאוד במקורות הללו, והמודל אינו מכיל מנגנון לזהות איזה מקור הוא הנכון.

Nutrola ואפליקציות תזונה ייעודיות אחרות משתמשות במאגרים מאומתים. מאגר הנתונים של Nutrola מכיל מעל 1.8 מיליון רשומות שנבדקו מול נתוני USDA FoodData Central, תוויות תזונה של יצרנים וניתוחים מעבדתיים עצמאיים. כאשר אתה רושם "חזה עוף, בגריל, 150 גרם", הערך המוחזר הוא נקודת נתון מאומתת, ולא ממוצע סטטיסטי של כל מה שהאינטרנט אי פעם אמר על עוף.

בעיה 2: אין בסיס גודל מנה. כאשר אתה אומר לצ'אטבוט AI שאכלת "קערת פסטה", עליו לנחש מה זה אומר "קערה". האם מדובר ב-200 גרם פסטה מבושלת או 400 גרם? ההבדל הוא 250 קלוריות או יותר. צ'אטבוטים של AI נוטים להניח ממוצעי תרבותיים של גודל המנות שעשויים לא להתאים למנה שלך בפועל.

בבדיקות שלנו, חישוב שגוי של גודל המנה היה מקור השגיאה הגדול ביותר. Gemini העריך קערת גרנולה ב-210 קלוריות פחות מכפי שנצרך בפועל, כי הניח גודל מנה קטן יותר. ChatGPT העריך מנה מוקפצת ב-285 קלוריות יותר כי הניח שמדובר במנות בגודל מסעדה כאשר הארוחה הייתה ביתית.

Nutrola מתמודדת עם זה באמצעות מספר מנגנונים: סריקת ברקוד מקשרת ישירות לגודל המנה המצוינת על ידי היצרן, זיהוי תמונה של AI מעריך את נפח המנה מהתמונה, והמשתמשים יכולים להתאים את המנות בגרמים בעזרת משקל מטבח כדי להשיג דיוק מקסימלי.

בעיה 3: אין זיכרון בין מפגשים. זו אולי המגבלה הבסיסית ביותר למעקב קלוריות מתמשך. צ'אטבוטים של AI אינם שומרים רישום מתמשך של מה שאכלת. כל שיחה מתחילה מאפס. אין סך יומי, אין מגמה שבועית, אין פיצול מאקרו-נוטריינטים רציף.

מעקב קלוריות אפקטיבי דורש נתונים מצטברים. אתה צריך לדעת לא רק את הקלוריות בארוחת הצהריים שלך אלא גם את הסך היומי שלך, את הממוצע השבועי שלך, את הפיצול המאקרו-נוטריינטי שלך ואת מגמת המשקל שלך לאורך זמן. צ'אטבוט מספק הערכות נקודתיות מבודדות ללא רציפות.

בעיה 4: הערכות לא עקביות עבור שאילתות זהות. ביקשנו מ-Gemini ומ-ChatGPT להעריך קלוריות עבור אותה תיאור ארוחה שלוש פעמים בימים שונים. התוצאות השתנו ב-50 עד 200 קלוריות בין השאילתות. "סלט קיסר בינוני עם עוף בגריל" החזיר הערכות של 380, 450 ו-520 קלוריות מ-Gemini בשלוש שיחות נפרדות. חוסר עקביות זה הוא תוצאה מהותית של איך מודלים של שפה מייצרים תגובות. הם יצרני טקסט פרובביליסטיים, ולא מערכות חיפוש במאגרי נתונים.

בעיה 5: נתוני תזונה מדומיינים. ב-4 מתוך 30 הערכות ארוחה, ChatGPT סיפק פירוט תזונתי ספציפי אך מפוברק. לדוגמה, הוא טען שברק של חטיף חלבון מסוים מכיל 22 גרם חלבון ו-210 קלוריות, כאשר התווית האמיתית מציינת 20 גרם חלבון ו-190 קלוריות. המספרים היו קרובים מספיק כדי להיראות סבירים, אך שגויים מספיק כדי להיות משמעותיים לאורך זמן. תופעה זו, הידועה כהזיה במחקר AI, מסוכנת במיוחד בתחום התזונה כי השגיאות נראות סמכותיות.

האם ChatGPT מדויק בספירת קלוריות?

ChatGPT ביצע מעט טוב יותר מ-Gemini בבדיקות שלנו, עם 43 אחוז מההערכות שנפלו בטווח של 10 אחוזים מהערך המדוד לעומת 37 אחוז עבור Gemini. עם זאת, ההבדל הזה אינו משמעותי מעשית. שני הצ'אטבוטים נמצאים רחוק מתחת לסף הדיוק הנדרש לניהול תזונתי אמין.

הסטנדרט האקדמי לכלי הערכת תזונה, כפי שהוגדר על ידי חוקרים כמו Subar et al. ו-Thompson et al. במכון הלאומי לסרטן, דורש שכלי יוכיח פחות מ-10 אחוז שגיאה ממוצעת כדי להיחשב תקף למעקב תזונתי ברמת הפרט. שני הצ'אטבוטים חורגים מהסף הזה במידה רבה.

היתרון של ChatGPT על פני Gemini נראה נובע מהנחות טובות יותר לגבי גודל המנה עבור מזונות אמריקאיים נפוצים, כנראה משקף את הרכב נתוני האימון שלו. עבור מזונות בינלאומיים, מנות אזוריות ומנות ביתיות, הדיוק ירד משמעותית עבור שני המודלים.

השוואה מלאה בין צ'אטבוט AI לאפליקציית תזונה למעקב דיאטה

מעבר לדיוק הגולמי, ההבדלים הפונקציונליים בין צ'אטבוט לאפליקציית תזונה ייעודית נוגעים למספר ממדים שמשפיעים על השימושיות בעולם האמיתי.

תכונה Gemini / ChatGPT Nutrola
דיוק קלוריות (לעומת מקור מדוד) 18-22% שגיאה ממוצעת 6% שגיאה ממוצעת
מאגר מזון מאומת לא כן, 1.8M+ רשומות
סריקת ברקוד לא כן
זיהוי מזון מבוסס תמונה מוגבל (דורש העלאה) זיהוי AI מובנה
רישום קולי עקיף (טקסט מדיבור) רישום מזון קולי מקורי
רישום יומי מתמשך לא כן, אוטומטי
סיכום יומי/שבועי רציף לא (יש לסכם ידנית) כן, בזמן אמת
פיצול מאקרו-נוטריינטים מוערך לכל שאילתה מנוטר בעבור מזון, יומי, שבועי
מעקב מיקרו-נוטריינטים לא עקבי 100+ נוטריינטים
מעקב מגמת משקל לא כן, עם גרפים
אינטגרציה עם Apple Watch לא כן
יעדים קלוריים מותאמים לא כן, מתאימים למגמות שלך
הערכות עקביות לא (משתנה לפי שאילתה) כן (נעול במאגר)
גישה לא מקוונת לא כן
עלות חינם (עם מנוי עבור מתקדם) החל מ-€2.50/חודש
פרסומות משתנה לפי פלטפורמה אפס פרסומות

במה צ'אטבוטים של AI טובים בתחום התזונה?

למרות המגבלות שלהם במעקב קלוריות, לצ'אטבוטים של AI יש שימושים תזונתיים לגיטימיים שראוי להכיר בהם.

חינוך תזונתי כללי. כאשר שואלים את Gemini או ChatGPT להסביר את ההבדל בין שומן רווי לשומן בלתי רווי, או לתאר כיצד מתבצע סינתזת חלבון, בדרך כלל מתקבלות תשובות מדויקות ומאורגנות היטב. עבור שאלות קונספטואליות עם הסכמה מדעית מבוססת, צ'אטבוטים מבצעים היטב.

יצירת רעיונות לארוחות. צ'אטבוטים מצטיינים ביצירת רעיונות למתכונים על סמך מגבלות כמו "ארוחות עשירות בחלבון מתחת ל-500 קלוריות עם עוף וברוקולי." מספר הקלוריות הספציפי עשוי שלא להיות מדויק, אך רעיונות הארוחות הם נקודות התחלה מועילות.

השוואת דפוסי תזונה. כאשר שואלים צ'אטבוט להשוות בין דיאטות ים-תיכוניות, קטוגניות וצמחוניות, מתקבלות סיכומים סבירים של הראיות לכל גישה.

היכן שצ'אטבוטים נכשלו הוא במשימה הכמותית, המתמשכת, והדרושה לדיוק של מעקב יומי אחר קלוריות ומזינים. זו בעיה של מאגר ורישום, ולא בעיה של יצירת שפה.

מדוע אפליקציות תזונה ייעודיות עולות על צ'אטבוטים של AI

הסיבה המרכזית היא ארכיטקטונית. אפליקציית מעקב תזונה בנויה סביב מאגר נתונים מובנה, פרופיל משתמש מתמשך, ולוגיקה של צבירה. צ'אטבוט AI בנוי סביב חיזוי טוקן הבא ממודל שפה. אלו כלים fundamentally שונים, מותאמים למשימות fundamentally שונות.

התמדה. Nutrola שומרת רישום מלא של כל מזון שאתה רושם, את הסכומים היומיים והשבועיים שלך, את מגמות המאקרו-נוטריינטים שלך, ואת היסטוריית המשקל שלך. נתונים לאורך זמן הם מה שהופך את מעקב הקלוריות לאפקטיבי. הערכת קלוריות נקודתית, לא משנה כמה מדויקת, חסרת ערך ללא הקשר של הסכום היומי שלך ודפוס השבועי.

נתונים מאומתים. רשומת נתונים עבור "יוגורט יווני של Chobani, טבעי, 150 גרם" ב-Nutrola נובעת מתווית התזונה של היצרן ומאומתת מול תקני USDA. כאשר צ'אטבוט מעריך את אותו פריט, הוא ממוצע מידע ממקורות אינטרנטיים רבים עם אמינות משתנה, ומייצר מספר סביר אך לא מאומת.

אינטגרציה עם מכשירים לבישים. נתוני Apple Watch מוזנים ישירות ל-Nutrola, ומספקים הערכות קלוריות מדויקות לפעילות שמחוברות לרישום המזון כדי לחשב את מאזן האנרגיה הנקי. אף צ'אטבוט אינו יכול לגשת לנתוני הלבוש שלך כדי להתאים את המלצות הקלוריות בהתבסס על תנועתך היומית בפועל.

מהירות ונוחות. צילום של הצלחת שלך, סריקת ברקוד, או דיבור על הארוחה שלך לוקחים פחות מ-30 שניות. הקלדת תיאור מפורט של הארוחה לצ'אטבוט, המתנה לתגובה, ואז רישום ההערכה במקום כלשהו לוקחים הרבה יותר זמן ומניבים תוצאה פחות מדויקת.

האם צ'אטבוטים של AI יכולים להשתפר מספיק כדי להחליף אפליקציות תזונה?

זו שאלה על ארכיטקטורה בסיסית, ולא רק על יכולת המודל. אפילו עם דיוק הערכת קלוריות מושלם (שמודלים נוכחיים רחוקים מלהשיג), לצ'אטבוטים של AI עדיין יחסר את הרישום המתמשך, המעקב המצטבר, האינטגרציה עם מכשירים לבישים, והאימות של מאגר נתונים מובנה שדרושים למעקב תזונתי.

מערכות AI עתידיות יכולות תיאורטית לכלול תכונות אלו. אבל בשלב הזה, הן יהיו בעצם אפליקציות תזונה עם ממשק שיחתי, ולא צ'אטבוטים כלליים. התכונות שהופכות את מעקב הקלוריות לעובד, מאגר נתונים מאומת, רישומי משתמש מתמשכים, אינטגרציות עם מכשירים, אלגוריתמים מותאמים, הן מערכות הנדסה, לא יכולות שפה.

העתיד הסביר ביותר אינו "צ'אטבוטים מחליפים אפליקציות תזונה" אלא "אפליקציות תזונה משלבות AI שיחתי." זה כבר קורה. זיהוי התמונה המונע על ידי AI ורישום קולי של Nutrola מביאים את הנוחות של אינטראקציה שיחתית לאמינות המובנית של מאגר תזונה מאומת. אתה מקבל את האינטראקציה הטבעית של שיחה עם AI עם הדיוק וההתמדה של מערכת מעקב ייעודית.

מה קורה כשאתה מבקש מ-AI לעקוב אחרי הקלוריות שלך?

כדי להמחיש את ההבדל המעשי, הנה איך נראה יום טיפוסי של מעקב קלוריות עם כל גישה.

שימוש ב-Gemini או ChatGPT: אתה מבקש מהצ'אטבוט להעריך את ארוחת הבוקר שלך. הוא נותן לך מספר. אתה רושם אותו איפשהו או מנסה לזכור אותו. בארוחת הצהריים, אתה מתחיל שיחה חדשה (הצ'אטבוט לא זוכר את ארוחת הבוקר) ומקבל הערכה נוספת. אתה מוסיף את שני המספרים בראש. עד ערב, יש לך סך כולל גס שעשוי להיות שגוי ב-200 עד 400 קלוריות, ואין לך פיצול מאקרו-נוטריינטים, רישום מתמשך, או מגמה שבועית.

שימוש ב-Nutrola: אתה מצלם את ארוחת הבוקר שלך. ה-AI מזהה את המזונות, מתאם אותם לרשומות מאגר מאומתות, ומרשום אותם אוטומטית. הסך היומי שלך מתעדכן בזמן אמת. בארוחת הצהריים, אתה סורק ברקוד על אריזת הסנדוויץ', ונתוני התזונה המדויקים של היצרן מתווספים לרישום שלך. עד ערב, יש לך סך כולל מדויק, פיצול מאקרו-נוטריינטים, והיסטוריה של הארוחות שלך שמזינה את המגמות השבועיות והחודשיות שלך. היעד הקלורי שלך מתעדכן בהתבסס על נתוני מגמת המשקל שלך המוזנים מ-Apple Watch שלך.

ההבדל אינו עדין. זה ההבדל בין ניחוש לבין מערכת.

מסקנות מרכזיות

צ'אטבוטים כלליים כמו Gemini ו-ChatGPT הם כלים מרשימים עבור משימות רבות, אך מעקב קלוריות אינו אחד מהם. הבדיקה שלנו של 30 ארוחות מצאה שגיאות ממוצעות של 108 עד 127 קלוריות לכל ארוחה, תוצאות לא עקביות בין שאילתות חוזרות, חוסר יכולת רישום מתמשך, וחוסר אינטגרציה עם מאגרי מזון או מכשירים לבישים. מגבלות אלו הן מבניות, ולא אקראיות. הן נובעות מההבדל הבסיסי בין מודל שפה לבין מערכת מעקב תזונתי.

עבור כל מי ש serious על ניהול התזונה שלו, אפליקציה ייעודית עם מאגר נתונים מאומת, רישום מתמשך, ויעדים מותאמים נשארת חיונית. Nutrola משלבת נוחות מונעת AI (זיהוי תמונה, רישום קולי, סריקת ברקוד) עם הדיוק וההתמדה של פלטפורמת תזונה מובנית, כל זאת עבור 2.50 אירו לחודש עם אפס פרסומות. כשמדובר במעקב קלוריות, השאלה אינה אם AI מעורב. השאלה היא אם ה-AI נתמך על ידי הארכיטקטורה הנכונה למשימה.

מוכנים לשנות את מעקב התזונה שלכם?

הצטרפו לאלפים ששינו את מסע הבריאות שלהם עם Nutrola!