Gemini AI Kalori Takibi Yapabilir mi? Özel Bir Uygulama ile Test Ettik

Gemini ve ChatGPT'ye 30 farklı yemeğin kalori tahminini sorduk, sonuçları Nutrola ile karşılaştırdık ve gıda referanslarını tarttık. Doğruluk farkı beklenenden daha büyüktü.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

AI sohbet botları günlük yaşamın bir parçası haline geldikçe, doğal bir soru ortaya çıkıyor: Neden Gemini veya ChatGPT'ye kalori takibi yaptırmıyorsunuz? Bu soruyu doğrudan test ettik. İki hafta boyunca, Google Gemini ve OpenAI ChatGPT'ye 30 farklı yemeğin kalori ve makro besin içeriğini tahmin etmesini istedik. Bu yemekler, basit tek malzemeli gıdalardan karmaşık restoran yemeklerine kadar çeşitlilik gösteriyordu. Tahminlerini iki referans noktasıyla karşılaştırdık: Nutrola'nın doğrulanmış gıda veritabanı girdileri ve USDA FoodData Central değerlerine dayanan tartılmış gıda referansları.

Sonuçlar, genel amaçlı AI sohbet botlarının beslenme takibi için kullanımıyla ilgili temel sınırlamaları ortaya koyuyor. Bu sınırlamalar yapısal nitelikte ve geçici değil; dolayısıyla gelecekteki model güncellemeleriyle tamamen çözülecek gibi görünmüyor.

Gemini ile Kalori Sayabilir miyim?

Gemini'ye bir yemeğin kalorisini tahmin etmesini isteyebilirsiniz ve size bir cevap verecektir. Ancak asıl soru, bu cevabın gerçek diyet yönetimi için yeterince doğru ve tutarlı olup olmadığı. Testlerimize dayanarak, güvenilirlik gerektiren her kullanım durumu için cevap hayır.

Test metodolojisi: 30 yemeği, farklı karmaşıklık seviyelerini kapsayacak şekilde hazırladık veya satın aldık. Her bir yemek, kalibre edilmiş bir mutfak tartısında tartıldı ve referans kalori değerleri USDA FoodData Central besin verileri kullanılarak hesaplandı. Daha sonra, her yemeği Gemini'ye (Google'ın AI asistanı) doğal bir dil ile, gerçek bir kullanıcının yapacağı gibi tanımladık ve kalori tahminini kaydettik. Aynı testi ChatGPT (GPT-4o) ile de gerçekleştirdik ve her yemeği Nutrola'da fotoğraf tanıma ve veritabanı sorgulaması ile kaydettik.

Doğruluk tanımı: Bir tahmini "doğru" olarak tanımladık, eğer tartılmış referans değerinin %10'u içinde kalıyorsa. Bu, diyet değerlendirme araştırmalarında kullanılan standart bir eşik (Subar ve diğerleri, The Journal of Nutrition, 2015).

AI Sohbet Botları Kalori Sayımında Ne Kadar Doğru?

Sonuçlar, yemek kategorileri arasında tutarlılık gösterdi: genel amaçlı AI sohbet botları, kalori kontrollü diyetler için yeterince güvenilir olmayan kaba tahminler sağlıyor.

Ölçüt Gemini ChatGPT (GPT-4o) Nutrola Tartılmış Referans
Referansa %10 içinde kalan yemekler 11/30 (37%) 13/30 (43%) 25/30 (83%) 30/30 (100%)
Ortalama mutlak hata 127 kcal 108 kcal 38 kcal 0 kcal
Ortalama yüzde hata 22.4% 18.6% 6.1% 0%
En büyük tek aşırı tahmin +340 kcal (makarna yemeği) +285 kcal (sote) +95 kcal (restoran yemeği) N/A
En büyük tek düşük tahmin -290 kcal (soslu salata) -315 kcal (granola kasesi) -72 kcal (ev yapımı çorba) N/A
Tekrar eden sorgularda tutarlılık Hayır (50-200 kcal değişkenlik) Hayır (30-150 kcal değişkenlik) Evet (veritabanı kilitli) N/A

Ana bulgu: Yemek başına ortalama mutlak hata 108 ile 127 kalori arasında değişiyor ve bu, günde üç yemek üzerinden 324 ile 381 kalori toplam hata anlamına geliyor. 500 kalori açığı hedefleyen birisi için bu hata düzeyi, hedefledikleri açığın %65 ile %76'sını ortadan kaldırabilir ve ilerlemeyi durdurabilir.

AI Sohbet Botları Neden Kalori Sayımında Hata Yapıyor?

Gözlemlediğimiz hatalar rastgele değildi. Beslenme tahmini için büyük dil modellerinin yapısal sınırlamalarını ortaya koyan öngörülebilir kalıplar izlediler.

Sorun 1: Doğrulanmış veritabanının olmaması. Gemini ve ChatGPT, kalori tahminleri için gıdaları yapılandırılmış bir beslenme veritabanında sorgulamıyor. Yanıtlarını, doğru USDA verileri, kullanıcı tarafından üretilen içerikler, yemek blogu tahminleri ve pazarlama materyalleri gibi eğitim verilerindeki kalıplara dayanarak oluşturuyorlar. Tek bir gıda maddesinin bu kaynaklar arasında çok farklı kalori değerleri olabilir ve model, hangi kaynağın doğru olduğunu belirleyecek bir mekanizmaya sahip değil.

Nutrola ve diğer özel beslenme uygulamaları, doğrulanmış gıda veritabanları kullanıyor. Nutrola'nın veritabanı, USDA FoodData Central, üretici besin etiketleri ve bağımsız laboratuvar analizleri ile çapraz referans yapılmış 1.8 milyondan fazla girdi içeriyor. "Tavuk göğsü, ızgara, 150g" kaydını yaptığınızda, dönen değer doğrulanmış bir veri noktasıdır; internette tavuk hakkında söylenmiş her şeyin istatistiksel ortalaması değildir.

Sorun 2: Porsiyon boyutu ile ilgili belirsizlik. Bir AI sohbet botuna "bir kâse makarna" yediğinizi söylediğinizde, "kâse"nin ne anlama geldiğini tahmin etmek zorundadır. Bu, 200 gram pişirilmiş makarna mı yoksa 400 gram mı? Fark 250 kalori veya daha fazlasıdır. AI sohbet botları, kültürel olarak ortalama porsiyon varsayımlarına dayanır ve bu, sizin gerçek porsiyonunuzla uyuşmayabilir.

Testlerimizde, porsiyon boyutu yanlış hesaplaması en büyük hata kaynağıydı. Gemini, granola kasesini 210 kalori düşük tahmin etti çünkü tüketilen miktardan daha küçük bir porsiyon varsaymıştı. ChatGPT, ev yapımı bir yemek için restoran boyutlarında porsiyon varsayarak bir sote yemeğini 285 kalori fazla tahmin etti.

Nutrola, bu durumu çeşitli mekanizmalarla ele alıyor: barkod tarama, doğrudan üretici listelenen porsiyon boyutlarına bağlantı sağlıyor; AI fotoğraf tanıma, görüntüden porsiyon hacmini tahmin ediyor; kullanıcılar, maksimum doğruluk için mutfak tartısı kullanarak gram cinsinden porsiyonları ayarlayabiliyor.

Sorun 3: Oturumlar arasında hafıza yok. Bu, sürekli kalori takibi için belki de en temel sınırlamadır. AI sohbet botları, ne yediğinize dair sürekli bir kayıt tutmaz. Her konuşma sıfırdan başlar. Günlük toplam yok, haftalık trend yok, sürekli makro besin dağılımı yok.

Etkili kalori takibi, birikimli verilere ihtiyaç duyar. Sadece öğle yemeğinizdeki kalorileri değil, günlük toplamınızı, haftalık ortalamanızı, makro besin dağılımınızı ve zaman içindeki kilo trendinizi bilmeniz gerekir. Bir sohbet botu, kesintisiz bir süreklilik olmadan izole nokta tahminleri sağlar.

Sorun 4: Aynı sorgular için tutarsız tahminler. Hem Gemini'ye hem de ChatGPT'ye aynı yemek tanımının kalorisini üç kez farklı günlerde tahmin ettirdik. Sonuçlar, sorgular arasında 50 ile 200 kalori değişiklik gösterdi. "Izgara tavuklu orta boy bir Sezar salatası" ifadesi, Gemini'den üç ayrı konuşma boyunca 380, 450 ve 520 kalori tahmini aldı. Bu tutarsızlık, dil modellerinin yanıtları nasıl ürettiğine özgüdür. Onlar olasılıksal metin üreticileridir, veritabanı sorgulama sistemleri değil.

Sorun 5: Yanlış besin verileri. 30 yemek tahmininin 4'ünde, ChatGPT belirli bir marka protein barının 22g protein ve 210 kalori içerdiğini belirtti, oysa gerçek etiket 20g protein ve 190 kalori gösteriyordu. Sayılar, makul görünecek kadar yakın ama zamanla önemli olacak kadar yanlıştı. AI araştırmalarında "halüsinasyon" olarak bilinen bu fenomen, beslenme alanında özellikle tehlikelidir çünkü hatalar otoriter görünür.

ChatGPT Kalori Sayımında Ne Kadar Doğru?

ChatGPT, testlerimizde Gemini'den biraz daha iyi performans gösterdi; tahminlerin %43'ü referans değerinin %10'u içinde kalırken, Gemini için bu oran %37'ydi. Ancak bu fark pratikte anlamlı değil. Her iki sohbet botu da güvenilir diyet yönetimi için gereken doğruluk eşiğinin çok altında kalıyor.

Diyet değerlendirme araçları için akademik standart, Subar ve diğerleri gibi araştırmacılar tarafından tanımlandığı üzere, bireysel düzeyde diyet izleme için geçerli sayılabilmesi için aracın ortalama %10'dan daha az hata göstermesi gerektiğini belirtiyor. Her iki sohbet botu da bu eşiği geniş bir marjla aşıyor.

ChatGPT'nin Gemini'ye göre avantajı, muhtemelen eğitim verilerinin bileşimi nedeniyle, yaygın Amerikan gıdaları için biraz daha iyi porsiyon boyutu varsayımlarından kaynaklanıyordu. Uluslararası gıdalar, bölgesel yemekler ve ev yapımı yemekler için her iki modelin doğruluğu önemli ölçüde düştü.

AI Sohbet Botu ile Beslenme Uygulaması Arasındaki Farklar: Tam Karşılaştırma

Ham doğruluğun ötesinde, bir sohbet botu ile özel bir beslenme uygulaması arasındaki işlevsel farklılıklar, gerçek dünya kullanılabilirliğini etkileyen birçok boyutu kapsar.

Özellik Gemini / ChatGPT Nutrola
Kalori doğruluğu (tartılmış referansa göre) %18-22 ortalama hata %6 ortalama hata
Doğrulanmış gıda veritabanı Hayır Evet, 1.8M+ girdi
Barkod tarama Hayır Evet
Fotoğraf tabanlı gıda tanıma Sınırlı (yükleme gerektirir) Yerleşik AI tanıma
Sesle kayıt Dolaylı (sesten metne) Yerel sesli gıda kaydı
Sürekli günlük kayıt Hayır Evet, otomatik
Günlük/haftalık toplamlar Hayır (manuel toplama gerek) Evet, gerçek zamanlı
Makro besin dağılımı Sorguya göre tahmin Her gıda için, günlük, haftalık takip
Mikro besin takibi Tutarsız 100+ besin
Kilo trend takibi Hayır Evet, grafik ile
Apple Watch entegrasyonu Hayır Evet
Uyarlanabilir kalori hedefleri Hayır Evet, trendlerinize göre ayarlanır
Tutarlı tahminler Hayır (sorguya göre değişir) Evet (veritabanı kilitli)
Çevrimdışı erişim Hayır Evet
Maliyet Ücretsiz (gelişmiş için abonelik) Aylık 2.50 €'dan itibaren
Reklamlar Platforma göre değişir Sıfır reklam

AI Sohbet Botları Beslenmede Ne İşe Yarar?

Kalori takibi için sınırlamalarına rağmen, genel amaçlı AI sohbet botlarının tanınması gereken geçerli beslenme kullanım alanları vardır.

Genel beslenme eğitimi. Gemini veya ChatGPT'ye doymuş ve doymamış yağ arasındaki farkı açıklamasını veya protein sentezinin nasıl çalıştığını sormak genellikle doğru ve iyi organize edilmiş yanıtlar üretir. Bilimsel konsensüsün olduğu kavramsal sorular için AI sohbet botları iyi performans gösterir.

Yemek fikirleri oluşturma. Sohbet botları, "500 kalorinin altında tavuk ve brokoli ile yüksek proteinli yemekler" gibi kısıtlamalara dayalı tarif fikirleri üretmede başarılıdır. Belirli kalori sayısı kesin olmayabilir, ancak yemek kavramları yararlı başlangıç noktalarıdır.

Diyet desenleri karşılaştırma. Bir sohbet botuna Akdeniz, ketojenik ve bitki bazlı diyetleri karşılaştırmasını sorduğunuzda, her yaklaşım için kanıtların makul özetlerini sunar.

Sohbet botlarının başarısız olduğu alan, günlük kalori ve besin takibinin niceliksel, sürekli ve doğruluk gerektiren görevleridir. Bu, bir veritabanı ve kayıt sorunudur, dil üretim sorunu değil.

Neden Özel Beslenme Uygulamaları Genel AI Sohbet Botlarından Daha İyi Performans Gösteriyor?

Temel neden mimari farklılıklardır. Bir beslenme takip uygulaması, yapılandırılmış bir veritabanı, sürekli bir kullanıcı profili ve birikim mantığı etrafında inşa edilmiştir. Bir AI sohbet botu ise, bir dil modelinden sonraki kelime tahmini etrafında inşa edilmiştir. Bu, temelde farklı görevler için optimize edilmiş temelde farklı araçlardır.

Süreklilik. Nutrola, kaydettiğiniz her gıda, günlük ve haftalık toplamlarınızı, makro besin trendlerinizi ve vücut ağırlığı geçmişinizi tam olarak kaydeder. Bu uzun dönem verileri, kalori takibini etkili kılar. Tek bir nokta kalori tahmini, ne kadar doğru olursa olsun, günlük toplamınız ve haftalık deseninizin bağlamı olmadan işe yaramaz.

Doğrulanmış veriler. Nutrola'daki "Chobani Yunan Yoğurdu, Düz, 150g" için bir veritabanı girişi, üretici besin etiketinden alınmış ve USDA standartlarına göre doğrulanmıştır. Bir sohbet botu aynı öğeyi tahmin ettiğinde, güvenilirliği değişken olan binlerce web kaynağından bilgileri ortalamasını yapar ve makul ama doğrulanmamış bir sayı üretir.

Giyilebilir entegrasyon. Apple Watch verileri doğrudan Nutrola'ya aktarılır ve doğru aktivite kalori tahminleri, gıda kaydı ile birleştirilerek net enerji dengesi hesaplanır. Hiçbir sohbet botu, gerçek günlük hareketinize dayalı kalori önerilerini ayarlamak için giyilebilir verilerinize erişemez.

Hız ve kullanım kolaylığı. Tabağınızın fotoğrafını çekmek, barkodu taramak veya yemeğinizi sesli olarak kaydetmek 30 saniyeden daha kısa sürer. Bir sohbet botuna ayrıntılı bir yemek tanımı yazmak, yanıtı beklemek ve ardından tahmini bir yere manuel olarak kaydetmek çok daha uzun sürer ve daha az doğru bir sonuç üretir.

AI Sohbet Botları Beslenme Uygulamalarını Yerine Geçirebilir mi?

Bu, temel mimari ile ilgili bir sorudur, sadece model yeteneği ile değil. Mükemmel kalori tahmin doğruluğu sağlansa bile (ki mevcut modeller bunun çok uzağındadır), AI sohbet botları yine de sürekli kayıt, birikimli takip, giyilebilir entegrasyon ve yapılandırılmış veritabanı doğrulaması gibi beslenme takibinin gerektirdiği özelliklerden yoksun olacaktır.

Gelecekteki AI sistemleri teorik olarak bu özellikleri içerebilir. Ancak bu noktada, esasen bir konuşma arayüzüne sahip beslenme uygulamaları haline gelirler, genel amaçlı sohbet botları değil. Kalori takibini etkili kılan özellikler, doğrulanmış bir veritabanı, sürekli kullanıcı kayıtları, cihaz entegrasyonları ve uyarlanabilir algoritmalar mühendislik sistemleridir, dil yetenekleri değil.

En olası gelecek, "sohbet botları beslenme uygulamalarını yerine geçirir" değil, "beslenme uygulamaları konuşma AI'sını entegre eder" olacaktır. Bu zaten oluyor. Nutrola'nın AI destekli fotoğraf tanıma ve sesli kayıt özellikleri, yapılandırılmış bir doğrulanmış beslenme veritabanının güvenilirliği ile konuşma etkileşiminin kolaylığını bir araya getiriyor. AI ile doğal bir etkileşim elde ediyorsunuz, aynı zamanda bir amaç için tasarlanmış bir takip sisteminin doğruluğu ve sürekliliğini de sağlıyorsunuz.

AI'ye Kalori Takibi Yapmasını Sorduğunuzda Ne Olur?

Pratik farkı göstermek için, her yaklaşımın tipik bir kalori takibi gününün nasıl göründüğüne bakalım.

Gemini veya ChatGPT Kullanarak: Sohbet botuna kahvaltınızın kalorisini tahmin etmesini söylüyorsunuz. Size bir sayı veriyor. Bunu bir yere yazıyorsunuz veya aklınızda tutmaya çalışıyorsunuz. Öğle yemeğinde yeni bir konuşma başlatıyorsunuz (sohbet botu kahvaltıyı hatırlamıyor) ve başka bir tahmin alıyorsunuz. İki sayıyı zihninizde topluyorsunuz. Akşam yemeğinde, 200 ile 400 kalori arasında bir hata ile yaklaşık bir toplamınız var ve makro besin dağılımı, sürekli bir kayıt ve haftalık bir trend yok.

Nutrola Kullanarak: Kahvaltınızın fotoğrafını çekiyorsunuz. AI, gıdaları tanıyor, doğrulanmış veritabanı girdileri ile eşleştiriyor ve otomatik olarak kaydediyor. Günlük toplamınız gerçek zamanlı olarak güncelleniyor. Öğle yemeğinde, sandviçinizin ambalajındaki barkodu tarıyorsunuz ve tam üretici besin verileri kaydınıza ekleniyor. Akşam yemeğinde, doğru bir toplam, makro besin dağılımı ve haftalık ve aylık trendlerinize katkıda bulunan bir yemek geçmişiniz var. Kalori hedefiniz, Apple Watch'tan senkronize edilen gerçek kilo trend verilerine dayalı olarak ayarlanıyor.

Fark, ince değil. Bu, bir tahmin ile bir sistem arasındaki farktır.

Anahtar Çıkarımlar

Gemini ve ChatGPT gibi genel amaçlı AI sohbet botları birçok görev için etkileyici araçlardır, ancak kalori takibi bunlardan biri değildir. 30 yemek testimiz, yemek başına 108 ile 127 kalori arasında ortalama hatalar, tekrar eden sorgular arasında tutarsız sonuçlar, sürekli kayıt yeteneği eksikliği ve gıda veritabanları veya giyilebilir cihazlarla entegrasyon eksikliği buldu. Bu sınırlamalar yapısaldır, tesadüfi değildir. Bir dil modeli ile bir beslenme takip sistemi arasındaki temel farklardan kaynaklanmaktadır.

Beslenmenizi yönetmekte ciddi olan herkes için, doğrulanmış bir veritabanı, sürekli kayıt ve uyarlanabilir hedefler içeren özel bir uygulama hala gereklidir. Nutrola, AI destekli kolaylığı (fotoğraf tanıma, ses kaydı, barkod tarama) yapılandırılmış bir beslenme platformunun doğruluğu ve sürekliliği ile birleştiriyor; tüm bunlar aylık 2.50 €'dan ve sıfır reklam ile. Kalori takibinde soru, AI'nin dahil olup olmadığı değil, iş için doğru mimari ile desteklenip desteklenmediğidir.

Beslenme takibinizi dönüştürmeye hazır mısınız?

Nutrola ile sağlık yolculuklarını dönüştürmüş binlerce kişiye katılın!