Voiko Gemini AI Laskea Kaloreita? Testasimme Sen Erityisen Sovelluksen Vastaavana
Kysyimme Geminiltä ja ChatGPT:ltä kaloriarvioita 30 aterialle ja vertasimme tuloksia Nutrolaan sekä punnittuihin ruokaviittauksiin. Tarkkuuserot olivat suuremmat kuin odotimme.
Kun AI-chatbotit tulevat osaksi päivittäistä elämää, herää luonnollinen kysymys: voiko Geminiltä tai ChatGPT:ltä kysyä kalorien seurantaa sen sijaan, että käyttäisi erityistä ravitsemussovellusta? Testasimme tätä suoraan. Kaksi viikkoa kysyimme Google Geminiltä ja OpenAI ChatGPT:ltä kalori- ja makroravinnearvioita 30 eri ateriasta, jotka vaihtelivat yksinkertaisista yksikomponenttisista ruoista monimutkaisiin ravintolaruokiin. Vertasimme niiden arvioita kahteen vertailukohtaan: Nutrolan vahvistettuihin ruokadatakirjauksiin ja punnittuihin ruokaviittauksiin, jotka laskettiin käyttäen USDA FoodData Central -arvoja.
Tulokset paljastavat perustavanlaatuisia rajoituksia yleiskäyttöisten AI-chatbottien käytössä ravitsemusseurannassa. Nämä rajoitukset ovat rakenteellisia eivätkä tilapäisiä, mikä tarkoittaa, että niitä ei todennäköisesti pystytä täysin ratkaisemaan tulevissa mallipäivityksissä.
Voinko Käyttää Geminiä Kalorien Laskemiseen?
Voit pyytää Geminiltä arvioita aterian kaloreista, ja se antaa vastauksen. Kysymys kuuluu, onko tämä vastaus tarpeeksi tarkka ja johdonmukainen todellisen ruokavalion hallinnan tueksi. Testimme perusteella vastaus on ei, jos luotettavuutta vaaditaan.
Testimenetelmä: Valmistimme tai ostimme 30 ateriaa, jotka kattoivat erilaisia monimutkaisuuksia. Jokainen ateria punnittiin kalibroidulla keittiövaakalla, ja viitekaloriarvot laskettiin käyttäen USDA FoodData Centralin ravitsemustietoja. Kuvasimme sitten jokaisen aterian Geminille (Googlen AI-avustaja) luonnollisella kielellä, kuten oikea käyttäjä tekisi, ja kirjasimme sen kaloriarvion. Suoritimme saman testin myös ChatGPT:llä (GPT-4o) ja kirjasimme jokaisen aterian Nutrolaan valokuvantunnistuksen ja tietokannan haun avulla.
Tarkkuuden määritelmä: Määrittelimme arvion "tarkaksi", jos se oli 10 prosentin sisällä punnitusta viitearvosta, mikä on standardi kynnys ravitsemustutkimuksessa (Subar et al., The Journal of Nutrition, 2015).
Kuinka Tarkkoja AI-chatbotit Ovat Kalorien Laskennassa?
Tulokset olivat johdonmukaisia aterialuokittain: yleiskäyttöiset AI-chatbotit antavat karkean arvion, joka ei ole tarpeeksi luotettava kaloreita rajoittaville ruokavalioille.
| Mittari | Gemini | ChatGPT (GPT-4o) | Nutrola | Punnittu viite |
|---|---|---|---|---|
| Ateriat, jotka ovat 10% viitearvosta | 11/30 (37%) | 13/30 (43%) | 25/30 (83%) | 30/30 (100%) |
| Keskimääräinen absoluuttinen virhe | 127 kcal | 108 kcal | 38 kcal | 0 kcal |
| Keskimääräinen prosentuaalinen virhe | 22.4% | 18.6% | 6.1% | 0% |
| Suurin yksittäinen yliarviointi | +340 kcal (pastaruoka) | +285 kcal (wokki) | +95 kcal (ravintolaruoka) | N/A |
| Suurin yksittäinen aliarviointi | -290 kcal (salaatti kastikkeella) | -315 kcal (granolakulho) | -72 kcal (kotitekoinen keitto) | N/A |
| Johdonmukaisuus toistuvissa kyselyissä | Ei (vaihteli 50-200 kcal) | Ei (vaihteli 30-150 kcal) | Kyllä (tietokanta lukittu) | N/A |
Keskeinen havainto: Keskimääräinen absoluuttinen virhe 108–127 kaloria per ateria tarkoittaa 324–381 kalorin kumulatiivista virhettä kolmen aterian osalta päivässä. Jos joku tavoittelee 500 kalorin vajeen saavuttamista painonpudotuksessa, tämä virheellisyys voi eliminoida 65–76 prosenttia heidän tarkoitetusta vajeestaan, mikä käytännössä pysäyttää edistymisen.
Miksi AI-chatbotit Saavat Kalorilaskennat Väärin?
Havaitsemamme virheet eivät olleet satunnaisia. Ne noudattivat ennakoitavia kaavoja, jotka paljastavat rakenteellisia rajoituksia suurten kielimallien käytössä ravitsemusarvioinnissa.
Ongelma 1: Ei vahvistettua tietokantaa. Gemini ja ChatGPT eivät tarkista ruokia rakenteellisesta ravitsemustietokannasta, kun pyydät niitä kaloriarvioita. Ne tuottavat vastauksia koulutusdatansa kaavojen perusteella, johon sisältyy sekoitus tarkkaa USDA-dataa, käyttäjien tuottamaa sisältöä, ruokablogien arvioita ja markkinointimateriaaleja. Yhdellä ruokatuotteella voi olla valtavasti erilaisia kaloriarvoja eri lähteissä, eikä mallilla ole mekanismia tunnistaa, mikä lähde on oikea.
Nutrola ja muut erityiset ravitsemussovellukset käyttävät vahvistettuja ruokadatakirjoja. Nutrolan tietokanta sisältää yli 1.8 miljoonaa merkintää, jotka on ristiviitattu USDA FoodData Centralin, valmistajien ravintotietojen ja itsenäisten laboratorioanalyysien kanssa. Kun kirjaat "grillattu kanafilee, 150g", palautettu arvo on vahvistettu tietopiste, ei tilastollinen keskiarvo kaikesta, mitä internet on koskaan sanonut kanasta.
Ongelma 2: Ei annoskoko perustaa. Kun kerrot AI-chatbotille, että söit "kulhollisen pastaa", sen on arvattava, mitä "kulho" tarkoittaa. Onko se 200 grammaa kypsää pastaa vai 400 grammaa? Ero on 250 kaloria tai enemmän. AI-chatbotit oletavat kulttuurisesti keskimääräisiä annoskokoja, jotka eivät välttämättä vastaa todellista annostasi.
Testissämme annoskokoerot olivat suurin virheiden lähde. Gemini aliarvioi granolakulhon 210 kaloria, koska se oletti pienemmän annoksen kuin mitä todellisuudessa kulutettiin. ChatGPT yliarvioi wokin 285 kaloria, koska se oletti ravintolakokoisia annoksia, vaikka ateria oli kotitekoinen.
Nutrola ratkaisee tämän useilla mekanismeilla: viivakoodin skannaus linkittää suoraan valmistajan ilmoittamiin annoskokoihin, AI-valokuvantunnistus arvioi annoksen tilavuuden kuvasta, ja käyttäjät voivat säätää annoksia grammoina keittiövaakaa käyttäen maksimaalisen tarkkuuden saavuttamiseksi.
Ongelma 3: Ei muistia istuntojen välillä. Tämä on ehkä perustavin rajoitus jatkuvassa kalorien seurannassa. AI-chatbotit eivät pidä yllä pysyvää lokia siitä, mitä olet syönyt. Jokainen keskustelu alkaa nollasta. Ei ole päivittäistä yhteenvetoa, ei viikoittaista trendiä, ei jatkuvaa makroravinnejakoa.
Tehokas kalorien seuranta vaatii kumulatiivista dataa. Sinun on tiedettävä, ei vain lounaan kalorit, vaan myös päivittäinen kokonaiskalorimäärä, viikoittainen keskiarvo, makroravinnejako ja painotrendi ajan myötä. Chatbot tarjoaa eristettyjä arvioita ilman jatkuvuutta.
Ongelma 4: Epäjohdonmukaiset arviot identtisille kyselyille. Kysyimme sekä Geminiltä että ChatGPT:ltä kaloriarvioita samasta aterian kuvauksesta kolme kertaa eri päivinä. Tulokset vaihtelivat 50–200 kalorin välillä kyselyissä. "Keskikokoinen Caesar-salaatti grillatulla kanalla" sai Geminiltä arvioita 380, 450 ja 520 kaloria kolmessa eri keskustelussa. Tämä epäjohdonmukaisuus on sisäänrakennettu siihen, miten kielimallit tuottavat vastauksia. Ne ovat todennäköisiä tekstigeneraattoreita, eivät tietokannan hakujärjestelmiä.
Ongelma 5: Kuviteltu ravitsemustieto. 4:ssä 30 aterian arviossa ChatGPT antoi erityisen kuulostavia, mutta keksittyjä ravitsemustietoja. Esimerkiksi se väitti, että tietyssä brändin proteiinipatukassa oli 22g proteiinia ja 210 kaloria, kun todellinen etiketti ilmoittaa 20g proteiinia ja 190 kaloria. Numerot olivat tarpeeksi lähellä vaikuttaakseen uskottavilta, mutta tarpeeksi vääriä, jotta niillä on merkitystä ajan myötä. Tätä ilmiötä kutsutaan AI-tutkimuksessa hallusinaatioksi, ja se on erityisen vaarallista ravitsemuksessa, koska virheet näyttävät auktoriteettisilta.
Onko ChatGPT Tarkka Kalorien Laskennassa?
ChatGPT suoriutui hieman paremmin kuin Gemini testissämme, sillä 43 prosenttia arvioista oli 10 prosentin sisällä viitearvosta verrattuna 37 prosenttiin Geminiltä. Kuitenkin tämä ero ei ole käytännöllisesti merkittävä. Molemmat chatbotit jäävät kauas tarkkuuskynnyksen alapuolelle, joka on tarpeen luotettavalle ruokavalion hallinnalle.
Akateeminen standardi ravitsemustyökaluille, kuten Subar et al. ja Thompson et al. Kansallisesta syöpäinstituutista määrittelevät, että työkalun on osoitettava alle 10 prosentin keskimääräinen virhe, jotta sitä voidaan pitää pätevänä yksilötason ravitsemusseurannassa. Molemmat chatbotit ylittävät tämän kynnyksen laajalla marginaalilla.
ChatGPT:n etu Geministä näyttäisi johtuvan hieman paremmista annoskoko-oletuksista yleisille amerikkalaisille ruoille, mikä todennäköisesti heijastaa sen koulutusdatan koostumusta. Kansainvälisten ruokien, alueellisten ruokien ja kotitekoisten aterioiden tarkkuus laski merkittävästi molemmilla malleilla.
AI-chatbot vs Ravitsemussovellus Ruokavalion Seurannassa: Täydellinen Vertailu
Raakan tarkkuuden lisäksi chatbotin ja erityisen ravitsemussovelluksen toiminnalliset erot ulottuvat useisiin ulottuvuuksiin, jotka vaikuttavat käytettävyyteen todellisessa maailmassa.
| Ominaisuus | Gemini / ChatGPT | Nutrola |
|---|---|---|
| Kalorien tarkkuus (vs punnittu viite) | 18-22% keskimääräinen virhe | 6% keskimääräinen virhe |
| Vahvistettu ruokadatakanta | Ei | Kyllä, 1.8M+ merkintää |
| Viivakoodin skannaus | Ei | Kyllä |
| Valokuvapohjainen ruokantunnistus | Rajoitettu (vaatii latauksen) | Sisäänrakennettu AI-tunnistus |
| Äänilokitus | Epäsuora (äänestä tekstiksi) | Natiivinen ääniruoan lokitus |
| Pysyvä päivittäinen loki | Ei | Kyllä, automaattinen |
| Juoksevat päivittäiset/viikoittaiset yhteenvetot | Ei (on manuaalisesti laskettava) | Kyllä, reaaliaikaisesti |
| Makroravinnejako | Arvioitu kyselyittäin | Seurattu per ruoka, päivittäin, viikoittain |
| Mikroravinne seuranta | Epäjohdonmukainen | 100+ ravintoainetta |
| Painotrendi seuranta | Ei | Kyllä, graafisesti |
| Apple Watch -integraatio | Ei | Kyllä |
| Mukautuvat kaloritavoitteet | Ei | Kyllä, sopeutuu trendeihisi |
| Johdonmukaiset arviot | Ei (vaihtelee kyselyittäin) | Kyllä (tietokanta lukittu) |
| Offline-käyttö | Ei | Kyllä |
| Hinta | Ilmainen (edistyneille tilaus) | Alkaen €2.50/kuukausi |
| Mainokset | Vaihtelee alustan mukaan | Ei mainoksia |
Mihin AI-chatbotit Ovat Hyviä Ravinnossa?
Huolimatta rajoituksistaan kalorien seurannassa, yleiskäyttöisillä AI-chatboteilla on kuitenkin oikeita ravitsemuskäyttötarkoituksia, jotka tulisi tunnustaa.
Yleinen ravitsemuskoulutus. Kysyessään Geminiltä tai ChatGPT:ltä, mikä on ero tyydyttyneiden ja tyydyttymättömien rasvojen välillä tai miten proteiinisynteesi toimii, saadaan yleensä tarkkoja ja hyvin järjestettyjä vastauksia. Käsitteellisiin kysymyksiin, joissa on vakiintunut tieteellinen konsensus, AI-chatbotit suoriutuvat hyvin.
Ateriaideageneraattori. Chatbotit ovat erinomaisia reseptiehdotusten luomisessa rajoitteiden, kuten "korkean proteiinin ateriat alle 500 kalorin, joissa on kanaa ja parsakaalia", perusteella. Tarkka kalorien määrä ei välttämättä ole täsmällinen, mutta ateriaideat ovat hyödyllisiä lähtökohtia.
Ravitsemusmallien vertailu. Kysyessään chatbotilta Välimeren, ketogeenisen ja kasvipohjaisen ruokavalion vertailua, saadaan kohtuullisia yhteenvetoja kunkin lähestymistavan todisteista.
Missä chatbotit epäonnistuvat, on kvantitatiivisessa, jatkuvassa ja tarkkuudelle riippuvaisessa tehtävässä päivittäisten kalorien ja ravinteiden seurannassa. Tämä on tietokanta- ja lokitusongelma, ei kielimallin ongelma.
Miksi Erityiset Ravitsemussovellukset Ylittävät Yleiset AI-chatbotit
Ydin syy on arkkitehtuuri. Ravitsemusseurantasovellus on rakennettu rakenteellisen tietokannan, pysyvän käyttäjäprofiilin ja kumulatiivisen logiikan ympärille. AI-chatbot on rakennettu seuraavan tokenin ennustamisen ympärille kielimallista. Nämä ovat perustavanlaatuisesti erilaisia työkaluja, jotka on optimoitu perustavanlaatuisesti erilaisiin tehtäviin.
Jatkuvuus. Nutrola ylläpitää täydellistä lokia kaikista ruoista, jotka kirjaat, päivittäisistä ja viikoittaisista kokonaisista, makroravinne-trendeistä ja painohistoriasta. Tämä pitkittäistieto tekee kalorien seurannasta tehokasta. Yksittäinen kaloriarvio, ei matter kuinka tarkka, on hyödyttömiä ilman päivittäisen kokonaisuuden ja viikoittaisen kaavan kontekstia.
Vahvistettu data. Tietokannan merkintä "Chobani Kreikkalainen Jogurtti, Luonnollinen, 150g" Nutrolassa on peräisin valmistajan ravintotiedoista ja vahvistettu USDA-standardeja vastaan. Kun chatbot arvioi samaa tuotetta, se keskiarvoittaa tietoja tuhansista verkkolähteistä, joiden luotettavuus vaihtelee, tuottaen uskottavan mutta vahvistamattoman numeron.
Pukeutuvan integraatio. Apple Watchin tiedot syötetään suoraan Nutrolaan, tarjoten tarkkoja aktiivisuuskaluroiden arvioita, jotka yhdistetään ruokakirjauksiin nettienergiataseen laskemiseksi. Mikään chatbot ei voi käyttää pukeutuvia tietojasi säätääkseen kalori-suosituksia todellisten päivittäisten liikkeidesi perusteella.
Nopeus ja mukavuus. Ruokasi valokuvan ottaminen, viivakoodin skannaaminen tai aterian puhuminen vie alle 30 sekuntia. Yksityiskohtaisen aterian kuvauksen kirjoittaminen chatbotille, odottaminen vastausta ja sitten arvion manuaalinen kirjaaminen johonkin vie huomattavasti enemmän aikaa ja tuottaa vähemmän tarkkoja tuloksia.
Voisivatko AI-chatbotit Parantua Riittävästi Korvaamaan Ravitsemussovelluksia?
Tämä on kysymys perustavanlaatuisesta arkkitehtuurista, ei vain mallin kyvykkyydestä. Jopa täydellisen kaloriarvioinnin tarkkuuden (mikä nykyisillä malleilla on kaukana saavutettavissa) kanssa AI-chatbotit puuttuvat silti pysyvään lokitukseen, kumulatiiviseen seurantaan, pukeutuvan integraatioon ja rakenteelliseen tietokannan vahvistamiseen, joita ravitsemusseuranta vaatii.
Tulevaisuuden AI-järjestelmät voisivat teoriassa sisällyttää nämä ominaisuudet. Mutta tuolloin ne olisivat käytännössä ravitsemussovelluksia, joilla on keskusteleva käyttöliittymä, eivät yleiskäyttöisiä chatboteja. Ominaisuudet, jotka tekevät kalorien seurannasta toimivaa, vahvistettu tietokanta, pysyvät käyttäjälokit, laiteintegraatiot, mukautuvat algoritmit, ovat insinöörijärjestelmiä, eivät kielikykyjä.
Todennäköisin tulevaisuus ei ole "chatbotit korvaavat ravitsemussovellukset", vaan "ravitsemussovellukset sisällyttävät keskustelevaa AI:ta." Tämä on jo tapahtumassa. Nutrolan AI-teknologian avulla valokuvantunnistus ja äänilokitus tuovat keskustelun mukavuuden vahvistetun ravitsemustietokannan rakenteelliseen luotettavuuteen. Saat luonnollisen vuorovaikutuksen AI:n kanssa tarkkuuden ja jatkuvuuden ohella, jota tarkoituksellisesti rakennettu seurantasysteemi tarjoaa.
Mitä Tapahtuu, Kun Kysyt AI:lta Kalorien Seurantaa?
Kuvastamaan käytännön eroa, tässä on, miltä tyypillinen kalorien seuranta näyttää kummassakin lähestymistavassa.
Käyttäen Geminiä tai ChatGPT:tä: Kysyt chatbotilta arvioita aamiaisestasi. Se antaa sinulle numeron. Kirjoitat sen ylös johonkin tai yrität muistaa sen. Lounaalla aloitat uuden keskustelun (chatbot ei muista aamiaista) ja saat toisen arvion. Mielessäsi lisäät kaksi numeroa yhteen. Illalla sinulla on karkea juokseva kokonaismäärä, joka voi olla 200–400 kaloria väärin, eikä sinulla ole makroravinnejakoa, pysyvää lokia tai viikoittaista trendiä.
Käyttäen Nutrola: Otat valokuvan aamiaisestasi. AI tunnistaa ruoat, yhdistää ne vahvistettuihin tietokantamerkintöihin ja kirjaa ne automaattisesti. Päivittäinen kokonaismäärä päivittyy reaaliaikaisesti. Lounaalla skannaat viivakoodin voileipäpaketistasi, ja tarkat valmistajan ravintotiedot lisätään lokiisi. Illalla sinulla on tarkka juokseva kokonaismäärä, makroravinnejako ja ateriahistoria, joka syöttää viikoittaisiin ja kuukausittaisiin trendeihisi. Kaloritavoitteesi mukautuu todellisten painotrenditietojesi perusteella, jotka on synkronoitu Apple Watchistasi.
Ero ei ole hienovarainen. Se on ero arvauksen ja järjestelmän välillä.
Keskeiset Huomiot
Yleiskäyttöiset AI-chatbotit, kuten Gemini ja ChatGPT, ovat vaikuttavia työkaluja moniin tehtäviin, mutta kalorien seuranta ei ole yksi niistä. 30 aterian testimme paljasti keskimääräiset virheet 108–127 kaloria per ateria, epäjohdonmukaiset tulokset toistuvissa kyselyissä, ei pysyvää lokituskykyä ja ei integraatiota ruokadatakantojen tai pukeutuvien laitteiden kanssa. Nämä rajoitukset ovat rakenteellisia, eivät satunnaisia. Ne johtuvat perustavanlaatuisesta erosta kielimallin ja ravitsemusseurantasysteemin välillä.
Kaikille, jotka ottavat ravitsemuksensa hallinnan vakavasti, erityinen sovellus vahvistetulla tietokannalla, pysyvällä lokituksella ja mukautuvilla tavoitteilla on edelleen välttämätön. Nutrola yhdistää AI-teknologian mukavuuden (valokuvantunnistus, äänilokitus, viivakoodin skannaus) tarkkuuden ja jatkuvuuden rakenteelliseen ravitsemusalustaan, kaikki 2.50 eurolla kuukaudessa ilman mainoksia. Kun kyse on kalorien seurannasta, kysymys ei ole siitä, onko AI mukana. Kysymys on siitä, onko AI:n taustalla oikea arkkitehtuuri tehtävään.
Valmis muuttamaan ravitsemusseurantaasi?
Liity tuhansien joukkoon, jotka ovat muuttaneet terveysmatkansa Nutrola avulla!