Hoe Betrouwbaar Is Cal AI Portie Schatting? Een Audit van Gemeten Gewicht versus AI Schatting
We hebben 20 voedingsmiddelen gewogen op een keukenweegschaal, ze gefotografeerd via Cal AI en de portieschattingen van de app vergeleken met de werkelijke gewichten. Hier is hoe nauwkeurig en consistent de portieschatting van Cal AI werkelijk is.
Cal AI is een foto-gebaseerde calorie tracking app die computer vision gebruikt om voedselporties en calorieën uit foto's te schatten. De belofte van de app is dat je het wegen en meten van je voedsel helemaal kunt overslaan — maak gewoon een foto van je bord en de AI doet de rest. Dit is een aantrekkelijke propositie die het meest tijdrovende aspect van calorie tracking wegneemt. Maar het hangt af van het oplossen van een fundamenteel probleem in computer vision: het inschatten van de driedimensionale grootte en het gewicht van een object op basis van een tweedimensioneel beeld.
Betrouwbaarheid bij portieschatting betekent dat het door de AI geschatte gewicht of volume nauwkeurig overeenkomt met de daadwerkelijk gemeten hoeveelheid. Het betekent ook consistentie — het fotograferen van hetzelfde voedsel meerdere keren zou elke keer dezelfde schatting moeten opleveren. We hebben beide dimensies getest door 20 voedingsmiddelen te wegen op een gekalibreerde keukenweegschaal, ze te fotograferen via Cal AI en de resultaten te vergelijken.
Het Fundamentele Probleem: 3D Schatting uit een 2D Beeld
Voordat we de testresultaten bekijken, is het de moeite waard om te begrijpen waarom dit probleem inherent moeilijk is. Een foto reduceert drie dimensies tot twee. Informatie over diepte, hoogte en volume gaat gedeeltelijk verloren. Een berg rijst van 3 centimeter hoog ziet er op een foto identiek uit aan een berg van 2 centimeter hoog als de camerahoek het verschil samendrukt.
De AI moet de ontbrekende dimensie afleiden uit contextuele aanwijzingen: de grootte van het bord, de schaduw die door het voedsel wordt geworpen, de relatieve verhoudingen van bekende objecten in het kader en patroonherkenning tegen trainingsdata. Elk van deze inferentiestappen introduceert potentiële fouten. Een studie gepubliceerd in het International Journal of Food Sciences and Nutrition (2021) toonde aan dat zelfs opgeleide diëtisten die porties uit foto's inschatten slechts 50-70% nauwkeurigheid bereikten, wat suggereert dat visuele portieschatting inherent onnauwkeurig is, ongeacht of een mens of AI deze uitvoert.
Dit is geen kritiek op Cal AI specifiek. Het is de basisuitdaging waarmee elk foto-gebaseerd portieschatting systeem te maken heeft. De vraag is hoeveel fout deze fundamentele beperking in de praktijk produceert en of die fout klein genoeg is om de caloriegegevens nuttig te maken.
Testmethodologie: Op de Weegschaal Gemeten Gewicht versus Cal AI Schatting
We selecteerden 20 voedingsmiddelen uit zes categorieën: uniforme items (voorspelbare vorm en grootte), onregelmatige vaste stoffen (variabele vorm), opgestapeld of gebundeld voedsel, vloeistoffen, voedsel in containers en opgemaakte maaltijden met meerdere componenten. Elk voedingsmiddel werd gewogen op een gekalibreerde keukenweegschaal die tot 1 gram nauwkeurig is.
Elk voedingsmiddel werd vervolgens op een standaard 26-centimeter wit dinerbord geplaatst (tenzij anders vermeld) en gefotografeerd via Cal AI vanuit een hoek van 45 graden op ongeveer 30 centimeter afstand. We registreerden de geschatte portiegrootte en calorieën van Cal AI, en berekenden vervolgens de afwijking van de daadwerkelijk gemeten waarden.
Nauwkeurigheid van Portieschatting: Cal AI Schatting versus Werkelijk Gewicht
Volledige Betrouwbaarheid Testresultaten
| Voedsel | Werkelijk Gewicht | Cal AI Schatting | Gewicht Afwijking | Afwijking % | Werkelijke Calorieën | Cal AI Calorieën | Calorie Impact |
|---|---|---|---|---|---|---|---|
| Sneetje brood | 38 g | 40 g | +2 g | +5.3% | 95 | 100 | +5 |
| Groot ei, gekookt | 50 g | 50 g | 0 g | 0.0% | 78 | 78 | 0 |
| Eiwitreep (niet verpakt) | 60 g | 55 g | -5 g | -8.3% | 210 | 193 | -17 |
| Kipfilet, gegrild | 174 g | 140 g | -34 g | -19.5% | 287 | 231 | -56 |
| Biefstuk, gegrild | 225 g | 175 g | -50 g | -22.2% | 573 | 446 | -127 |
| Zalmfilet, gebakken | 168 g | 145 g | -23 g | -13.7% | 349 | 302 | -47 |
| Gekookte witte rijst | 210 g | 180 g | -30 g | -14.3% | 232 | 199 | -33 |
| Gekookte pasta | 240 g | 195 g | -45 g | -18.8% | 374 | 304 | -70 |
| Aardappelpuree | 200 g | 160 g | -40 g | -20.0% | 224 | 179 | -45 |
| Gemengde groene salade | 120 g | 95 g | -25 g | -20.8% | 19 | 15 | -4 |
| Sinaasappelsap in glas | 250 ml | 200 ml | -50 ml | -20.0% | 112 | 90 | -22 |
| Koffie met melk in mok | 350 ml | 250 ml | -100 ml | -28.6% | 58 | 41 | -17 |
| Soep in kom | 400 ml | 300 ml | -100 ml | -25.0% | 160 | 120 | -40 |
| Amandelen in kleine kom | 35 g | 28 g | -7 g | -20.0% | 204 | 163 | -41 |
| Trail mix in kom | 55 g | 42 g | -13 g | -23.6% | 264 | 201 | -63 |
| Yoghurt in container | 170 g | 150 g | -20 g | -11.8% | 100 | 88 | -12 |
| Appel, heel | 182 g | 170 g | -12 g | -6.6% | 95 | 89 | -6 |
| Halve avocado | 68 g | 75 g | +7 g | +10.3% | 109 | 120 | +11 |
| Pindakaas op toast | 18 g (alleen PB) | 12 g | -6 g | -33.3% | 105 | 70 | -35 |
| Kip + rijst + broccoli bord | 440 g totaal | 365 g totaal | -75 g | -17.0% | 542 | 450 | -92 |
Samenvattende Statistieken:
- Gemiddelde absolute afwijking: 16.9%
- Mediaan afwijking: 19.2%
- Onderestimatie bias: 18 van de 20 voedingsmiddelen werden onderschat
- Gemiddelde calorie impact: 37 calorieën per voedingsmiddel
- Voedingsmiddelen binnen 10% nauwkeurigheid: 5 van de 20 (25%)
- Voedingsmiddelen met >20% afwijking: 8 van de 20 (40%)
De resultaten onthullen een duidelijk en consistent patroon. Cal AI onderschatte de portiegroottes bij 18 van de 20 geteste voedingsmiddelen. De gemiddelde afwijking was 16.9%, maar dit gemiddelde verbergt de ernst voor specifieke categorieën. Onregelmatige vleessoorten (kipfilet, biefstuk) vertoonden een onderschatting van 19-22%. Opgestapeld voedsel (rijst, pasta, aardappelpuree) vertoonde een onderschatting van 14-20%. Vloeistoffen vertoonden een onderschatting van 20-29%.
Waar Portieschatting Betrouwbaar Is
De schattingen van Cal AI waren het meest nauwkeurig voor voedingsmiddelen met uniforme, voorspelbare vormen en gestandaardiseerde maten.
Uniforme Items
Een sneetje brood, een gekookt ei en een appel vallen allemaal binnen 5-10% van het werkelijke gewicht. Deze voedingsmiddelen hebben consistente vormen die goed worden vastgelegd in de AI-trainingsdata. Een sneetje brood is ongeveer dezelfde dikte en afmetingen, ongeacht het merk. Een groot ei is een groot ei. De trainingsdata van de AI bevat duizenden afbeeldingen van deze items, en hun voorspelbare geometrie maakt diepteschatting minder kritisch.
Gestandaardiseerde Verpakte Items
De eiwitreep, ondanks dat deze niet verpakt was, werd geschat binnen 8.3% van het werkelijke gewicht. De rechthoekige vorm en gestandaardiseerde afmetingen maken het visueel voorspelbaar. Voedingsmiddelen met regelmatige geometrische vormen presteerden consequent beter dan onregelmatige voedingsmiddelen in onze tests.
De gemeenschappelijke factor is dat deze voedingsmiddelen een lage vormvariabiliteit hebben. Wanneer je één sneetje brood hebt gezien, heb je ze in wezen allemaal gezien. De AI kan vertrouwen op gememoriseerde typische afmetingen in plaats van dimensies af te leiden uit contextuele aanwijzingen.
Waar Portieschatting Onbetrouwbaar Is
Onregelmatige Vormen: Het Biefstuk en Kip Probleem
De gegrilde biefstuk werd onderschat met 22.2%, wat resulteerde in een fout van 127 calorieën voor één voedingsmiddel. De kipfilet werd onderschat met 19.5%, wat een fout van 56 calorieën opleverde. Dit zijn enkele van de meest geregistreerde voedingsmiddelen voor mensen die hun eiwitinname bijhouden.
Onregelmatige vormen zijn moeilijk omdat de dikte varieert over het voedsel. Een kipfilet loopt van een dikke kern naar dunne randen. Vanuit een bovenaanzicht of een schuine foto legt de AI het oppervlak vast, maar onderschat de dikte in het midden. Het resultaat is een systematische ondertelling die invloed heeft op calorie-dense eiwitten — precies de voedingsmiddelen waar nauwkeurigheid het belangrijkst is voor macro tracking.
Opgestapeld en Gebundeld Voedsel: Rijst, Pasta en Aardappelen
Gekookte rijst, pasta en aardappelpuree werden onderschat met 14-20%. Deze voedingsmiddelen stapelen zich op met een aanzienlijke hoogte die een 2D-foto samendrukt. Een portie rijst op een bord kan 4 centimeter hoog zijn op de top, maar een foto die onder een hoek van 45 graden is genomen, maakt dit plat tot wat lijkt op een veel dunnere laag.
De USDA FoodData Central database vermeldt gekookte witte rijst op 130 calorieën per kop (186 g). Een onderschatting van 14.3% op een portie van 210 gram vertaalt zich naar 33 ontbrekende calorieën — en de meeste mensen eten rijst als een onderdeel van een grotere maaltijd. De fouten stapelen zich op over elk opgestapeld voedsel op het bord.
Vloeistoffen: Het Onzichtbare Volume Probleem
Vloeistoffen waren de minst betrouwbaar geschatte categorie, met afwijkingen van 20-29%. Een glas sinaasappelsap werd onderschat met 20%. Koffie met melk in een mok werd onderschat met 28.6%. Soep in een kom werd onderschat met 25%.
Het probleem is eenvoudig: de AI kan het oppervlak van de vloeistof zien, maar kan de diepte van de container niet bepalen. Een brede, ondiepe kom en een smalle, diepe kom kunnen identieke oppervlakken in een foto presenteren terwijl ze totaal verschillende volumes bevatten. Zonder de afmetingen van de container te kennen, is de volumeschatting van de AI in wezen een gok.
Het Hoekprobleem: Zelfde Voedsel, Verschillende Schattingen
Naast de nauwkeurigheidstest per voedingsmiddel onderzochten we of Cal AI consistente schattingen produceert wanneer hetzelfde voedsel vanuit verschillende hoeken wordt gefotografeerd.
Hoekconsistentie Test: Gegrilde Kipfilet (174 g werkelijk)
| Fotografeer Hoek | Cal AI Schatting | Afwijking van Werkelijk |
|---|---|---|
| 45 graden (standaard) | 140 g | -19.5% |
| Direct van boven (90 graden) | 155 g | -10.9% |
| Lage hoek (20 graden) | 125 g | -28.2% |
| Zijhoek (10 graden) | 110 g | -36.8% |
Dezelfde kipfilet van 174 gram produceerde schattingen variërend van 110 gram tot 155 gram, afhankelijk van de camerahoek — een spreiding van 45 gram. De overheadhoek produceerde het meest nauwkeurige resultaat omdat het het volledige oppervlak vastlegt, maar zelfs dit was bijna 11% fout. De lage en zijhoeken onderschatten de portie dramatisch omdat de hoogte en diepte van het voedsel steeds meer samengedrukt werden.
Dit betekent dat de calorieën die een gebruiker krijgt deels bepaald worden door hoe ze hun telefoon vasthouden, niet alleen door wat ze eten. Een gebruiker die gewend is om voedsel vanuit een lage hoek te fotograferen, zal consequent calorieën onderschatten in vergelijking met een gebruiker die van boven fotografeert.
De Bordgrootte Illusie: Zelfde Portie, Verschillende Borden
We testten of de bordgrootte de portieschatting van Cal AI beïnvloedt door 200 gram gekookte pasta op drie verschillende borden te plaatsen.
Bordgrootte Test: 200 g Gekookte Pasta
| Bord Diameter | Cal AI Schatting | Afwijking |
|---|---|---|
| 20 cm (klein bord) | 225 g | +12.5% |
| 26 cm (standaard bord) | 195 g | -2.5% |
| 32 cm (groot bord) | 155 g | -22.5% |
Dezelfde 200 gram pasta werd geschat op 225 gram op een klein bord en 155 gram op een groot bord — een verschil van 70 gram uitsluitend op basis van bordgrootte. Dit is de Delboeuf illusie, een goed gedocumenteerde perceptuele bias waarbij objecten groter lijken wanneer ze omringd zijn door een klein kader en kleiner wanneer ze omringd zijn door een groot kader. De AI heeft deze bias geleerd uit zijn trainingsdata, die bestaat uit voedselfoto's waarbij de bordgrootte correleert met de waargenomen portiegrootte.
Voor gebruikers die eten van grote restaurantborden of serveerschalen, betekent dit dat Cal AI systematisch hun porties zal onderschatten. Voor gebruikers die van kleine dessertborden eten, zal de app overschatten. Geen van beide groepen krijgt een nauwkeurige telling van wat ze daadwerkelijk hebben geconsumeerd.
Consistentie Test: Zelfde Voedsel, Vijf Foto's
We fotografeerden een enkele portie gegrilde kipfilet met rijst en broccoli (542 werkelijke calorieën) vijf keer achter elkaar, waarbij we alleen de hoek van de telefoon iets aanpasten elke keer.
Vijf-Foto Consistentie Test
| Foto Nummer | Cal AI Totale Calorieën | Afwijking van Werkelijk |
|---|---|---|
| 1 | 450 | -17.0% |
| 2 | 478 | -11.8% |
| 3 | 435 | -19.7% |
| 4 | 462 | -14.8% |
| 5 | 448 | -17.3% |
Vijf foto's van dezelfde maaltijd produceerden vijf verschillende calorie schattingen, variërend van 435 tot 478 — een spreiding van 43 calorieën. Het gemiddelde was 455 calorieën, wat de werkelijke 542 calorieën onderschatte met 16.1%. Geen enkele foto produceerde een resultaat binnen 10% van de werkelijke calorie-inhoud.
Deze test toont zowel de nauwkeurigheids- als consistentieproblemen tegelijkertijd aan. De schattingen zijn consequent te laag (nauwkeurigheidsfout) en ze variëren over foto's van identiek voedsel (consistentiefout). Een gebruiker die deze maaltijd registreert, krijgt een ander aantal afhankelijk van welke van de vijf foto's ze toevallig nemen.
Hoe Dagelijkse Fouten Zich Ophopen
De individuele fouten per voedingsmiddel in onze tests gemiddeld 37 calorieën. Dat klinkt klein totdat je bedenkt dat een typische dag het registreren van 10 tot 15 individuele voedingsmiddelen omvat over drie maaltijden en snacks.
Dagelijkse Accumulatie Scenario
| Maaltijd | Geregistreerde Voedingsmiddelen | Werkelijke Calorieën | Cal AI Totaal | Cumulatieve Fout |
|---|---|---|---|---|
| Ontbijt (havermout, banaan, pindakaas) | 3 items | 445 | 385 | -60 |
| Lunch (kip, rijst, groenten) | 3 items | 542 | 450 | -92 |
| Snack (amandelen, yoghurt) | 2 items | 304 | 251 | -53 |
| Diner (biefstuk, aardappelpuree, salade) | 3 items | 816 | 640 | -176 |
| Dag Totaal | 11 items | 2,107 | 1,726 | -381 |
Een dagelijkse ondertelling van 381 calorieën. Dat is 18.1% van de totale inname — een tekort dat niet bestaat. Een gebruiker die een dagelijkse tekort van 500 calorieën plant voor gewichtsverlies, bevindt zich na rekening houden met de onderestimatie van Cal AI in een effectief tekort van 119 calorieën. Bij die snelheid wordt een geplande gewichtsverlies van 1 pond per week 0.24 pond per week. Een maand van gedisciplineerde tracking levert een week aan verwachte resultaten op, en de gebruiker heeft geen idee waarom.
Onderzoek gepubliceerd in het American Journal of Clinical Nutrition heeft consequent aangetoond dat het onderrapporteren van voedselinname de meest voorkomende richting van fout is in dieetbeoordeling, en AI-systemen die zijn getraind op door mensen gelabelde data erven deze bias.
Hoe Nutrola Portieschatting Anders Aanpakt
Nutrola's aanpak van het portieschatting probleem is om foto-AI als een startpunt te beschouwen, niet als een definitief antwoord. De app's fotoherkenning identificeert voedingsmiddelen en koppelt ze aan een door een voedingsdeskundige geverifieerde database van meer dan 1.8 miljoen vermeldingen, waarmee nauwkeurige calorie waarden per gram worden vastgesteld. Maar in plaats van uitsluitend op AI te vertrouwen om de portiegrootte te raden, biedt Nutrola een spraakcorrectielaag.
Na het fotograferen van je maaltijd, kun je zeggen "dat was ongeveer 200 gram kip" of "de rijst was ongeveer één kop." De invoer wordt onmiddellijk bijgewerkt op basis van geverifieerde voedingsdata per gram. Dit kost seconden — sneller dan handmatig zoeken — en lost de fundamentele beperking op dat geen AI nauwkeurig 3D-volume kan schatten uit een 2D-beeld.
De geverifieerde database is de kritische onderscheidende factor. Zelfs wanneer portieschatting perfect is, is de calorie telling alleen zo betrouwbaar als de voedingsdata waarop het zich baseert. Nutrola's database bevat één geverifieerde vermelding per voedsel, afkomstig van door voedingsdeskundigen gevalideerde data, zonder crowdsourced duplicaten of conflicterende vermeldingen. De combinatie van foto-identificatie, spraak-gecorrigeerde porties en geverifieerde data produceert calorie logs die weerspiegelen wat je daadwerkelijk hebt gegeten in plaats van wat een AI uit een foto heeft geraden.
Nutrola omvat ook barcode-scanning voor verpakte voedingsmiddelen en receptimport voor zelfgemaakte maaltijden, wat zorgt voor consistente datakwaliteit over elke registratie methode. Beschikbaar op iOS en Android voor €2.50 per maand zonder advertenties op elk plan, is Nutrola ontworpen rond het principe dat snelheid en nauwkeurigheid niet met elkaar in strijd zijn.
Veelgestelde Vragen
Hoe nauwkeurig is Cal AI voor het tellen van calorieën?
In onze test van 20 voedingsmiddelen, varieerden de portieschattingen van Cal AI van de daadwerkelijk gemeten gewichten met een gemiddelde van 16.9%. Dit vertaalde zich naar een gemiddelde calorie fout van 37 calorieën per individueel voedingsmiddel. Slechts 25% van de voedingsmiddelen (5 van de 20) werd geschat binnen 10% nauwkeurigheid. De app toonde een sterke onderestimatie bias, waarbij 18 van de 20 geteste voedingsmiddelen werden onderschat. Voor een volledige dag eten stapelden deze fouten zich op tot een ondertelling van 381 calorieën in ons testscenario.
Waarom geeft Cal AI verschillende calorieën voor dezelfde maaltijd?
De schattingen van Cal AI veranderen op basis van de fotografische hoek, belichting en framing omdat het de 3D-portiegrootte afleidt uit een 2D-beeld. In onze consistentietest produceerden vijf foto's van dezelfde maaltijd calorie schattingen variërend van 435 tot 478 — een spreiding van 43 calorieën. De camerahoek heeft de grootste invloed: onze hoektest toonde aan dat een enkele kipfilet geschat werd op 110 gram vanuit een zijhoek versus 155 gram van recht boven.
Is Cal AI nauwkeuriger voor sommige voedingsmiddelen dan voor andere?
Ja. Cal AI is het meest nauwkeurig voor voedingsmiddelen met uniforme, voorspelbare vormen: gesneden brood (5.3% afwijking), gekookte eieren (0% afwijking) en hele vruchten (6.6% afwijking). Het is het minst nauwkeurig voor onregelmatig gevormde vleessoorten (19-22% afwijking), opgestapeld voedsel zoals rijst en pasta (14-20% afwijking), en vloeistoffen (20-29% afwijking). Als je dieet voornamelijk uit eenvoudige, uniforme voedingsmiddelen bestaat, zal de app betrouwbaarder zijn dan wanneer je complexe, meercomponenten maaltijden eet.
Beïnvloedt bordgrootte de calorie schatting van Cal AI?
Ja. In onze bordgrootte test werd 200 gram pasta geschat op 225 gram op een klein bord van 20 centimeter en 155 gram op een groot bord van 32 centimeter — een verschil van 70 gram voor dezelfde portie. Dit wordt veroorzaakt door de Delboeuf illusie, waarbij de omringende context de waargenomen grootte van een object verandert. Gebruikers die van grote borden of restaurantgerechten eten, zullen consequent onderschatte porties zien.
Kan ik Cal AI gebruiken voor gewichtsverlies?
Cal AI kan een ruwe calorie bewustzijn bieden, maar de systematische onderestimatie bias maakt het problematisch voor nauwkeurig tekort-gebaseerd gewichtsverlies. In ons dagelijkse scenario werd een gepland tekort van 500 calorieën gereduceerd tot een effectief tekort van 119 calorieën na rekening houden met de onderestimatie van Cal AI — een vermindering van 76% in het beoogde tekort. Voor betrouwbaardere resultaten, combineer foto-gebaseerde registratie met daadwerkelijk wegen van voedsel of gebruik een app zoals Nutrola die foto-AI koppelt aan spraak-gecorrigeerde porties en een geverifieerde voedingsdatabase.
Klaar om je voedingstracking te transformeren?
Sluit je aan bij duizenden die hun gezondheidsreis hebben getransformeerd met Nutrola!