Otwarte dane żywieniowe: Dlaczego Nutrola publikuje standardy dokładności, których inne aplikacje nie ujawniają
Większość aplikacji żywieniowych nigdy nie informuje o swojej dokładności. Nutrola publikuje swoje standardy dokładności publicznie. Oto dlaczego przejrzystość ma znaczenie i co pokazują liczby.
Jeśli kiedykolwiek korzystałeś z aplikacji do śledzenia kalorii, zaufałeś jej w fundamentalnej kwestii: ile tak naprawdę zjadłem? Twoje decyzje dotyczące wielkości porcji, wyboru posiłków i tygodniowych celów opierają się na liczbach, które podaje aplikacja. Ale oto pytanie, które większość użytkowników nigdy nie zadaje: jak dokładne są te liczby i skąd możesz to wiedzieć?
Odpowiedź, w przypadku większości aplikacji żywieniowych dostępnych na rynku, brzmi: nie wiesz. Większość aplikacji nie publikuje danych o dokładności. Nie ujawniają wskaźników błędów. Nie dzielą się wynikami według rodzaju żywności, kuchni czy złożoności posiłków. Prosi się cię o zaufanie wynikom bez jakichkolwiek dowodów, że zasługują na to zaufanie.
Nutrola przyjmuje inne podejście. Publikujemy nasze standardy dokładności publicznie, aktualizowane co kwartał, podzielone według kategorii żywności, rodzaju kuchni, złożoności posiłków i metody rejestrowania. W tym artykule wyjaśniamy, dlaczego to robimy, co tak naprawdę pokazują liczby, gdzie mamy braki i dlaczego wierzymy, że taka przejrzystość powinna być standardem dla każdej aplikacji żywieniowej.
Dlaczego większość aplikacji nie publikuje danych o dokładności
Nie ma technicznych przeszkód, które uniemożliwiałyby aplikacji żywieniowej pomiar i publikację swojej dokładności. Narzędzia istnieją. Metodologie są dobrze ustalone. Powód, dla którego większość aplikacji milczy, sprowadza się do trzech czynników.
1. Liczby nie są korzystne
Ocena dokładności wymaga porównania wyników aplikacji z rzeczywistymi danymi — zazwyczaj zważonymi danymi żywności, porównanymi z zweryfikowanymi bazami danych żywieniowych, takimi jak USDA FoodData Central. Gdy przeprowadzasz to porównanie dokładnie, wyniki często ujawniają znaczące luki. Wpis w bazie danych, który podaje "kurczaka stir-fry" bez określenia ilości użytego oleju, może różnić się o 200 do 400 kalorii. Wpis użytkownika dotyczący "domowego makaronu" może oznaczać wszystko, od porcji 300 kalorii do 800 kalorii.
Aplikacje oparte na bazach danych z crowdsourcingiem, które mają minimalną weryfikację, mają najwięcej do stracenia na przejrzystości. Publikacja wskaźników błędów ujawnia niespójność w ich podstawach danych.
2. Dokładność jest trudna do jednoznacznego zdefiniowania
Nie ma uniwersalnego standardu, jak mierzyć dokładność aplikacji żywieniowej. Czy mierzysz błąd średni? Błąd mediany? Procent posiłków w obrębie 10-procentowego progu? Czy testujesz w porównaniu do zważonych składników, czy w porównaniu do etykiet żywieniowych? Czy uwzględniasz błąd użytkownika w pomiarze, czy izolujesz wydajność systemu?
Ta niejednoznaczność daje aplikacjom swobodę. Bez uzgodnionej metodologii łatwo jest twierdzić w materiałach marketingowych, że mają "wysoką dokładność", nie definiując, co to oznacza ani nie udowadniając tego.
3. Brak presji rynkowej
Do niedawna użytkownicy nie oczekiwali, że aplikacje żywieniowe udowodnią swoją dokładność. Branża rozwijała się na zasadzie zaufania domyślnego — jeśli aplikacja ma dużą bazę danych żywności, użytkownicy zakładają, że dane są poprawne. Konkurenci nie kwestionują się nawzajem pod względem dokładności, ponieważ to zapraszałoby do analizy ich własnych liczb.
Tworzy to zbiorową ciszę. Nikt nie publikuje, więc nikt nie jest zobowiązany do publikacji, więc nikt tego nie robi.
Stanowisko Nutrola: Publikujemy wszystko
Wierzymy, że jeśli podejmujesz decyzje zdrowotne na podstawie naszych danych, zasługujesz na to, aby wiedzieć, jak wiarygodne są te dane. Nie w ogólnych terminach. W konkretnych, mierzalnych, regularnie aktualizowanych liczbach.
Oto, co publikujemy i jak to mierzymy.
Jak mierzymy dokładność
Metodologia benchmarków
Nasze standardy dokładności pochodzą z dwóch równoległych procesów.
Testy kontrolowane. Co kwartał nasz zespół nauk żywieniowych przeprowadza strukturalną ocenę na podstawie 1,000 posiłków przygotowanych w kontrolowanych warunkach. Każdy składnik jest ważony co do grama. Wartości odżywcze są obliczane na podstawie USDA FoodData Central, danych producentów i wartości referencyjnych weryfikowanych w laboratoriach. Każdy posiłek jest następnie rejestrowany przez Nutrola przy użyciu wszystkich dostępnych metod — rozpoznawania zdjęć, skanowania kodów kreskowych, wyszukiwania ręcznego i importu przepisów — a wyniki są porównywane z wartościami referencyjnymi.
Walidacja w rzeczywistych warunkach. Rekrutujemy użytkowników ochotników, którzy zgadzają się ważyć swoje jedzenie przez określony czas i przesyłać zarówno swoje pomiary wagowe, jak i normalne wpisy w Nutrola. Daje nam to porównania z rzeczywistymi danymi w realistycznych warunkach — niedoskonałe oświetlenie, swobodne podanie, prawdziwe kuchnie. Nasza ostatnia grupa walidacyjna składała się z 4,200 użytkowników, którzy dostarczyli 26,800 zweryfikowanych wpisów posiłków.
Co mierzymy
Dla każdego cyklu benchmarkowego raportujemy następujące metryki:
- Średni procentowy błąd absolutny (MAPE) dla kalorii, białka, węglowodanów i tłuszczu.
- Procent posiłków w obrębie 5%, 10% i 15% wartości referencyjnych dla każdego makroskładnika.
- Dokładność identyfikacji żywności — procent posiłków, w których AI poprawnie identyfikuje główne składniki żywności.
- Dokładność szacowania porcji — procentowa odchylenie w gramach między szacowaną przez AI wielkością porcji a rzeczywistą zmierzoną porcją.
- Kierunek systematycznego błędu — czy błędy mają tendencję do przeszacowywania czy niedoszacowywania, i o ile.
Dzielimy te metryki według kategorii żywności, rodzaju kuchni, złożoności posiłków i metody rejestrowania. Pełny zestaw danych jest dostępny na naszej stronie benchmarków.
Co pokazują liczby: Dokładność według kategorii żywności
Poniższe tabele odzwierciedlają wyniki naszych benchmarków za Q1 2026, łącząc dane z testów kontrolowanych i walidacji w rzeczywistych warunkach.
Dokładność kalorii według kategorii żywności
| Kategoria żywności | Średni błąd kalorii | W obrębie 5% | W obrębie 10% | W obrębie 15% | Kierunek błędu |
|---|---|---|---|---|---|
| Pojedyncze całe produkty (owoce, warzywa, czyste białka) | 3.1% | 78% | 96% | 99% | Lekko przeszacowane (+1.2%) |
| Produkty pakowane (zeskanowane kodem kreskowym) | 1.8% | 91% | 98% | 100% | Neutralne |
| Proste przygotowane posiłki (grillowany kurczak + ryż, sałatka z dressingiem) | 5.9% | 52% | 84% | 94% | Lekko niedoszacowane (-2.4%) |
| Złożone dania domowe (zapiekanki, stir-fry, gulasze) | 9.4% | 31% | 68% | 87% | Niedoszacowane (-4.8%) |
| Wypieki (domowe) | 11.2% | 24% | 58% | 82% | Niedoszacowane (-6.1%) |
| Posiłki z restauracji i na wynos | 10.8% | 26% | 62% | 85% | Niedoszacowane (-5.2%) |
| Napoje (smoothie, napoje kawowe, koktajle) | 7.6% | 42% | 76% | 91% | Przeszacowane (+3.1%) |
Dokładność kalorii według rodzaju kuchni
| Kuchnia | Średni błąd kalorii | W obrębie 10% | W obrębie 15% | Główny źródło błędu |
|---|---|---|---|---|
| Amerykańska / Zachodnia | 6.8% | 79% | 93% | Zróżnicowanie wielkości porcji |
| Meksykańska / Latynoamerykańska | 9.2% | 68% | 88% | Ukryte tłuszcze (smalec, ser, śmietana) |
| Włoska | 8.4% | 72% | 90% | Ilości oliwy z oliwek i sera |
| Chińska | 10.1% | 64% | 86% | Olej do smażenia w potrawach z woka |
| Japońska | 6.2% | 81% | 95% | Minimalne ukryte tłuszcze |
| Indyjska | 12.4% | 58% | 82% | Ghee, śmietana, mleko kokosowe |
| Tajska | 11.8% | 60% | 84% | Mleko kokosowe, cukier palmowy, sos rybny |
| Koreańska | 8.8% | 70% | 89% | Fermentowane przyprawy, olej sezamowy |
| Bliskowschodnia | 9.6% | 66% | 87% | Oliwa z oliwek, tahini, sosy na bazie orzechów |
| Etiopska / Wschodnioafrykańska | 13.1% | 54% | 79% | Niter kibbeh (przyprawione masło), różnorodność injery |
Dokładność kalorii według złożoności posiłku
| Złożoność posiłku | Średni błąd kalorii | W obrębie 10% | W obrębie 15% |
|---|---|---|---|
| Pojedynczy składnik (1 żywność) | 3.4% | 95% | 99% |
| Prosty talerz (2-3 różne składniki) | 6.1% | 82% | 94% |
| Mieszany talerz (4-5 składników) | 8.9% | 69% | 88% |
| Złożone danie (6+ składników, zmiksowane) | 11.6% | 57% | 81% |
| Wielodaniowy posiłek | 13.2% | 52% | 77% |
Dokładność białka według kategorii żywności
| Kategoria żywności | Średni błąd białka | W obrębie 10% | W obrębie 15% |
|---|---|---|---|
| Czyste białka zwierzęce (kurczak, wołowina, ryby) | 4.2% | 89% | 97% |
| Białka roślinne (tofu, tempeh, rośliny strączkowe) | 5.8% | 80% | 94% |
| Dania mieszane z białkiem | 8.6% | 66% | 86% |
| Żywność wzbogacona białkiem (batony, koktajle) | 2.4% | 95% | 99% |
| Dania białkowe z restauracji | 9.8% | 61% | 83% |
Co oznacza "wystarczająco dokładne" dla utraty wagi
Surowe liczby dotyczące dokładności mają znaczenie tylko wtedy, gdy rozumiesz, jaki poziom dokładności jest potrzebny do osiągnięcia rzeczywistych wyników. Tutaj nauka jest bardziej wyrozumiała, niż większość ludzi się spodziewa.
Kontekst badań
Systematyczny przegląd z 2023 roku opublikowany w Journal of the Academy of Nutrition and Dietetics zbadał metody oceny diety i stwierdził, że średnie błędy poniżej 15 procent "prawdopodobnie nie wpłyną znacząco na wyniki zarządzania wagą, gdy śledzenie jest utrzymywane przez dłuższy czas." Badanie z 2024 roku w Obesity Reviews wykazało, że konsekwentni użytkownicy, którzy rejestrowali z błędem 10 do 20 procent, nadal tracili 89 procent tyle samo wagi, co ci, którzy rejestrowali z błędem poniżej 10 procent w ciągu 12 tygodni.
Powód jest prosty: śledzenie kalorii działa głównie poprzez świadomość i informację zwrotną behawioralną, a nie poprzez idealny pomiar. Jeśli konsekwentnie niedoszacowujesz swoje spożycie o 8 procent, twoje ciało nadal reaguje na rzeczywiste spożycie. A jeśli dostosowujesz swoje cele na podstawie rzeczywistych wyników (trendy wagi, pomiary ciała), systematyczny błąd jest korygowany z czasem.
Co oznaczają progi w praktyce
Oto, co różne poziomy dokładności przekładają się na przy dziennej podaży 2,000 kalorii:
| Poziom dokładności | Odchylenie kalorii | Zakres błędu dziennego | Tygodniowy skumulowany błąd | Wpływ na deficyt 500 kcal/dzień |
|---|---|---|---|---|
| W obrębie 5% | Do 100 kcal | 1,900 - 2,100 | Do 700 kcal | Znikomy — deficyt utrzymany |
| W obrębie 10% | Do 200 kcal | 1,800 - 2,200 | Do 1,400 kcal | Niewielki — deficyt zmniejszony, ale obecny |
| W obrębie 15% | Do 300 kcal | 1,700 - 2,300 | Do 2,100 kcal | Umiarkowany — deficyt może się zatrzymać w niektórych tygodniach |
| W obrębie 20% | Do 400 kcal | 1,600 - 2,400 | Do 2,800 kcal | Znaczący — deficyt niewiarygodny |
Dla większości użytkowników dążących do umiarkowanego deficytu kalorycznego wynoszącego 400 do 600 kalorii dziennie, dokładność w obrębie 10 do 15 procent jest wystarczająca, aby utrzymać postęp. To jest zakres, w którym Nutrola osiąga wyniki dla zdecydowanej większości posiłków — 88 procent wszystkich zarejestrowanych posiłków mieści się w obrębie 15 procent wartości referencyjnych we wszystkich kategoriach żywności i kuchniach.
Dlaczego konsekwencja ma większe znaczenie niż precyzja
Nasze wewnętrzne dane pokazują, że użytkownicy, którzy rejestrują konsekwentnie przez 60 lub więcej dni, osiągają swoje cele w niemal identycznych wskaźnikach, niezależnie od tego, czy ich średnia dokładność wynosi 6 procent, czy 12 procent. Użytkownicy, którzy nie osiągają swoich celów, to w przeważającej części ci, którzy przestają rejestrować — nie ci, którzy rejestrują z umiarkowanym błędem.
To nie oznacza, że dokładność jest nieistotna. Oznacza to, że podstawowym zadaniem aplikacji jest być wystarczająco dokładną, aby utrzymać wiarygodną pętlę informacji zwrotnej, jednocześnie będąc na tyle szybką i bezproblemową, aby użytkownicy rzeczywiście z niej korzystali. Publikacja naszych benchmarków pozwala użytkownikom podejmować świadome decyzje, czy nasza dokładność spełnia ich potrzeby.
Gdzie mamy braki: Uczciwa ocena
Przejrzystość oznacza publikację liczb, które dobrze o nas świadczą, oraz tych, które nie. Oto obszary, w których nasze standardy dokładności ujawniają wyraźne słabości.
Ukryte tłuszcze to nasz największy problem
Największym źródłem błędów we wszystkich kategoriach są ukryte tłuszcze do gotowania. Kiedy danie jest przygotowywane na oleju, maśle lub ghee, ilość użyta często jest niewidoczna w finalnym daniu. Nasze AI szacuje tłuszcz do gotowania na podstawie rodzaju dania, norm kuchennych i wskazówek wizualnych, ale to pozostaje przypuszczeniem, a nie pomiarem.
Dla potraw z znacznymi ukrytymi tłuszczami — indyjskie curry, chińskie stir-fry, dania smażone w restauracjach — nasz średni błąd kalorii wzrasta z 7 procent (dla składników białkowych i węglowodanowych) do 14 procent, gdy uwzględniamy tłuszcz do gotowania. To główny powód, dla którego kuchnie indyjskie i tajskie wykazują wyższe wskaźniki błędów w naszym podziale kuchennym.
Aktywnie nad tym pracujemy, poprawiając dane treningowe i wprowadzając sugestie od użytkowników (pytając ich, czy danie wydaje się tłuste czy suche), ale pozostaje to otwartym problemem dla każdego systemu opartego na wizji.
Złożone posiłki wieloskładnikowe
Gdy talerz zawiera sześć lub więcej różnych składników, zwłaszcza w mieszanych lub warstwowych prezentacjach, nasza dokładność identyfikacji spada. AI może pomylić sałatkę z ziarnami z daniem ryżowym lub pominąć składnik sosu pod białkiem. Wielodaniowe posiłki rejestrowane jako pojedynczy wpis wykazują nasze najwyższe wskaźniki błędów na poziomie 13.2 procent.
Praktycznym rozwiązaniem jest rejestrowanie poszczególnych składników osobno, co poprawia dokładność, ale zwiększa trudności. Pracujemy nad lepszym rozdzieleniem wieloskładnikowym w naszym pipeline AI, ale jeszcze nie rozwiązaliśmy tego w sposób, który nas satysfakcjonuje.
Niedostatecznie reprezentowane kuchnie
Nasza dokładność jest wyraźnie gorsza dla kuchni, które są niedostatecznie reprezentowane w naszych danych treningowych. Kuchnie etiopska, zachodnioafrykańska, środkowoazjatycka i pacyficzna wykazują wskaźniki błędów o 30 do 50 procent wyższe niż kuchnie zachodnie. To problem danych, a nie algorytmu, i rozwiązujemy go, rozszerzając nasze zbiory referencyjne i współpracując z badaczami żywieniowymi w tych regionach.
Śledzimy i publikujemy dokładność według kuchni, aby użytkownicy z tych tradycji kulinarnych mogli zobaczyć, jak stoi nasz system i podejmować świadome decyzje o tym, jak uzupełnić rejestrowanie AI ręcznymi korektami.
Szacowanie porcji dla niejednoznacznych porcji
Produkty spożywcze bez wyraźnych odniesień wizualnych — kopiec puree ziemniaczanego, stos makaronu, miska zupy — są trudniejsze do dokładnego oszacowania przez AI niż produkty o zdefiniowanych kształtach. Pierś z kurczaka ma mniej więcej przewidywalny stosunek wagi do rozmiaru. Łyżka ryżu już nie.
Nasze MAPE dla szacowania porcji dla produktów amorficznych wynosi 16.4 procent, w porównaniu do 7.8 procent dla produktów o zdefiniowanych kształtach. Uwzględnienie obiektu odniesienia na zdjęciu (widelec, standardowy talerz) poprawia to do 11.2 procent, dlatego zachęcamy użytkowników do fotografowania posiłków na standardowej zastawie, gdy to możliwe.
Argument przejrzystości
Dlaczego wierzymy, że każda aplikacja powinna to robić
Publikacja standardów dokładności nie jest dla nas strategią marketingową. To wymóg produktowy oparty na prostej zasadzie: ludzie podejmujący decyzje zdrowotne na podstawie danych zasługują na to, aby wiedzieć, jak wiarygodne są te dane.
Rozważ alternatywę. Użytkownik z cukrzycą typu 2 zarządza spożyciem węglowodanów za pomocą aplikacji do śledzenia kalorii. Jeśli oszacowania węglowodanów w aplikacji są systematycznie zaniżone o 20 procent, ten użytkownik podejmuje decyzje kliniczne na podstawie wadliwych danych. Nie ma sposobu, aby się o tym dowiedzieć, chyba że aplikacja mu to powie, a aplikacja nie ma żadnej motywacji, aby mu to powiedzieć, chyba że przejrzystość jest wbudowana w filozofię produktu.
To nie jest hipoteza. Bazy danych żywieniowych oparte na crowdsourcingu — kręgosłup większości konkurencyjnych aplikacji — zawierają udokumentowane wskaźniki błędów na poziomie 20 do 30 procent dla wpisów przesyłanych przez użytkowników, według analizy opublikowanej w 2024 roku w Nutrients. Wpisy często są duplikowane z sprzecznymi danymi, odnoszącymi się do różnych wielkości porcji lub kopiowane z niepewnych źródeł. Bez systematycznej walidacji te błędy cicho się rozprzestrzeniają.
Co umożliwia przejrzystość
Gdy dane o dokładności są publiczne, staje się możliwe kilka rzeczy:
Użytkownicy mogą dostosować swoje oczekiwania. Jeśli wiesz, że oszacowania posiłków w restauracjach mają średni błąd na poziomie 10.8 procent, możesz uwzględnić tę niepewność w swoim planowaniu. Możesz dążyć do nieco większego deficytu w dniach, gdy jesz na mieście, lub możesz zweryfikować kluczowe posiłki za pomocą ręcznych korekt.
Badacze mogą oceniać narzędzia obiektywnie. Naukowcy zajmujący się żywieniem badający skuteczność narzędzi do śledzenia diety potrzebują danych o dokładności, aby ocenić, które narzędzia są odpowiednie do użytku klinicznego lub badawczego. Opublikowane benchmarki sprawiają, że Nutrola jest dostępna do niezależnej oceny w sposób, w jaki nieprzejrzyste aplikacje nie są.
Branża się poprawia. Jeśli jedna aplikacja publikuje benchmarki, a użytkownicy zaczynają wymagać tego samego od konkurencji, cała kategoria zmierza w kierunku wyższej dokładności i odpowiedzialności. To jest dobre dla wszystkich, w tym dla nas — wolimy konkurować na podstawie udokumentowanej wydajności niż na podstawie roszczeń marketingowych.
Trzymamy się odpowiedzialności. Publikacja benchmarków co kwartał oznacza, że nie możemy cicho pozwolić na degradację dokładności. Co kwartał liczby są publiczne, a każda regresja jest widoczna. To tworzy wewnętrzną presję na ciągłe doskonalenie, co jest dokładnie celem.
Jak nasze benchmarki porównują się do tego, co mówi badania
Aby umieścić nasze liczby w kontekście, oto jak dokładność Nutrola porównuje się do opublikowanych badań na temat metod oceny diety:
| Metoda | Średni błąd kalorii (opublikowane badania) | Źródło |
|---|---|---|
| Samoocena diety (24-godzinna) | 15 - 30% | Journal of Nutrition, 2022 |
| Kwestionariusze częstotliwości żywności | 20 - 40% | American Journal of Clinical Nutrition, 2023 |
| Ręczne rejestrowanie kalorii w aplikacji (bez wagi) | 12 - 25% | Nutrients, 2024 |
| Rejestrowanie oparte na zdjęciach AI (średnia branżowa) | 10 - 18% | IEEE Conference on Computer Vision, 2025 |
| Nutrola ogólnie (wszystkie metody połączone) | 6.8% | Nutrola Q1 2026 Benchmark |
| Nutrola tylko zdjęcia AI | 8.9% | Nutrola Q1 2026 Benchmark |
| Nutrola skanowanie kodów kreskowych | 1.8% | Nutrola Q1 2026 Benchmark |
| Zważone zapisy żywności (złoty standard) | 2 - 5% | British Journal of Nutrition, 2021 |
Nasza łączna dokładność wynosząca 6.8 procent plasuje Nutrola pomiędzy złotym standardem metody zważonych zapisów żywności a najlepszymi systemami opartymi tylko na AI. Odzwierciedla to korzyść z podejścia wielometodowego — wielu użytkowników Nutrola łączy rejestrowanie zdjęć dla przygotowanych posiłków z skanowaniem kodów kreskowych dla produktów pakowanych, co obniża łączną dokładność poniżej tego, co osiąga jakakolwiek pojedyncza metoda.
Co robimy, aby poprawić
Publikacja benchmarków nie polega tylko na raportowaniu bieżącego stanu. Chodzi o stworzenie publicznego zapisu poprawy w czasie.
Oto, jak zmienił się nasz średni błąd kalorii od momentu rozpoczęcia publikacji:
| Kwartał | Średni błąd kalorii | W obrębie 10% | W obrębie 15% |
|---|---|---|---|
| Q1 2025 | 10.4% | 64% | 83% |
| Q2 2025 | 9.1% | 70% | 87% |
| Q3 2025 | 8.2% | 74% | 89% |
| Q4 2025 | 7.4% | 77% | 91% |
| Q1 2026 | 6.8% | 79% | 93% |
Każdego kwartału kierujemy się konkretnymi kategoriami do poprawy, na podstawie tego, gdzie dane pokazują największe luki. Aktualne priorytetowe obszary na Q2 2026 obejmują:
- Szacowanie ukrytych tłuszczów: Nowe modelowanie z danymi oznaczonymi ilościami oleju z partnerskich szkół kulinarnych.
- Dokładność kuchni południowoazjatyckiej: Rozszerzony zbiór referencyjny o 3,200 nowych zweryfikowanych potraw indyjskich, pakistańskich, lankijskich i bangladeszańskich.
- Dezkompozycja posiłków wieloskładnikowych: Zaktualizowany pipeline wizji komputerowej dla lepszego rozdzielenia składników w złożonych talerzach.
- Szacowanie porcji dla produktów amorficznych: Udoskonalenia w szacowaniu głębokości przy użyciu zdjęć z różnych kątów.
Najczęściej zadawane pytania
Jak często aktualizowane są benchmarki?
Publikujemy pełne raporty benchmarkowe co kwartał. Pośrednie aktualizacje są publikowane, jeśli aktualizacja modelu przynosi statystycznie istotną zmianę w dokładności (większą niż 0.5 punktu procentowego w ogólnym MAPE).
Czy mogę zobaczyć surowe dane benchmarkowe?
Tak. Publikujemy tabele podsumowujące na naszej stronie benchmarków i udostępniamy zanonimizowany, zagregowany zestaw danych do pobrania. Indywidualne wpisy posiłków nigdy nie są uwzględniane — tylko statystyki na poziomie kategorii.
Czy dokładność Nutrola zmienia się w zależności od używanego telefonu?
Jakość aparatu wpływa na dokładność rejestrowania opartego na zdjęciach. W naszych testach flagowe telefony z 2024 roku i później (iPhone 15 i nowsze, Samsung Galaxy S24 i nowsze, Google Pixel 8 i nowsze) produkują wyniki zgodne z naszymi opublikowanymi benchmarkami. Starsze lub budżetowe urządzenia z aparatami o niższej rozdzielczości wykazują średnio o około 1 do 2 punktów procentowych wyższą dokładność, głównie z powodu zmniejszonego szczegółu w szacowaniu wielkości porcji.
Jak Nutrola radzi sobie z żywnością, której nie może zidentyfikować?
Gdy nasz wynik pewności AI spada poniżej określonego progu, aplikacja oznacza wpis i prosi użytkownika o potwierdzenie lub poprawienie identyfikacji. Około 5.2 procent posiłków rejestrowanych na zdjęciach wywołuje ten komunikat potwierdzający. Te oznaczone wpisy są wykluczane z naszych benchmarków dokładności, co oznacza, że opublikowane liczby reprezentują posiłki, w których system był pewny swojej identyfikacji.
Czy posiłki z restauracji są mniej dokładne z powodu restauracji czy rodzaju żywności?
Obie przyczyny. Posiłki z restauracji mają wyższy błąd z dwóch powodów. Po pierwsze, rzeczywiste przygotowanie (ilości tłuszczu do gotowania, ilości sosów, wielkości porcji) różni się między restauracjami i nie jest widoczne na zdjęciu. Po drugie, dania restauracyjne mają tendencję do bycia bardziej złożonymi niż posiłki domowe, z większą ilością ukrytych składników. Nasze dane pokazują, że proste dania restauracyjne (grillowana sałatka z kurczaka, kawałek sushi) są niemal tak dokładne jak ich odpowiedniki przygotowane w domu. Luka w dokładności poszerza się głównie w przypadku smażonych potraw, dań w sosach i produktów z niewidocznymi dodanymi tłuszczami.
Co z produktami pakowanymi z błędnymi etykietami producentów?
To znany problem w całej branży. Przepisy FDA pozwalają na odchylenia etykiet żywieniowych o maksymalnie 20 procent od podanych wartości dla większości składników odżywczych. Nasza dokładność kodów kreskowych wynosząca 1.8 procent odzwierciedla zgodność między naszymi danymi a etykietą producenta — niekoniecznie zgodność z tym, co faktycznie znajduje się w opakowaniu. Gdy niezależne testy laboratoryjne ujawniają niezgodności etykiet dla popularnych produktów, oznaczamy je w naszej bazie danych i odpowiednio dostosowujemy wartości referencyjne.
Jak dokładność Nutrola porównuje się do oszacowania zarejestrowanego dietetyka?
Badanie z 2025 roku opublikowane w Journal of the American Dietetic Association wykazało, że zarejestrowani dietetycy szacujący kalorie posiłków na podstawie zdjęć mieli średni błąd wynoszący 10.2 procent, z istotnymi różnicami w zależności od doświadczenia dietetyka i złożoności posiłku. Dokładność Nutrola oparta na zdjęciach wynosząca 8.9 procent znajduje się w tym samym zakresie, nieco lepsza w średniej, chociaż dietetycy osiągają lepsze wyniki w przypadku niektórych złożonych lub nietypowych potraw.
Zauważyłem, że moje zarejestrowane sumy wydają się konsekwentnie niskie. Czy to znany problem?
Tak. Nasze benchmarki pokazują systematyczny błąd niedoszacowania wynoszący około 3 do 5 procent we wszystkich kategoriach żywności, napędzany głównie przez niedoszacowanie ukrytych tłuszczów. Ujawniamy kierunek błędu w naszych tabelach benchmarkowych, aby użytkownicy mogli dostosować swoje dane, jeśli zajdzie taka potrzeba. Jeśli podejrzewasz konsekwentne niedoszacowanie, rejestrowanie tłuszczów do gotowania osobno (zamiast polegać na AI w ich szacowaniu) znacząco redukuje ten błąd.
Podsumowanie
Większość aplikacji żywieniowych prosi o twoje zaufanie, nie dając ci żadnego powodu, aby je przyznać. Pokazują ci liczby kalorii z pewnością, jednocześnie ukrywając swoje wskaźniki błędów.
Nutrola publikuje swoje standardy dokładności, ponieważ wierzymy, że odwrotne podejście jest właściwe. Oto, co te liczby pokazują: jesteśmy dokładni w obrębie 10 procent dla 79 procent posiłków i w obrębie 15 procent dla 93 procent posiłków. Najsłabiej wypadają złożone dania z ukrytymi tłuszczami, niedostatecznie reprezentowane kuchnie i posiłki wielodaniowe. Poprawiliśmy naszą ogólną dokładność z 10.4 procent błędu do 6.8 procent w ciągu ostatniego roku i publikujemy konkretne obszary, które planujemy poprawić.
Te liczby nie są idealne, i nie twierdzimy, że są. Ale są prawdziwe, są publiczne i są aktualizowane co kwartał. To standard, do którego się zobowiązujemy, i to standard, który wierzymy, że każda aplikacja żywieniowa powinna spełniać.
Jeśli wybierasz aplikację do śledzenia kalorii, zadaj proste pytanie: czy ta aplikacja może pokazać mi swoje dane o dokładności? Jeśli odpowiedź brzmi nie, zapytaj siebie, dlaczego nie.
Gotowy, aby przeksztalcic sledzenie zywienia?
Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!