Porównanie baz danych żywności: crowdsourcing, weryfikacja i szacowanie AI — dokładność, koszty i kompromisy

Bezpośrednie porównanie trzech podejść do baz danych żywności wykorzystywanych w aplikacjach do śledzenia kalorii: crowdsourcing, profesjonalna weryfikacja i szacowanie AI. Zawiera dane z testów dokładności dla 20 popularnych produktów, analizę zalet i wad oraz rekomendacje metodologiczne.

Medically reviewed by Dr. Emily Torres, Registered Dietitian Nutritionist (RDN)

Branża śledzenia kalorii korzysta z trzech zasadniczo różnych podejść do budowy baz danych żywności: crowdsourcingu od użytkowników, profesjonalnej weryfikacji w oparciu o autorytatywne źródła oraz szacowania opartego na AI na podstawie zdjęć jedzenia. To nie są drobne różnice w podejściu. To odrębne metodologie, które prowadzą do znacząco różnych wyników dokładności, a wybór metody jest najważniejszym czynnikiem decydującym o tym, czy liczba kalorii na twoim ekranie jest wiarygodna.

W artykule przedstawiamy bezpośrednie porównanie wszystkich trzech podejść, wykorzystując dane dotyczące dokładności, analizę kosztów oraz uporządkowaną ocenę mocnych i słabych stron każdej metody.

Definiowanie trzech podejść

Bazy danych oparte na crowdsourcingu

W modelu crowdsourcingowym każdy użytkownik aplikacji może dodać wpis dotyczący jedzenia, wpisując wartości odżywcze z etykiety opakowania, szacując wartości z pamięci lub kopiując dane z witryny internetowej. Te wpisy są zazwyczaj dostępne dla wszystkich użytkowników natychmiast lub po minimalnych automatycznych kontrolach. Kontrola jakości opiera się na tym, że inni użytkownicy zgłaszają błędy, a wolontariusze lub lekko zatrudnieni moderatorzy przeglądają zgłoszone wpisy.

Główny przykład: MyFitnessPal, który zgromadził ponad 14 milionów wpisów dzięki otwartym wkładom użytkowników.

Bazy danych oparte na profesjonalnej weryfikacji

Zweryfikowane bazy danych opierają się na autorytatywnych źródłach (głównie rządowych bazach danych żywieniowych, takich jak USDA FoodData Central) i są uzupełniane wpisami, które przechodzą przegląd profesjonalnych dietetyków lub naukowców zajmujących się żywnością. Każdy wpis ma udokumentowane pochodzenie, a wartości są sprawdzane w odniesieniu do znanych zakresów składu dla danej kategorii żywności.

Główny przykład: Nutrola, która krzyżowo odnosi się do USDA FoodData Central oraz krajowych baz danych żywieniowych i stosuje weryfikację przez dietetyków do swoich 1,8 miliona wpisów. Innym przykładem jest Cronometer, który kuratoruje dane z USDA i NCCDB pod nadzorem profesjonalnym.

Bazy danych oparte na szacowaniu AI

Podejścia oparte na szacowaniu AI wykorzystują wizję komputerową (sieci neuronowe, transformery wizji) do identyfikacji żywności na zdjęciach i szacowania wielkości porcji przy użyciu estymacji głębokości lub skalowania obiektów referencyjnych. Zidentyfikowana żywność i oszacowana porcja są następnie porównywane z bazą danych referencyjnych, aby uzyskać szacunkową wartość kalorii.

Główny przykład: Cal AI, który wykorzystuje szacowanie oparte na zdjęciach jako swoją główną metodę śledzenia.

Porównanie dokładności: 20 popularnych produktów

Poniższa tabela porównuje dokładność trzech podejść dla 20 popularnych produktów, wykorzystując wartości laboratoryjne z USDA FoodData Central jako standard odniesienia. Wartości crowdsourcingowe reprezentują zakres znaleziony w wielu wpisach dla tej samej żywności w reprezentatywnej bazie danych opartej na crowdsourcingu. Wartości zweryfikowane reprezentują pojedynczy wpis z bazy danych zweryfikowanej opartej na USDA. Wartości szacowane przez AI reprezentują typowe zakresy z opublikowanych badań dotyczących szacowania żywności przy użyciu wizji komputerowej, w tym dane z badań Thames et al. (2021) i Meyers et al. (2015).

Produkt (100g) Referencja USDA (kcal) Zakres crowdsourcingowy (kcal) Błąd crowdsourcingowy Wartość zweryfikowana (kcal) Błąd zweryfikowany Zakres szacowania AI (kcal) Błąd AI
Pierś z kurczaka, pieczona 165 130–231 -21% do +40% 165 0% 140–210 -15% do +27%
Ryż biały, gotowany 130 110–170 -15% do +31% 130 0% 110–180 -15% do +38%
Banan, surowy 89 85–135 -4% do +52% 89 0% 75–120 -16% do +35%
Chleb pełnoziarnisty 247 220–280 -11% do +13% 247 0% 200–300 -19% do +21%
Ser cheddar 403 380–440 -6% do +9% 403 0% 350–480 -13% do +19%
Łosoś, gotowany 208 180–260 -13% do +25% 208 0% 170–270 -18% do +30%
Brokuły, surowe 34 28–55 -18% do +62% 34 0% 25–50 -26% do +47%
Jogurt grecki, naturalny 59 50–130 -15% do +120% 59 0% 50–90 -15% do +53%
Migdały, surowe 579 550–640 -5% do +11% 579 0% 500–680 -14% do +17%
Oliwa z oliwek 884 800–900 -10% do +2% 884 0% N/A (ciecz) N/A
Batat, pieczony 90 80–120 -11% do +33% 90 0% 75–130 -17% do +44%
Wołowina mielona, 85% chuda 250 220–280 -12% do +12% 250 0% 200–310 -20% do +24%
Awokado 160 140–240 -13% do +50% 160 0% 130–220 -19% do +38%
Jajko, całe, gotowane 155 140–185 -10% do +19% 155 0% 130–200 -16% do +29%
Owsianka, gotowana 71 55–130 -23% do +83% 71 0% 60–110 -15% do +55%
Jabłko, surowe 52 47–72 -10% do +38% 52 0% 40–75 -23% do +44%
Makaron, gotowany 131 110–200 -16% do +53% 131 0% 100–180 -24% do +37%
Tofu, twarde 144 70–176 -51% do +22% 144 0% 100–190 -31% do +32%
Ryż brązowy, gotowany 123 110–160 -11% do +30% 123 0% 100–170 -19% do +38%
Masło orzechowe 588 560–640 -5% do +9% 588 0% N/A (pasta) N/A

Kluczowe obserwacje z tabeli:

Zakres wartości crowdsourcingowych jest najszerszy dla produktów, które występują w wielu odmianach (jogurt grecki, owsianka, tofu), ponieważ użytkownicy często mylą różne przygotowania, procenty tłuszczu lub wielkości porcji. Zweryfikowana baza danych produkuje wartości identyczne z referencjami USDA, ponieważ bezpośrednio się na nich opiera. Szacowanie AI wykazuje stałą zmienność, głównie związaną z błędami w szacowaniu wielkości porcji, a nie błędami w identyfikacji żywności.

Kompletna analiza zalet i wad

Bazy danych oparte na crowdsourcingu

Aspekt Ocena
Zakres pokrycia Doskonały — miliony wpisów, w tym regionalne, restauracyjne i markowe produkty
Szybkość nowych wpisów Bardzo szybka — nowe produkty dostępne w ciągu kilku godzin od zgłoszenia przez użytkownika
Dokładność makroskładników Słaba do umiarkowanej — średnie błędy wynoszą 15-30% (Tosi et al., 2022)
Dokładność mikroskładników Słaba — większość wpisów crowdsourcingowych nie zawiera danych o mikroskładnikach
Zarządzanie duplikatami Słabe — liczne duplikaty z sprzecznymi wartościami
Pochodzenie danych Brak — źródło wartości nie jest udokumentowane
Koszt budowy Prawie zerowy — użytkownicy wnoszą wkład pracy za darmo
Koszt utrzymania Niski — społeczność samodzielnie moderuje przy minimalnym nadzorze profesjonalnym
Przydatność do badań Ograniczona — Evenepoel et al. (2020) zauważyli problemy z dokładnością w zastosowaniach badawczych

Bazy danych oparte na profesjonalnej weryfikacji

Aspekt Ocena
Zakres pokrycia Dobry — 1-2 miliony wpisów obejmujących popularne i markowe produkty
Szybkość nowych wpisów Umiarkowana — weryfikacja wydłuża czas dodawania
Dokładność makroskładników Wysoka — w granicach 5-10% wartości laboratoryjnych
Dokładność mikroskładników Wysoka — wpisy pochodzące z USDA zawierają ponad 80 składników odżywczych
Zarządzanie duplikatami Doskonałe — pojedynczy kanoniczny wpis dla każdego produktu
Pochodzenie danych Pełne — źródło udokumentowane i weryfikowalne
Koszt budowy Wysoki — wymaga pracy profesjonalnych dietetyków
Koszt utrzymania Umiarkowany — bieżąca weryfikacja nowych wpisów i aktualizacji
Przydatność do badań Wysoka — metodologia zgodna z narzędziami badawczymi

Bazy danych oparte na szacowaniu AI

Aspekt Ocena
Zakres pokrycia Teoretycznie nieograniczony — może oszacować każdą sfotografowaną żywność
Szybkość nowych wpisów Natychmiastowa — nie jest potrzebny wpis do bazy danych
Dokładność makroskładników Słaba do umiarkowanej — błąd złożony z identyfikacji + szacowania porcji
Dokładność mikroskładników Bardzo słaba — AI nie może oszacować mikroskładników na podstawie wyglądu
Zarządzanie duplikatami Nie dotyczy — szacunki generowane są na podstawie zdjęcia
Pochodzenie danych Algorytmiczne — wagi modelu, brak ścisłych źródeł danych
Koszt budowy Wysoki początkowy (szkolenie modelu), prawie zerowy marginalny
Koszt utrzymania Umiarkowany — okresowe szkolenie modelu wymagane
Przydatność do badań Ograniczona — Thames et al. (2021) udokumentowali znaczną zmienność szacowania

Hybrydowe podejścia: najlepsze z obu światów

Niektóre aplikacje łączą różne podejścia, aby zminimalizować słabości każdej z metod.

Rejestrowanie AI + zweryfikowana baza danych (podejście Nutrola). Nutrola wykorzystuje rozpoznawanie zdjęć AI i rejestrowanie głosowe jako warstwę wygody do identyfikacji żywności, a następnie porównuje zidentyfikowaną żywność z profesjonalnie zweryfikowaną bazą danych zawierającą 1,8 miliona wpisów. To połączenie zachowuje szybkość i łatwość rejestrowania AI, jednocześnie zapewniając, że dane żywieniowe dotyczące każdej zidentyfikowanej żywności zostały skontrolowane w odniesieniu do USDA FoodData Central i przeglądane przez dietetyków. Użytkownik korzysta zarówno z wygody AI, jak i dokładności zweryfikowanych danych.

Baza danych crowdsourcingowa + algorytmiczne dostosowanie (podejście MacroFactor). MacroFactor korzysta z kuratorowanej bazy danych uzupełnionej danymi użytkowników, ale stosuje algorytm, który dostosowuje cele kaloryczne na podstawie rzeczywistych trendów wagowych w czasie. To częściowo kompensuje błędy indywidualnych wpisów w bazie danych, wykorzystując ciało użytkownika jako ostateczny standard odniesienia.

Kuratorowana baza danych + etykietowanie źródła (podejście Cronometer). Cronometer oznacza każdy wpis żywności etykietą z jego źródłem danych (USDA, NCCDB lub producent), co pozwala świadomym użytkownikom preferencyjnie wybierać wpisy z najbardziej autorytatywnych źródeł.

Jak błędy kumulują się w codziennym śledzeniu

Praktyczny wpływ podejścia do bazy danych staje się jasny, gdy błędy kumulują się w ciągu całego dnia śledzenia.

Rozważmy użytkownika rejestrującego 15 wpisów żywnościowych dziennie (pięć posiłków i przekąsek, z których każdy zawiera średnio trzy produkty):

Z bazą danych crowdsourcingową (średni błąd ±20%):

  • Każdy wpis odchyla się od rzeczywistej wartości średnio o ±20%.
  • Zakładając losowy rozkład błędów, dzienny szacunek może odchylać się od rzeczywistego spożycia o 200-400 kalorii przy diecie 2,000 kalorii.
  • W ciągu tygodnia skumulowany błąd może wynosić od 1,400 do 2,800 kalorii, co odpowiada całkowitemu deficytowi potrzebnemu do utraty 0,5-1 funta.

Z zweryfikowaną bazą danych (średni błąd ±5%):

  • Każdy wpis odchyla się od rzeczywistej wartości średnio o ±5%.
  • Dzienny błąd szacunkowy: około 50-100 kalorii przy diecie 2,000 kalorii.
  • Tygodniowy skumulowany błąd: 350-700 kalorii, co jest do zarządzania w ramach typowych celów deficytowych.

Z szacowaniem AI (średni błąd ±25-35%):

  • Błąd kumulacyjny wynikający z identyfikacji żywności i szacowania wielkości porcji.
  • Dzienny błąd szacunkowy: 250-500+ kalorii.
  • Tygodniowy skumulowany błąd: 1,750-3,500+ kalorii.

Freedman et al. (2015), publikując w American Journal of Epidemiology, wykazali, że błędy w bazach danych dotyczących składu żywności są głównym czynnikiem przyczyniającym się do całkowitego błędu oceny diety, często przewyższającym wkład błędów w szacowaniu wielkości porcji. To odkrycie bezpośrednio wskazuje na metodologię bazy danych jako najważniejszy czynnik wpływający na dokładność śledzenia.

Dlaczego większość aplikacji opiera się na crowdsourcingu

Mimo ograniczeń w dokładności, crowdsourcing dominuje w branży śledzenia kalorii z prostych powodów ekonomicznych.

Brak marginalnych kosztów. Każdy wpis zgłoszony przez użytkownika nic nie kosztuje aplikacji. Zweryfikowane wpisy kosztują od 5 do 15 dolarów za czas przeglądu profesjonalnego. Przy dużej skali ta różnica kosztów jest ogromna.

Szybkie pokrycie. Baza danych oparta na crowdsourcingu może dodać nowe produkty w ciągu kilku godzin od ich wprowadzenia na rynek. Zweryfikowana baza danych może zająć dni lub tygodnie.

Postrzegana kompleksowość. Użytkownicy utożsamiają "więcej wpisów" z "lepszą aplikacją". Baza danych zawierająca 14 milionów wpisów wydaje się bardziej kompleksowa niż baza danych zawierająca 1,8 miliona wpisów, nawet jeśli mniejsza baza danych jest dokładniejsza w każdym wpisie.

Efekty sieciowe. W miarę jak więcej użytkowników wnosi wpisy, baza danych wydaje się bardziej kompleksowa, przyciągając więcej użytkowników, którzy dodają kolejne wpisy. Ten cykl nagradza skalę kosztem dokładności.

W rezultacie na rynku najpopularniejsze aplikacje (MFP, FatSecret) korzystają z najmniej dokładnej metodologii, a najbardziej dokładne aplikacje (Nutrola, Cronometer) mają mniejsze, ale bardziej wiarygodne bazy danych. Świadomi użytkownicy, którzy rozumieją ten kompromis, konsekwentnie wybierają dokładność zamiast rozmiaru.

Przyszłość: zbieżne podejścia

Różnica między bazami danych opartymi na crowdsourcingu, weryfikacji i szacowaniu AI może się zatarć w miarę rozwoju technologii.

Weryfikacja wspomagana AI. Modele uczenia maszynowego mogą być szkolone do oznaczania wpisów crowdsourcingowych, które odbiegają od oczekiwanych zakresów składu, automatycznie identyfikując prawdopodobne błędy do przeglądu profesjonalnego. To mogłoby przynieść dokładność na poziomie weryfikacji większym bazom danych.

Wizja komputerowa z zweryfikowanym zapleczem. Obecne podejście Nutrola, wykorzystujące AI do identyfikacji żywności w połączeniu z zweryfikowaną bazą danych dla danych żywieniowych, reprezentuje obecnie najlepsze praktyki. W miarę jak modele rozpoznawania żywności poprawiają swoją dokładność, to hybrydowe podejście stanie się coraz bardziej płynne.

Automatyczne krzyżowe odniesienie. Proces krzyżowego odniesienia wpisów żywnościowych z wieloma krajowymi bazami danych może być częściowo zautomatyzowany, co zmniejsza koszt weryfikacji z wielu źródeł, jednocześnie zachowując korzyści z dokładności.

Te trendy sugerują, że przyszłość baz danych do śledzenia kalorii leży w inteligentnych połączeniach wygody AI i dokładności weryfikowanej, a nie w poleganiu na pojedynczym podejściu.

Najczęściej zadawane pytania

Które podejście do bazy danych jest najbardziej dokładne w śledzeniu kalorii?

Profesjonalnie zweryfikowane bazy danych oparte na danych analizowanych przez rząd (USDA FoodData Central) są najbardziej dokładne, z typowymi błędami makroskładników w granicach 5-10 procent wartości laboratoryjnych. Bazy danych oparte na crowdsourcingu wykazują błędy na poziomie 15-30 procent (Tosi et al., 2022), a szacowanie AI pokazuje błędy złożone na poziomie 20-40 procent (Thames et al., 2021). Nutrola korzysta z zweryfikowanej bazy danych opartej na USDA z krzyżową weryfikacją przez dietetyków.

Dlaczego MyFitnessPal ma tak wiele duplikatów wpisów?

Otwarte podejście crowdsourcingowe MyFitnessPal pozwala każdemu użytkownikowi na dodawanie wpisów bez sprawdzania istniejących duplikatów. Kiedy wielu użytkowników zgłasza swoją wersję "pierś z kurczaka, gotowana", baza danych gromadzi liczne wpisy dla tej samej żywności z różnymi wartościami odżywczymi. Bez systematycznego procesu usuwania duplikatów, te duplikaty utrzymują się i wprowadzają zamieszanie dla użytkowników, którzy muszą wybierać między sprzecznymi wpisami.

Czy szacowanie kalorii AI może zastąpić śledzenie oparte na bazie danych?

Na chwilę obecną nie. Szacowanie oparte na zdjęciach AI wprowadza błędy złożone wynikające z niepewności identyfikacji żywności i niepewności szacowania wielkości porcji. Thames et al. (2021) zgłosili błędy w szacowaniu wielkości porcji wynoszące 20-40 procent. Jednak rejestrowanie AI jest najbardziej efektywne, gdy jest używane jako wygodna metoda wprowadzania danych w połączeniu z zweryfikowanym zapleczem bazy danych, co jest podejściem Nutrola: AI identyfikuje żywność, a zweryfikowana baza danych dostarcza dokładne dane żywieniowe.

Jak Nutrola łączy AI i dane zweryfikowane?

Nutrola wykorzystuje rozpoznawanie zdjęć AI i rejestrowanie głosowe jako funkcje wygody do identyfikacji żywności. Kiedy użytkownik fotografuje posiłek lub opisuje go głosowo, AI identyfikuje produkty. Te zidentyfikowane produkty są następnie porównywane z bazą danych Nutrola zawierającą 1,8 miliona wpisów zweryfikowanych przez dietetyków, pochodzących z USDA FoodData Central i krzyżowo odniesionych do międzynarodowych baz danych. Ta architektura dostarcza wygody AI bez poświęcania dokładności bazy danych.

Czy mniejsza zweryfikowana baza danych jest lepsza od większej bazy danych opartej na crowdsourcingu?

Dla dokładności śledzenia — tak. Zweryfikowana baza danych zawierająca 1,8 miliona wpisów z udokumentowanym pochodzeniem i profesjonalnym przeglądem będzie produkować dokładniejsze szacunki kalorii niż baza danych oparta na crowdsourcingu zawierająca 14 milionów wpisów, które zawierają liczne duplikaty i niezweryfikowane zgłoszenia. Dokładność na wpis ma większe znaczenie niż całkowita liczba wpisów. Jeśli produkt znajduje się w obu bazach danych, wpis zweryfikowany prawie zawsze będzie dokładniejszy.

Gotowy, aby przeksztalcic sledzenie zywienia?

Dolacz do tysiecy osob, ktore przeksztalcily swoja podroz zdrowotna z Nutrola!