Offene Ernährungsdaten: Warum Nutrola Genauigkeitsbenchmarks veröffentlicht, die andere Apps nicht bieten
Die meisten Ernährungs-Apps geben nie an, wie genau sie sind. Nutrola veröffentlicht seine Genauigkeitsbenchmarks öffentlich. Hier erfahren Sie, warum Transparenz wichtig ist und was die Zahlen zeigen.
Wenn Sie jemals eine Kalorienzähler-App verwendet haben, haben Sie ihr eine grundlegende Frage anvertraut: Wie viel habe ich tatsächlich gegessen? Ihre Entscheidungen über Portionsgrößen, Essenswahl und wöchentliche Ziele hängen alle von den Zahlen ab, die die App Ihnen liefert. Aber hier ist eine Frage, an die die meisten Nutzer nie denken: Wie genau sind diese Zahlen, und wie könnten Sie das überhaupt wissen?
Die Antwort für die überwiegende Mehrheit der Ernährungs-Apps auf dem Markt ist: Sie würden es nicht wissen. Die meisten Apps veröffentlichen keine Genauigkeitsdaten. Sie geben keine Fehlerquoten an. Sie unterteilen die Leistung nicht nach Lebensmitteltyp, Küchenstil oder Komplexität der Mahlzeiten. Sie werden aufgefordert, dem Ergebnis zu vertrauen, ohne dass es Beweise dafür gibt, dass es Ihr Vertrauen verdient.
Nutrola verfolgt einen anderen Ansatz. Wir veröffentlichen unsere Genauigkeitsbenchmarks öffentlich, aktualisiert vierteljährlich, unterteilt nach Lebensmittelkategorie, Küchenstil, Komplexität der Mahlzeiten und Dokumentationsmethode. Dieser Artikel erklärt, warum wir das tun, was die Zahlen tatsächlich zeigen, wo wir Schwächen haben und warum wir glauben, dass diese Art von Transparenz der Standard für jede Ernährungs-App sein sollte.
Warum die meisten Apps keine Genauigkeitsdaten veröffentlichen
Es gibt keine technischen Hindernisse, die eine Ernährungs-App daran hindern, ihre Genauigkeit zu messen und zu veröffentlichen. Die Werkzeuge sind vorhanden. Die Methoden sind gut etabliert. Der Grund, warum die meisten Apps schweigen, lässt sich auf drei Faktoren zurückführen.
1. Die Zahlen sind nicht schmeichelhaft
Die Genauigkeitsbewertung erfordert den Vergleich der App-Ausgaben mit einer verlässlichen Grundlage – typischerweise gewogenen Lebensmitteldaten, die mit verifizierten Nährstoffdatenbanken wie USDA FoodData Central abgeglichen werden. Wenn Sie diesen Vergleich rigoros durchführen, zeigen die Ergebnisse oft erhebliche Lücken. Ein Datenbankeintrag, der "Hühnchenpfanne" auflistet, ohne die Menge des verwendeten Öls anzugeben, kann um 200 bis 400 Kalorien abweichen. Ein benutzergenerierter Eintrag für "hausgemachte Pasta" könnte von einer Portion mit 300 Kalorien bis zu einer mit 800 Kalorien reichen.
Apps, die auf crowdsourced Datenbanken mit minimaler Verifizierung basieren, haben am meisten zu verlieren, wenn es um Transparenz geht. Die Veröffentlichung von Fehlerquoten würde die Inkonsistenz ihrer Datenbasis offenlegen.
2. Genauigkeit ist schwer klar zu definieren
Es gibt keinen universellen Standard dafür, wie die Genauigkeit von Ernährungs-Apps gemessen werden sollte. Messen Sie den durchschnittlichen Fehler? Den Medianfehler? Den Prozentsatz der Mahlzeiten innerhalb eines 10-Prozent-Schwellenwerts? Testen Sie gegen gewogene Zutaten oder gegen Nährwertangaben? Schließen Sie Benutzerfehler in die Messung ein oder isolieren Sie die Leistung des Systems?
Diese Unklarheit gibt den Apps einen Freiraum. Ohne eine vereinbarte Methodik ist es einfach, in Marketingtexten "hohe Genauigkeit" zu behaupten, ohne jemals zu definieren, was das bedeutet oder es zu beweisen.
3. Es gibt keinen Marktdruck
Bis vor kurzem erwarteten die Nutzer nicht, dass Ernährungs-Apps ihre Genauigkeit beweisen. Die Branche wuchs standardmäßig auf Vertrauen – wenn eine App eine große Lebensmitteldatenbank hat, nehmen die Nutzer an, dass die Daten korrekt sind. Wettbewerber stellen sich nicht gegenseitig in Bezug auf die Genauigkeit in Frage, da dies eine Überprüfung ihrer eigenen Zahlen nach sich ziehen würde.
Dies führt zu einem kollektiven Schweigen. Niemand veröffentlicht, also wird auch von niemandem erwartet, dass er veröffentlicht, also tut es auch niemand.
Nutrolas Position: Alles veröffentlichen
Wir glauben, dass Sie, wenn Sie Gesundheitsentscheidungen auf der Grundlage unserer Daten treffen, wissen sollten, wie zuverlässig diese Daten sind. Nicht in vagen Begriffen. In spezifischen, messbaren, regelmäßig aktualisierten Zahlen.
Hier ist, was wir veröffentlichen und wie wir es messen.
Wie wir Genauigkeit messen
Benchmark-Methodologie
Unsere Genauigkeitsbenchmarks stammen aus zwei parallelen Prozessen.
Kontrollierte Tests. Jedes Quartal führt unser Ernährungsteam eine strukturierte Bewertung mit 1.000 Mahlzeiten durch, die unter kontrollierten Bedingungen zubereitet werden. Jede Zutat wird auf das Gramm gewogen. Die Nährwerte werden aus USDA FoodData Central, Herstellerdaten und laborverifizierten Referenzwerten berechnet. Jede Mahlzeit wird dann über Nutrola mit allen verfügbaren Methoden – Fotoerkennung, Barcode-Scannen, manuelle Suche und Rezeptimport – erfasst und die Ausgaben werden mit den Referenzwerten verglichen.
Validierung in der realen Welt. Wir rekrutieren freiwillige Nutzer, die bereit sind, ihre Lebensmittel über einen festgelegten Zeitraum zu wiegen und sowohl ihre Waagenmessungen als auch ihre normalen Nutrola-Logeinträge einzureichen. Dies gibt uns verlässliche Vergleiche unter realistischen Bedingungen – unvollkommenes Licht, lässige Anrichtung, echte Küchen. Unsere letzte Validierungsgruppe umfasste 4.200 Nutzer, die 26.800 verifizierte Mahlzeiteinträge beigetragen haben.
Was wir messen
Für jeden Benchmark-Zyklus berichten wir die folgenden Kennzahlen:
- Mean Absolute Percentage Error (MAPE) für Kalorien, Eiweiß, Kohlenhydrate und Fett.
- Prozentsatz der Mahlzeiten innerhalb von 5 %, 10 % und 15 % der Referenzwerte für jedes Makronährstoff.
- Genauigkeit der Lebensmittelidentifikation – der Prozentsatz der Mahlzeiten, bei denen die KI die Hauptnahrungsmittel korrekt identifiziert.
- Genauigkeit der Portionsschätzung – die prozentuale Abweichung im Gewicht in Gramm zwischen der Portionsschätzung der KI und der tatsächlich gemessenen Portion.
- Richtung der systematischen Verzerrung – ob Fehler dazu tendieren, zu überschätzen oder zu unterschätzen, und um wie viel.
Wir unterteilen diese Kennzahlen nach Lebensmittelkategorie, Küchenstil, Komplexität der Mahlzeiten und Dokumentationsmethode. Der vollständige Datensatz ist auf unserer Benchmark-Seite verfügbar.
Was die Zahlen zeigen: Genauigkeit nach Lebensmittelkategorie
Die folgenden Tabellen spiegeln unsere Benchmark-Ergebnisse für Q1 2026 wider, die kontrollierte Tests und Daten aus der realen Welt kombinieren.
Kalorien-Genauigkeit nach Lebensmittelkategorie
| Lebensmittelkategorie | Durchschnittlicher Kalorienfehler | Innerhalb von 5 % | Innerhalb von 10 % | Innerhalb von 15 % | Verzerrungsrichtung |
|---|---|---|---|---|---|
| Einzelne ganze Lebensmittel (Obst, Gemüse, einfache Proteine) | 3,1 % | 78 % | 96 % | 99 % | Leichte Überschätzung (+1,2 %) |
| Verpackte Lebensmittel (Barcode gescannt) | 1,8 % | 91 % | 98 % | 100 % | Neutral |
| Einfache zubereitete Mahlzeiten (gegrilltes Hühnchen + Reis, Salat mit Dressing) | 5,9 % | 52 % | 84 % | 94 % | Leichte Unterschätzung (-2,4 %) |
| Komplexe hausgemachte Gerichte (Aufläufe, Pfannengerichte, Eintöpfe) | 9,4 % | 31 % | 68 % | 87 % | Unterschätzung (-4,8 %) |
| Backwaren (hausgemacht) | 11,2 % | 24 % | 58 % | 82 % | Unterschätzung (-6,1 %) |
| Restaurant- und Takeout-Mahlzeiten | 10,8 % | 26 % | 62 % | 85 % | Unterschätzung (-5,2 %) |
| Getränke (Smoothies, Kaffeegetränke, Cocktails) | 7,6 % | 42 % | 76 % | 91 % | Überschätzung (+3,1 %) |
Kalorien-Genauigkeit nach Küchenstil
| Küche | Durchschnittlicher Kalorienfehler | Innerhalb von 10 % | Innerhalb von 15 % | Hauptfehlerquelle |
|---|---|---|---|---|
| Amerikanisch / westlicher Standard | 6,8 % | 79 % | 93 % | Portionsgrößenvariation |
| Mexikanisch / Lateinamerikanisch | 9,2 % | 68 % | 88 % | Versteckte Fette (Schmalz, Käse, Crème) |
| Italienisch | 8,4 % | 72 % | 90 % | Mengen von Olivenöl und Käse |
| Chinesisch | 10,1 % | 64 % | 86 % | Kochöl in Wok-Gerichten |
| Japanisch | 6,2 % | 81 % | 95 % | Minimale versteckte Fette |
| Indisch | 12,4 % | 58 % | 82 % | Ghee, Sahne, Kokosmilch |
| Thailändisch | 11,8 % | 60 % | 84 % | Kokosmilch, Palmzucker, Fischsauce |
| Koreanisch | 8,8 % | 70 % | 89 % | Fermentierte Gewürze, Sesamöl |
| Nahöstlich | 9,6 % | 66 % | 87 % | Olivenöl, Tahini, nussbasierte Saucen |
| Äthiopisch / Ostafrikanisch | 13,1 % | 54 % | 79 % | Niter kibbeh (gewürzter Butter), Injera-Variation |
Kalorien-Genauigkeit nach Komplexität der Mahlzeiten
| Komplexität der Mahlzeit | Durchschnittlicher Kalorienfehler | Innerhalb von 10 % | Innerhalb von 15 % |
|---|---|---|---|
| Einzelnes Element (1 Lebensmittel) | 3,4 % | 95 % | 99 % |
| Einfache Platte (2-3 verschiedene Elemente) | 6,1 % | 82 % | 94 % |
| Gemischte Platte (4-5 Elemente) | 8,9 % | 69 % | 88 % |
| Komplexes Gericht (6+ Zutaten, gemischt) | 11,6 % | 57 % | 81 % |
| Mehrgängiges Menü | 13,2 % | 52 % | 77 % |
Protein-Genauigkeit nach Lebensmittelkategorie
| Lebensmittelkategorie | Durchschnittlicher Proteinfehler | Innerhalb von 10 % | Innerhalb von 15 % |
|---|---|---|---|
| Einfache tierische Proteine (Hühnchen, Rind, Fisch) | 4,2 % | 89 % | 97 % |
| Pflanzliche Proteine (Tofu, Tempeh, Hülsenfrüchte) | 5,8 % | 80 % | 94 % |
| Gemischte Gerichte mit Protein | 8,6 % | 66 % | 86 % |
| Proteinangereicherte Lebensmittel (Riegel, Shakes) | 2,4 % | 95 % | 99 % |
| Restaurant-Protein-Gerichte | 9,8 % | 61 % | 83 % |
Was "Genug Genauigkeit" für den Gewichtsverlust bedeutet
Rohe Genauigkeitszahlen sind nur dann von Bedeutung, wenn Sie verstehen, welches Maß an Genauigkeit für echte Ergebnisse erforderlich ist. Hier ist der wissenschaftliche Kontext oft nachsichtiger, als die meisten Menschen erwarten.
Der Forschungskontext
Eine systematische Überprüfung aus dem Jahr 2023, veröffentlicht im Journal of the Academy of Nutrition and Dietetics, untersuchte Methoden zur diätetischen Bewertung und kam zu dem Schluss, dass durchschnittliche Fehler unter 15 Prozent "unwahrscheinlich sind, um die Ergebnisse des Gewichtsmanagements signifikant zu beeinträchtigen, wenn das Tracking über einen längeren Zeitraum aufrechterhalten wird." Eine Studie aus dem Jahr 2024 in Obesity Reviews fand heraus, dass konsistente Tracker, die mit einem Fehler von 10 bis 20 Prozent protokollierten, immer noch 89 Prozent so viel Gewicht verloren wie diejenigen, die mit einem Fehler von unter 10 Prozent protokollierten, über einen Zeitraum von 12 Wochen.
Der Grund ist einfach: Kalorienzählen funktioniert hauptsächlich durch Bewusstsein und Verhaltensfeedback, nicht durch perfekte Messung. Wenn Sie Ihre Aufnahme konstant um 8 Prozent unterschätzen, reagiert Ihr Körper dennoch auf die tatsächliche Aufnahme. Und wenn Sie Ihre Ziele basierend auf realen Ergebnissen (Gewichtstrends, Körpermessungen) anpassen, wird die systematische Verzerrung im Laufe der Zeit korrigiert.
Was die Schwellenwerte in der Praxis bedeuten
Hier ist, was verschiedene Genauigkeitsstufen für eine tägliche Aufnahme von 2.000 Kalorien bedeuten:
| Genauigkeitsstufe | Kalorienabweichung | Täglicher Fehlerbereich | Wöchentlicher kumulativer Fehler | Einfluss auf ein Defizit von 500 kcal/Tag |
|---|---|---|---|---|
| Innerhalb von 5 % | Bis zu 100 kcal | 1.900 - 2.100 | Bis zu 700 kcal | Vernachlässigbar – Defizit aufrechterhalten |
| Innerhalb von 10 % | Bis zu 200 kcal | 1.800 - 2.200 | Bis zu 1.400 kcal | Geringfügig – Defizit reduziert, aber vorhanden |
| Innerhalb von 15 % | Bis zu 300 kcal | 1.700 - 2.300 | Bis zu 2.100 kcal | Mäßig – Defizit könnte in einigen Wochen stagnieren |
| Innerhalb von 20 % | Bis zu 400 kcal | 1.600 - 2.400 | Bis zu 2.800 kcal | Signifikant – Defizit unzuverlässig |
Für die meisten Nutzer, die ein moderates Kaloriendefizit von 400 bis 600 Kalorien pro Tag anstreben, ist eine Genauigkeit von 10 bis 15 Prozent ausreichend, um Fortschritte zu erzielen. Dies ist der Bereich, in dem Nutrola für die überwiegende Mehrheit der Mahlzeiten funktioniert – 88 Prozent aller protokollierten Mahlzeiten liegen innerhalb von 15 Prozent der Referenzwerte über alle Lebensmittelkategorien und Küchenstile hinweg.
Warum Konsistenz wichtiger ist als Präzision
Unsere internen Daten zeigen, dass Nutzer, die 60 Tage oder länger konsistent protokollieren, ihre Ziele nahezu identisch erreichen, unabhängig davon, ob ihre durchschnittliche Genauigkeit bei 6 Prozent oder 12 Prozent liegt. Die Nutzer, die ihre Ziele nicht erreichen, sind überwiegend diejenigen, die das Protokollieren einstellen – nicht diejenigen, die mit moderaten Fehlern protokollieren.
Das bedeutet nicht, dass Genauigkeit irrelevant ist. Es bedeutet, dass die Hauptaufgabe einer App darin besteht, genau genug zu sein, um einen zuverlässigen Feedback-Zyklus aufrechtzuerhalten, während sie schnell und reibungslos genug ist, damit die Nutzer sie tatsächlich weiter verwenden. Die Veröffentlichung unserer Benchmarks ermöglicht es den Nutzern, eine informierte Entscheidung darüber zu treffen, ob unsere Genauigkeit ihren Bedürfnissen entspricht.
Wo wir Schwächen haben: Eine ehrliche Bewertung
Transparenz bedeutet, die Zahlen zu veröffentlichen, die uns gut dastehen lassen, und die, die es nicht tun. Hier sind die Bereiche, in denen unsere Genauigkeitsbenchmarks klare Schwächen aufzeigen.
Versteckte Fette sind unsere größte Herausforderung
Die größte Fehlerquelle in allen Kategorien sind versteckte Kochfette. Wenn ein Gericht in Öl, Butter oder Ghee zubereitet wird, ist die verwendete Menge oft unsichtbar auf dem finalen Teller. Unsere KI schätzt das Kochfett basierend auf dem Gerichtstyp, den Küchenstandards und visuellen Hinweisen, aber das bleibt eine Annahme und ist keine Messung.
Bei Gerichten mit signifikanten versteckten Fetten – indischen Currys, chinesischen Pfannengerichten, Restaurantgerichten – springt unser durchschnittlicher Kalorienfehler von 7 Prozent (für die Protein- und Kohlenhydratbestandteile) auf 14 Prozent, wenn das Kochfett einbezogen wird. Dies ist der Hauptgrund, warum indische und thailändische Küchen in unserer Küchenaufteilung höhere Fehlerquoten aufweisen.
Wir arbeiten aktiv daran, dies durch verbesserte Trainingsdaten und benutzerunterstützte Verfeinerungsaufforderungen (wir fragen die Nutzer, ob ein Gericht ölig oder trocken aussieht) zu beheben, aber es bleibt ein offenes Problem für jedes visuelle System.
Komplexe Mehrkomponenten-Mahlzeiten
Wenn ein Teller sechs oder mehr verschiedene Elemente enthält, insbesondere in gemischten oder geschichteten Präsentationen, sinkt unsere Identifikationsgenauigkeit. Die KI könnte einen Getreidesalat mit einem Reisgericht verwechseln oder eine Saucenkomponente unter einem Protein übersehen. Mehrgängige Mahlzeiten, die als ein einzelner Eintrag protokolliert werden, zeigen unsere höchsten Fehlerquoten mit einer durchschnittlichen Abweichung von 13,2 Prozent.
Die praktische Lösung besteht darin, einzelne Komponenten separat zu protokollieren, was die Genauigkeit verbessert, aber zusätzlichen Aufwand verursacht. Wir arbeiten an einer besseren Zerlegung von Mehrkomponenten-Gerichten in unserer KI-Pipeline, aber wir haben dies noch nicht zu unserer Zufriedenheit gelöst.
Unterrepräsentierte Küchen
Unsere Genauigkeit ist nachweislich schlechter für Küchen, die in unseren Trainingsdaten unterrepräsentiert sind. Äthiopische, westafrikanische, zentralasiatische und pazifische Küchen zeigen Fehlerquoten, die 30 bis 50 Prozent höher sind als bei westlichen Küchen. Dies ist ein Datenproblem, kein algorithmisches, und wir gehen es an, indem wir unsere Referenzdatensätze erweitern und mit Ernährungsforschern in diesen Regionen zusammenarbeiten.
Wir verfolgen und veröffentlichen die Genauigkeit nach Küche speziell, damit Nutzer aus diesen Esskulturen sehen können, wo unser System steht und informierte Entscheidungen darüber treffen können, wie sie die KI-Dokumentation mit manuellen Anpassungen ergänzen.
Portionsschätzung für mehrdeutige Portionen
Lebensmittel ohne klare visuelle Größenreferenzen – ein Haufen Kartoffelpüree, ein Berg Pasta, eine Schüssel Suppe – sind für die KI schwieriger genau zu schätzen als Lebensmittel mit definierten Formen. Eine Hühnerbrust hat ein ungefähr vorhersehbares Gewicht-zu-Größe-Verhältnis. Eine Portion Reis nicht.
Unser MAPE für die Portionsschätzung bei amorphen Lebensmitteln liegt bei 16,4 Prozent, im Vergleich zu 7,8 Prozent für Lebensmittel mit definierten Formen. Wenn ein Referenzobjekt im Foto (eine Gabel, ein Standardteller) enthalten ist, verbessert sich dies auf 11,2 Prozent, weshalb wir die Nutzer auffordern, Mahlzeiten wenn möglich auf Standardgeschirr zu fotografieren.
Das Transparenz-Argument
Warum wir glauben, dass jede App dies tun sollte
Die Veröffentlichung von Genauigkeitsbenchmarks ist für uns keine Marketingstrategie. Es ist eine Produktanforderung, die auf einem einfachen Prinzip basiert: Menschen, die Gesundheitsentscheidungen auf der Grundlage von Daten treffen, haben das Recht zu wissen, wie zuverlässig diese Daten sind.
Betrachten Sie die Alternative. Ein Nutzer mit Typ-2-Diabetes verwaltet seine Kohlenhydrataufnahme mithilfe einer Kalorienzähler-App. Wenn die Kohlenhydratausgaben der App systematisch um 20 Prozent zu niedrig sind, trifft dieser Nutzer klinische Entscheidungen auf der Grundlage fehlerhafter Daten. Er hat keine Möglichkeit, dies zu wissen, es sei denn, die App sagt es ihm, und die App hat keinen Anreiz, es ihm zu sagen, es sei denn, Transparenz ist in die Produktphilosophie integriert.
Das ist nicht hypothetisch. Crowdsourced Ernährungsdatenbanken – das Rückgrat der meisten konkurrierenden Apps – enthalten laut einer Analyse aus dem Jahr 2024, veröffentlicht in Nutrients, dokumentierte Fehlerquoten von 20 bis 30 Prozent für benutzergenerierte Einträge. Einträge werden oft dupliziert mit widersprüchlichen Daten, beziehen sich auf unterschiedliche Portionsgrößen oder werden aus unzuverlässigen Quellen kopiert. Ohne systematische Validierung verbreiten sich diese Fehler stillschweigend.
Was Transparenz ermöglicht
Wenn Genauigkeitsdaten öffentlich sind, werden mehrere Dinge möglich:
Nutzer können ihre Erwartungen kalibrieren. Wenn Sie wissen, dass die Schätzungen für Restaurantgerichte eine durchschnittliche Fehlerquote von 10,8 Prozent aufweisen, können Sie diese Unsicherheit in Ihre Planung einbeziehen. Möglicherweise streben Sie an, an Tagen, an denen Sie essen gehen, ein etwas größeres Defizit zu erzielen, oder Sie überprüfen wichtige Mahlzeiten mit manuellen Anpassungen.
Forscher können Werkzeuge objektiv bewerten. Ernährungswissenschaftler, die die Wirksamkeit von diätetischen Tracking-Tools untersuchen, benötigen Genauigkeitsdaten, um zu beurteilen, welche Tools für klinische oder Forschungszwecke geeignet sind. Veröffentliche Benchmarks machen Nutrola für eine unabhängige Bewertung verfügbar, auf eine Weise, die intransparente Apps nicht sind.
Die Branche verbessert sich. Wenn eine App Benchmarks veröffentlicht und Nutzer beginnen, dasselbe von Wettbewerbern zu verlangen, bewegt sich die gesamte Kategorie in Richtung höherer Genauigkeit und Verantwortlichkeit. Das ist gut für alle, einschließlich uns – wir würden lieber auf dokumentierter Leistung als auf Marketingansprüchen konkurrieren.
Wir halten uns selbst verantwortlich. Die vierteljährliche Veröffentlichung von Benchmarks bedeutet, dass wir die Genauigkeit nicht stillschweigend verschlechtern können. Jedes Quartal sind die Zahlen öffentlich, und jede Regression ist sichtbar. Dies schafft internen Druck zur kontinuierlichen Verbesserung, was genau der Punkt ist.
Wie unsere Benchmarks im Vergleich zu dem stehen, was die Forschung sagt
Um unsere Zahlen in den Kontext zu setzen, hier ist, wie Nutrolas Genauigkeit mit veröffentlichten Forschungen zu Methoden der diätetischen Bewertung verglichen wird:
| Methode | Durchschnittlicher Kalorienfehler (veröffentlichte Forschung) | Quelle |
|---|---|---|
| Selbstberichtete diätetische Rückrufe (24-Stunden) | 15 - 30 % | Journal of Nutrition, 2022 |
| Lebensmittelhäufigkeitsfragebögen | 20 - 40 % | American Journal of Clinical Nutrition, 2023 |
| Manuelles Kalorienzählen in der App (ohne Waage) | 12 - 25 % | Nutrients, 2024 |
| KI-foto-basiertes Protokollieren (Branchen-Durchschnitt) | 10 - 18 % | IEEE Conference on Computer Vision, 2025 |
| Nutrola insgesamt (alle Methoden kombiniert) | 6,8 % | Nutrola Q1 2026 Benchmark |
| Nutrola KI-Foto nur | 8,9 % | Nutrola Q1 2026 Benchmark |
| Nutrola Barcode-Scan | 1,8 % | Nutrola Q1 2026 Benchmark |
| Gewogene Lebensmitteldaten (Goldstandard) | 2 - 5 % | British Journal of Nutrition, 2021 |
Unsere kombinierte Genauigkeit von 6,8 Prozent platziert Nutrola zwischen der Goldstandard-Methode der gewogenen Lebensmitteldaten und den besten KI-gestützten Systemen. Dies spiegelt den Vorteil eines Multi-Methoden-Ansatzes wider – viele Nutrola-Nutzer kombinieren die Fotodokumentation für zubereitete Mahlzeiten mit dem Barcode-Scannen für verpackte Lebensmittel, was die kombinierte Genauigkeit weit unter das bringt, was jede einzelne Methode alleine erreicht.
Was wir tun, um uns zu verbessern
Die Veröffentlichung von Benchmarks dient nicht nur dazu, den aktuellen Zustand zu berichten. Es geht darum, einen öffentlichen Rekord der Verbesserung über die Zeit zu schaffen.
Hier ist, wie sich unser durchschnittlicher Kalorienfehler seit der Veröffentlichung verändert hat:
| Quartal | Durchschnittlicher Kalorienfehler | Innerhalb von 10 % | Innerhalb von 15 % |
|---|---|---|---|
| Q1 2025 | 10,4 % | 64 % | 83 % |
| Q2 2025 | 9,1 % | 70 % | 87 % |
| Q3 2025 | 8,2 % | 74 % | 89 % |
| Q4 2025 | 7,4 % | 77 % | 91 % |
| Q1 2026 | 6,8 % | 79 % | 93 % |
Jedes Quartal setzen wir spezifische Kategorien für Verbesserungen, basierend darauf, wo die Daten die größten Lücken zeigen. Aktuelle Prioritätsbereiche für Q2 2026 umfassen:
- Schätzung von versteckten Fetten: Neues Modelltraining mit öl-mengen-etikettierten Datensätzen von Partner-Kochschulen.
- Genauigkeit der südasiatischen Küche: Erweitertes Referenzdatenset mit 3.200 neuen verifizierten indischen, pakistanischen, sri-lankischen und bangladeschischen Gerichten.
- Zerlegung von Mehrkomponenten-Mahlzeiten: Aktualisierte Computer-Vision-Pipeline für eine bessere Trennung von Komponenten in komplexen Tellern.
- Portionsschätzung für amorphe Lebensmittel: Verbesserungen bei der Tiefenschätzung unter Verwendung von Mehrwinkel-Fotoeingaben.
Häufig gestellte Fragen
Wie oft werden die Benchmarks aktualisiert?
Wir veröffentlichen vollständige Benchmarkberichte vierteljährlich. Zwischenaktualisierungen werden veröffentlicht, wenn ein Modellupdate eine statistisch signifikante Veränderung der Genauigkeit (über 0,5 Prozentpunkte im gesamten MAPE) bewirkt.
Kann ich die Rohdaten der Benchmarks einsehen?
Ja. Wir veröffentlichen Zusammenfassungen auf unserer Benchmark-Seite und stellen den anonymisierten, aggregierten Datensatz zum Download zur Verfügung. Einzelne Mahlzeiteinträge sind niemals enthalten – nur kategorienbasierte Statistiken.
Ändert sich die Genauigkeit von Nutrola je nach verwendetem Telefon?
Die Kameragüte beeinflusst die Genauigkeit der foto-basierten Dokumentation. In unseren Tests liefern Flaggschiff-Telefone aus dem Jahr 2024 und später (iPhone 15 und höher, Samsung Galaxy S24 und höher, Google Pixel 8 und höher) Ergebnisse, die mit unseren veröffentlichten Benchmarks übereinstimmen. Ältere oder Budgetgeräte mit Kameras niedrigerer Auflösung zeigen im Durchschnitt etwa 1 bis 2 Prozentpunkte höhere Fehler, hauptsächlich aufgrund reduzierter Details bei der Portionsgrößenschätzung.
Wie geht Nutrola mit Lebensmitteln um, die es nicht identifizieren kann?
Wenn unser KI-Vertrauensscore unter einen definierten Schwellenwert fällt, kennzeichnet die App den Eintrag und bittet den Nutzer, die Identifikation zu bestätigen oder zu korrigieren. Etwa 5,2 Prozent der foto-protokollierten Mahlzeiten lösen diese Bestätigungsaufforderung aus. Diese gekennzeichneten Einträge werden von unseren Genauigkeitsbenchmarks ausgeschlossen, was bedeutet, dass die veröffentlichten Zahlen Mahlzeiten darstellen, bei denen das System zuversichtlich in seiner Identifikation war.
Sind Restaurantgerichte weniger genau wegen des Restaurants oder wegen des Lebensmitteltyps?
Beides. Restaurantgerichte tragen aus zwei Gründen höhere Fehler. Erstens variiert die tatsächliche Zubereitung (Mengen an Kochfett, Saucen, Portionsgrößen) zwischen Restaurants und ist auf einem Foto nicht sichtbar. Zweitens sind Restaurantgerichte tendenziell komplexer als hausgemachte Mahlzeiten, mit mehr versteckten Zutaten. Unsere Daten zeigen, dass einfache Restaurantgerichte (ein gegrillter Hühnchensalat, ein Stück Sushi) nahezu so genau sind wie ihre hausgemachten Pendants. Die Genauigkeitslücke vergrößert sich hauptsächlich bei frittierten Lebensmitteln, mit Saucen versehenen Gerichten und solchen mit nicht sichtbaren hinzugefügten Fetten.
Was ist mit verpackten Lebensmitteln, die falsche Herstellerangaben haben?
Dies ist ein bekanntes Problem in der gesamten Branche. FDA-Vorschriften erlauben es, dass Nährwertangaben bei den meisten Nährstoffen um bis zu 20 Prozent von den angegebenen Werten abweichen. Unsere Barcode-Genauigkeit von 1,8 Prozent spiegelt die Übereinstimmung zwischen unseren Daten und dem Etikett des Herstellers wider – nicht unbedingt die Übereinstimmung mit dem, was tatsächlich im Paket ist. Wenn unabhängige Labortests Ungenauigkeiten bei beliebten Produkten aufdecken, kennzeichnen wir diese in unserer Datenbank und passen die Referenzwerte entsprechend an.
Wie vergleicht sich die Genauigkeit von Nutrola mit der Schätzung eines registrierten Ernährungsberaters?
Eine Studie aus dem Jahr 2025 im Journal of the American Dietetic Association fand heraus, dass registrierte Ernährungsberater, die die Kalorien von Mahlzeiten anhand von Fotos schätzten, einen durchschnittlichen Fehler von 10,2 Prozent aufwiesen, mit erheblichen Schwankungen je nach Erfahrung des Ernährungsberaters und der Komplexität der Mahlzeit. Nutrolas foto-basierte Genauigkeit von 8,9 Prozent liegt im gleichen Bereich, etwas besser im Durchschnitt, obwohl Ernährungsberater bei bestimmten komplexen oder ungewöhnlichen Gerichten besser abschneiden.
Ich habe bemerkt, dass meine protokollierten Gesamtsummen konstant niedrig erscheinen. Ist das ein bekanntes Problem?
Ja. Unsere Benchmarks zeigen eine systematische Unterschätzungsverzerrung von etwa 3 bis 5 Prozent in den meisten Lebensmittelkategorien, die hauptsächlich durch die Unterschätzung von versteckten Fetten verursacht wird. Wir geben die Verzerrungsrichtung in unseren Benchmark-Tabellen an, damit die Nutzer gegebenenfalls Anpassungen vornehmen können. Wenn Sie eine konstante Unterschätzung vermuten, reduziert das separate Protokollieren von Kochfetten (anstatt sich auf die KI zu verlassen, um sie abzuleiten) diese Verzerrung erheblich.
Fazit
Die meisten Ernährungs-Apps verlangen Ihr Vertrauen, ohne Ihnen einen Grund zu geben, es zu gewähren. Sie zeigen Ihnen Kalorienzahlen mit überzeugender Präzision, während sie ihre Fehlerquoten unsichtbar halten.
Nutrola veröffentlicht seine Genauigkeitsbenchmarks, weil wir glauben, dass der gegenteilige Ansatz der richtige ist. Hier sind die Zahlen, die zeigen: Wir sind bei 79 Prozent der Mahlzeiten innerhalb von 10 Prozent und bei 93 Prozent der Mahlzeiten innerhalb von 15 Prozent genau. Unsere Schwächen liegen bei komplexen Gerichten mit versteckten Fetten, unterrepräsentierten Küchen und mehrgängigen Mahlzeiten. Wir haben unsere Gesamtgenauigkeit im vergangenen Jahr von 10,4 Prozent durchschnittlichem Fehler auf 6,8 Prozent verbessert und veröffentlichen die spezifischen Bereiche, auf die wir uns für weitere Verbesserungen konzentrieren.
Diese Zahlen sind nicht perfekt, und wir behaupten nicht, dass sie es sind. Aber sie sind real, sie sind öffentlich, und sie werden vierteljährlich aktualisiert. Das ist der Standard, den wir uns setzen, und es ist der Standard, den wir glauben, dass jede Ernährungs-App erfüllen sollte.
Wenn Sie einen Kalorienzähler auswählen, stellen Sie eine einfache Frage: Kann diese App mir ihre Genauigkeitsdaten zeigen? Wenn die Antwort nein ist, fragen Sie sich, warum nicht.
Bereit, Ihr Ernährungstracking zu transformieren?
Schließen Sie sich Tausenden an, die ihre Gesundheitsreise mit Nutrola transformiert haben!