AI 칼로리 추적 정확도: 20개 요리에서 500개 요리를 테스트한 결과
AI 사진 추적이 어떤 요리를 가장 잘 처리하고, 어떤 요리를 잘 못하는지 알아보았습니다. Nutrola의 Snap & Track을 사용해 20개 요리에서 500개 요리를 테스트하여 AI의 강점과 약점을 파악했습니다.
대부분의 AI 음식 인식 모델은 주로 서양 음식에 대해 훈련되었습니다. 이는 로스앤젤레스 델리의 그릴 치킨 샐러드와 뉴욕의 페퍼로니 피자가 거의 완벽하게 인식되는 반면, 에티오피아의 도로 와트나 필리핀의 시시그는 알고리즘이 헷갈릴 수 있음을 의미합니다. 우리는 이 정확도 차이가 얼마나 큰지 알고 싶어서, 통제된 테스트를 진행했습니다: 500개의 실제 요리, 20개 요리, 각 요리는 무게를 측정하고 영양사 계산 값과 교차 검증했습니다. 그 결과는 다음과 같습니다.
방법론: 500개 요리 테스트 방법
우리는 이 연구를 실제 조건에 최대한 가깝게 설계했습니다. 방법은 다음과 같습니다:
- 총 500개 요리, 각 요리당 25개, 레스토랑과 가정 주방에서 수집.
- 20개 요리를 선정하여 광범위한 지리적 및 요리적 범위를 대표.
- 각 요리는 표준 조건에서 촬영 — 자연광, 단일 접시, 위에서 아래로 및 45도 각도 — 스마트폰 카메라를 사용하여 (스튜디오 설정 없음).
- 각 요리는 보정된 주방 저울로 무게를 측정하고, 등록된 영양사가 재료를 분해하여 기준 칼로리 수치를 산출.
- 사진은 Nutrola의 Snap & Track AI에 제출되어 칼로리 추정을 받았습니다.
- 우리는 AI 추정치를 영양사 기준과 비교하고, 평균 칼로리 편차(백분율), 음식 식별률(AI가 요리나 주요 성분을 올바르게 명명했는지), 기준 값의 10% 및 15% 이내에 포함된 요리의 비율을 측정했습니다.
이 연구는 실험실 연구가 아니며, 임상 수준의 정밀도를 주장하지 않습니다. 그러나 500개 요리는 AI 음식 인식이 뛰어난 부분과 부족한 부분에서 명확한 패턴을 드러내기에 충분한 데이터입니다.
테스트한 20개 요리
우리는 세 가지 기준에 따라 요리를 선택했습니다: 세계적인 인기, 다양한 조리 방법, AI 훈련 데이터에서 소외된 음식 카테고리의 대표성.
- 미국
- 이탈리아
- 멕시코
- 중국
- 일본
- 한국
- 인도
- 태국
- 베트남
- 중동 / 레바논
- 터키
- 그리스
- 에티오피아
- 나이지리아
- 브라질
- 프랑스
- 독일
- 스페인
- 필리핀
- 카리브해
각 요리는 해당 요리의 범위를 포괄하는 25개 요리로 구성되었습니다 — 전채, 주요 요리, 사이드, 길거리 음식. 우리는 "사진이 잘 나오는" 요리(스시 플래터, 개별 타코)와 도전적인 요리(커리, 스튜, 캐서롤)를 의도적으로 포함했습니다.
전체 결과: 정확도별로 순위 매긴 20개 요리
다음은 평균 칼로리 편차에 따라 가장 정확한 것부터 가장 부정확한 것까지 순위 매긴 결과입니다:
| 순위 | 요리 | 테스트한 요리 수 | 평균 칼로리 편차 | 음식 ID 비율 | 10% 이내 | 15% 이내 |
|---|---|---|---|---|---|---|
| 1 | 일본 | 25 | 5.8% | 96% | 84% | 96% |
| 2 | 미국 | 25 | 6.2% | 98% | 80% | 92% |
| 3 | 이탈리아 | 25 | 6.5% | 96% | 80% | 92% |
| 4 | 한국 | 25 | 7.1% | 92% | 76% | 88% |
| 5 | 독일 | 25 | 7.4% | 92% | 72% | 88% |
| 6 | 그리스 | 25 | 7.9% | 88% | 68% | 84% |
| 7 | 프랑스 | 25 | 8.3% | 88% | 64% | 84% |
| 8 | 스페인 | 25 | 8.6% | 88% | 64% | 80% |
| 9 | 멕시코 | 25 | 9.1% | 84% | 60% | 80% |
| 10 | 베트남 | 25 | 9.4% | 84% | 60% | 76% |
| 11 | 브라질 | 25 | 9.8% | 80% | 56% | 76% |
| 12 | 터키 | 25 | 10.2% | 80% | 52% | 72% |
| 13 | 중국 | 25 | 10.7% | 80% | 48% | 72% |
| 14 | 중동 | 25 | 11.3% | 76% | 48% | 68% |
| 15 | 필리핀 | 25 | 12.1% | 72% | 44% | 64% |
| 16 | 카리브해 | 25 | 12.8% | 68% | 40% | 60% |
| 17 | 나이지리아 | 25 | 13.4% | 64% | 36% | 56% |
| 18 | 태국 | 25 | 13.9% | 68% | 36% | 56% |
| 19 | 인도 | 25 | 14.6% | 64% | 32% | 52% |
| 20 | 에티오피아 | 25 | 15.8% | 56% | 28% | 48% |
전체 500개 요리 평균: 9.8% 칼로리 편차, 78% 음식 식별률, 56% 10% 이내, 74% 15% 이내.
가장 정확한 5개 요리 (이유 포함)
1. 일본 (5.8% 평균 편차)
일본 음식은 세계에서 AI에 가장 친화적인 요리로 평가받습니다. 스시 롤, 사시미 조각, 튀김 조각, 도시락은 시각적으로 구별되는 개별 아이템으로 제공됩니다. 밥은 일반적으로 명확하게 정의된 부분으로 제공됩니다. AI는 조각 수를 세고 크기를 추정하며 잘 구축된 훈련 데이터베이스와 비교할 수 있습니다. 일본의 음식 문화는 또한 표준화된 프레젠테이션을 선호합니다 — 한 레스토랑의 캘리포니아 롤은 다른 레스토랑의 캘리포니아 롤과 거의 동일하게 보입니다.
최고 성과: 니기리 스시 (3.2% 편차), 에다마메 (2.9%), 오니기리 (4.1%) 최저 성과: 라멘 (11.4% — 국물 칼로리 추정이 어렵고), 오코노미야키 (9.8%)
2. 미국 (6.2% 평균 편차)
미국 음식은 두 가지 주요 장점이 있습니다: AI 훈련 데이터에서의 높은 비율과 포장된, 표준화된 또는 체인 레스토랑 품목의 높은 비율. 빅맥은 어디서나 동일하게 보입니다. 핫도그는 예측 가능한 크기를 가지고 있습니다. 샐러드는 일반적으로 인식 가능한, 분리된 재료로 구성됩니다. 미국 가정 요리 — 햄버거, 그릴 치킨, 구운 감자 — 도 시각적으로 구별되는 구성 요소로 이루어져 있습니다.
최고 성과: 햄버거 (3.8%), 그릴 치킨 가슴살 (4.1%), 시저 샐러드 (5.2%) 최저 성과: 캐서롤 (12.3%), 로딩 나초 (10.9%)
3. 이탈리아 (6.5% 평균 편차)
이탈리아 요리는 일본과 유사한 이유로 높은 점수를 받습니다 — 많은 요리가 표준화되고 시각적으로 인식 가능한 형태를 가지고 있습니다. 마르게리타 피자, 스파게티, 카프레제 샐러드, 리조또는 모두 시각적으로 구별되며 음식 이미지 데이터셋에서 많이 나타납니다. 파스타 모양은 식별 가능하고, 토핑은 일반적으로 요리 위에 놓여져 혼합되지 않습니다.
최고 성과: 마르게리타 피자 (3.5%), 카프레제 샐러드 (4.0%), 브루스케타 (4.8%) 최저 성과: 라자냐 (11.2% — 층이 있는 요리는 치즈와 고기를 숨기고), 카르보나라 (9.6% — 크림과 계란 함량이 다양함)
4. 한국 (7.1% 평균 편차)
한국 음식은 4위에 올라 놀라웠습니다. 주요 요인은 한국식 식사가 일반적으로 여러 개의 작은 반찬(반찬)과 함께 제공되어 개별 항목 인식이 용이하다는 점입니다. 비빔밥은 재료를 밥 위에 시각적으로 구분된 섹션으로 제공합니다. 김밥은 식별 가능한 둥글게 썰려 있습니다. 김치와 절임 반찬은 시각적으로 구별됩니다.
최고 성과: 김밥 (4.2%), 비빔밥 (5.8%), 김치 (3.1%) 최저 성과: 찌개/스튜 (12.7%), 소스가 있는 떡볶이 (10.1%)
5. 독일 (7.4% 평균 편차)
독일 요리는 대형, 시각적으로 구별되는 아이템 — 소시지, 슈니첼, 프레첼, 감자 만두 — 을 특징으로 하여 AI가 식별하고 크기를 측정하기 쉽습니다. 접시는 혼합된 요리보다는 분리된 구성 요소로 이루어져 있습니다. 소시지 종류는 서로 시각적으로 구별 가능하며, 빵 제품은 표준적인 모양과 크기를 가지고 있습니다.
최고 성과: 브랏부르스트 (4.5%), 프레첼 (4.9%), 슈니첼 (6.2%) 최저 성과: 아인트옵프/스튜 (11.8%), 다양한 드레싱이 있는 감자 샐러드 (9.4%)
가장 부정확한 5개 요리 (이유 포함)
20. 에티오피아 (15.8% 평균 편차)
에티오피아 요리는 모든 지표에서 AI에게 가장 도전적이었습니다. 핵심 문제는: 인제라 기반의 식사가 여러 스튜(와트)와 채소 요리를 하나의 큰 평평한 빵 위에 함께 제공하여 서로 겹치고 혼합되는 경우가 많습니다. AI는 한 요리가 끝나는 지점과 다른 요리가 시작되는 지점을 판단하는 데 어려움을 겪습니다. 도로 와트, 미시르 와트, 키트포는 시각적으로 유사하며 — 어두운 소스가 많은 요리로 구별할 수 있는 표면 특징이 거의 없습니다. 버터(니터 키베)는 소스 아래에서 보이지 않습니다.
낮은 음식 식별률(56%)은 훈련 데이터의 진정한 격차를 반영합니다. 에티오피아 음식은 여전히 세계 음식 이미지 데이터셋에서 과소 대표되고 있습니다.
19. 인도 (14.6% 평균 편차)
인도 요리는 AI에게 도전적인 요소가 많습니다. 커리는 시각적으로 불투명합니다 — 사진만으로는 버터 치킨 안에 얼마나 많은 기름, 크림 또는 코코넛 밀크가 들어 있는지 알 수 없습니다. 달은 기름의 온도에 따라 150에서 400칼로리까지 다양합니다. 그레이비는 요리마다 비슷하게 보입니다: 코르마, 티카 마살라, 로간 조시는 사진에서 거의 동일하게 나타나지만 칼로리는 수백 차이가 날 수 있습니다.
빵도 또 다른 변수입니다. 일반 로티는 대략 100칼로리이고, 레스토랑의 버터 난은 300칼로리를 초과할 수 있습니다. 사진에서는 비슷하게 보이지만 칼로리 차이는 엄청납니다.
기름 요인: 많은 인도 요리는 기름을 넉넉히 부어 마무리하며, 이는 섞여서 보이지 않게 됩니다. 우리의 영양사 기준 값은 많은 요리에서 기름과 기름이 전체 칼로리의 25-40%를 차지한다고 보여주었습니다 — AI가 단순히 볼 수 없는 칼로리입니다.
18. 태국 (13.9% 평균 편차)
태국 요리는 인도 음식과 유사한 여러 도전 과제를 공유합니다: 숨겨진 지방 함량이 있는 코코넛 밀크 기반의 커리, 기름의 양이 가변적인 볶음 요리, 재료를 가리는 소스. 그린 커리는 코코넛 밀크 비율에 따라 한 그릇에 300에서 600칼로리까지 다양할 수 있습니다. 팟타이는 타마린드 페이스트, 땅콩, 기름에 따라 칼로리 수치가 크게 변동합니다 — 재료가 위에 보이지 않고 전체에 분산되어 있습니다.
피쉬 소스와 설탕, 두 가지 기본 태국 양념은 사진에서 완전히 보이지 않는 칼로리를 추가합니다.
17. 나이지리아 (13.4% 평균 편차)
나이지리아 음식은 두 가지 도전에 직면해 있습니다: 훈련 데이터에서의 제한된 대표성과 칼로리가 높은 조리 방법. 졸로프 라이스는 조리 중 기름을 흡수하여 표면에 보이지 않습니다. 에구시 수프는 고칼로리 재료인 멜론 씨와 팜 오일로 만들어지며, 이 두 가지는 요리에 섞여 있습니다. 푸푸(얌)는 칼로리가 높은 전분으로 겉보기에는 가벼워 보입니다.
AI는 서로 다른 나이지리아 수프를 구별하는 데 어려움을 겪었습니다 — 오그보노, 에구시, 오크라 수프는 사진에서 비슷하게 보였지만 팜 오일과 씨앗 함량의 차이로 인해 칼로리 프로필이 크게 달랐습니다.
16. 카리브해 (12.8% 평균 편차)
카리브해 요리는 여러 가지 복잡한 요소를 결합합니다: 숨겨진 지방이 있는 스튜 고기(옥수수, 커리 염소), 코코넛 밀크 기반의 쌀, 기름 흡수량이 가변적인 튀긴 플랜테인, 그리고 펠라우와 같은 일품 요리. AI는 자주 보이는 그릴 자국과 식별 가능한 형태의 저크 치킨에서는 잘 작동했지만, 소스가 단백질을 가리는 브라운 스튜 요리와 커리 준비에서는 성과가 저조했습니다.
숨겨진 칼로리 문제: 어떤 요리가 AI를 가장 속이는가
이 테스트에서 가장 중요한 발견 중 하나는 우리가 "숨겨진 칼로리 격차"라고 부르는 것입니다 — AI가 볼 수 있는 것과 실제 요리에 포함된 것 사이의 차이. 우리는 AI의 추정치와 실제 칼로리 수치 간의 가장 큰 격차가 어떤 요리에서 발생하는지를 살펴보았습니다. 이는 주로 보이지 않는 지방과 기름에 의해 발생합니다.
| 요리 | 평균 숨겨진 지방 칼로리 (각 요리당) | 숨겨진 지방에서 오는 총 칼로리 비율 | 숨겨진 지방으로 인한 AI 과소 추정 |
|---|---|---|---|
| 인도 | 187 kcal | 34% | -22% |
| 에티오피아 | 165 kcal | 31% | -20% |
| 태국 | 152 kcal | 29% | -18% |
| 나이지리아 | 148 kcal | 28% | -17% |
| 중국 | 134 kcal | 24% | -14% |
| 중동 | 128 kcal | 23% | -13% |
| 카리브해 | 124 kcal | 22% | -12% |
| 필리핀 | 118 kcal | 21% | -11% |
| 터키 | 112 kcal | 20% | -10% |
| 브라질 | 98 kcal | 17% | -8% |
패턴은 명확합니다: 조리 기름, 기름, 코코넛 밀크, 견과류 기반 소스를 많이 사용하는 요리는 AI 칼로리 추적기를 속여 과소 추정하게 만듭니다. 이는 Nutrola에만 국한된 결함이 아닙니다 — 사진 기반 칼로리 추정의 근본적인 한계입니다. 카메라는 녹아 있는 지방을 볼 수 없습니다.
실용적인 의미: 만약 당신이 이 표의 상반부에 있는 요리를 자주 먹는다면, AI 추정치가 낮게 나올 것으로 예상해야 하며, 소스가 많은 요리와 스튜 기반 요리에는 10-20%의 수동 수정을 추가하는 것을 고려해야 합니다.
Nutrola가 소외된 요리의 정확도를 개선하는 방법
우리는 이 데이터를 발표하여 저조한 성과를 변명하려는 것이 아닙니다 — 우리는 투명성이 개선을 촉진한다고 믿기 때문에 이를 발표합니다. 현재 우리는 다음과 같은 조치를 취하고 있습니다:
소외된 요리를 위한 훈련 데이터 확장
우리의 이미지 훈련 파이프라인은 역사적으로 북미 및 유럽 음식에 치우쳐 있었습니다. 우리는 남아시아, 서아프리카, 동아프리카, 동남아시아, 카리브해의 음식 사진작가 및 레시피 데이터베이스와 적극적으로 협력하여 80% 미만의 음식 식별률을 기록한 요리를 위한 훈련 세트를 대폭 확장하고 있습니다.
지역 음식 데이터베이스 파트너십
칼로리 추정은 그 뒤에 있는 영양 데이터만큼이나 좋습니다. 우리는 인도, 나이지리아, 에티오피아, 태국의 영양 연구 기관과 파트너십을 구축하여 지역별 영양 데이터를 통합하고 있습니다. 델리에서 만든 "버터 치킨"은 영국 테이크아웃 버전과 칼로리 프로필이 다르며, 우리의 데이터베이스는 이를 반영해야 합니다.
요리별 AI 프롬프트
Nutrola의 AI가 요리 카테고리(예: 인도, 태국, 에티오피아)를 감지하면 이제 요리별 수정 계수를 적용합니다. 시스템이 커리를 식별하면 숨겨진 지방을 고려하여 자동으로 상향 조정합니다. 이는 완벽한 해결책은 아니지만, 내부 테스트 결과 인도 음식의 평균 편차를 14.6%에서 11.2%로, 태국 음식은 13.9%에서 10.8%로 줄이는 데 도움이 됩니다.
사용자 피드백 루프
Nutrola 사용자가 AI 추정치를 수동으로 수정할 때마다 그 수정 사항은 모델에 피드백됩니다. 더 많은 활동적인 사용자 기반을 가진 요리는 더 빠르게 개선됩니다. 우리는 또한 소외된 요리 지역의 사용자를 모집하기 위한 타겟 캠페인을 진행하여 모델 훈련에 도움을 주고 있습니다.
국제 음식을 추적하는 사용자 팁
이 데이터를 바탕으로 비서양 요리를 추적할 때 가장 정확한 결과를 얻기 위한 실용적인 전략은 다음과 같습니다:
1. 소스가 많은 요리에 "숨겨진 기름" 버퍼 추가
인도, 태국, 에티오피아, 나이지리아, 중국 음식을 먹을 때, 소스나 그레이비가 포함된 요리의 AI 추정치에 10-15%를 추가하세요. 이 단일 조정이 대부분의 정확도 격차를 해소합니다.
2. 가능한 경우 개별 구성 요소 촬영
에티오피아 공유 플래터 전체를 촬영하는 대신, 각 와트를 따로 촬영하세요. 전체 탈리를 찍는 대신 각 그릇을 개별적으로 캡처하세요. AI는 개별 요리를 분리할 수 있을 때 훨씬 더 잘 작동합니다.
3. 수동 조정 기능 사용
Nutrola는 스캔 후 AI 추정치를 상향 또는 하향 조정할 수 있습니다. 자주 먹는 요리에 대해 이를 사용하세요 — 지역 태국 레스토랑의 그린 커리가 AI가 생각하는 것보다 약 15% 더 높다는 것을 알게 되면, 매번 그 수정을 적용할 수 있습니다.
4. 알려진 레시피와 교차 검증
집에서 국제 음식을 요리할 경우, 정확한 측정값(모든 기름과 기름 포함)으로 레시피를 한 번 기록하세요. Nutrola에 사용자 정의 식사로 저장하세요. 그 이후부터는 사진 추정에 의존하지 않고 검증된 정확도로 즉시 기록할 수 있습니다.
5. "칼로리 유사체" 주의
사진에서 거의 동일하게 보이지만 칼로리가 크게 다른 요리가 있습니다. 난 vs. 로티. 코코넛 커리 vs. 토마토 기반 커리. 튀긴 플랜테인 vs. 삶은 플랜테인. AI가 추정치를 제시할 때, 올바른 조리 방법을 식별했는지 다시 확인하세요.
6. 음료는 따로 추적
많은 국제 요리에는 AI가 프레임 가장자리에 있을 경우 놓칠 수 있는 칼로리가 높은 음료가 포함되어 있습니다 — 망고 라씨, 태국 아이스 티, 호르차타, 나이지리아 조보 등. 최상의 결과를 위해 음료를 따로 촬영하세요.
AI 음식 추적의 미래에 대한 의미
이 테스트는 AI 칼로리 추적이 얼마나 발전했는지와 여전히 얼마나 멀리 가야 하는지를 보여줍니다. 시각적으로 구별되고 잘 문서화된 음식이 있는 요리 — 일본, 미국, 이탈리아, 한국 — 에 대해 AI 사진 추적은 이미 놀라울 정도로 정확하여 영양사의 수동 평가와 6-7% 이내에서 수행됩니다. 이는 일상 추적에 충분히 유용합니다.
숨겨진 지방, 겹치는 요리, 제한된 훈련 데이터가 있는 요리 — 인도, 에티오피아, 태국, 나이지리아 — 에 대해서는 사용자가 인식해야 할 의미 있는 정확도 격차가 있습니다. 이 격차는 이러한 요리에 대한 AI 추적이 쓸모없게 만들 만큼 크지 않지만, 정확한 칼로리 적자를 유지하려는 경우에는 중요할 수 있습니다.
좋은 소식은 이 문제가 해결 가능하다는 것입니다. 이는 근본적으로 데이터 문제이지 알고리즘 문제는 아닙니다. 훈련 데이터셋이 확장되고 지역 영양 데이터베이스가 개선됨에 따라 소외된 요리의 정확도는 상위 성과자와 수렴할 것입니다. Nutrola의 목표는 2026년 말까지 모든 20개 요리에 대해 평균 편차를 8% 미만으로 줄이는 것입니다.
그동안 AI 추정치와 사용자 인식, 수동 수정의 조합은 당신이 먹는 요리와 관계없이 의미 있는 영양 추적을 위한 충분한 정확도 수준에 도달할 수 있게 해줍니다.
Nutrola의 Snap & Track 기능은 모든 요금제에서 제공되며, 월 2.50 EUR부터 시작하며, 광고 없이 AI 음식 인식 엔진에 지속적으로 접근할 수 있습니다. 우리의 사용자가 다양한 요리를 촬영할수록 시스템은 모두를 위해 더 똑똑해집니다.
방법론 주: 이 테스트는 2026년 3월 Nutrola 팀에 의해 내부적으로 수행되었습니다. 기준 칼로리 값은 두 명의 등록된 영양사가 독립적으로 계산하였으며, 차이는 합의에 의해 해결되었습니다. 모든 AI 추정치는 Nutrola v3.2의 Snap & Track 기능을 사용하여 생성되었습니다. 우리는 이 테스트를 분기마다 반복하고 업데이트된 결과를 발표할 계획입니다.