構建影象庫

15,000 張照片,10 個菜系類別 × 3 個難度級別。照片在標準化光照下(5500K, 800 lux)、以一致角度(45° 和俯視)拍攝,帶參考物(信用卡或叉子)用於視覺比例。每個菜餚拍兩次:準備好時和吃到一半時(測試部分識別)。

建立參考標準

菜餚的每個組成部分在裝盤前在校準秤(精度 ±0.1 g)上單獨稱重。這給出每種成分的精確重量。營養從 USDA FoodData Central 和經過驗證的區域資料庫(LATINFOODS、CIQUAL 等)計算。

統計分析

每張照片向每款應用提交 3 次,使用中位數作為最終分數。這消除了單次嘗試的方差。我們為每個指標計算 95% 置信區間。識別率使用 top-1 指標(最自信的預測)。MAPE 在所有 15,000 張照片上計算以確保統計顯著性。