开发者知道他们的应用正被测试吗?
不知道。测试使用标准消费账户,事先不联系开发者。测试前、中、后都不通知。这防止任何针对我们特定条件的预先优化。
首页 › 方法论
方法论最后更新:2026 年 4 月 20 日
我们如何在 15,000 张标准化餐食照片上评估 10 款 AI 卡路里追踪应用,以实验室称重份量作为参考标准。
我们纳入根据公开下载和评分数据全球使用最广泛的 10 款 AI 卡路里追踪应用。应用必须在至少一个免费或试用版本中提供基于 AI 的照片食物识别;纯基于数据库搜索的应用被排除。10 款名单每年审核。
15,000 张餐食照片,分布在 10 个菜系类别(每类 1,500 张):美式、地中海、日式、中式、印度、墨西哥/拉美、东南亚、中东、非洲和欧洲。三个难度等级:简单(单一食物)、混合(2–4 种成分)和复杂(5+ 种成分或密集菜肴)。照片在标准化光照下、以一致角度拍摄,带参考物用于比例。
每份拍照的餐食在拍摄前都用校准过的实验室秤(精度 ±0.1 g)称重。宏量营养素成分根据 USDA FoodData Central 和经过验证的区域数据库计算。这创建了一个客观参考,我们用它来测量每款应用的 AI 估算。
五个加权指标构成最终得分:
不知道。测试使用标准消费账户,事先不联系开发者。测试前、中、后都不通知。这防止任何针对我们特定条件的预先优化。
公开图像库会让开发者在未来训练中包含我们的基准图像,使后续周期失效。库内部保留,每年更换为新的图像集。构建方法完全公开,以便他人可独立复现可比较的基准。
基准是自筹资金。所有应用购买、测试设备和实验室验证成本都由我们自掏腰包。网站仅通过展示广告产生收入。没有开发者、联盟项目或赞助置入对成本作贡献或影响结果。