Home › Artikelen › Protocol
MethodologieHoe we testen: ons benchmarkprotocol van 15.000 maaltijden
Laatst bijgewerkt: 20 april 2026 · Door Zhenguo Chen
Het protocol achter onze cijfers: hoe de bibliotheek van 15.000 afbeeldingen wordt opgebouwd, hoe ground truth wordt vastgesteld en hoe we de resultaten statistisch valideren.
De bibliotheek bouwen
15.000 foto's in 10 keukencategorieën × 3 moeilijkheidsniveaus. De foto's worden genomen onder gestandaardiseerde verlichting (5500K, 800 lux), vanuit consistente hoeken (45° en van bovenaf), met een referentieobject (creditcard of vork) voor visuele schaal. Elk gerecht wordt twee keer gefotografeerd: opgemaakt en halverwege de maaltijd (om gedeeltelijke herkenning te testen).
Ground truth vaststellen
Elk onderdeel van het gerecht wordt apart gewogen op gekalibreerde weegschalen (precisie ±0,1 g) vóór het opdienen. Dit geeft het exacte gewicht van elk ingrediënt. De voeding wordt berekend uit USDA FoodData Central en geverifieerde regionale databases (LATINFOODS, CIQUAL, enz.).
Statistische analyse
Elke foto wordt 3× naar elke app gestuurd, met de mediaan als eindscore. Dit elimineert variantie van één enkele poging. We berekenen 95%-betrouwbaarheidsintervallen voor elke metriek. Herkenningsratio gebruikt de top-1-metriek (de meest betrouwbare voorspelling). MAPE wordt berekend over alle 15.000 foto's om statistische significantie te waarborgen.