Jag har upptäckt att autoresearch fungerar bäst (och endast) för hastighetsoptimering, där: 1. Målet är en enda skalär (väggklockatid), så varje experiment har en tydlig "bättre eller sämre" signal 2. Kvalitetsförsämring är billig att utvärdera, som en enkel MSE/pixel-diff mot baslinjeutgång ger en automatisk godkänd/underkänd grind 3. Sökutrymmet är mikrooptimeringar: dtype-casting, kvantisering, cache-tricks, utvärderingsschemaläggning, där varje förändring är liten, oberoende och omedelbart benchmarkbar Var också försiktig med autokompakt när den tappar kontexten om vad som redan har testats.