Saya ingin membuat beberapa klarifikasi, yang kami yakini jelas dalam makalah kami tetapi tidak dalam posting asli saya (menganalisis ulang data @METR_Evals). Kontribusi kami adalah untuk memposisikan kemajuan sebagai produk multiplikatif sigmoid di sekitar inovasi yang berbeda. Mengingat data METR, kami membaginya menjadi peningkatan kemampuan dasar (ukuran data/model) dan penalaran. Kami menunjukkan bahwa produk ini memberikan kesesuaian *dalam sampel* yang serupa dengan kumpulan data kecil yang kami amati sebagai pertumbuhan eksponensial. Namun, implikasinya sangat berbeda! Di bawah model kami, kami akan membutuhkan inovasi berkelanjutan (mirip dengan penalaran) untuk melihat kemajuan eksponensial yang berkelanjutan. Ini tidak berarti kita mengesampingkan kemajuan eksponensial, atau bahwa produk sigmoid kita adalah model yang tepat. Ini hanya untuk mengatakan ada beberapa poin dan beberapa kemungkinan model mendasar dengan implikasi yang sangat berbeda. Produk kami sigmoid fit sebenarnya sangat cocok saat memegang GPT 5.2 dan/atau Gemini 3 pro. Kami terlihat lebih buruk ketika juga memegang Claude Opus 4.5, tetapi masih masuk akal. Tujuan kami bukan untuk berdalih tentang metrik OOS pada beberapa titik data, tetapi untuk menunjukkan bahwa perkiraan yang ada rapuh, dan tidak memodelkan suksesi inovasi yang berbeda. (Ada beberapa kecocokan lain yang mengambang di sekitar X, tetapi mereka tampaknya tidak menggunakan sigmoid produk yang kami usulkan jadi saya tidak bisa mengatakan apa yang terjadi di sana ...) Saya minta maaf atas posting saya sebelumnya yang tidak bernuansa – kami berharap orang akan membaca koran ini!