Rantai Pemikiran sudah mati. Saya baru saja menguji prompting Skeleton of Thought dan itu memotong latensi respons menjadi dua pada tugas terstruktur dengan output yang lebih tajam. Wawasan itu menghancurkan model mental saya tentang bagaimana AI harus menghasilkan teks. CoT memaksa model untuk berpikir dan menulis pada saat yang bersamaan. Poin 1 harus selesai sebelum Poin 2 dapat dimulai. Poin 2 harus selesai sebelum Poin 3. Setiap token diblokir oleh token sebelumnya. Itu bukan cara para ahli benar-benar menyusun informasi. Seorang konsultan McKinsey tidak menulis laporan secara linier. Mereka menguraikan setiap bagian terlebih dahulu, kemudian mengembangkan masing-masing secara independen. Seorang profesor tidak menyusun catatan kuliah dari awal hingga akhir. Mereka menyusun topik, lalu mengisinya. SoT akhirnya cocok dengan itu. Fase 1 - Kerangka: Model menulis garis besar telanjang dari setiap poin terlebih dahulu. Tidak ada elaborasi. Hanya struktur. Cepat. Fase 2 - Pengisian Paralel: Setiap titik kerangka diperluas secara independen dan bersamaan. Poin 3 tidak menunggu Poin 2. Poin 5 tidak menunggu Poin 4. Satu cabang yang salah tidak memperlambat setiap cabang setelahnya. Struktur prompt yang tepat: "Pertama, tulis kerangka singkat tanggapan Anda sebagai daftar poin-poin penting. Kemudian, perluas setiap titik secara mandiri dan penuh. Format: [Kerangka] diikuti oleh [Poin 1], [Poin 2], dll." Itu saja. Itulah keseluruhan pembukaannya. Di mana SoT mendominasi:...