Chain of Thought đã chết. Tôi vừa thử nghiệm Skeleton of Thought và nó đã giảm thời gian phản hồi xuống một nửa trong các nhiệm vụ có cấu trúc với đầu ra sắc nét hơn. Nhận thức này đã phá hủy mô hình tư duy của tôi về cách AI nên tạo ra văn bản. CoT buộc mô hình phải suy nghĩ và viết cùng một lúc. Điểm 1 phải hoàn thành trước khi Điểm 2 có thể bắt đầu. Điểm 2 phải hoàn thành trước khi Điểm 3. Mỗi token bị chặn bởi token trước đó. Đó không phải là cách mà các chuyên gia thực sự cấu trúc thông tin. Một tư vấn viên của McKinsey không viết báo cáo theo cách tuyến tính. Họ phác thảo từng phần trước, sau đó phát triển từng phần một cách độc lập. Một giáo sư không soạn thảo ghi chú bài giảng từ đầu đến cuối. Họ phác thảo các chủ đề, sau đó điền vào. SoT cuối cùng đã phù hợp với điều đó. Giai đoạn 1 - Skeleton: Mô hình viết một phác thảo sơ lược của từng điểm trước. Không có sự giải thích. Chỉ có cấu trúc. Nhanh chóng. Giai đoạn 2 - Parallel Fill: Mỗi điểm skeleton được mở rộng một cách độc lập và đồng thời. Điểm 3 không chờ Điểm 2. Điểm 5 không chờ Điểm 4. Một nhánh sai không làm chậm mọi nhánh sau nó. Cấu trúc prompt chính xác: "Đầu tiên, viết một skeleton ngắn gọn của phản hồi của bạn dưới dạng danh sách các điểm chính. Sau đó, mở rộng từng điểm một cách độc lập và đầy đủ. Định dạng: [Skeleton] theo sau là [Điểm 1], [Điểm 2], v.v." Chỉ vậy thôi. Đó là toàn bộ chìa khóa. Nơi SoT chiếm ưu thế:...