Hôm nay tôi đang thực hiện một số thí nghiệm với cửa sổ ngữ cảnh 1M của Opus 4.6. Cố gắng đẩy các phiên lập trình vào sâu trong cái mà tôi coi là 'khu vực ngu ngốc' của các mô hình SOTA: >100K token. Sự giảm sút về chất lượng là rất rõ ràng. Những quyết định ngu ngốc hơn, mã kém hơn, việc tuân theo hướng dẫn kém hơn. Đừng đối xử với cửa sổ ngữ cảnh 1M theo cách khác. Nó vẫn là 100K thông minh, và 900K ngu ngốc.