Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI của bạn đã âm thầm quên mọi thứ bạn đã nói với nó.
Không phải ngẫu nhiên. Không phải ồn ào. Mà là có hệ thống. Bắt đầu từ những quyết định quan trọng nhất.
> Ràng buộc bạn đã đặt ra ba tháng trước "không bao giờ sử dụng Redis, khách hàng đã phủ quyết điều đó sau một sự cố sản xuất." Đã biến mất. Ràng buộc khu vực triển khai GDPR. Đã biến mất. Giới hạn thử nghiệm mà bạn đã kiểm tra thực nghiệm sau sự cố chuỗi. Đã biến mất.
> Mô hình chưa bao giờ nói với bạn. Nó chỉ bắt đầu sử dụng các mặc định.
> Điều này được gọi là sự suy giảm ngữ cảnh. Và các nhà nghiên cứu từ Cambridge và Independent vừa định lượng chính xác mức độ nghiêm trọng của nó.
> Mỗi hệ thống AI sản xuất chạy đủ lâu cuối cùng sẽ nén ngữ cảnh của nó để tạo chỗ cho thông tin mới. Việc nén này là cực kỳ mất mát. Họ đã thử nghiệm trực tiếp: 2.000 sự thật được nén ở tỷ lệ 36,7× đã để lại 60% cơ sở tri thức không thể phục hồi vĩnh viễn. Không phải ảo tưởng. Không sai. Chỉ đơn giản là biến mất. Mô hình đã báo cáo một cách trung thực rằng nó không còn thông tin nữa.
> Sau đó, họ đã thử nghiệm một điều tồi tệ hơn. Họ đã nhúng 20 ràng buộc dự án thực vào một cuộc trò chuyện 88 lượt, những loại ràng buộc xuất hiện tự nhiên trong bất kỳ dự án dài hạn nào, sau đó áp dụng nén chuỗi giống như các hệ thống sản xuất làm. Sau một vòng: 91% được bảo tồn. Sau hai vòng: 62%. Sau ba vòng: 46%.
> Mô hình vẫn làm việc với sự tự tin đầy đủ trong suốt thời gian đó. Tạo ra các đầu ra vi phạm các ràng buộc đã quên. Không có tín hiệu lỗi. Không có cảnh báo. Chỉ là sự trở lại im lặng về các mặc định hợp lý mà lại sai cho tình huống cụ thể của bạn.
> Họ đã thử nghiệm điều này trên bốn mô hình tiên tiến. Claude Sonnet 4.5, Claude Sonnet 4.6, Opus, GPT-5.4. Mỗi một trong số đó đều sụp đổ dưới áp lực nén. Đây không phải là vấn đề của mô hình. Đây là vấn đề kiến trúc.
→ 60% sự thật bị mất vĩnh viễn sau một lần nén
→ 54% ràng buộc dự án biến mất sau ba vòng nén chuỗi
→ GPT-5.4 giảm xuống 0% độ chính xác chỉ với 2× nén
→ Ngay cả Opus cũng chỉ giữ lại 5% sự thật ở 20× nén
→ Chi phí bộ nhớ trong ngữ cảnh là 14.201 đô la/năm cho 7.000 sự thật so với 56 đô la/năm cho phương án thay thế
Các phòng thí nghiệm AI biết điều này. Giải pháp của họ là cửa sổ ngữ cảnh lớn hơn. Một cửa sổ 10 triệu token là một cái thùng lớn hơn. Nó vẫn chỉ là một cái thùng. Việc nén là không thể tránh khỏi đối với bất kỳ hệ thống dài hạn nào. Kích thước cửa sổ chỉ xác định khi nào việc quên bắt đầu chứ không phải liệu nó có xảy ra hay không.

Hàng đầu
Thứ hạng
Yêu thích
