今日はOpus 4.6の100万コンテキストウィンドウでいくつか実験をしています。 コーディングセッションをSOTAモデルの「ダムゾーン」と呼ぶ、>10万トークンの深部に押し込もうとしています。 品質の低下は本当に目立ちます。愚かな判断、悪いコード、悪い命令の実行。 1Mのコンテキストウィンドウを特に扱わないでください。 それでも10万ドルの賢さと90万ドルのバカなゲームです。