🚨 突發消息:普林斯頓大學開發了一個AI,僅在36次對話中就從幾乎無用變得高度個性化。 每當你告訴AI「這是錯的」或因為它沒有抓住重點而重複問同樣的問題時,這種反應是它能收到的最有價值的反饋。 今天建造的每個AI系統都完全忽略了這一點。 普林斯頓開發了一個名為OpenClaw RL的系統來解決這個問題。 這個想法很簡單:當你糾正一個AI時,它會立即從這個糾正中學習。沒有工程師參與。沒有重新訓練。只有你已經在進行的對話。 模型會觀察你在每次回覆後的反應: > 重新提問意味著它失敗了 > 流暢的回覆意味著它成功了 隨著時間的推移,它會準確地弄清楚你想要什麼並進行調整。 在他們的測試中: > 一個AI助手從幾乎無用變得高度個性化僅需36次對話 > 一個評分助手在僅24次互動後學會了寫出更溫暖、更詳細的反饋 它僅僅通過被使用而變得更好。 > 個性化分數之前:0.17 > 36次對話後:0.81 > 無需重新訓練,無需工程師,無需停機 > 在AI仍在與你交談時運作 你曾經輸入的每一個沮喪的「不,這不是我的意思」都是一堂免費的課。 AI只是從未保留這些。直到現在。