一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

🚨 突發消息：普林斯頓大學開發了一個AI，僅在36次對話中就從幾乎無用變得高度個性化。每當你告訴AI「這是錯的」或因為它沒有抓住重點而重複問同樣的問題時，這種反應是它能收到的最有價值的反饋。今天建造的每個AI系統都完全忽略了這一點。普林斯頓開發了一個名為OpenClaw RL的系統來解決這個問題。這個想法很簡單：當你糾正一個AI時，它會立即從這個糾正中學習。沒有工程師參與。沒有重新訓練。只有你已經在進行的對話。模型會觀察你在每次回覆後的反應： > 重新提問意味著它失敗了 > 流暢的回覆意味著它成功了隨著時間的推移，它會準確地弄清楚你想要什麼並進行調整。在他們的測試中： > 一個AI助手從幾乎無用變得高度個性化僅需36次對話 > 一個評分助手在僅24次互動後學會了寫出更溫暖、更詳細的反饋它僅僅通過被使用而變得更好。 > 個性化分數之前：0.17 > 36次對話後：0.81 > 無需重新訓練，無需工程師，無需停機 > 在AI仍在與你交談時運作你曾經輸入的每一個沮喪的「不，這不是我的意思」都是一堂免費的課。 AI只是從未保留這些。直到現在。