熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
🚨 突發消息:普林斯頓大學開發了一個AI,僅在36次對話中就從幾乎無用變得高度個性化。
每當你告訴AI「這是錯的」或因為它沒有抓住重點而重複問同樣的問題時,這種反應是它能收到的最有價值的反饋。
今天建造的每個AI系統都完全忽略了這一點。
普林斯頓開發了一個名為OpenClaw RL的系統來解決這個問題。
這個想法很簡單:當你糾正一個AI時,它會立即從這個糾正中學習。沒有工程師參與。沒有重新訓練。只有你已經在進行的對話。
模型會觀察你在每次回覆後的反應:
> 重新提問意味著它失敗了
> 流暢的回覆意味著它成功了
隨著時間的推移,它會準確地弄清楚你想要什麼並進行調整。
在他們的測試中:
> 一個AI助手從幾乎無用變得高度個性化僅需36次對話
> 一個評分助手在僅24次互動後學會了寫出更溫暖、更詳細的反饋
它僅僅通過被使用而變得更好。
> 個性化分數之前:0.17
> 36次對話後:0.81
> 無需重新訓練,無需工程師,無需停機
> 在AI仍在與你交談時運作
你曾經輸入的每一個沮喪的「不,這不是我的意思」都是一堂免費的課。
AI只是從未保留這些。直到現在。

熱門
排行
收藏
