每個 LLM 的訓練數據中都包含 Reddit 用戶的廢話,這是為什麼如果你真的要求它對任何重要的事情發表意見,就像對待一個人一樣,而不是僅僅寫代碼、處理數據、提供客戶支持等,這是毫無希望的原因之一。
Aakash Gupta
Aakash Gupta3月16日 11:48
在 Reddit 上,50% 的所有關係建議是「離開」。15 年的數據,5200 萬條評論,趨勢線只朝一個方向走。 一位研究人員將 r/relationship_advice 篩選至 1,166,592 條優質評論,並追蹤人們實際推薦的內容。在 2010 年,「結束關係」的比例約為 30%。到 2025 年,這一比例接近 50%。 「溝通」的比例從 22% 降至 14%。 「妥協」從 7% 崩潰至 3%。 「給予空間」從 25% 降至 13%。每一個需要耐心的類別每年都在失去地盤。 唯一一個增長速度超過「離開」的類別是「尋求治療」,其比例從 1% 增加到 6%。這個子版塊正在慢慢學會說「這超出了我的薪資範圍」。 如果在這個數據集上訓練一個模型,它絕對會告訴人們分手。訓練數據中有 50% 是「離開」,並且還在上升。這個模型不會出錯。它將準確反映 5200 萬條評論者對你關係的看法。 一個 50% 的先驗認為你應該離開,14% 的先驗認為你應該談談,6% 的先驗認為你需要專業人士。這不是 LLM 精神病。這是對你關係的中位數人類意見,得到了有史以來最大建議數據集的支持。
垃圾進,垃圾出
135