Includerea prostiilor de pe Reddit în datele de antrenament ale fiecărui LLM este o mare parte din motivul pentru care este fără speranță dacă chiar îi ceri să intervină despre ceva important, cum ar fi o persoană, în loc să scrie cod, să proceseze date, să facă suport clienți etc.
Aakash Gupta
Aakash Gupta16 mar., 11:48
50% din toate sfaturile despre relații de pe Reddit sunt "pleacă". 15 ani de date, 52 de milioane de comentarii, iar linia tendinței merge într-o singură direcție. Un cercetător a filtrat r/relationship_advice la 1.166.592 comentarii de calitate și a urmărit ce recomandă oamenii de fapt. În 2010, "End Relationship" era în jur de 30%. Până în 2025, se apropie de 50%. "Comunicarea" a scăzut de la 22% la 14%. "Compromisul" s-a prăbușit de la 7% la 3%. "Give Space" a scăzut de la 25% la 13%. Fiecare categorie care necesită răbdare pierdea teren în fiecare an. Categoria care crește mai repede decât "leave" este "Seek Therapy", care a crescut de la 1% la 6%. Subreddit-ul învață încet să spună "asta depășește nivelul meu de salariu". Antrenează un model pe acest set de date și cu siguranță le-ar spune oamenilor să se despartă. Datele de antrenament sunt 50% "plecare" și escaladă. Modelul nu s-ar strica. Ar reflecta cu acuratețe ceea ce cred cu adevărat 52 de milioane de comentatori despre relația voastră. Un 50% înainte să pleci, un 14% înainte să vorbești despre asta și un 6% înainte să ai nevoie de un profesionist. Asta nu este psihoză LLM. Aceasta este opinia medie a oamenilor despre relația voastră, susținută de cel mai mare set de date de sfaturi adunat vreodată.
Gunoiul intră, gunoiul afară
120