Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Creo que esta es una buena forma de visualizar la raza de IA usando el longevo benchmark GPQA Diamond.
Se puede ver cuánto tiempo OpenAI tuvo el campo para sí solo, el auge (y colapso) de Meta, la repentina recuperación (y luego estancamiento) de xAI y la entrada de los LLMs chinos de peso abierto.
El test de preguntas y respuestas a prueba de Google a nivel de posgrado (GPQA) es una serie de problemas difíciles de opción múltiple diseñados para poner a prueba conocimientos avanzados. Los no expertos con acceso a internet aciertan en un 34%, los doctores con acceso a internet obtienen entre un 65 y un 70% en su especialidad. Probablemente estamos cerca de la saturación
Ordené a Codex que esto se hiciera. Datos de @EpochAIResearch.
1.45K
Populares
Ranking
Favoritas
