Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Investigar el razonamiento @OpenAI | Co-creación de las IA de póker sobrehumano Libratus/Pluribus, CICERO Diplomacy AI y OpenAI o3 / o1 / 🍓 modelos de razonamiento
La receta detrás de los modelos de razonamiento pioneros actuales es sorprendentemente similar a la de AlphaGo:
1) Imitar grandes cantidades de datos humanos
2) Cálculo de inferencia a escala para razonar mejor (en aquel entonces era Búsqueda de Árbol de Montecarlo, hoy es Cadena de Pensamiento)
3) Usar el RL para ir más allá de la imitación

Demis Hassabis10 mar, 23:13
Hace diez años, el legendario combate de AlphaGo en Seúl marcó el inicio de la era moderna en la IA. Su famoso 'Move 37' nos indicó que las técnicas de IA estaban preparadas para abordar problemas reales en áreas como la ciencia, y las ideas inspiradas en estos métodos son fundamentales para construir la AGI
176
Resumen: dr: @OpenAI no se desplegará a la NSA ni a otras agencias de inteligencia del Departamento de Guerra por ahora, para que haya tiempo de abordar posibles lagunas de vigilancia a través del proceso democrático.
Durante el fin de semana quedó claro que el lenguaje original del acuerdo OpenAI / DoW dejaba preguntas legítimas sin respuesta, especialmente en torno a algunas formas novedosas en que la IA podría potencialmente permitir la vigilancia legal. El lenguaje ya se ha actualizado para abordar esto, pero también creo firmemente que el mundo no debería depender de la confianza en los laboratorios de IA o en las agencias de inteligencia para su seguridad y protección. El despliegue a la NSA y a todas las demás agencias de inteligencia del Departamento de Guerra será retenido para que haya tiempo de abordar estas lagunas a través del proceso democrático antes del despliegue.
Sé que la legislación a veces puede ser lenta, pero temo una pendiente resbaladiza en la que nos acostumbremos a eludir el proceso democrático para decisiones políticas importantes. Cuando hay apoyo bipartidista y urgencia, confío en que el gobierno puede actuar rápidamente. Y a medida que la IA se vuelve más poderosa, es más importante que nunca que la autoridad última recaiga en el público.
También planeo involucrarme más personalmente en la política en OpenAI. Creo que ahora más que nunca es importante que los investigadores estén informados para que las políticas estén informadas del progreso extremadamente rápido que estamos viendo.

Sam Altman3 mar, 09:15
Aquí tienes una re-publicación de una publicación interna:
Hemos estado trabajando con el DoW para añadir algunas incorporaciones en nuestro acuerdo y dejar muy claros nuestros principios.
1. Vamos a modificar nuestro acuerdo para añadir este texto, además de todo lo demás:
"• De acuerdo con las leyes aplicables, incluyendo la Cuarta Enmienda de la Constitución de los Estados Unidos, la Ley de Seguridad Nacional de 1947 y la Ley FISA de 1978, el sistema de IA no podrá ser utilizado intencionadamente para la vigilancia doméstica de personas y nacionales estadounidenses.
• Para evitar dudas, el Departamento entiende que esta limitación prohíbe el seguimiento, la vigilancia o la vigilancia deliberada de personas o nacionales estadounidenses, incluyendo la adquisición o el uso de información personal o identificable adquirida comercialmente."
Es fundamental proteger las libertades civiles de los estadounidenses, y hubo tanto énfasis en esto, que queríamos dejar este punto especialmente claro, incluso en torno a la información adquirida comercialmente. Como todo lo que hacemos con el despliegue iterativo, seguiremos aprendiendo y perfeccionando sobre la marcha.
Creo que es un cambio importante; nuestro equipo y el equipo de DoW hicieron un gran trabajo trabajando en ello.
2. El Departamento también afirmó que nuestros servicios no serán utilizados por agencias de inteligencia del Departamento de Guerra (por ejemplo, la NSA). Cualquier servicio prestado a esas agencias requeriría una modificación posterior de nuestro contrato.
3. Para mayor claridad: queremos trabajar a través de procesos democráticos. Debería ser el gobierno quien tome las decisiones clave sobre la sociedad. Queremos tener voz y un lugar en la mesa donde podamos compartir nuestra experiencia y luchar por los principios de la libertad. Pero tenemos claro cómo funciona el sistema (porque mucha gente ha preguntado, si recibiera lo que considero una orden inconstitucional, por supuesto preferiría ir a la cárcel antes que seguirla). Pero
4. Hay muchas cosas para las que la tecnología simplemente no está preparada, y muchas áreas en las que aún no entendemos los compromisos que requiere la seguridad. Trabajaremos en estos asuntos, poco a poco, con el DoW, con salvaguardas técnicas y otros métodos.
5. Una cosa que creo que hice mal: no deberíamos habernos apresurado a sacar esto el viernes. Los problemas son súper complejos y exigen una comunicación clara. De verdad intentábamos desescalar las cosas y evitar un resultado mucho peor, pero creo que simplemente parecía oportunista y descuidado. Una buena experiencia de aprendizaje para mí mientras nos enfrentamos a decisiones de mayor riesgo en el futuro.
En mis conversaciones durante el fin de semana, reiteré que Anthropic no debería ser designado como SCR, y que esperamos que el DoW les ofrezca los mismos términos que hemos acordado.
Mañana por la mañana organizaremos una reunión general para responder a más preguntas.
382
Tras los resultados de la IMO el verano pasado, algunos lo descartaron como "matemáticas de instituto". Creemos que nuestros últimos modelos eliminarán cualquier duda de que la investigación STEM está a punto de cambiar fundamentalmente.
Los matemáticos crearon un conjunto de 10 preguntas de investigación que surgieron de forma natural a partir de su propia investigación. Solo ellos conocen las respuestas, y le dieron al mundo una semana para usar los LLMs y intentar resolverlas. Creemos que nuestros modelos más recientes permiten resolver varios de ellos.
Este es un modelo interno por ahora, pero soy optimista de que pronto lo sacaremos (o sacaremos un modelo mejor).


368
Populares
Ranking
Favoritas
