¡Feliz de compartir KernelFactory! Un arnés que construí para resolver la prueba de rendimiento que compartió @AnthropicAI hace unas semanas.
En resumen, el desafío era optimizar un núcleo personalizado que escribieron. Puedes avanzar bastante hablando con Claude Code al respecto. En lugar de hacer eso, quería construir un arnés para ver hasta dónde podías llegar sin intervención humana.
Es un desafío divertido. Está bien definido y tiene un claro punto de referencia. Y necesitas aprender un nuevo conjunto de herramientas si quieres salir del bucle. Terminé construyendo un arnés evolutivo que intentaba equilibrar la exploración de un conjunto diverso de ideas y el uso de las existentes.
Al final, el arnés entregó un núcleo de 1297 ciclos, que supera los benchmarks iniciales establecidos por el equipo en su repositorio de git. Lo detuve en ese punto de manera algo arbitraria, pero podría ofrecer un mejor rendimiento con más capacidad de cómputo. También encontró algunos exploits interesantes que podrían reducir esto aún más, como eliminar la función hash del núcleo de referencia para que no necesitara calcularla.
Hay más detalles en la publicación del blog si tienes curiosidad. En general, creo que mi mayor conclusión es cuánto se puede lograr con un buen bucle de retroalimentación y un punto de referencia.
Planeo seguir experimentando con arneses, así que no dudes en ponerte en contacto si tienes un problema interesante con un potente bucle de retroalimentación. cc: @trishume, gracias por hacer de este desafío un proyecto de código abierto :)
215