Dios, el intelecto supremo que los residentes de RL han estado cocinando tan duro Un importante cuello de botella en el aprendizaje continuo es que no disponemos de una forma general de comparar y evaluar métodos entre dominios de tareas Creo que @carnot_cyclist ha solucionado esto
No voy a estropearlo porque quiero que escriba una entrada de blog espectacular sobre ello. Pero vaya, es un formalismo realmente, muy limpio que puede usarse para muchas cosas diferentes, y tiene algunos buenos resultados experimentales tempranos para demostrarlo
203