DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

la forma de interpretarlo es que después del entrenamiento posterior, tus pesos están más o menos equidistantes de todas las tareas que vio durante el preentrenamiento (el modelo ha visto todas las tareas, así que las ha atraído hacia ellas). así que todo lo que hace este método es perturbar los pesos y ver qué perturbaciones acercan la red a pesos específicos de la tarea. es como un lora realmente barato también se conecta a la observación de que el entrenamiento posterior no añade conocimiento, sino que simplemente esculpe la distribución del preentrenamiento.

perturbar los pesos es realmente análogo a los despliegues aleatorios a alta temperatura. Creo que esto puede ser iterativo (como grpo) perturbar los pesos con un gran radio -> seleccionar mejores desempeños -> seguir disminuyendo el radio esto *debería* aumentar la precisión de la tarea @yule_gan, ¿lo intentaste?

70

Parte superior

Clasificación

Favoritos