i modelli di domanda sono stati costruiti per gli esseri umani che colpiscono le API alcune volte al minuto... massimo ma milioni di agenti non dormono mai, non fanno mai batch, non aspettano mai eseguono inferenze continuamente, in tutti i fusi orari, con zero tolleranza per restare in fila AWS non riesce a costruire data center abbastanza velocemente per la domanda umana. non stanno nemmeno considerando cosa fanno gli agenti a quella curva è un eufemismo dire che è tempo di aggiornare i modelli.