das läuft den ganzen Tag ich lasse es eine Menge agentischer Harnesses, Tools, Auswertungen, Ideen mit Gedächtnis ausprobieren und führe automatische Recherchen gegen LongMemEval durch, um zu sehen, ob es ein Harness erstellen kann, das 99% erreicht, wie einen Beitrag, den ich neulich hier gesehen habe Stück für Stück. So cool!