header
david rein
sentio ergo sum. tekoälyagenttien arviointien tieteen kehittäminen @METR_Evals, aiemmin GPQA:ssa NYU:ssa, @cohere