se você perdeu, estamos a realizar uma colaboração de pesquisa com Harvard neste momento eu você pode participar e obter 25% de desconto nos seus custos de inferência. tudo o que você precisa fazer é mudar o seu endpoint: → mesmos modelos, mesma API, nada mais muda. você apenas paga menos. seus dados vão para a equipe de Harvard para ajudar a construir um algoritmo de caching que tornará a inferência mais rápida e barata em toda a plataforma assim que for lançado. apenas saiba que seus prompts e respostas são gravados neste endpoint, então mantenha qualquer coisa sensível como normalmente. está ativo agora e já está a funcionar.