Falls du es verpasst hast, wir führen gerade eine Forschungszusammenarbeit mit Harvard durch. Du kannst teilnehmen und 25 % Rabatt auf deine Inferenzkosten erhalten. Alles, was du tun musst, ist, deinen Endpunkt zu wechseln: → Die gleichen Modelle, die gleiche API, es ändert sich nichts anderes. Du zahlst einfach weniger. Deine Daten gehen an das Team von Harvard, um einen Caching-Algorithmus zu entwickeln, der die Inferenz schneller und günstiger macht, sobald er bereitgestellt wird. Sei dir nur bewusst, dass deine Eingaben und Antworten an diesem Endpunkt aufgezeichnet werden, also halte alles Sensible wie gewohnt geheim. Es ist jetzt live und funktioniert bereits.