Willkommen im Labor der Zukunft! 🧬🤖 Ich freue mich, LUMI-lab zu teilen, das heute in @CellCellPress veröffentlicht wurde – eine selbstfahrende Plattform, die ein KI-Grundlagenmodell mit einem robotergestützten Labor kombiniert, um autonom ionisierbare Lipide (LNPs) für die mRNA-Abgabe zu entdecken. Das Kernproblem: Die Gestaltung von lipidischen Nanopartikeln (LNPs) ist schwierig. Der chemische Raum der ionisierbaren Lipide ist riesig, experimentelle Zyklen sind langsam, und – entscheidend – historische LNP-Datensätze sind viel zu klein, um ein prädiktives Modell von Grund auf zu trainieren. Die meisten KI-Ansätze in diesem Bereich stoßen sofort an eine Wand: nicht genug Daten, um daraus zu lernen. Unsere Lösung: Lernen mit einem Labor im Loop. Anstatt nur mit LNP-Daten zu trainieren, beginnt LUMI als ein transformerbasiertes Grundlagenmodell, das über einen breiten chemischen Raum vortrainiert ist und reiche molekulare Darstellungen aufbaut, bevor es jemals ein einziges LNP-Experiment sieht. Dann tritt es in einen geschlossenen Loop mit einer robotergestützten Syntheseplattform ein: vorhersagen → synthetisieren → testen → aktualisieren. Jede Runde realer Laborversuche verfeinert das Modell, das dann intelligentere Kandidaten für die nächste Runde vorschlägt. Das Labor validiert nicht nur die KI-Vorhersagen – es lehrt das Modell aktiv, kontinuierlich. Was passiert ist, als wir es laufen ließen: LUMI-lab hat autonom über 1.700 ionisierbare Lipide in menschlichen bronchialen Epithelzellen synthetisiert und gescreent. Der beste Kandidat – LUMI-6 – weist einen bromierten Lipidschwanz auf, ein strukturelles Motiv, das bei der LNP-Gestaltung weitgehend übersehen wurde. LUMI fand es, ohne gesagt zu bekommen, wo es suchen sollte. Als es in LNPs formuliert und intratracheal an Mäuse abgegeben wurde, erreichte LUMI-6 eine Genbearbeitungseffizienz von 20,3 % in Lungenepithelzellen – ein überzeugendes Ergebnis für eines der schwer zu erreichenden therapeutischen Ziele, das direkt relevant für Krankheiten wie Mukoviszidose und Alpha-1-Antitrypsin-Mangel ist. Warum das über LNPs hinaus wichtig ist: Dies ist ein Beweis für ein breiteres Konzept – dass Grundlagenmodell-Vortraining + aktives Lernen + robotergestützte Experimente die Datenknappheitsengpass überwinden können, der die KI-gesteuerte Entdeckung in der Biologie plagt. Man benötigt kein massives domänenspezifisches Dataset, um zu beginnen. Man benötigt ein Modell, das verallgemeinern kann, ein Labor, das die richtigen Daten generieren kann, und einen Loop, der sie verbindet. Herzlichen Glückwunsch an die Erstautoren Yue Xu, @HAOTIANCUI1 und Kuan Pang, sowie an das gesamte Team von @BowenLi_Lab. Dankbar sind wir unseren Partnern bei @UHN und @UofTPharmacy sowie dem Princess Margaret Cancer Centre Research @PMResearch_UHN. 📄 Papier: