歡迎來到未來實驗室! 🧬🤖 很高興能分享 LUMI-lab,今天在 @CellCellPress 發佈 — 一個自駕平台,將 AI 基礎模型與機器人實驗室結合,能自主發現可離子化脂質 (LNPs) 用於 mRNA 傳遞。 核心問題:設計脂質納米顆粒 (LNPs) 是困難的。可離子化脂質的化學空間非常廣泛,實驗周期緩慢,並且 — 重要的是 — 歷史 LNP 數據集太小,無法從零開始訓練預測模型。這個領域的大多數 AI 方法立即遇到瓶頸:沒有足夠的數據可供學習。 我們的解決方案:實驗室內循環的基礎模型學習。LUMI 不僅僅依賴 LNP 數據進行訓練,而是作為一個基於變壓器的基礎模型,在廣泛的化學空間中進行預訓練,構建豐富的分子表示,然後才會看到任何 LNP 實驗。然後它進入一個與機器人合成平台的閉環:預測 → 合成 → 測定 → 更新。每一輪真實的濕實驗都會微調模型,然後模型會為下一輪提出更智能的候選者。實驗室不僅僅是在驗證 AI 的預測 — 它還在不斷地教導模型。 當我們讓它運行時發生了什麼:LUMI-lab 自主合成並篩選了 1,700 多種可離子化脂質在人體支氣管上皮細胞中。最佳候選者 — LUMI-6 — 具有溴化脂質尾部,這是一種在 LNP 設計中被大多數忽視的結構特徵。LUMI 在未被告知尋找位置的情況下找到了它。當被製成 LNP 並經氣管內注射到小鼠中時,LUMI-6 在肺上皮細胞中達到了 20.3% 的基因編輯效率 — 對於最難以達到的治療目標之一,這是一個引人注目的結果,與囊性纖維化和 α-1 抗胰蛋白酶缺乏等疾病直接相關。 這為什麼超越 LNPs 重要:這是對更廣泛論點的概念驗證 — 基礎模型預訓練 + 主動學習 + 機器人實驗可以克服困擾 AI 驅動的生物學發現的數據稀缺瓶頸。你不需要一個龐大的特定領域數據集來開始。你需要一個能夠概括的模型,一個能夠生成正確數據的實驗室,以及一個將它們連接起來的循環。 衷心祝賀第一作者 Yue Xu, @HAOTIANCUI1 和 Kuan Pang,以及整個 @BowenLi_Lab 團隊。感謝我們在 @UHN 和 @UofTPharmacy 的合作者,以及公主瑪格麗特癌症中心研究 @PMResearch_UHN。 📄 論文: