Ласкаво просимо до Лабораторії Майбутнього! 🧬🤖 Раді поділитися LUMI-lab, який виходить сьогодні у @CellCellPress році — платформою для автономного керування, яка поєднує модель бази ШІ з роботизованою лабораторією для автономного виявлення іонізованих ліпідів (LNP) для доставки мРНК. Основна проблема: проєктування ліпідних наночастинок (LNP) — це складно. Хімічний простір іонізованих ліпідів величезний, експериментальні цикли повільні, і — що критично — історичні набори даних LNP надто малі, щоб навчати прогнозну модель з нуля. Більшість підходів ШІ в цій сфері одразу стикаються зі стіною: недостатньо даних для навчання. Наше рішення: базова модель навчання з лабораторією в циклі. Замість навчання лише на даних LNP, LUMI починається як трансформерна базова модель, попередньо навчена в широкому хімічному просторі, створюючи багаті молекулярні представлення ще до того, як побачить хоча б один експеримент LNP. Потім він входить у замкнений цикл із платформою роботизованого синтезу: прогнозувати → синтезувати → аналізувати → оновлювати. Кожен раунд справжніх експериментів у лабораторії тонко налаштовує модель, яка потім пропонує більш розумних кандидатів на наступний етап. Лабораторія не просто перевіряє прогнози ШІ — вона активно навчає модель безперервно. Що сталося, коли ми дозволили йому працювати: LUMI-lab автономно синтезував і скринінував 1 700+ іонізованих ліпідів у бронхальних епітеліальних клітинах людини. Головний кандидат — LUMI-6 — має бромований ліпідний хвіст, структурний мотив, який раніше здебільшого ігнорувався у проєктуванні LNP. LUMI знайшли його, не отримавши вказівок, де шукати. Коли LUMI-6 був сформульований у LNP і доставлявся внутрішньотрахічно мишам, він досяг ефективності редагування генів у 20,3% у епітеліальних клітинах легені — переконливий результат для однієї з найважчо доступних терапевтичних цілей, безпосередньо пов'язаних із такими захворюваннями, як муковісцидоз і дефіцит альфа-1 антитрипсину. Чому це важливо поза межами LNPs: Це доказ концепції ширшої тези — що базова модель попереднє навчання + активне навчання + роботизовані експерименти можуть подолати вузьке місце дефіциту даних, яке переслідує відкриття в біології, кероване штучним інтелектом. Для початку не потрібен величезний доменно-специфічний набір даних. Вам потрібна модель, яка може узагальнювати, лабораторія, яка генерує потрібні дані, і цикл, що їх з'єднує. Щирі вітання першим авторам Юе Сюю, @HAOTIANCUI1 і Куань Пану, а також усій команді @BowenLi_Lab. Вдячні нашим співробітникам у @UHN та @UofTPharmacy, а також Центру досліджень раку принцеси Маргарет @PMResearch_UHN. 📄 Стаття: