Репортаж от Wedoany,Databricks и Nvidia совместно запустили открытый проект под названием Genesis Workbench, направленный на решение проблемы сложности интеграции моделей с корпоративными данными и вычислительной инфраструктурой при внедрении ИИ в сфере наук о жизни.
В исследованиях по открытию лекарств внутренние исследовательские данные компаний, лабораторные результаты и ресурсы GPU обычно распределены по независимым средам, что затрудняет совместную работу и воспроизведение результатов. В то же время количество моделей ИИ постоянно растет, и то, как объединить эти модели с проприетарными данными и существующими рабочими процессами исследований, становится реальной проблемой для фармацевтических и биотехнологических компаний. Genesis Workbench не вводит новые модели, а интегрирует корпоративные данные, модели BioNeMo от Nvidia и инфраструктуру GPU в единую среду Databricks, помогая исследователям перейти от настройки рабочих процессов ИИ к практическому применению.
Платформа фокусируется на всем процессе открытия лекарств, объединяя инструменты для геномики, одноячеечного анализа, белковой инженерии и дизайна малых молекул на единой платформе, в одном пользовательском интерфейсе и под одной моделью управления. По словам Databricks, централизация общедоступных и проприетарных наборов данных с помощью Databricks AI Search позволяет устранить зависимость от внешних API, обеспечивая плавный переход от геномных открытий к одноячеечной валидации, прогнозированию структуры мишеней, стыковке кандидатов, сортировке ADMET и другим этапам. Платформа использует открытые модели, управляемые через Unity Catalog, отслеживает эксперименты с помощью MLflow, а обработка вывода осуществляется сервисами моделей на базе GPU. Nvidia предоставила технологии, такие как BioNeMo Agent Toolkit, Parabricks, а также комбинации биологических и химических моделей.
Отличительной особенностью Genesis Workbench является то, что он полностью работает в среде Databricks клиента, что позволяет организациям хранить конфиденциальные исследовательские данные в рамках существующего контроля управления, не отправляя их сторонним сервисам ИИ. По мере развития биологического ИИ платформа поддерживает гибкое масштабирование: организации могут добавлять или заменять отдельные модули без необходимости перестраивать всю исследовательскую среду.

Исследования в области наук о жизни охватывают несколько дисциплин, включая геномику, структурную биологию, химию и клинические данные, и требуют обработки высокорегулируемых и проприетарных данных. Создание приложений ИИ в такой среде требует не только вычислительной мощности, но и безопасного доступа к данным, а также гибкости для интеграции новых моделей. Для Databricks Genesis Workbench является примером перехода от аналитики к приложениям ИИ на основе lakehouse; Nvidia же использует это для размещения BioNeMo и программного обеспечения для ускоренных вычислений в центре корпоративных рабочих процессов по открытию лекарств.









