Технологии искусственного интеллекта для ретросинтетического анализа больших массивов данных (Big Data) зависимости структура-биологическая активность

КНТН-3-16
Руководитель проекта: А.С. Тимин

НиМБАВ, Институт биомедицинских систем и биотехнологий

 Цель: 

  • Использование графовой свёрточной нейронной сети для поиска фармакофорных фрагментов биологически активных структур и предсказания соединений-лидеров в терапии злокачественных новообразований.

 Задачи проекта:

  • Создание алгоритмов обучения нейросети на основе больших массивов данных; подготовка обучающих, валидационных, тестовых выборок и экспериментальных выборок для анализа взаимосвязи структура-биологическое свойство; предсказание соединений-лидеров;
  • Проведение in vitro и in vivo исследование для отобранных соединений;
  • Разработка и усовершенствование протоколов проведения химиотерапии с использованием разрабатываемых соединений-лидеров.

 Вклад проекта в достижение технологического лидерства:

  • Планируемые результаты способствуют достижению технологического лидерства в рамках национального проекта “Наука и университеты”, Национального проекта “Здравоохранение”, стратегии “Цифровая экономика Российской Федерации” по проекту “Искусственный интеллект” и проекту “Технологии здоровья” в инициативе “Технологии разработки медицинских изделий, лекарственных средств и платформ нового поколения”.
  • Разрабатываемая технология повысит глобальный престиж страны в сфере биотехнологических разработок, внесёт значительный вклад в технологическое лидерство России, укрепит национальную науку, поддерживая государственные приоритеты и снижая зависимость от иностранных решений.

 Сфера применения:

  • Медицинские организации;
  • Фармкомпании.

 Экономический эффект:

Использование методов машинного обучения снижает затраты на начальных этапах разработки до 40% и сокращает время вывода препарата на рынок.

 Репутационный эффект:

Доступность отечественных фармпрепаратов, независимость от зарубежных

Партнеры:

 Ожидаемые результаты в 2025 году:

  • Создание подсистемы ретросинтетического анализа биологически активных структур.
  • Обученная нейросетевая модель на основе больших массивов данных.
  • Создание виртуальной библиотеки (big data) молекулярных дескрипторов потенциальных кандидатных химических структур с селективной противоопухолевой активностью.

 Ожидаемые результаты в 2025 году:

  • Нейросетевая модель, обученная на основании результатов нескольких итераций доклинических испытаний полученных соединений-лидеров. Перечень соединений-лидеров с оптимизированной структурой и готовых к доклиническим испытаниям.

 Ближайшие аналоги:

Recursion, Insilico Medicine, Atomwise, Relay Therapeutics, TumFlow.

 Функциональные преимущества:

Применение собственной базы химических соединений и молекулярных дескрипторов – болеее 10000 соединений.

 Технические преимущества:

Использование собственных вычислительных мощностей -- СЦК “Политехнический” с общей пиковой производительностью 1.7 Петафлопс.

 Стоимостные преимущества:

Применение технологии искуственного интеллекта на ранних этапах разработки противоопухолевых препаратов снижает затраты до 40% и сокращает время вывода препарата на рынок, которое обычно занимает 10–12 лет и обходится в несколько миллиардов рублей.

 Общественно значимый результат:

Технология вносит значительный вклад в технологическое лидерство России, укрепляя национальную науку, поддерживая государственные приоритеты и снижая зависимость от иностранных решений.