Top.Mail.Ru

В ЛЭТИ разработали нейросеть для ускорения и облегчения поиска новых лекарственных препаратов

В ЛЭТИ разработали нейросеть для ускорения и облегчения поиска новых лекарственных препаратов

Созданная в ЛЭТИ модель глубокого обучения RetroSynthNet позволяет прогнозировать реагенты для производства новых молекул, сохраняя высокую достоверность результатов реального синтеза.

20.01.2026


Поиск новых типов лекарственных и фармацевтических препаратов — это трудоемкий и затратный аналитический процесс. Как правило, новые соединения являются либо модификациями, либо комбинациями веществ с известными свойствами. Поскольку таких компонентов относительно много, то подбор потенциально полезного нового препарата представляет собой математическую задачу перебора тысяч различных комбинаций в составе макромолекулы.

Поскольку предсказать с высокой вероятностью новые свойства бывает сложно, все перспективные препараты проходят лабораторные испытания, в частности на живых клетках, чтобы оценить их полезные и токсические свойства. Однако для человеческого глаза изменения клеток под воздействием тестируемых соединений незаметны. Поэтому для визуальной оценки эффекта ученые добавляют специальные маркеры (дифференциальные красители), которые окрашивают клеточные образцы в различные цвета в зависимости от целостности, жизнеспособности и некоторых других характеристик клетки.

Применение такого подхода требует большого количества образцов для проведения испытаний, поскольку после окрашивания клетки, как правило, выводятся из эксперимента вследствие побочных эффектов красителей. При этом количество образцов, успешно прошедших испытания, обычно оказывается многократно ниже количества неудачных. Поэтому для разработчиков новых лекарственных препаратов задача автоматизации и удешевления процесса отбора перспективных макромолекул является крайне актуальной.

«Мы разработали инновационную модель глубокого обучения RetroSynthNet, которая значительно ускоряет и облегчает процесс проектирования синтеза новых фармацевтических препаратов. Используя подход “последовательность-последовательность” и анализ химических структур в формате SMILES, RetroSynthNet автономно прогнозирует возможные реагенты для производства целевых молекул, сохраняя при этом высокую химическую достоверность — почти 70%. Этот и другие показатели точности демонстрируют способность модели генерировать качественные и вычислительно эффективные решения».

Аспирант кафедры вычислительной техники (ВТ) СПбГЭТУ «ЛЭТИ» Джозеф Инносент

В рамках исследования использован набор данных для синтеза соединений USPTO-50K – это обширный датасет, который находится в свободном доступе для исследователей и включает огромное количество данных.

Датасет использовался для обучения нейросети типа Seq2Seq. Ее особенность заключается в том, что при генерации она может имитировать способность человека избирательно концентрироваться на различных фрагментах информации – в данном случае, на участках химических соединений. Производительность, химическая достоверность и точность прогноза оценивались при помощи различных независимых тестов (BLEU, RDKit).

«RetroSynthNet может помочь химикам и исследователям эффективно генерировать потенциальные пути для синтеза молекул лекарственных препаратов, минимизируя ручной анализ и ускоряя начальные этапы разработки лекарств при сравнительно низких вычислительных ресурсах. В перспективе наша нейросеть поможет ускорить темпы фармацевтических исследований, снизить затраты на разработку и облегчить поиск новых терапевтических соединений».

Аспирант кафедры ВТ СПбГЭТУ «ЛЭТИ» Джозеф Инносент

Результаты исследования опубликованы в материалах международной конференции (IEEE) 2025 XXVIII International Conference on Soft Computing and Measurements (SCM).

Работа ведётся в русле научно-исследовательской политики программы развития СПбГЭТУ «ЛЭТИ» «Приоритет 2030», национального проекта «Молодёжь и дети» и инициативы Десятилетия науки и технологий.