![]() |
ИСТИНА |
Войти в систему Регистрация |
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Представленный комплексный проект включает в себя создание, обоснование и применение новых высокопроизводительных алгоритмов решения важных прикладных задач естествен-ного и гуманитарного характера в физике элементарных частиц, задачах искусственного ин-теллекта и автоматической обработки текстов, разработке моделей Земной системы, биоин-форматике, а также разработку архитектуры и принципов построения сверхвысокопроизво-дительной платформы для эффективной поддержки приложений предсказательного модели-рования и искусственного интеллекта, требующих интенсивных вычислений и/или работу с большими объемами данных. Модели, методы и средства высокопроизводительных вычислений. В рамках проекта будет создана уникальная система оценок, позволяющих проводить срав-нительный анализ и расставлять приоритеты при изучении производительности суперком-пьютерных приложений и систем. После этого будут разработаны методы и средства опера-тивного информирования пользователей, администраторов и руководства суперкомпьютеров о качестве выполнения отдельных приложений и вычислительной системы в целом, выводы о котором будут получены с помощью разработанной системы оценок. Физика элементарных частиц. В современной физике элементарных частиц «Стандартная Модель» достаточно хорошо описывает, по крайней мере, сильное, слабое и электромагнитное взаимодействия. Поскольку она основана на квантовой теории поля, а в четырёхмерном пространстве-времени до сих пор не удаётся решать квантовополевые модели точно, теория возмущений остаётся наиболее последовательным подходом в физике элементарных частиц. Предполагается усовершенствовать алгоритмы и соответствующие компьютерные программы, требуемые для проведения вычислений в данной области, адаптировать их для работы с использованием сверхвысокопроизводительных платформ и применить для решения конкретных задач. Искусственный интеллект и автоматическая обработка текстов. В СМИ, сети Интернет, социальных сетях публикуется огромное количество мнений, анализ которых может дать представление о проблемах и вопросах, обсуждаемых с наиболее диаметральных позиций, изучить настроения общества. Анализ больших текстовых данных с использованием методов искусственного интеллекта для выделения значимых факторов и их взаимосвязей в сочетании с традиционными методами социологии, такими как социологические опросы, может дать более детальную картину происходящих в обществе процессов. Задачей исследования является формирование карты дискуссионных вопросов с выявлением антагонистических и поддерживающих отношений между обсуждаемыми субъектами, объектами, явлениями и процессами, основных позиций по данным вопросам, что позволит быстрее выявлять возникающие проблемные точки и конфликты в российском обществе, исследовать модели предсказательного моделирования социальной устойчивости общества. Новизна исследования состоит в применении комплексного подхода к анализу больших текстовых данных, включая большие лингвистические ресурсы (словари оценочной лексики, онтологии), предобученные модели и методы классификации на основе нейронных сетей, методы логического вывода, и методы анализа связного текста. Прежде всего путем внедрения знаний о глобальных взаимосвязях окружающего мира, описанных в больших лингвистических ресурсах, в большие предобученные языковые модели. Суперкомпьютерный кодизайн для моделей Земной системы. Процессы, происходящие в деятельном слое суши и пограничном слое атмосферы, представляют ключевые звенья циклов энергии, воды, углерода и биогенных элементов в Земной системе. Явное численное моделирование многомасштабных и комплексных физических процессов в этих слоях требуется как в частных прикладных задачах, так и для совершенствования систем предсказательного моделирования погоды и климата. Это, в свою очередь, подразумевает развитие математических методов и алгоритмов и использование принципов суперкомпьютерного кодизайна. В проекте будет проведено усовершенствование вихреразрешающей модели пограничного слоя атмосферы и схемы деятельного слоя суши в части воспроизведения процессов, связанных с переносом и преобразованием влаги. Часть математических подходов при этом будет применено впервые в мире. Одной из основных задач является также реализация упомянутых моделей на высокопроизводительных платформах с использованием общей, распределённой памяти и графических ускорителей. Биоинформатика и моделирование живых систем. Выполнение проекта сделает возможным использование компьютерных методов в медицине и фармацевтике на качественно новом уровне. Будет создана единая база ключевых белков/ферментов человека и перечень мутаций, связанных с патологическими состояниями организма, что даст возможность проводить автоматизированную оценку функциональной значимости структурных вариаций в геноме пациента. Будет разработана не имеющая мировых аналогов технология компьютерного дизайна прототипов лекарственных средств, предсказания их возможных побочных действий, что позволит исключить ряд длительных и трудоемких стадий предварительного экспериментального скрининга и существенно ускорить процесс создания селективных лекарственных препаратов.
The presented complex project includes the creation, substantiation and application of new high-performance algorithms for solving important applied problems of a natural and humanitarian nature in elementary particle physics, аrtificial intelligence and natural language processing tasks, development of the Earth System models, bioinformatics problems, as well as the development of architecture and principles for building an ultra-highperformance platform to efficiently support computationally intensive and / or data intensive predictive modeling and artificial intelligence applications. Models, methods and tools of high-performance computing. Within the project a unique assessment system will be created that allows for comparative analysis and prioritization when studying the performance of supercomputer applications and systems. After that, methods and tools will be developed for promptly informing users, administrators and supercomputing managers about the quality of the execution of individual applications and the computing system as a whole, conclusions about which will be obtained using the developed assessment system. Elementary particle physics. In modern elementary particles physics, the "Standard Model" describes quite well, at least, strong, weak and electromagnetic interactions. Since it is based on quantum field theory, and in four-dimensional space-time it is still not possible to solve quantum field models exactly, perturbation theory still remains the most consistent approach in elementary particle physics. It is supposed to improve the algorithms and the corresponding computer programs required to carry out computations in this area, to adapt them to work using ultra-high-performance platforms and apply to solving specific problems. Artificial intelligence and natural language processing. A huge number of opinions are published in the media, the Internet, social networks, the analysis of which can give an idea of the problems and issues discussed from the most diametrical positions, and study the mood of society. Such an analysis, combined with traditional methods of sociology, such as sociological polls, can provide a more detailed picture of the processes taking place in the society. The objective of the study is to form a map of debatable issues with the identification of relations between them, the main positions on these issues, which will make it possible to quickly identify emerging problem points and conflicts in Russian society, and explore models of predictive modeling of social stability of society. The novelty of the research lies in the application of an integrated approach to the analysis of large text data, including large linguistic resources (dictionaries of evaluative vocabulary, ontology), pre-trained models and classification methods based on neural networks, inference methods, and methods for analyzing coherent text. Supercomputer codesign for the Earth System models. The processes occurring in the soil active layer and atmospheric boundary layer represent the key links in the cycles of energy, water, carbon and biogenic elements in the Earth system. Explicit numerical modeling of multiscale and complex physical processes in these layers is required both in particular applied problems and for improving predictive weather and climate modeling systems. This, in turn, implies the development of mathematical methods and algorithms and the use of the principles of supercomputer codesign. The project will improve the Large-eddy simulation model of the atmospheric boundary layer and the land surface scheme in terms of reproducing the processes associated with the transfer and phase transitions of moisture. Some of the mathematical approaches will be applied for the first time. One of the main tasks is also the implementation of the mentioned models on high-performance platforms using shared, distributed memory and GPU. Bioinformatics and modeling of living systems. The implementation of the project will make it possible to use computational methods in medicine and drug design at a qualitatively new level. A unified database of key human proteins/enzymes and a list of substantiated mutations related to pathological conditions of the patients will be created, which will make it possible to conduct an automated assessment of the functional significance of structural variations in the patient's genome. The technology of a computational design of drug prototypes, predicting their possible side effects, which has no analogues, will be developed, what will make possible to eliminate a number of lengthy and laborious stages of preliminary experimental screening and significantly accelerate the process of creating selective drugs.
Модели, методы и средства высокопроизводительных вычислений. Обзор и анализ возможностей современных сквозных цифровых технологий для решения вычислительно сложных задач. Разработка программной инфраструктуры сверхвысокопроизводительной платформы предсказательного моделирования, включая архитектуру, комплект подсистем обеспечения эффективности платформы, правила построения платформы с учетом целевых функций базового вычислительного центра, в рамках которого разворачивается платформа. Установка сверхвысокопроизводительной платформы предсказательного моделирования на российских суперкомпьютерных центрах МГУ имени М.В.Ломоносова и в двух СКЦ из списка Топ50 самых мощных суперкомпьютеров России. Физика элементарных частиц. Оптимизация алгоритмов, ориентированных на применение сверхпроизводительных вычислительных платформ, для вычисления многопетлевых фейнмановских интегралов. Применение этих алгоритмов в современной физике элементарных частиц. Предполагается дальнейшее развитие и применение программы FIRE, позволяющей осуществлять сведение любого многопетлевого фейнмановского интеграла заданного семейства к так называемых мастер-интегралам. Предполагается аналитически вычислить двухпетлевые смешанные КХД-слабые поправки в рождение бозона Хиггса в рамках глюонного синтеза, для диаграмм, содержащих петлю тяжелых кварков. Предполагается аналитически вычислить фейнмановские интегралы, описывающих рассеяние электронов и позитронов, для диаграмм с безмассовым порогом в t-канале. Искусственный интеллект и автоматическая обработка текстов. Основным результатом исследований в задачах автоматической обработки текстов является составление так называемой дискуссионной карты (графа знаний оценочных отношений и типовой аргументации), которая показывает сущности, обсуждаемые с наиболее диаметральных позиций, отношения между ними, а также связанные с ними позиции (аргументацию). Построение такой карты для разных источников, разных регионов и разных периодов времени, сопоставление ее с результатами социологических опросов и реальными конфликтами тех же и последующих периодов времени позволит исследовать модели предсказательного моделирования социальной устойчивости общества. Суперкомпьютерный кодизайн для моделей Земной системы. Будет создана и верифицирована новая версия модели деятельного слоя суши ИВМ РАН-МГУ, в которой будет учтен горизонтальный перенос почвенной жидкой и газообразной влаги. В этом отношении модель будет превосходить наиболее известные схемы деятельного слоя систем прогноза погоды и климата. Кроме того, модель будет реализована на гибридных высокопроизводительных платформах (MPI+OpenMP, MPI+OpenACC/CUDA), что также является практически исключением среди ведущих аналогичных моделей. Усовершенствованная модель позволит более точно воспроизводить водный режим суши, что будет впоследствии способствовать повышению качества предсказательного моделирования погоды и гидрологических процессов. Будет разработана вихреразрешающая модель атмосферного пограничного слоя, включающая блок микрофизики для описания фазовых переходов воды, перенос радиации и возможность воспроизведения процессов переноса тепла и влаги в верхнем слое почвы. Вычислительная технология будет ориентирована на архитектуру современных и перспективных высокопроизводительных платформ и будет позволять проводить расчеты на гетерогенных системах, включающих центральные и графические процессоры. Численные исследования динамики атмосферного пограничного слоя на основе вихреразрешающей модели позволят рассмотреть задачи об уточнении турбулентных замыканий, параметризаций облачности и микрофизики в предсказательных моделях погоды и климата. Биоинформатика и моделирование живых систем Выполнение проекта сделает возможным использование компьютерных методов в медицине и фармацевтике на качественно новом уровне. Будет создана единая база ключевых белков/ферментов человека и обоснованный перечень их мутаций, связанных с патологическими состояниями организма, что станет основой формирования информационной службы для персонализированной медицины и автоматизированной оценки функциональной значимости структурных вариаций в геноме пациента. Будет разработана не имеющая мировых аналогов технология компьютерного дизайна прототипов лекарственных средств, предсказания их возможных побочных действий, что позволит исключить ряд длительных и трудоемких стадий предварительного экспериментального скрининга и существенно ускорить процесс создания селективных лекарственных препаратов. Создание единой базы участков связывания модуляторов функциональной активности белков/ферментов в живых системах от микроорганизмов до человека позволит выявлять особенности структурной организации и регуляции белков/ферментов, обеспечивающих похожую функцию в организмах животных и человека по сравнению с патогенами бактериальной и вирусной природы, что даст возможность применить разработанную платформу высокопроизводительного компьютерного скрининга к решению широкого круга задач и проводить не только поиск прототипов новых лекарственных препаратов, но и оценку их токсичности и возможных побочных действий. Для проверки эффективности действия платформы будет осуществлена компьютерная и экспериментальная оптимизация структуры новых ингибиторов вируса гриппа.
Модели, методы и средства высокопроизводительных вычислений. Одной из наиболее значимых задач, выполняемых коллективом исполнителей из МГУ имени М.В.Ломоносова, является работа по сопровождению и обеспечению эффективной эксплуатации Центра коллективного пользования сверхвысокопроизводительными вычислительными ресурсами МГУ имени М.В.Ломоносова, в который на данный момент входит уникальная научная установка (УНУ) суперкомпьютерный комплекс «Ломоносов-2» с суммарной пиковой производительностью 5.5 PFlops, являющийся одним из самых мощных Российских суперкомпьютеров, занимающим на данный момент 130-ое место в международном суперкомпьютерном рейтинге Top500, в котором находится 2 российские установки. Безусловной сильной стороной Центра коллективного пользования сверхвысокопроизводительными вычислительными ресурсами Московского университета является мощное пользовательское сообщество, сложившееся за время функционирования ЦКП. В настоящее время Суперкомпьютерный комплекс МГУ обеспечивает выполнение более 700 суперкомпьютерных проектов, инициированных более чем 100 научными институтами РАН и более чем 100 университетами России. Организация работ в масштабах большого суперкомпьютерного комплекса сопряжена с необходимостью постоянного решения ряда ключевых задач, вот лишь некоторые из них: мониторинг состояния программно-аппаратной среды, учет пользователей, управление доступом и квотами, исследование и оптимизация структуры потока задач, анализ характера использования выделенных ресурсов пользователями и пользовательскими приложениями, обеспечение бесперебойной работы и сохранности оборудования. Все эти и многие другие задачи успешно решаются благодаря использованию комплекса специально разработанных в МГУ профильных инструментов в каждодневной практике Суперкомпьютерного комплекса.
грант РНФ |
# | Сроки | Название |
1 | 17 марта 2021 г.-31 декабря 2021 г. | Разработка и реализация принципов суперкомпьютерного кодизайна для развития сквозных цифровых технологий и создания высокопроизводительных вычислительных платформ для предсказательного моделирования и применения искусственного интеллекта: от микромира, до живых организмов и Земной системы |
Результаты этапа: Модели, методы и средства высокопроизводительных вычислений. Основной целью данной работы является разработка системы оценок, которая позволит оценивать и сравнивать качество использования вычислительных ресурсов в суперкомпьютерных приложениях. Для каждого типа ресурсов предполагается разработать по одной оценке, которая позволит быстро и достаточно точно анализировать общее качество работы с этим типом в рамках отдельных заданий, пользователей, проектов, организаций или прикладных пакетов; при этом собираться оценки будут автоматически для всех выполняющихся заданий. Рассматриваются следующие типы вычислительных ресурсов: процессоры, подсистема памяти, MPI сеть, файловая система (ввод-вывод), графические ускорители. На данном этапе работ была разработана первая версия оценок для рассматриваемых типов ресурсов. Так, оценки качества использования процессоров и подсистемы памяти, которые вычисляются на основе значений аппаратных счетчиков, учитывают долю процессорного времени, во время которого процессор был полностью загружен выполнением полезной работы или простаивал в ожидании данных из памяти, соответственно. Оценки MPI сети и ввода-вывода построены на другом принципе – они учитывают, какие проблемы с производительностью были автоматически обнаружены в выполняющихся приложениях, и насколько серьезно эти проблемы влияют на производительность приложений. Для анализа качества работы с графическими ускорителями были разработаны новые оценки, которые позволяют адаптировать идеи, заложенные в оценках процессоров и подсистемы памяти, для применения на GPU устройствах. Была выполнена реализация и апробация некоторых оценок на суперкомпьютере Ломоносов 2. В частности, был реализован в тестовом режиме модуль системы мониторинга для вычисления оценок качества использования процессоров и подсистемы памяти. Проведенная апробация показала, что предложенные оценки показывают достаточную точность и поэтому подходят для целей данного проекта. Был также реализован автоматический сбор оценок качества использования сети MPI и ввода-вывода для всех задач, выполняющихся на суперкомпьютере Ломоносов-2. Анализ собранной статистики по данным оценкам позволил сделать некоторые интересные выводы. Например, был обнаружен пользователь прикладного пакета, у которого оценка работы с MPI на порядок хуже, чем у всех других пользователей данного пакета. Причина этого заключается, судя по полученным данным, в слишком маленьком размере MPI пакетов, что приводило к существенным накладным расходам. Были также разработаны методы оперативного информирования пользователей и администраторов о качестве выполнения суперкомпьютерных приложений и систем, а также механизмы организации обратной связи с данными участниками, вовлеченными в работу суперкомпьютера. Было проведено детальное рассмотрение возможных вариантов, и в результате были разработаны наиболее подходящие в нашем случае методы, которые предполагают применение различных способов коммуникации в зависимости от оперативности необходимого взаимодействия и роли участников. Помимо этого, были продуманы возможные способы интеграции данных методов в пользовательские и административные технологические циклы, что позволит не только информировать пользователей и администраторов о качестве выполнения приложений, но и по возможности прилагать усилия для повышения этого качества. Физика элементарных частиц. Нами проводились исследования в рамках квантовой хромодинамики, т.е. современной теории сильных взаимодействий, в рамках которой процессы с протонами и нейтронами, а также другими сильно взаимодействующими частицами описываются взаимодействием кварков и глюонов. Аналитически вычислены поправки четвёртого порядка по константе связи в такие фундаментальные функции теории, как фотон-кварковый и Хиггс-глюонный форм-факторы в случае диаграмм, содержащих безмассовую фермионную петлю. Другие исследования по проекту, относящиеся к физике элементарных частиц, производились в рамках квантовой электродинамики. Нами аналитически вычислены так называемые двухпетлевые мастер-интегралы для второго типа планарных вкладов в рассеяние электронов и позитронов. Эти мастер-интегралы представляют собой базис в линейном пространстве всех фейнмановских интегралов данного типа, так что любой из интегралов в этом пространстве может быть выражен в виде некоторой линейном комбинации мастер-интегралов. Подобные результаты не могли бы быть получены без применения ранее разработанных нами программ FIRE и FIESTA, а также проведения оптимизированных вычислений с применением высокопроизводительных серверов (на данный момент без использования суперкомпьютеров). Разрабатываемые нами программы имеют как частные версии, так и публичные, доступные по следующим адресам: https://bitbucket.org/feynmanIntegrals/fiesta https://bitbucket.org/feynmanIntegrals/fire Искусственный интеллект и автоматическая обработка текстов. До недавнего времени большое внимание исследователей уделялось анализу тональности относительно простых видов текстов с точки зрения выражаемой тональности: отзывы пользователей или посты пользователей в Твиттере (твиты). Автоматический анализ тональности осуществляется с помощью двух основных подходов или их комбинирования, а именно методов машинного обучения и методов, основанных на словарях и правилах. В настоящее время удается в значительной мере повысить качество в задачах анализа тональности на основе глубоких нейронных, однако для этого требуются размеченные обучающие коллекции, которые часто отсутствуют в общественно-политической области, отличающейся большим разнообразием обсуждаемых явлений. В ходе первого года проекта собраны текстовые коллекции для исследования позиций по теме и аргументации, создан программный интерфейс для разметки высказываний по релевантности темам и позициям авторов по темам, на основе созданного интерфейса размечены датасеты, в которых выполнена разметка по релевантности темам и по позициям авторов по темам. Выполнено тестирование методов машинного обучения на основе созданных датасетов с разметкой мнений и проведено тестирование методов машинного обучения в задаче извлечения релевантности и мнений на основе англозычных датасетов. Суперкомпьютерный кодизайн для моделей Земной системы. В рамках проекта разработана вычислительная технология вихреразрешающего (LES, Large-Eddy Simulation) моделирования атмосферного пограничного слоя на параллельных вычислительных системах гетерогенной архитектуры. В численной модели используются консервативные конечно-разностные схемы второго и четвертого порядка точности для аппроксимации по пространству на прямоугольных сетках. Применение смешанного локализованного замыкания динамического типа позволяет воспроизвести вертикальное распределение скорости ветра и потенциальной температуры в квазистационарных устойчиво-стратифицированных и конвективных пограничных слоях при относительно грубом пространственном разрешении. Программная реализация основана на гибридном MPI-OpenMP-CUDA подходе и допускает выполнение расчетов как на центральных, так и графических процессорах. Разработанная вычислительная технология дает возможность рассматривать задачи численного моделирования атмосферного пограничного слоя и его суточной динамики на вычислительных сетках большой размерности и на современных суперкомпьютерных системах. В данном отчёте представлена новая версия схемы поверхности суши ИВМ РАН-МГУ, в которой термогидродинамическая модель речной сети встроена в структуру параллельного выполнения модели с использованием двух уровней параллелизма: первый предполагает независимую обработку речных бассейнов на основе MPI, а второй использует технику OpenMP для распараллеливания расчёта рек одного порядка Стралера. Численные эксперименты были проведены для восточноевропейской расчётной области с разрешением 0,5°×0,5°. MPI-реализация модели почвы основана на традиционной равномерной долготно-широтной декомпозиции области интегрирования модели, унаследованной от модели атмосферы. Показано, что параллельная эффективность модели почвы на 1-144 ядрах составляет 0.52-0.79 и ограничивается наличием океанической области, а также дисбалансом вычислительной нагрузки между почвенными колонками, обусловленным наличием/отсутствием снежного покрова и количества итераций для температуры поверхности, необходимых для обновления вертикальных распределений теплофизических характеристик на шаге по времени. Ускорение модели реки на уровне MPI не превысило 4 раза и определяется размером самого большого речного бассейна в расчётной области (Волга), тогда как на уровне OpenMP потенциал ускорения моделирования большого речного бассейна близок к количеству используемых потоков. Ускорению на уровне OpenMP в наших численных экспериментах препятствовало занижение порядков рек при грубом разрешении модели деятельного слоя (рекомендуемая производительность для Волжского бассейна достигается при 4-6 потоках с ускорением в 2,5-3 раза). Дальнейшее развитие параллельного кода включает MPI+OpenMP реализацию модели почвы, оптимизацию MPI-декомпозиции области интегрирования для модели почвы при наличии поверхности океана и дальнейшую настройку MPI+OpenMP конфигурации модели речной системы. Биоинформатика и моделирование живых систем. С использованием принципов суперкомпьютерного дизайна реализована высокоэффективная связка модуля метадинамики и молекулярной динамики на суперкомпьютере “Ломоносов 2” для проведения метадинамических расчётов, в том числе на графических ускорителях. Разрабатываются протоколы интеграции докинга, молекулярной динамики, метадинамики, вычислительной алхимии и новых алгоритмов структурной фильтрации для высокопроизводительного компьютерного скрининга и молекулярного дизайна лекарственных препаратов. Это позволило приступить к разработке новых ингибиторов нейраминидазы вируса гриппа, направленных на преодоление лекарственной устойчивости к существующим препаратам. Высокоэффективные вычисления помогли построить модель конформационной пластичности гемагглютинина вируса гриппа, включающая структурный переход белковой молекулы в “развернутое” состояние трех α-спиралей, необходимое для атаки клетки хозяина, которая будет пригодна для изучения функционирования целого класса патогенов, содержащих белки слияния I класса, включая COVID-19. В ходе работы определены структурные перестройки центральной части поверхностного белка, ответственного за слияние с мембраной клетки хозяина. Произведено моделирование спирализации отдельных субъединиц, из которых складывается центральный фрагмент стволового домена гемагглютинина. При моделировании было обнаружено, что при изменении конформации отдельных субъединиц, их спирализация может предшествовать выпрямлению в конечное состояние. Выпрямление может происходит с использованием особого шарнира в центральной области каждой из субъединиц. Из результатов моделирования становится ясно, что структурный переход каждой из трех субъединиц может быть разобщены во времени Спирализация первой субъединицы способна облегчать переход последующих субъединиц и стабилизировать промежуточные конформации. В ходе работы над проектом также установлены подробности каталитического механизма фермента 2-гидроксибифенил-3-монооксигеназы. Фермент был выделен из почвенной бактерии Pseudomonas azelaica, он позволяет этой бактерии использовать токсичный фунгицид 2-гидроксибифенил в качестве источника углерода и энергии. Механизм работы этого фермента изучен недостаточно, хотя этот фермент представляет как фундаментальный интерес для понимания биодеградации загрязнителей окружающей среды, так и имеет практическую значимость как катализатор для фармацевтической промышленности. Фермент катализирует реакцию окисления 2-гидроксибифенила в 2,3-дигидроксибифенил с помощью кислорода воздуха (добавляет вторую гидроксильную группу в орто-положение к первой), для его работы также требуются коферменты FAD и NADH. С использованием методов молекулярного моделирования на суперкомпьютере "Ломоносов-2" удалось существенно продвинуться в понимании механизма этого фермента: с помощью "разведывательной" метадинамики и методов машинного обучения уточнено положение гибких участков в активном центре; впервые установлен центр связывания кофермента NADH и проведено моделирование полуреакции восстановления активной части FAD с помощью NADH с использованием комбинированного метода квантовой механики, молекулярной механики и метадинамики. Другой задачей выполняемого этапа является моделирование каталитического механизма действия пенициллинацилазы из Escherichia coli и получение ее мутантов с измененными функциональными свойствами. Использование пенициллинацилаз в промышленных процессах производства бета-лактамных антибиотиков позволяет перейти к экологически безопасным технологиям, снижению энергоемкости, повышению качества и стоимости целевых продуктов. В настоящее время наиболее непонятной стадией реакций, катализируемых пенициллинацилазами, является превращение ацилферментного интермедиата. При моделировании была определена траектория доставки нуклеофила в активный центр и роль аминокислотных остатков в координации его аминогруппы для нуклеофильной атаки. Это поможет выявить пути целенаправленного изменения структуры фермента с целью дизайна более эффективных форм биокатализатора для синтеза. К настоящему моменту выявлены два аминокислотных остатка, мутации которых приводят к увеличению синтетической активности пенициллинацилазы. Высокопроизводительное моделирование и использование принципов суперкомпьютерного кодизайна при интеграции инструментов биоинформатики также помогли при изучении структурных изменений белков вируса гриппа (гемагглютинина и нейраминидазы) во время их адаптации к иммунной системе хозяина. Для эффективного распространения гриппа требуется координированное действие двух белков: гемагглютинина, обеспечивающего селективную колонизацию патогена на рецепторах хозяина, и нейраминидазы, способной гидролизовать рецепторы хозяина для отделения новообразовавшихся вирионов от клетки. Получено выравнивание последовательностей гемагглютининов вируса гриппа, обнаруженных у человека, птиц или свиней, и определен круг аминокислотных остатков белка, непосредственно контактирующих с устойчивыми топологиями структур олигосахаридных субстратов. Полученное выравнивание использовано для классификации нейраминидаз по специфичности к субстратам. Сформированные группы позволили определить аминокислотные остатки в нейраминидазах, ответственные за сохранение свойств специфичности в подгруппах. Обнаружены и смоделированы структурные изменения в четырех позициях в нейраминидазе одного из штаммов птичьего вируса, способного заражать человека. | ||
2 | 1 января 2022 г.-31 декабря 2022 г. | Разработка и реализация принципов суперкомпьютерного кодизайна для развития сквозных цифровых технологий и создания высокопроизводительных вычислительных платформ для предсказательного моделирования и применения искусственного интеллекта: от микромира, до живых организмов и Земной системы |
Результаты этапа: | ||
3 | 1 января 2023 г.-31 декабря 2023 г. | Разработка и реализация принципов суперкомпьютерного кодизайна для развития сквозных цифровых технологий и создания высокопроизводительных вычислительных платформ для предсказательного моделирования и применения искусственного интеллекта: от микромира, до живых организмов и Земной системы |
Результаты этапа: | ||
4 | 1 января 2024 г.-31 декабря 2024 г. | Разработка и реализация принципов суперкомпьютерного кодизайна для развития сквозных цифровых технологий и создания высокопроизводительных вычислительных платформ для предсказательного моделирования и применения искусственного интеллекта: от микромира, до живых организмов и Земной системы |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".