Технологии суперкомпьютерного кодизайна для решения ресурсоемких вычислительных задач биокатализаНИР

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

грант РФФИ

Этапы НИР

# Сроки Название
1 1 января 2014 г.-31 декабря 2014 г. Технологии суперкомпьютерного кодизайна для решения ресурсоемких вычислительных задач биокатализа
Результаты этапа: Проект нацелен на исследование принципов выполнения суперкомпьютерного кодизайна (Co-Design) для разработки взаимосогласованного множества масштабируемых математических методов, проектных решений и информационных технологий, одновременно учитывающих особенности архитектуры суперкомпьютерных систем, свойства программно-аппаратной среды, технологии параллельного программирования, структуру алгоритмов и специфику исходных постановок для эффективного решения множества больших задач биоинформатики. За первый год выполнения проекта проведен анализ множества задач биоинформатики, описана структура решения двух ресурсоемких задач данной области. Первая задача - это конструирование выравниваний и биоинформатический анализ больших суперсемейств ферментов. Вторая задача направлена на изучение роли отдельных аминокислотных остатков в работе ферментов и итеративный выбор конкретных изменений в структуре белков, приводящих к целенаправленному улучшению функционального фенотипа. Проведен глубокий анализ одного из наиболее успешных современных проектов: суперкомпьютера ANTON-2, спроектированного полностью на принципах суперкомпьютерного кодизайна, и направленного на решение задач молекулярной динамики. Для каждой описанной задачи выделены основные этапы, определены их ключевые особенности и требования как с точки зрения вычислительной нагрузки, так и с точки зрения обработки больших массивов данных, описаны характерные параметры и их значения для актуальных постановок задач. Проанализированы требования, определяемые исходными постановками задач на ключевых этапах их решения; проведен сквозной анализ структуры выделенных задач с точки зрения технологий суперкомпьютерного кодизайна; на основе проведенного анализа предложена модель организации вычислительного процесса для решения выделенных задач данного класса, объединяющая возможности современных вычислительных платформ.
2 1 января 2015 г.-31 декабря 2015 г. Технологии суперкомпьютерного кодизайна для решения ресурсоемких вычислительных задач биокатализа
Результаты этапа: - описаны структура, количественные и качественные характеристики и параметры вычислительно сложных задач биоинформатики, определены узкие места в структуре задач, требующих особого внимания при выполнении суперкомпьютерного кодизайна; - описана последовательность этапов, потоков задач, информационных зависимостей, последовательности в принятии решений для каждой из рассматриваемых задач биоинформатики; определены взаимосвязи между этапами решения задач и архитектурой современных вычислительных систем; - определена архитектура и действующие прототипы вычислительных платформ, спроектированных для решения задач (1) конструирования выравниваний и биоинформатического анализа больших суперсемейств ферментов и (2) изучения роли отдельных аминокислотных остатков в работе ферментов; - разработаны технологии организации и выполнения серий масштабных вычислительных экспериментов на предложенных вычислительных платформах; проведены эксперименты с использованием реальных данных из Protein Data Base и/или других источников; выполнено профилирование времени выполнения и эффективности отдельных этапов вычислительного процесса для выделенных задач применительно к сегментам целевых вычислительных платформ.
3 1 января 2016 г.-31 декабря 2016 г. Технологии суперкомпьютерного кодизайна для решения ресурсоемких вычислительных задач биокатализа
Результаты этапа: Ожидаемые в конце 2015 г. научные результаты К концу 2015 года будут получены следующие результаты. - описание структуры, количественных и качественных характеристик и параметров вычислительно сложных задач биоинформатики, описание узких мест в структуре задач, требующих особого внимания при выполнении суперкомпьютерного кодизайна; - описание последовательности этапов, потока задач, информационных зависимостей, последовательности в принятии решений для каждой из рассматриваемых задач биоинформатики; описание взаимосвязи между этапами решения задач и архитектурой современных вычислительных систем; - архитектура и действующие прототипы вычислительных платформ, спроектированных для решения задач (1) конструирования выравниваний и биоинформатического анализа больших суперсемейств ферментов и (2) изучения роли отдельных аминокислотных остатков в работе ферментов; - технологии организации и выполнения серий масштабных вычислительных экспериментов на предложенных вычислительных платформах; результаты проведения экспериментов с использованием реальных данных из Protein Data Base и/или других источников; профилирование времени выполнения и эффективности отдельных этапов вычислительного процесса для выделенных задач применительно к сегментам целевых вычислительных платформ.

Статьи по НИР