ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Разработка качественно новых методов построения тест-систем для решения биологических и медицинских задач предсказания и классификации с данными высокой размерности и малым количеством образцов.
Development of new methods for constructing test systems for solving biological and medical problems of prediction and classification with high-dimensional data and a small number of samples.
Развитие переборного подхода к построению тест-систем.
Членами коллектива был предложен подход, основанный на полном переборе комбинаций из небольшого числа признаков с последующим «жадным» достраиванием. Оказалось, что, например, в случае рака молочной железы таким образом можно строить тест-системы, сопоставимые по качеству с лучшими коммерческими решениями, но состоящие из существенно меньшего количества генов. В работе подход был успешно применен к построению тест-системы в ситуации, когда был проведен предварительный отбор признаков с учетом графа взаимодействий.
госбюджет, раздел 0110 (для тем по госзаданию) |
# | Сроки | Название |
1 | 10 января 2022 г.-31 декабря 2022 г. | Математические методы анализа биомедицинских данных |
Результаты этапа: 1. Разработан новый инструмент для анализа регуляторных внутриклеточных сетей, позволяющий идентифицировать и количествено оценивать внутриклеточные взаимодействие. Он использует информацию об экспериментально подтвержденных взаимодействиях, а также интегративные профили экспрессий молекул miRNA/mRNA в заданном наборе образцов. Последнее обеспечивает одновременную тканеспецифичность и биологическую обоснованность взаимодействий. Компьютерная реализация выложена в открытый доступ https://github.com/s-a-nersisyan/miRGTF-net. 2. Предложен новый подход к построению тест-систем, основанный на полном переборе комбинаций из небольшого числа признаков с предварительным отбором признаков и последующим «жадным» достраиванием. Он позволяет строить простые тест-системы, сопоставимые по качеству с лучшими коммерческими решениями. В рамках проекта была создана компьютерная реализация этого подхода, которая успешно применена для решения задачи предсказания рецидива рака молочной железы и задачи предсказания времени дожития пациентов в постоперационный период. Компьютерная реализация выложена в открытый доступ https://github.com/s-a-nersisyan/ExhauFS. 3. Получена более точная верхняя оценка вероятности линейной отделимости двух множеств случайных точек в многомерном вещественном пространстве. Данная оценка позволяет в худшем случае оценить точность и качество машинного обучения тест-систем для задач классификации многомерных данных. 4. Исследована новая математическая модель внутриклеточной динамики развития инфекции COVID-19, представленная системой дифференциальных уравнений. Получены аналитические решения нескольких параметров этой системы, для которых ранее были известны только приближенные численные решения. Полученные результаты были применены для оценки инкубационного периода COVID-19 и сравнения различных критериев прекращения изоляции пациентов с COVID-19. 5. Решена задача о классе алгоритмической сложности задачи подбора оптимальных порогов в алгоритме бинаризации многомерных вещественных данных. Известно, что данная задача принадлежит классу сложности NP. В рамках проекта было доказано, что задача является NP-полной и, следовательно, оптимальным разрешающим алгоритмом для этой задачи в худшем случае может быть только переборный алгоритм. | ||
2 | 10 января 2023 г.-31 декабря 2023 г. | Математические методы анализа биомедицинских данных |
Результаты этапа: Мы собрали несколько типов данных для клеточных линий Caco-2, инфицированных SARS-CoV-2, включая титры инфекционного вируса, измерения внутриклеточной вирусной РНК, данные о жизнеспособности клеток и процент инфицированных клеток для вариантов WT и Delta. Мы показали, что стандартные модели не могут объяснить некоторые ключевые наблюдения, учитывая отсутствие цитопатического эффекта в клеточных линиях человека. Мы предложили новую математическую модель динамики SARS-CoV-2 in vitro, которая включала явное моделирование внутриклеточных событий, таких как истощение клеточных ресурсов, необходимых для производства вируса. Модель также явно учитывает врожденный иммунный ответ. Предложенная модель точно объясняет экспериментальные данные. Ослабленная репликация дельта-варианта в клетках Caco-2 может быть объяснена нашей моделью на основе всего двух параметров: сниженной скорости проникновения клеток и повышенной скорости выработки цитокинов. Мы предложили модель динамики заражения SARS-CoV-2 в клеточных линиях, основанную на системе из шести интегро- дифференциальных уравнений. Оказалось, что на клеточной линии Caco-2 различия между штаммами можно с высокой точностью описать с помощью трех параметров — интенсивности заражения, интенсивности генерации цитокинов и интенсивности заражения резистентных клеток. В дальнейшем планируется обобщение результатов на случай других клеточных линий. Были решены две задачи выявления и классификации неоднородностей на основе данных, полученных от тактильного механорецептора в случае, когда жесткость вкраплений выше, чем жесткость здоровой ткани. Решение задач реализовывалось с помощью методов машинного обучения. Была создана библиотека искусственных образцов с реалистичными свойствами, каждый образец был пальпирован с помощью тактильного механорецептора при различных условиях. Коллекция собранных данных разбивалась на обучающую и тестовую компоненту; на обучающей компоненте проводилась настройка параметров алгоритма распознавания, на тестовой выборке вычислялось качество работы. | ||
3 | 10 января 2024 г.-31 декабря 2024 г. | Математические методы анализа биомедицинских данных |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".