План работы семинара «Проблемы современных информационно-вычислительных систем»: 2024-2025 учебный год, зимний семестр
Заседания: 25 февраля 2025 г., 4 марта 2025 г., 11 марта 2025 г., 18 марта 2025 г., 25 марта 2025 г., 1 апреля 2025 г., 8 апреля 2025 г., 8 апреля 2025 г., 15 апреля 2025 г., 22 апреля 2025 г., 29 апреля 2025 г.,
Аннотация доклада.
В условиях быстрого развития технологий искусственного интеллекта (ИИ) и увеличения объема информации, с которой сталкиваются государственные институты, возникает необходимость в эффективных инструментах для поддержки принятия решений. В данном докладе рассматривается внедрение больших языковых моделей (БЯМ) в процессы автоматизации экспертизы отчетов научно-исследовательских работ (НИР) как одного из направлений использования ИИ в управлении наукой. БЯМ могут значительно повысить эффективность обработки и анализа больших объемов текстовой информации, обеспечивая быстрое и точное выявление значимых данных и выводов. Доклад включает в себя обзор процесса интеграции БЯМ в рабочий процесс эксперта, обзор существующих методов и инноваций. Обсуждаются преимущества и вызовы, связанные с интеграцией ИИ в процессы экспертизы, включая вопросы надежности и этики, технологического оснащения и необходимую подготовку кадров. В заключение, формулируются рекомендации по дальнейшему развитию и внедрению ИИ-технологий в решение задач управления наукой, подчеркивая важность пошагового подхода для достижения устойчивых результатов в области научной экспертизы, как в обобщенном процессе интеграции ИИ в государственное управление.
Аннотация доклада.
Для решения некоторых задач картирования местности необходимо сенсорное прощупывание самой территории и объектов, на ней расположенных. Для этого используются манипуляторы с установленными на них датчиками силы, позволяющими получить необходимую информацию. На основе анализа данных, поступающих от датчика силы, предложен алгоритм определения класс препятствия в процессе его взаимодействия с манипулятором. При этом точность и надежность измерений датчика силы зависит от способа крепления датчика к манипулятору и формы поверхности взаимодействия датчика с внешними объектами. В докладе описываются эксперименты по определению наилучшего способа крепления датчика Force Sensitive Resistor 0.5 для задач сенсорики. Успешное определение класса препятствия позволит не только построить карту местности, но и предотвратить поломку устройства при воздействии на «статичный» объект с чрезмерным усилием.
Аннотация доклада.
В докладе рассматривается проблема разработки геоинформационных систем, используемых для задач управления территорией на основе данных. Данные о территории могут поступать из множества различных источников, в том числе из интернет. Подобные дата-ориентированные системы зачастую подвержены угрозам, возникают риски при использовании данных для принятия решений. Предлагается шаблон проектирования архитектуры ГИС на основе кибериммунного подхода, использующего принципы конструктивно безопасных систем (англ. Secure by Design). Кибериммунный поход продвигается "Лабораторией Касперского", объединяя экономически эффективную методологию разработки киберсистем с архитектурными требованиями к ним. Предлагаемый архитектурный шаблон позволяет проектировать защищенную архитектуру многомодульной ГИС в зависимости от требуемого уровня безопасности и выделяемых ресурсов на обеспечение безопасности.
Аннотация доклада.
Перспективной сферой использования больших языковых моделей является статический анализ программного кода. В частности, такие модели могут использоваться для обнаружения и классификации различных типов уязвимостей. Одной из наиболее распространенных архитектур больших языковых моделей является архитектура Transformer. Модели на этой архитектуре показывают впечатляющие результаты в области генерации программного кода, а также во многих других сферах программной инженерии. Эффективность обучения во многом зависит от качества данных на которых происходит обучение. В связи с этим, одной из ключевых проблем при обучении нейросетевых моделей является недостаток качественных наборов данных. В докладе будут рассмотрены основные трудности и особенности тонкой настройки больших языковых моделей при использовании их для поиска уязвимостей, а также представлен формальный подход к описанию нейросетевых статических анализаторов.
Аннотация доклада.
Миграция баз данных информационных систем с богатой внутренней структурой на новую СУБД является нетривиальной задачей, для решения которой не существует универсального механизма. В докладе рассматривается набор адаптированных существующих и дополнительно разработанных средств, использованных в рамках миграции БД информационной наукометрической системы "ИСТИНА" с СУБД Oracle на СУБД PostgreSQL. При разработанном подходе подготовка к переходу становится частью эволюции системы, что снижает риски и позволяет лучше адаптироваться к особенностям новой СУБД.
Аннотация доклада.
В докладе рассматривается система мониторинга для выявления атак по сторонним каналам (Side-Channel Attacks, SCA), разрабатываемая в НИЦ "Курчатовский институт" - НИИСИ. Приведено теоретическое обоснование выбранного метода выявления SCA-атак: анализ аппаратных событий целевой системы. Дано описание архитектуры системы мониторинга, включающее низкоуровневые процессы сбора данных и экспертную систему, производящую анализ собранных данных, приведены результаты тестирования прототипа этой системы на различных классах SCA-атак.
Аннотация доклада.
Формальная верификация позволяет математически доказать корректность программного обеспечения, повышая его надежность в критически важных системах. В докладе рассматриваются основные подходы к формальной верификации, их преимущества и ограничения. Особое внимание уделено применению системы Coq на примере доказательства корректности алгоритма решения систем линейных уравнений. Также обсуждаются трудности практического использования формальной верификации и возможные пути их преодоления.
Аннотация доклада.
Тривиальное применение больших языковых моделей ограничено областью знаний, на которых обучена та или иная LLM. Для учета знаний конкретной предметной области применяются методы типа дообучения (SFT), дообучения с обратной связью от человека (RLHF/DPO) или генерация с дополненной выборкой (RAG). Наиболее многообещающим выглядит использование коммуникативных агентов. Поведение человека зависит от ответа на 3 ключевые вопроса: 1 Какую ситуацию я сейчас наблюдаю? 2 Какой личностью я являюсь? 3 Какое действие в ситуации, типа текущей, предпримет личность типа меня? Применение больших языковых моделей позволяет задать первые две конфигурации в виде промпта, а ответ на последний вопрос получить из обобщения мультимодальных, в том числе, текстовых данных. При этом эти данные агенты могут получать путем активного взаимодействия внешней средой и обобщать на основе знаний, накопленных в LLM. В докладе представлены подходы к проблемной ориентации предобученных языковых моделей и примеры построения систем коммуникативных агентов на базе LLM для: - описания социальных явлений - генерации программного кода В качестве «гуманитарного примера» рассматривается составление информационной сводки об интересующих событиях с помощью следующей конфигурации агентов: Агент1 - ОSINT goal - Составить подборку информационных источников по заданному региону backstory - Вы являетесь специалистом OSINT и на основании задания ищете источники информации об интересующих событиях заданного региона. При подготовке поискового запроса Вы рассматриваете как российские, так и зарубежные источники Агент2 - Референт goal - Составить подборку новостей по заданному региону backstory - Вы являетесь референтом и с использованием полученного перечня источников составляете подборку актуальных новостей об интересующем событии Агент3 - Аналитик goal — Подговить краткую справку по предоставленной информации с указанием источников backstory - Вы являетесь аналитиком и с использованием полученного перечня информационных материалов составляете краткую справку об интересующем событии
Аннотация доклада.
В данном докладе рассматривается разработка системы обратной связи для миоэлектрических протезов верхней конечности, а также программно-аппаратного обеспечения, необходимого для обучения пользователей работе с протезом и контроля за функционированием датчиков. Основная цель исследования заключается в разработке и дальнейшей апробации систем обратной связи в аспекте программно-аппаратного обеспечения. Миоэлектрические протезы, оснащенные системой обратной связи, позволят пользователям управлять протезами, восстанавливая не только моторные, но и сенсорные функции, что значительно улучшает качество жизни людей с ампутациями. Помимо этого, обратная связь может использоваться в технологиях дополненной и виртуальной реальности, открывая новые каналы взаимодействия в медицине, образовании и развлечениях. В данной работе рассмотрено решение, позволяющее воспроизвести для реального или виртуального миоэлектрического протеза ключевые системы обратной связи – проприоцептивную, тактильную и температурную. Изучены различные типы датчиков, использующиеся при реализации программно-аппаратного комплекса системы обратной связи, и определены наиболее удачные в аспекте программно-аппаратной реализации конфигурации элементов системы. Также проведен сравнительный анализ микроконтроллеров и выбор наиболее подходящего под условия текущей задачи. Спроектированы подходы по установке и расположению тактильных актуаторов на поверхности руки. На основе рассмотренных подходов и методов была создана информационная система обучения пользователя работе с миоэлектрическими протезами, использующая технологию виртуальной реальности. Полученные результаты могут значительно расширить функциональные возможности миоэлектрических протезов.
Аннотация доклада.
Последовательности событий, также иногда называемые нерегулярными многомерными временными рядами, являются распространённым типом данных в банковской сфере. Современные методы глубокого обучения позволяют эффективно извлекать информацию из таких последовательностей, превосходя традиционные подходы в решении задач прогнозирования, включая такие задачи, как оценка вероятности дефолта по кредитам и оттока клиентов. В докладе рассматриваются архитектуры нейронных сетей, адаптированные для различных задач анализа событийных последовательностей, а также методы их обучения, основанные на подходах из компьютерного зрения и обработки естественного языка. Представлены практические примеры использования данных технологий в реальных банковских задачах.
Аннотация доклада.
В докладе будут рассмотрены вопросы устойчивости моделей сегментации изображений к состязательным атакам – специальным модификациям входных данных, призванных воздействовать на работу моделей машинного (глубокого) обучения. Семантическая сегментация играет важную роль в определении (понимании) содержания изображения. Семантическая сегментация – это такой вид разметки данных, который позволяет определять, какие объекты находятся на изображении, разметив их границы и местоположение. Соответственно, состязательные атаки на такого рода модели направлены на искажение этой информации (сокрытие объектов, изменение их границ или меток и т.п.). В докладе рассмотрены как существующие атаки на модели семантической сегментации, так программные инструменты тестирования устойчивости к ним.