Компьютерно-обеспеченные исследования в области истории и современного состояния русского языкаНИР

Computer-aided research into the past and present of the Russian language

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

госбюджет, раздел 0110 (для тем по госзаданию)

Этапы НИР

# Сроки Название
2 1 января 2014 г.-31 декабря 2014 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: 1. Было завершено исследование по гранту РГНФ № 12-04-00405 «Анализ теоретических оснований и проведение экспериментов для отбора активного словаря» (2012-2014 гг). 2. Было проведено тестирование словарного знания и подготовлена база данных, включающая в себя результаты тестирования 70 испытуемых на списке 1650 слов. По его результатам были подготовлены две статьи. 3. Было создано и размещено на сайте средство интерактивного тестирования словарного знания (http://humlang.ru/lc/). 3. Проводилась работа по тестированию и развитию функций системы "ИСТОК", а также по конвертированию текстов словарей в базу данных. 4. Была продолжена работа по созданию учебно-исследовательского электронного корпуса текстов А.С. Пушкина. 5. Осуществлялось руководство лексикографической практикой студентов и компьютерной практикой магистрантов. 6. С помощью средств и корпусов ЛОКЛЛ велись диссертационные и др. исследования. В 2014 г. были созданы также новые электронные корпуса текстов («Корпус текстов устной речи представителей первого и второго поколений русской эмиграции первой "волны"» «Корпус научных реферативных текстов», «Корпус писем Пушкину»). 7. Разработанные в ЛОКЛЛ и с участием ЛОКЛЛ программные средства и учебно-исследовательские корпуса активно использовались при ведении учебного курса «Компьютерные технологии в филологии» для магистрантов факультета - лингвистов (О.В.Кукушкина) и литературоведов (Е.В. Суровцева). 8. По результатом работ ЛОКЛЛ были сделаны доклады на V Международном конгрессе исследователей русского языка «Русский язык: исторические судьбы и современность» (март 2014, Москва, МГУ) и «QUALICO 2014 (Конференция по квантитативной лингвистике)» (май 2014, Прага, Университет им. Палацкого в Оломоуце). 9. На базе ЛОКЛЛ была проведена организационная работа по подготовке и проведению V Международного конгресса «Русский язык: история и современность» 12. Была обсуждена диссертация Д.Ивановой «Синонимия в системной взаимосвязи с другими характеристиками лексики русского языка» (рук. А.А.Поликарпов).
3 1 января 2015 г.-31 декабря 2015 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: 1. Была продолжена работа по созданию учебно-исследовательского электронного корпуса текстов А.С. Пушкина: а) На основе «Словаря языка Пушкина» была проведена семантизация слов (диапазон Г-Е). б) Подготовлены для конвертации в систему "Исток" примечания к произведениям Пушкина. в) Были исследованы типы композиционных элементов и вставок чужой речи в текстах Пушкина и сдана в печать статья с результатами этой работы(см. статью Е.В.Суровцевой). г) Начата работа по разметке "типов текста" в корпусе Пушкина. д) Выявлены слова корпуса, отсутствующие в "Словаре языка Пушкина" (диапазон а-н). 2) Была проведена работа по созданию на базе существующих словарей двух новых словарных баз данных (по "Словнику-индексу к словарю древнерусского языка (11-14 вв). Москва-Волгоград 2002 т.1. Отв. Редактор С.П.Лопушанская; по "Словарю древне-русских личных собственных имен" Н.М.Тупикова). 3.Была продолжена работа по тестированию словарного знания и анализу его результатов. Тестирование проводилось в online-режиме с помощью разработанного А.В.Варламовым средства. Некоторые результаты этой работы отражены в статье (см. Кукушкина О.В. и другие). 4. Было продолжено исследование характеристических отличий текстов различных типов на основе тексто-аналитической системы. "СтилеАнализатор". В рамках этого направления был проведен анализ некоторых признаков, обладающих возможной гендерной спецификой (к-во используемых усилительных и смягчительных лексических средств, к-во показателей согласия и несогласия и др.). Работа проводилась на созданном и лемматизованном корпусе мужских и женских текстов современных русских писателей. 5. Был издан сборник научных статей "Памяти А.А. Поликарпова" (Составитель Е.В.Суровцева, Под редакцией М.Л.Ремнёвой; 39 статей, 37,5 п.л., 596 стр. Электронное издание. Москва: МГУ, 2015. ISBN 978-5-19-011096-0. Сборник представлен на "26-ой международной выставки-презентации учебно-методических изданий" (ноябрь, Москва, РАН). 6. Сдана в печать статья Е.В.Суровцевой "Анализ текстов А.С.Пушкина в свете составления полного электронного конкорданса писателя" ("Молодой учёный", ноябрь-2). 7. Результаты работы над корпусом А.А. Пушкина были представлены на ежегодных Виноградовских чтениях, проводимых на кафедре русского языка филологического факультета МГУ (январь 2015 г.)
4 1 января 2016 г.-31 декабря 2016 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Достигнуто существенное продвижение в создании корпуса текстов А.С. Пушкина: получены списки для автоматического наложения результатов семантизации контекстов (интервал Ж-З) и завершена лемматизация. В результате этого корпус может быть открыт для частичного использования. Начата работа по исследованию корпуса и публикации его результатов. На этой основе опубликованы две статьи и подготовлен один доклад. Продолжена работа по развитию системы "Исток", связанная с подготовкой справочных материалов и совершенствованием интерфейса работы с ними. Продолжена работа по созданию сводной базы словников русских исторических словарей. Начата работа по составлению "Корпуса русских житий начала XXI века". Опубликована одна статья и сделан один доклад по этой теме.
5 1 января 2017 г.-31 декабря 2017 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: В течение отчетного периода велась регулярная работа по лемматизации текстов и получении на этой основе конкордансов и алфавитно-частотных словников по заявкам студентов и аспирантов факультета (исполнитель - О.В.Кукушкина). Продолжена работа над корпусом Пушкина: созданы вспомогательные базы данных для разметки корпуса (зап.-евр. заимствования; варианты слов; лица, охарактеризованные по свойству). По результатам анализа текстов корпуса в "Вестнике МГУ" опубликована третья статья из серии "Язык Пушкина: лексикографические этюды" (О.В.Кукушкина, Е.В.Суровцева, Е.Ф.Пирятинская. Продолжена работа по развитию системы "Исток" (блок соединения справочных словарей и текста) (В.В.Федотов). Продолжена работа по составлению "Корпуса русских житий начала XXI века" (контроль лемматизации, разметка церковной лексики). по результатам опубликовано две статьи и сделано два доклада по этой теме (испольнитель - Е.В.Суровцева. Создан электронный корпус на материале молодежной интернет-переписки (составитель- студ. 6 курса Н.Илюшко). Создан параллельный корпус (русско-китайский) на материале переводов трактата "Дао де дзин" (составитель - Чэнь Сяохуэй(стажер,Пекинский народный университет) Продолжена работа по созданию сводной базы словников русских исторических словарей (О.В.Кукушкина). Защищена на материале "Корпуса Чехова" ЛОКЛЛ кандидатская диссертация (С.С.Гусева, "Номинативная парадигма единиц, обозначающих лица, и ее функционирование в тексте"). Все намеченное выполнено.
6 1 января 2018 г.-31 декабря 2018 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Все запланированное выполнено. Получены следующие основные результаты: 1. Пополнена БД «Исторические словники» (в нее включен словник 25 томов словаря XI-XVII вв.; начато распознавание словаря Н. Яновского). 2. С помощью «Стилеанализатора» исследованы особенности употребления трех синонимичных групп в корпусе «Писатели XIX века». 3. Проведена семантизация диапазона «ф-х» корпуса текстов Пушкина . 4. С целью развития функций системы «Исток» разработана система тегирования параметров документов корпусов, отображаемых в режиме «Текст». 5. Создан параллельный корпус переводов китайского трактата «Даодэцзин». 6. На материале корпуса текстов Пушкина защищена одна дипломная работа. 7. С использованием разработок ЛОКЛЛ подготовлены и сделаны три доклада на конференции «Ломоносов». 8. На основе анализа полученных результатов опубликованы 10 статей. 9. По результатам автоматического анализа частей речи подготовлен и прочитан один доклад на «Виноградовских чтениях» 10. Организована и проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 11. По запросам студентов и аспирантов кафедры русского языка был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 12. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов.
7 1 января 2019 г.-31 декабря 2019 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Основные результаты: 1. Пополнена БД «Исторические словники» (в нее включен черновой вариант словника 30 томов словаря 11-17 вв.) 2. С помощью «Стилеанализатора» исследованы особенности употребления трех синонимичных групп в «Гендерном корпусе2. 3. Проведена семантизация диапазона «Ц – Я» корпуса текстов Пушкина (без служебных слов). 4. С целью развития системы «Исток» разработана функция «Выборка». 5. На материале корпуса текстов Пушкина защищены три работы. 6. С использованием разработок ЛОКЛЛ подготовлен и сделан 1 доклад на конференции «Ломоносов», опубликованы 1 тезисы доклада. 7. На основе анализа полученных результатов опубликованы 15 статей и тезисов докладов. 8. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 9. По запросам студентов и аспирантов, а также сотрудников кафедры русского языка и научных институтов был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 10. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. 11. При активном участии сотрудников ЛОКЛЛ проведен VI Международный Конгресс исследователей русского языка VI «Русский язык: исторические судьбы и современность» (март 2019). По его результатам подготовлен к публикации и опубликован сборник трудов Конгресса.
8 1 января 2020 г.-31 декабря 2020 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Основные результаты: 1. Начата работа по пополнению БД «Исторические словники» информацией о словообразовательных гнездах (по САР) 2. Проведена дополнительная семантизация лексики корпуса Пушкина (диапазое А – И) 3. Осуществлялась отладка и оптимизация работы программы "Исток"(после расширения её функций в 2019 году) (настройка новых окошек для отображения словарных статей и информации из справочников). 4. На материале баз данных и корпусов ЛОКЛЛ защищены две магистерские диссертации и один диплом. 5. С использованием разработок ЛОКЛЛ подготовлен и сделано 2 докладв на конференции «Ломоносов». 6. На основе анализа полученных результатов опубликованы 8 статей и 2 тезисов докладов. 7. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 8. По запросам студентов и аспирантов и сотрудников кафедры русского языка был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 9. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. 10. Проведен анализ корпуса "Наука-Худож" с помощью программы "Стилеанализатор" по параметрам "усилительная лексика", "показатели неожиданности".
9 1 января 2021 г.-31 декабря 2021 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Основные результаты: 1. Продолжена работа по пополнению корпуса текстов Пушкина новой информацией и контролю имеющейся. 2. Проведена работа по пополнению новыми данными БД «Исторические словники» (САР, родственные слова). 3. С помощью «Стилеанализатора» исследованы некоторые особенности выражения подчинительных отношений в научном и художественном подкорпусах корпуса «Научные и художественные тексты». 4. Расширены функциональные возможности системы «Исток» (ускорение загрузки словарных материалов; показ распределения единицы по корпусу) 5. На материале корпуса текстов Пушкина подготовлены 3 курсовых работы и защищена одна кандидатская. 6. С использованием разработок ЛОКЛЛ подготовлено и сделано 12 докладов на конференциях. 7. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 8. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. 9. На основе анализа полученных результатов опубликованы 16 статей и тезисов докладов. Запланированное выполнено в полном объеме и с превышением. Планируется продолжение работы во всех указанных направлениях.
10 3 января 2022 г.-30 декабря 2022 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: Запланированное выполнено. Опубликована опубликовано 7 статей и 3 тезисов. Состоялось выступление на ?? конференциях. Состоялась защита 5 выпускных работа на материале баз данных и корпусов ЛОКЛЛ. Продолжена разметка корпусов Пушкина и современных житий разными типами информации. Велась подготовка материалов для пробной интернет-версии корпуса Пушкина. Подготовлены три конкорданса по заявкам учащихся. Проведена практики для магистрантов кафедры русского языка.
11 2 января 2023 г.-29 декабря 2023 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа: На основе анализа полученных результатов опубликованы 4 статьи и раздела в коллективной монографии. Сделан доклад в Институте русского языка по результатам работы над корпусом текстов Пушкина. Осуществлена разметка корпуса современных житий новыми типами информации. Продолжена работа по разметке корпуса текстов Пушкина. Подготовлен вариант пробной интернет-версии этого корпуса. Реализованы новые функции в системе "ИСТОК". Выполнены заявки на создание конкордансов и частотных словников по текстам пользователей. Проведена практика для магистрантов.
11 1 января 2024 г.-31 декабря 2024 г. Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".