![]() |
ИСТИНА |
Войти в систему Регистрация |
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Создание и развитие электронных корпусов текстов, словарных и других текстовых баз данных, имеющих значение для изучения русского языка, а также их анализ. В проекте используются методы компьютерной и корпусной лингвистики. Разработка и оптимизация программного обеспечения "Исток" для работы с создаваемыми по проекту корпусами текстов.
Creating and developing electronic text corpora, dictionary and other textual databases that are important to learning of Russian language, as well as their analysis. The project uses methods of computer and corpus linguistics. Development and optimization of Istok software for working with text corpora created by the project.
Финальная версия информационно-исследовательского средства «Исток» и обеспечение с его помощью интернет-доступа к создаваемым по проекту корпусам.
Корпус текстов Пушкина (семантизация, работа с примечаниями и пр.) и корпусом современных житий (снятие омонимии, лексико-грамматические группы и пр.), корпус текстов Чехова
1. Был издан сборник научных статей "Памяти А.А. Поликарпова" (Составитель Е.В.Суровцева, Под редакцией М.Л.Ремнёвой; 39 статей, 37,5 п.л., 596 стр. Электронное издание. Москва: МГУ, 2015. ISBN 978-5-19-011096-0. Сборник представлен на "26-ой международной выставки-презентации учебно-методических изданий" (ноябрь, Москва, РАН). 2. Опубликована статья с результатами анализа тестирования словарного знания (Кукушкина О.В., Варламов А.А., Суровцева Е.В., Пирятинская Е.Ф."Анализ словарного знания: гипотезы и результаты": Сб. науч. ст, место издания Изд-во МГУ Москва, с. 262-268). 2. Подготовлена и сдана в печать статья Е.В.Суровцевой "Анализ текстов А.С.Пушкина в свете составления полного электронного конкорданса писателя" ("Молодой учёный", ноябрь-2). 3. Результаты работы над корпусом А.А. Пушкина были представлены на ежегодных Виноградовских чтениях, проводимых на кафедре русского языка филологического факультета МГУ (январь 2015). 4. Была продолжена работа по трем основным направлениям: (а) созданию учебно-исследовательского электронного корпуса текстов А.С. Пушкина; (б) созданию новых электронных словарных баз данных; (в) тестированию словарного знания.
МГУ имени М.В.Ломоносова | Координатор |
госбюджет, раздел 0110 (для тем по госзаданию) |
# | Сроки | Название |
2 | 1 января 2014 г.-31 декабря 2014 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: 1. Было завершено исследование по гранту РГНФ № 12-04-00405 «Анализ теоретических оснований и проведение экспериментов для отбора активного словаря» (2012-2014 гг). 2. Было проведено тестирование словарного знания и подготовлена база данных, включающая в себя результаты тестирования 70 испытуемых на списке 1650 слов. По его результатам были подготовлены две статьи. 3. Было создано и размещено на сайте средство интерактивного тестирования словарного знания (http://humlang.ru/lc/). 3. Проводилась работа по тестированию и развитию функций системы "ИСТОК", а также по конвертированию текстов словарей в базу данных. 4. Была продолжена работа по созданию учебно-исследовательского электронного корпуса текстов А.С. Пушкина. 5. Осуществлялось руководство лексикографической практикой студентов и компьютерной практикой магистрантов. 6. С помощью средств и корпусов ЛОКЛЛ велись диссертационные и др. исследования. В 2014 г. были созданы также новые электронные корпуса текстов («Корпус текстов устной речи представителей первого и второго поколений русской эмиграции первой "волны"» «Корпус научных реферативных текстов», «Корпус писем Пушкину»). 7. Разработанные в ЛОКЛЛ и с участием ЛОКЛЛ программные средства и учебно-исследовательские корпуса активно использовались при ведении учебного курса «Компьютерные технологии в филологии» для магистрантов факультета - лингвистов (О.В.Кукушкина) и литературоведов (Е.В. Суровцева). 8. По результатом работ ЛОКЛЛ были сделаны доклады на V Международном конгрессе исследователей русского языка «Русский язык: исторические судьбы и современность» (март 2014, Москва, МГУ) и «QUALICO 2014 (Конференция по квантитативной лингвистике)» (май 2014, Прага, Университет им. Палацкого в Оломоуце). 9. На базе ЛОКЛЛ была проведена организационная работа по подготовке и проведению V Международного конгресса «Русский язык: история и современность» 12. Была обсуждена диссертация Д.Ивановой «Синонимия в системной взаимосвязи с другими характеристиками лексики русского языка» (рук. А.А.Поликарпов). | ||
3 | 1 января 2015 г.-31 декабря 2015 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: 1. Была продолжена работа по созданию учебно-исследовательского электронного корпуса текстов А.С. Пушкина: а) На основе «Словаря языка Пушкина» была проведена семантизация слов (диапазон Г-Е). б) Подготовлены для конвертации в систему "Исток" примечания к произведениям Пушкина. в) Были исследованы типы композиционных элементов и вставок чужой речи в текстах Пушкина и сдана в печать статья с результатами этой работы(см. статью Е.В.Суровцевой). г) Начата работа по разметке "типов текста" в корпусе Пушкина. д) Выявлены слова корпуса, отсутствующие в "Словаре языка Пушкина" (диапазон а-н). 2) Была проведена работа по созданию на базе существующих словарей двух новых словарных баз данных (по "Словнику-индексу к словарю древнерусского языка (11-14 вв). Москва-Волгоград 2002 т.1. Отв. Редактор С.П.Лопушанская; по "Словарю древне-русских личных собственных имен" Н.М.Тупикова). 3.Была продолжена работа по тестированию словарного знания и анализу его результатов. Тестирование проводилось в online-режиме с помощью разработанного А.В.Варламовым средства. Некоторые результаты этой работы отражены в статье (см. Кукушкина О.В. и другие). 4. Было продолжено исследование характеристических отличий текстов различных типов на основе тексто-аналитической системы. "СтилеАнализатор". В рамках этого направления был проведен анализ некоторых признаков, обладающих возможной гендерной спецификой (к-во используемых усилительных и смягчительных лексических средств, к-во показателей согласия и несогласия и др.). Работа проводилась на созданном и лемматизованном корпусе мужских и женских текстов современных русских писателей. 5. Был издан сборник научных статей "Памяти А.А. Поликарпова" (Составитель Е.В.Суровцева, Под редакцией М.Л.Ремнёвой; 39 статей, 37,5 п.л., 596 стр. Электронное издание. Москва: МГУ, 2015. ISBN 978-5-19-011096-0. Сборник представлен на "26-ой международной выставки-презентации учебно-методических изданий" (ноябрь, Москва, РАН). 6. Сдана в печать статья Е.В.Суровцевой "Анализ текстов А.С.Пушкина в свете составления полного электронного конкорданса писателя" ("Молодой учёный", ноябрь-2). 7. Результаты работы над корпусом А.А. Пушкина были представлены на ежегодных Виноградовских чтениях, проводимых на кафедре русского языка филологического факультета МГУ (январь 2015 г.) | ||
4 | 1 января 2016 г.-31 декабря 2016 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Достигнуто существенное продвижение в создании корпуса текстов А.С. Пушкина: получены списки для автоматического наложения результатов семантизации контекстов (интервал Ж-З) и завершена лемматизация. В результате этого корпус может быть открыт для частичного использования. Начата работа по исследованию корпуса и публикации его результатов. На этой основе опубликованы две статьи и подготовлен один доклад. Продолжена работа по развитию системы "Исток", связанная с подготовкой справочных материалов и совершенствованием интерфейса работы с ними. Продолжена работа по созданию сводной базы словников русских исторических словарей. Начата работа по составлению "Корпуса русских житий начала XXI века". Опубликована одна статья и сделан один доклад по этой теме. | ||
5 | 1 января 2017 г.-31 декабря 2017 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: В течение отчетного периода велась регулярная работа по лемматизации текстов и получении на этой основе конкордансов и алфавитно-частотных словников по заявкам студентов и аспирантов факультета (исполнитель - О.В.Кукушкина). Продолжена работа над корпусом Пушкина: созданы вспомогательные базы данных для разметки корпуса (зап.-евр. заимствования; варианты слов; лица, охарактеризованные по свойству). По результатам анализа текстов корпуса в "Вестнике МГУ" опубликована третья статья из серии "Язык Пушкина: лексикографические этюды" (О.В.Кукушкина, Е.В.Суровцева, Е.Ф.Пирятинская. Продолжена работа по развитию системы "Исток" (блок соединения справочных словарей и текста) (В.В.Федотов). Продолжена работа по составлению "Корпуса русских житий начала XXI века" (контроль лемматизации, разметка церковной лексики). по результатам опубликовано две статьи и сделано два доклада по этой теме (испольнитель - Е.В.Суровцева. Создан электронный корпус на материале молодежной интернет-переписки (составитель- студ. 6 курса Н.Илюшко). Создан параллельный корпус (русско-китайский) на материале переводов трактата "Дао де дзин" (составитель - Чэнь Сяохуэй(стажер,Пекинский народный университет) Продолжена работа по созданию сводной базы словников русских исторических словарей (О.В.Кукушкина). Защищена на материале "Корпуса Чехова" ЛОКЛЛ кандидатская диссертация (С.С.Гусева, "Номинативная парадигма единиц, обозначающих лица, и ее функционирование в тексте"). Все намеченное выполнено. | ||
6 | 1 января 2018 г.-31 декабря 2018 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Все запланированное выполнено. Получены следующие основные результаты: 1. Пополнена БД «Исторические словники» (в нее включен словник 25 томов словаря XI-XVII вв.; начато распознавание словаря Н. Яновского). 2. С помощью «Стилеанализатора» исследованы особенности употребления трех синонимичных групп в корпусе «Писатели XIX века». 3. Проведена семантизация диапазона «ф-х» корпуса текстов Пушкина . 4. С целью развития функций системы «Исток» разработана система тегирования параметров документов корпусов, отображаемых в режиме «Текст». 5. Создан параллельный корпус переводов китайского трактата «Даодэцзин». 6. На материале корпуса текстов Пушкина защищена одна дипломная работа. 7. С использованием разработок ЛОКЛЛ подготовлены и сделаны три доклада на конференции «Ломоносов». 8. На основе анализа полученных результатов опубликованы 10 статей. 9. По результатам автоматического анализа частей речи подготовлен и прочитан один доклад на «Виноградовских чтениях» 10. Организована и проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 11. По запросам студентов и аспирантов кафедры русского языка был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 12. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. | ||
7 | 1 января 2019 г.-31 декабря 2019 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Основные результаты: 1. Пополнена БД «Исторические словники» (в нее включен черновой вариант словника 30 томов словаря 11-17 вв.) 2. С помощью «Стилеанализатора» исследованы особенности употребления трех синонимичных групп в «Гендерном корпусе2. 3. Проведена семантизация диапазона «Ц – Я» корпуса текстов Пушкина (без служебных слов). 4. С целью развития системы «Исток» разработана функция «Выборка». 5. На материале корпуса текстов Пушкина защищены три работы. 6. С использованием разработок ЛОКЛЛ подготовлен и сделан 1 доклад на конференции «Ломоносов», опубликованы 1 тезисы доклада. 7. На основе анализа полученных результатов опубликованы 15 статей и тезисов докладов. 8. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 9. По запросам студентов и аспирантов, а также сотрудников кафедры русского языка и научных институтов был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 10. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. 11. При активном участии сотрудников ЛОКЛЛ проведен VI Международный Конгресс исследователей русского языка VI «Русский язык: исторические судьбы и современность» (март 2019). По его результатам подготовлен к публикации и опубликован сборник трудов Конгресса. | ||
8 | 1 января 2020 г.-31 декабря 2020 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Основные результаты: 1. Начата работа по пополнению БД «Исторические словники» информацией о словообразовательных гнездах (по САР) 2. Проведена дополнительная семантизация лексики корпуса Пушкина (диапазое А – И) 3. Осуществлялась отладка и оптимизация работы программы "Исток"(после расширения её функций в 2019 году) (настройка новых окошек для отображения словарных статей и информации из справочников). 4. На материале баз данных и корпусов ЛОКЛЛ защищены две магистерские диссертации и один диплом. 5. С использованием разработок ЛОКЛЛ подготовлен и сделано 2 докладв на конференции «Ломоносов». 6. На основе анализа полученных результатов опубликованы 8 статей и 2 тезисов докладов. 7. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 8. По запросам студентов и аспирантов и сотрудников кафедры русского языка был создан ряд конкордансов и корпусов текстов; оказана помощь в получении и количественном анализе словарных данных. 9. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. 10. Проведен анализ корпуса "Наука-Худож" с помощью программы "Стилеанализатор" по параметрам "усилительная лексика", "показатели неожиданности". | ||
9 | 1 января 2021 г.-31 декабря 2021 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Основные результаты: 1. Продолжена работа по пополнению корпуса текстов Пушкина новой информацией и контролю имеющейся. 2. Проведена работа по пополнению новыми данными БД «Исторические словники» (САР, родственные слова). 3. С помощью «Стилеанализатора» исследованы некоторые особенности выражения подчинительных отношений в научном и художественном подкорпусах корпуса «Научные и художественные тексты». 4. Расширены функциональные возможности системы «Исток» (ускорение загрузки словарных материалов; показ распределения единицы по корпусу) 5. На материале корпуса текстов Пушкина подготовлены 3 курсовых работы и защищена одна кандидатская. 6. С использованием разработок ЛОКЛЛ подготовлено и сделано 12 докладов на конференциях. 7. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 8. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. 9. На основе анализа полученных результатов опубликованы 16 статей и тезисов докладов. Запланированное выполнено в полном объеме и с превышением. Планируется продолжение работы во всех указанных направлениях. | ||
10 | 3 января 2022 г.-30 декабря 2022 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Запланированное выполнено. Опубликована опубликовано 7 статей и 3 тезисов. Состоялось выступление на ?? конференциях. Состоялась защита 5 выпускных работа на материале баз данных и корпусов ЛОКЛЛ. Продолжена разметка корпусов Пушкина и современных житий разными типами информации. Велась подготовка материалов для пробной интернет-версии корпуса Пушкина. Подготовлены три конкорданса по заявкам учащихся. Проведена практики для магистрантов кафедры русского языка. | ||
11 | 2 января 2023 г.-29 декабря 2023 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: На основе анализа полученных результатов опубликованы 4 статьи и раздела в коллективной монографии. Сделан доклад в Институте русского языка по результатам работы над корпусом текстов Пушкина. Осуществлена разметка корпуса современных житий новыми типами информации. Продолжена работа по разметке корпуса текстов Пушкина. Подготовлен вариант пробной интернет-версии этого корпуса. Реализованы новые функции в системе "ИСТОК". Выполнены заявки на создание конкордансов и частотных словников по текстам пользователей. Проведена практика для магистрантов. | ||
11 | 1 января 2024 г.-31 декабря 2024 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: Основные результаты: 1. Продолжена работа по пополнению корпуса текстов Пушкина новой информацией и контролю имеющейся. В системе «Исток» создана β-версия корпуса. 2. С помощью «Стилеанализатора» исследованы некоторые особенности использования синонимов в корпусе текстов 19 века. 3. Проведена работа по пополнению новыми данными БД «Исторические словники». 4. Расширены функциональные возможности системы «Исток». 5. С использованием разработок ЛОКЛЛ подготовлено и сделано 15 докладов на конференциях, а также защищена кандидатская диссертация (на материале «Корпуса русских газет конца 20-го века»). 6. Проведена практика по компьютерной лексикографии для магистрантов кафедры русского языка. 7. Продолжена работа по созданию корпуса современных житий новомучеников и исповедников Российских Московской епархии. Произведена разметка корпуса, ведётся работа по анализу лексического состава текстов. В частности, мы приступили к изучению лексического выражения основных понятий русской культуры (вера, любовь, труд и пр.). 8. Продолжена работа над инициативным проектом «Корпус текстов “Русская эмигрантская речь во Франции и Канаде конца ХХ века”». Руководители: Голубева-Монаткина Н.И., Кукушкина О.В. Ответственные исполнители: Суровцева Е.В., Варламов А.А.). 9. На основе анализа полученных результатов опубликованы 13 статей, 1 тезисы доклада и 1 глава в коллективной монографии. 10. Велась работа по созданию конкордансов и частотных словников по заявкам аспирантов и сотрудников факультета. | ||
12 | 9 января 2025 г.-31 декабря 2025 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: | ||
13 | 9 января 2026 г.-9 января 2027 г. | Компьютерно-обеспеченные исследования в области истории и современного состояния русского языка |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".