ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Доклад посвящен задаче автоматического извлечения устойчивых словосочетаний (multiword expressions, MWE) из корпусов текстов для пополнения тезауруса. Предлагается и описывается метод извлечения MWE на основе сравнения множеств соседних слов потенциальных MWE и их компонентов. В качестве корпуса использованы русскоязычные новостные тексты, опубликованные в Интернете в 2011 году, в качестве потенциальных словосочетаний рассматриваются именные группы типа "прилагательное-существительное" и "существительное-существительное". Предложенный подход сравнивается со статистическими методами, традиционно используемыми в задаче автоматического извлечения MWE.
№ | Имя | Описание | Имя файла | Размер | Добавлен |
---|---|---|---|---|---|
1. | Презентация | Using_context_information_for_Russian_MWE_extraction.pptx | 1,9 МБ | 14 декабря 2019 [rossyaykin] |