Аннотация:В магистерской диссертации И.Н. Димова рассматривается задача автоматического выделения и оценки аргументации в текстах. Задача является актуальной, так как растет значимость технологий интеллектуального взаимодействия человека с компьютером, например с голосовыми колонками, когда требуется получать не просто фактический, но аргументированный ответ, более того сравнивать различные полемические позиции.
Задача выделения и оценки аргументации является нетривиальной. Аргументация к высказанному утверждению должна быть релевантна теме и содержать некоторую оценку. Проблема в том, что в качестве аргумента часто используются результаты некоторого ло-гического вывода, промежуточные этапы которого опускаются. Полемическая позиция также часто выражается не простыми эмоционально окрашенными словами, но некоторыми фактами, для определения негативной или позитивной оценки которых требуется обширное «внешнее» знание о мире.
В последнее время появились большие предобученные языковые модели (на основе нейросетевой архитектуры BERT), способные в некоторой сжатой форме накапливать знания об окружающем мире. Магистерская диссертация И.Н. Димова посвящена исследованию возможностей современных нейронных сетей для выделения аргументации. Существенной проблемой является отсутствие представительных обучающих текстовых коллекций.
В рамках работ над диссертацией были реализованы методы выделения специального вида аргументации - пропаганды, которые неплохо показали себя в научном соревновании в рамках семинара Semeval 11.
Магистрантом было реализовано несколько нейросетевых архитектур для выделения аргументации в общей задаче. Была проведена большая работа по обучению и тестированию предложенных нейросетевых моделей. Реализованные магистрантом нейросетевые модели, прежде всего BERTSE – «самообъясняющая» модель, позволили получить результаты по качеству выделения аргументации на корпусе ArgsEN лучше, чем в оригинальной работе из-вестных специалистов из компании IBM.
Также И.Н. Димов реализовал перенос обучения на русский язык, создал рабочий веб-сервис для проверки качества выделения аргументации на русском и английском языках.