Аннотация:В выпускной квалификационной работе Руслана Рашитовича Касимова рассматривается проблема автоматического определения сарказма в текстах. Наличие сарказма часто меняет оценку мнений на противоположную, поэтому важным является разработка и исследование моделей распознавания сарказма с целью их использования в современных системах понимания естественного языка. Однако, ключевым препятствием является недостаток соответствующих размеченных датасетов, особенно для русского языка. Поэтому рецензируемая работа, посвященная созданию и анализу русскоязычного текстового корпуса, размеченного по наличию сарказма, является весьма актуальной.
ВКР включает семь основных разделов. Во введении описывается актуальность предметной области. Во втором разделе приводится обзор существующих методов автоматического определения сарказма. В третьем разделе формулируется постановка задачи. Четвертый раздел посвящен описанию процедуры создания датасета на основе перевода корпуса на бенгальском языке BanglaSARC. В пятом разделе рассматриваются текстовые признаки, используемые в исследуемых моделях классификации. В шестом разделе приведены результаты экспериментов с пятью моделями на созданном датасете. В Заключении излагаются полученные в работе результаты.
Несомненным достоинством ВКР является текстовый корпус на русском языке с разметкой по сарказму, предоставленный в общий доступ.