Аннотация:В настоящей статье рассматриваются проблемы классификации ошибок в
машинном переводе. В первой части предлагается обзор разных подходов к оценке качества
машинного перевода и классификации ошибок, наблюдаемых при работе
автоматизированных систем перевода. Вторая часть посвящена описанию оригинальной
классификации ошибок машинного перевода, которая была создана таргетированно – для
перевода коннекторов в языковой паре русский–французский. На этой языковой паре
подобных исследований еще не проводилось. В предлагаемой классификации выделяются
две основные группы ошибок – грамматические / лексические ошибки во фрагменте текста с
коннектором и ошибки непосредственно в переводе коннектора. В работе использовался
параллельный корпус, состоящий из русскоязычных текстов и их референтных переводов
(около 4 млн словоупотреблений). Из этих русскоязычных текстов отбирались фрагменты,
содержащие коннекторы, которые затем переводились на французский в двух разных
системах машинного перевода.