ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Сегодня практически в любом русскоязычном тексте, будь то научная или публицистическая статья, новостной сайт в сети Интернет или инструкция по эксплуатации технического прибора, встречается большое количество словоупотреблений на латинице, чаще всего – на английском языке. В первую очередь это институциональные имена собственные: названия компаний и организаций, издательств, средств массовой информации, брендов, программного обеспечения. Чтобы в системе русскоязычного синтеза речи по тексту озвучивать англоязычные словоупотребления, которые представляют собой последовательность знаков латинского алфавита, необходимо в первую очередь перевести их в ту же графическую или фонетическую систему, которая используется для озвучивания обычного русскоязычного текста, написанного на кириллице. Для решения данной задачи нами предлагается метод практической транскрипции. При практической транскрипции мы переводим последовательность символов графической системы языка-источника L1 (здесь – латиницы) в последовательность символов графической системы языка-восприемника L2 (кириллицы), произношение которой в языке-восприемнике ближе всего к произношению исходной последовательности в языке-источнике [Успенский: 396]. Имея в распоряжении фонетическую транскрипцию английского слова, по предложенным в настоящей работе правилам англо-русской практической транскрипции можно получить следующие примеры обработки англоязычных вставок: (1) Bloomberg [ˈbluːmbərɡ] – /блу+мберг/ (2) British Airways [ˈbrɪtɪʃ ˈeəweɪz] – /бри+тиш э+рвэйс/. Система правил англо-русской практической транскрипции была разработана нами на основе работ [Ермолович], [Гиляревский, Старостин]. Нужно отметить, что изначально правила создавались указанными авторами с целью графической передачи английских имен собственных в русских текстах. В целях адаптации оригинальных правил Ермоловича и Гиляревского к возможностям и требованиям русскоязычного синтеза речи мы провели несколько перцептивных экспериментов на разборчивость англоязычных словоупотреблений, озвученных русскоязычным синтезатором с использованием предложенной ими системы практической транскрипции. С учетом анализа речи телеведущих и дикторов российских новостных каналов и результатов проведенных экспериментов исходные правила были скорректированы под задачу синтеза речи и протестированы дополнительно в озвученном синтезированном варианте. К важным преимуществам предлагаемого нами способа обработки слов на латинице относится среди прочего его оптимальность: вместо составления обширных словарных списков или написания дополнительного языкового модуля мы используем сравнительно небольшой набор правил англо-русской практической транскрипции для перевода английских слов на кириллицу. Кроме того, предлагаемый метод универсален, то есть может быть использован в любой русскоязычной системе синтеза речи: после того, как вставка на латинице переведена в кириллическую графическую систему, она может на всех дальнейших этапах синтеза речи обрабатываться по тем же правилам, что и обычные (нормализованные) русские слова на кириллице. Для оценки разборчивости англоязычных вставок, озвученных с помощью практической транскрипции, нами было проведено несколько целевых перцептивных экспериментов. С помощью транскрипционных правил, использованных в настоящем исследовании, был достигнут средний уровень разборчивости 86,6%. Систематические ошибки испытуемых при восприятии английских словоупотреблений позволили выделить ряд спорных вопросов в оригинальных правилах практической транскрипции (постановка ударения в сложных словах, передача фонем [w], [ð] и [θ] и др., некоторых суффиксов). Поскольку озвучивание англоязычных вставок на основе правил практической транскрипции осуществляется с помощью звуков русского языка, принципиально важной становится оценка качества и приемлемости такого способа озвучивания с точки зрения русскоязычных пользователей данных систем. В этом контексте помимо разборчивости озвучиваемых единиц важно рассмотреть и другой критерий оценки качества синтезированной речи: ее естественность. Если понимать под естественностью «соответствие норме, эталону», то каким именно нормам должны соответствовать озвученные английские словоупотребления? Нормам произношения английского или русского языка? И можно ли вообще четко определить, как произносительные нормы русского языка распространяются на английские слова в русскоязычном контексте? Чтобы изучить, как русскоговорящие дикторы произносят английские названия в русском контексте, нами был проанализирован аудио- и видеоматериал новостных сайтов и технические обзоры Интернет-магазинов. Анализ материала показал, что русскоязычные дикторы имеют привычку фонетически модифицировать английские слова, заимствованные в русскую речь. Для английских звуков, отсутствующих в русском языке, подыскиваются ближайшие по звучанию звуки-замены: так, вместо Twitter ['twɪtə] и Forbs [fɔːps] произносится «русифицированное» [тв'и́тър], [форпс]. Степень русификации диктором зависит среди прочего от распространенности англоязычной вставки и ее длины. В целом, если говорить о естественности синтеза речи по тексту, можно сделать вывод, что при озвучивании отдельных английских слов и не очень длинных словосочетаний вполне допустимо (а иногда даже желательно) использовать звуковой материал русского языка. С этой точки зрения практическая транскрипция как способ передачи англоязычных вставок при синтезе речи кажется вполне оправданной.
№ | Имя | Описание | Имя файла | Размер | Добавлен |
---|---|---|---|---|---|
1. | Презентация | Lomonosov-2016_prezentatsiya.pdf | 151,2 КБ | 17 января 2017 [cherepanova_od] |