ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
ПРИМЕНЕНИЕ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ К ЗАДАЧЕ ГЕНЕАЛОГИЧЕСКОЙ КЛАССИФИКАЦИИ В ТЕКСТОЛОГИИ Шпирко Сергей Валерьевич Московский физико-технический институт Московский Университет имени М.В.Ломоносова Высшая Школа Экономики Традиция применения математических методов к задаче формализованной классификации списков средневековых текстов ведет свое начало с 60-х гг. прошлого века. В основе большинства построенных моделей лежит содержательное предположение относительно процесса копирования списков: чем “ближе” генеалогически пара списков друг к другу, тем меньше различий содержат их тексты [1]. В результате попарного сличения текстов списков формируется матрица близости. Применяя теоретико-графовые подходы, на основе данной матрицы формируется граф списков. Далее из всех списков выбирают экспертным путем основной. К данному списку привязывают построенный граф списков, ориентируя его тем самым во времени (генеалогическое древо). Как известно, средневековый текст в процессе своего бытования подвергался последовательным искажениям, что приводило к возникновению своеобразных типологических рядов (редакций, изводов) [2]. При этом текст мог правиться по нескольким источникам, принадлежащим разным редакциям. Таким образом, становится невозможно однозначно отнести список к той или редакции. Иными словами, проведение классификации списков возможно лишь с определенной долей достоверности. По мнению автора доклада, данные наблюдения весьма естественным образом укладываются в круг идей и принципов теории нечетких множеств [3]. Предлагаемая автором доклада модель основывается на следующих предположениях:Чем больше доля ошибок, перешедших из одного списка в другой, тем достовернее гипотеза о том, что первый список генетически предшествует второму. И, наоборот, чем меньше эта доля, тем более независимы данные списки друг от друга [4]. Построенная на основе данной модели матрица (отношения предпочтения) уже не будет симметричной, как в случае с матрицей близости. В то же время, применяя аппарат теории нечетких множеств, удается формальным образом разбить исходное нечеткое отношение на симметричную (отношение эквивалентности) и антисимметричную (отношение порядка) части. Иными словами, удается разбить множество списков на текстологически близкие классы и установить между ними генеалого-преемственный связи. При этом степень подобного разбиения на классы нечеткой эквивалентности регулируются внешним параметром - уровнем нечеткости. 1. Бородкин Л.И. Математические модели классификации древних текстов //Методы количественного анализа текстов нарративных источников. Сборник статей. М., 1983. С. 8-30. 2. Лихачев Д.С. Текстология. Л., 1983. 640 С. 3. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М., 1976. 165 С. 4. Шпирко С.В. Применение теории нечетких множеств к задаче генеалогической классификации в текстологическом исследовании // Историческая информатика: Информационные технологии и математические методы в исторических исследованиях и образовании. Барнаул, 2013. N 3. С. 39-51.