ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Программа предназначена для вычислительной оценки тематического сходства двух произвольных коллекций текстов на естественных языках в результате анализа распределения текстов коллекций по категориям, определенным моделью референтной коллекции. Референтная коллекция может включать в свой состав обе сравниваемые коллекции и другие тексты. Модель представлена множествами слов с весовыми коэффициентами, тематически связанных в рамках референтной коллекции. Весовые коэффициенты характеризуют значимость слова в каждой тематической группе. Множества тематически связанных слов определяют таксономию референтной коллекции. Исходными данными являются формируемые вычислительно модель коллекции и распределение документов сравниваемых коллекций по тематическим группам, заданным множествами тематически связанных слов.