ИСТИНА |
Войти в систему Регистрация |
|
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
Программное обеспечение предназначено для автоматической классификации текстов. Под классификацией понимается отнесение входного текста к одной или нескольким заранее предопределенным тематическим категориям. В программном обеспечении реализованы следующие методы классификации: 1) выявление в тексте сообщения ключевых терминов (слов и словосочетаний), сопоставленных тематическим категориям, и их последующего вероятностного анализа; 2) сопоставление лексического состава входного текста и набора текстов-образцов. При классификации учитываются особенности словоизменения для русского и основных европейских языков. Процесс классификации управляется данными, определяющими состав и свойства категорий, а также набор признаков и критериев классификации. Программное обеспечение представляет собой библиотеку процедур, предназначенную для встраивания в пользовательские приложения.