Аннотация:Дипломная работа Чучанова П.С. посвящена классической задаче информационного поиска — автоматической классификации текстов на основе методов машинного обучения. Для данной задачи предложено множество методов решения. Существуют стандартные методы оценки качества классификации, эталонные коллекции для тестирования методов машинного обучения.
Тем не менее, качество классификации известных методов для многих актуальных задач классификации является крайне низким (менее 50% полноты/точности). Поэтому требуется разработка новых, более эффективных методов классификации.
Целью дипломной работы было разобраться в специфике работы метода опорных векторов SVM, который известен как один из наиболее эффективных на сегодняшний день методов, в применении к задаче классификации текстов и улучшить работу метода SVM на некачественных данных, которые возникают в реальной жизни.