Аннотация:Дипломная работа Рыжкова Александра Михайловича посвящена исследованию популярной модели алгоритмов машинного обучения – случайного леса, а также обобщений этой модели и построению композиций алгоритмов модели. Работа состоит из введения, двух основных разделов, заключения и списка литературы. В введении кратко говорится о появлении модели случайного леса. Первый раздел в работе назван теоретическим, в нём даётся постановка задачи классификации, описан алгоритм случайного леса, его недостатки и способы их устранения, способы ансамблирования алгоритмов, подходы к анализу плотности распределения объектов.
Второй раздел – основной – описывает вычислительные эксперименты. Автор рассмотрел два набора больших данных: «Бозон Хиггса» и «Avazu CTR prediction». Исследуется зависимость качества решения от параметров алгоритма, авторская модифицированная модель алгоритмов (обосновывается её эффективность для рассмотренных задач), композиции алгоритмов. Отдельно отметим исследование эффективности алгоритмов в задачах с пропусками в данных. Представлено оригинальное решение для интерпретации получаемых результатов с помощью методов многомерного шкалирования. Рассмотрена проблема применения исследуемых моделей на данных, которые не помещаются в ОЗУ. По результатам проведённых экспериментов сделаны выводы.
Из недостатков работы отметим специфический стиль написания работы, например обилие фраз не свойственных научному тексту: «этот алгоритм произвел настоящий фурор», «ни что не идеально» и т.п.