Описание:В рамках курса обсуждаются как классические алгоритмы на основе деревьев решений и EM-алгоритма, так и различные их современные модификации, а также подходы для повышения точности работы, в том числе развиваемые автором курса. Рассматриваются такие представляющие большой интерес темы, как методология искусственного зашумления данных, глубокие гауссовские модели и подходы к нетривиальному расширению признакового пространства за счет использования характеристик смешанных вероятностных моделей. Ряд тем дополнен творческими заданиями повышенной сложности, связанными как с программной реализацией алгоритмов, так и с теоретическими исследованиями. В частности, предлагается получить аналоги рассматриваемых теорем для иных классов распределений.
Изложение основ методов дополняется примерами анализа реальных рядов, в том числе рассмотрены: потоки тепла между океаном и атмосферой, осадки в различных климатических зонах, экспериментальные ряды измерений характеристик турбулентной плазмы. Практические задания включают работу с пользовательскими данными, включая открытые репозитории, ориентированные на отработку методов классификации и регрессии.
От слушателей требуется уверенное владение основами теории вероятностей и математической статистики, а также современными языками программирования (Python/R/MATLAB) для выполнения практических занятий.
Данный курс предназначен для студентов, обучающихся по направлениям подготовки, связанным с анализом данных, методами машинного обучения, и интересующихся применением вероятностно-статических моделей в указанных областях. Рекомендуется бакалаврам старших курсов, магистрантам и аспирантам.