Аннотация:В работе Журавлева А.Д. рассматривается задача прогнозирования результата спортивных соревнований. Спортивная аналитика – новый быстрорастущий рынок, объем которого превысит $4,7 млрд к 2021 г. (по прогнозам WinterGreen Research). В работе рассматривается в качестве примера хоккей. Принимая во внимание огромное количество исторических данных по хоккею, можно попытаться применить подход к прогнозированию хоккейных матчей на основе машинного обучения. Сказанное определяет актуальность темы исследования.
Автором проводится анализ источников данных по хоккею, их характеризация, предлагается процедура интеграции в одну базу. Анализируются возможные статистические характеристики и формирование обучающей выборки на этой основе. Далее, рассматриваются алгоритмы функционирования букмекерских контор, обсуждаются возможные стратегии ставок. На основе этого формулируется задача бинарной классификации (ставить на исход 1 или на противоположный ему исход 2), что существенно упрощает задачу прогнозирования. Также определяется метрика, которая будет является показателем успешности прогноза (ROI).