Индекс Гиттинса для простого семейства марковских игровых автоматов - доклад на конференции | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Автор: Савелов М.П.
Всероссийская Конференция : 63-я Всероссийская научная конференция МФТИ
Даты проведения конференции: 23 ноября - 3 декабря 2020
Дата доклада: 28 ноября 2020
Тип доклада: Устный
Докладчик: не указан
Место проведения: МФТИ, Russia
Аннотация доклада:
Ряд опубликованных в последнее время работ посвящен задаче о многоруком бандите. В докладе будет обсуждаться одна из версий этой задачи. Мы будем рассматривать простое семейство марковских игровых автоматов, предполагая, что отсутствует дисконтирование и присутствуют штрафы за переход от одного игрового автомата к другому. Также будем предполагать, что марковские цепи, задающие эволюцию игровых автоматов, имеют конечное пространство состояний. Оптимальной считается стратегия, имеющая наибольшую среднюю прибыль за единицу времени на бесконечном временном отрезке. Основным результатом доклада является теорема о том, что в данной задаче оптимальная стратегия может быть задана с помощью индекса Гиттинса в случае естественного предположения о неотрицательности штрафов.
Добавил в систему: Савелов Максим Павлович

	ИСТИНА	Войти в систему Регистрация
	Интеллектуальная Система Тематического Исследования НАукометрических данных
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

Интеллектуальная Система Тематического Исследования НАукометрических данных

Индекс Гиттинса для простого семейства марковских игровых автоматовдоклад на конференции