Аналитические методы теории риска, основанные на смешанных вероятностных моделяхНИР

Analytic methods of risk theory based on mixed probability models

Соисполнители НИР

МГУ имени М.В.Ломоносова Координатор

Источник финансирования НИР

грант РНФ

Этапы НИР

# Сроки Название
1 27 апреля 2018 г.-31 декабря 2018 г. Аналитические методы теории риска, основанные на смешанных вероятностных моделях
Результаты этапа: Работы, намеченные на 2018 год, выполнены в полном объеме. В частности: В рамках направления 1 получены следующие результаты. В. Ю. Королевым и А. И. Зейфманом разработаны некоторые критерии сравнения качества статистических оценок, построенных по выборкам случайного объема, с оценками, построенными по выборкам неслучайного объема. В качестве такого критерия предложено использовать дефект статистической оценки (обычно определяемый по отношению к «оптимальной» оценке), определяемый как число наблюдений, которые надо добавить к имеющейся выборке, чтобы рассматриваемая оценка была бы столь же эффективна, как и оптимальная. Дефект оценки может быть наглядной характеристикой возможной потери эффективности, когда выборка со случайным объемом (то есть такая, в которой число наблюдений заранее не известно и само является наблюдением) ошибочно интерпретируется как выборка с неслучайным объемом, в которой фактически неизвестный объем выборки заменен его наблюдаемым значением. Показано, что если асимптотическое распределение объема выборки, нормализованного его математическим ожиданием, не является вырожденным, то дефект оценки (статистики), построенной по выборке случайного объема, по отношению к оценке, построенной по выборке, объем которой неслучаен и равен математическому ожиданию случайного объема исходной выборки, растет почти линейно с ростом указанного математического ожидания. Доказано, что нетривиальное поведение дефекта (его асимптотическая ограниченность) возможно, только если случайный объем выборки является асимптотически вырожденным. Это утверждение является иллюстрацией того, что при невырожденном предельном распределении объема выборки асимптотическое распределение оценки имеет «тяжелые хвосты». Подробно рассмотрены случаи, когда объемы выборки имеют пуассоновское и биномиальное распределения. В. Ю. Королевым и А. К. Горшениным изучено асимптотическое поведение экстремальных порядковых статистик, построенных по выборкам случайного объема, порожденного дважды стохастическим пуассоновским процессом (процессом Кокса) и имеющего смешанное пуассоновское распределение. Доказаны некоторые неравенства, связывающие распределения и моменты экстремальных порядковых статистик с аналогичными характеристиками управляющего процесса (накопленной интенсивности). Доказаны предельные теоремы для распределений макс-обобщенных процессов Кокса, описаны предельные теоремы. Рассмотрен важный частный случай, когда объем выборки имеет отрицательное биномиальное распределение, соответствующего ситуации, в которой процесс Кокса управляется гамма-процессом Леви. Этот случай дает асимптотическое обоснование возникновения темперированных предельных распределений. В рамках направления 2 получены следующие результаты. В. Ю. Королевым и А. К. Горшениным рассмотрен важный пример предельной теоремы для экстремальных порядковых статистик, построенных по выборкам случайного объема, имеющего отрицательное биномиальное распределение. Данный пример соответствует ситуации, в которой процесс Кокса управляется гамма-процессом Леви. Этот случай дает асимптотическое обоснование возникновения темперированных предельных распределений. Исследована возможность практического применения этих результатов к вероятностному моделированию статистических закономерностей в данных об атмосферных осадках. В частности, предложены асимптотические аппроксимации для распределения максимального суточного объема осадков за дождливый период. Эта аппроксимация имеет вид масштабной смеси распределения Фреше, в которой в качестве смешивающего выступает гамма-распределение. Показано, что указанная смесь совпадает с темперированным распределением Снедекора-Фишера – распределением положительной степени случайной величины, имеющей классическое распределение Снедекора-Фишера. Аналогичные распределения получены для m-х экстремумов и выборочных квантилей. Доказательство соответствующих результатов основано на представлении отрицательного биномиального распределения в виде смешанного геометрического и смешанного пуассоновского распределений и предельных теоремах для экстремальных порядковых статистик, построенных по выборкам случайного объема, имеющего смешанное пуассоновское распределение. Описаны некоторые аналитические свойства полученных предельных распределений. В частности, показано, что при некоторых условиях предельное распределение является смешанным показательным и, следовательно, безгранично делимым. Показано, что при тех же условиях предельное распределение может быть представлено в виде масштабной смеси устойчивых или вейбулловских или паретовских или полунормальных распределений. Соответствующие мультипликативные представления случайных величин с указанными распределениями могут быть использованы для их компьютерной симуляции. Результаты статистической подгонки предложенных моделей к реальным данным свидетельствует об их отличном согласии с реальными данными. Также показано, что в указанной ситуации асимптотическим распределением выборочных квантилей является распределение Стьюдента – частный случай обобщенных дисперсионных гамма-распределений. Предложены некоторые методы статистического оценивания параметров предложенных моделей. Полученные представления асимптотических распределений в виде смесей дают лучшее представление о природе байесовских вероятностных моделей. М. Васильевой, А. К. Горшениным и В. Ю. Королевым показано, что флуктуации продолжительностей дождливых и сухих периодов, измеряемых в сутках, могут с очень высокой степенью согласия быть описаны отрицательным биномиальным распределением. Для многих географических точек как в России, так и за ее пределами вычислены оценки числовых характеристик указанного распределения. Отмечена зависимость параметра формы отрицательного биномиального распределения от высоты измерительной станции над уровнем моря и рельефа соответствующей местности (для равнинных станций параметр формы меньше единицы, для горных – больше единицы). Подобная информация может существенно улучшить качество интеллектуального анализа данных, например, с применением машинного обучения, поскольку позволяет ввести дополнительные обучающие признаки без увеличения объема исходных данных. В. Ю. Королевым и А. И. Зейфманом рассмотрен широкий класс гибких дискретных моделей – так называемые обобщенные отрицательные биномиальные распределения. Эти распределения являются смешанными пуассоновскими законами, в которых смешивающие распределения принадлежат классу обобщенных гамма-распределений (GG-распределений). Класс GG-распределений был введен E W. Stacy как единое семейство, включающее одновременно гамма- и вейбулловские распределения. Такие распределения весьма многообещающи при статистическом описании закономерностей, наблюдаемых во многих реальных явлениях. Изучены аналитические свойства обобщенных отрицательных биномиальных распределений. Показано, что GG-распределение является смешанным показательным тогда и только тогда, когда параметр формы и показатель степени в экспоненте не превосходят единицу. Смешивающее распределение выписано в явном виде. Показано, что оно является масштабной смесью односторонних строго устойчивых законов, сосредоточенных на положительной полуоси. В качестве следствия получено представление обобщенного отрицательного биномиального распределения в виде смешанного геометрического распределения. Рассмотрена соответствующая схема испытаний Бернулли со случайной вероятностью успеха. В рамках такой схемы доказан «случайный» аналог теоремы Пуассона, устанавливающий сходимость смешанных биномиальных распределений к смешанному пуассоновскому распределению. Доказаны предельные теоремы для сумм случайного числа независимых случайных величин, в которых число слагаемых имеет обобщенное отрицательное биномиальное распределение. Рассмотрены ситуации, в которых распределения слагаемых могут иметь как легкие, так и тяжелые хвосты. Описан класс предельных законов. Он оказывается довольно широким и включает обобщенные дисперсионные гамма-распределения. Для предельных законов получены разнообразные представления в виде смесей нормальных распределений или распределений Лапласа, Миттаг-Леффлера или Линника. В рамках направления 3 получены следующие результаты. И. Г. Шевцовой получены новые оценки для характеристических функций. Доказано точное моментное неравенство, связывающее квадратичный хвост распределения с квадратичным хвостом его сверточной симметризации, оптимальное при каждом значении параметра усечения. Найдены верхние оценки асимптотически правильных констант в обобщенных неравенствах типа Эсеена и Розовского, устанавливающих оценки скорости сходимости в центральной предельной теореме для сумм независимых случайных величин в терминах усеченных алгебраических третьих моментов и квадратичных хвостов, где обобщения были получены за счет введения параметра баланса и параметризации границы усечения. В рамках направления 4 получены следующие результаты. В.Ю. Королевым, А. Ю. Корчагиным, А.А. Щербининой и В.Ю. Евстефеевой предложен и исследован комбинированный сеточный метод статистического оценивания параметров распределений Линника и Миттаг-Леффлера. Особенностью задачи является отсутствие явных представлений плотностей указанных распределений в терминах элементарных функций, что делает неприменимым метод максимального правдоподобия. Более того, в этой ситуации «чистый» метод моментов также неприменим из-за того, что указанные распределения имеют тяжелые хвосты. Предлагаемый в данной статье сеточный метод основан на возможности представления распределений Линника и Миттаг-Леффлера соответственно в виде масштабной смеси распределения Лапласа и смешанного показательного распределения. В обоих случаях смешивающее распределение одно и то же и соответствует отношению двух независимых односторонних строго устойчивых случайных величин с одним и тем же характеристическим показателем. Оказалось, что плотность этого распределения может быть выражена в терминах элементарных функций и имеет довольно простой явный вид. На первом этапе предлагаемого метода с помощью версии ЕМ-алгоритма ищется дискретная аппроксимация указанного смешивающего распределения. На втором этапе путем минимизации невязки между полученной дискретной оценкой и теоретической смешивающей плотностью по параметру находится оценка параметра анализируемого распределения. Приведены результаты имитационного моделирования, иллюстрирующие сходимость метода. Также приведены результаты сравнения описываемого метода с оценками, полученными методом логарифмических моментов. Показано, что для некоторых диапазонов значений неизвестных параметров двухэтапный сеточный метод дает более точные оценки. Полученные результаты являются базой для дальнейших исследований с целью разработки двухэтапных сеточных методов с адаптивным выбором сетки и исследованием их свойств. В рамках направления 5 получены следующие результаты. Ю. С. Хохловым выделен класс многомерных распределений, обладающий свойством многомерного правильного изменения. Изучены свойства распределений из этого класса при суммировании независимых одинаково распределенных случайных векторов с таким распределений, в том числе и для случайных сумм. Эти результаты применены для описания некоторого обобщения областей нормального притяжения операторно-устойчивых распределений. Предложен некоторый вариант многомерной модели коллективного риска с зависимыми компонентами, в которой величина выплат имеет многомерное распределение описанного выше типа. Для такой модели получена асимптотика вероятности разорения при большой величине начального капитала. Разработана некоторая общая методика оценки вклада отдельной компоненты в общий риск портфеля. В рамках некоторого класса многомерных распределений, а именно эллиптически контурированных устойчивых распределений, эта методика позволяет получить точную асимптотику вклада отдельной компоненты в случае больших общих потерь. Свойства выбранного класса распределений были подробно исследованы. В рамках направления 6 получены следующие результаты. О. В.Шестаковым рассмотрена модель со случайным числом вейвлет-коэффициентов функции сигнала, загрязненных белым гауссовым шумом. Исследовались функции риска, основанные на вероятностях ошибок вычисления вейвлет-коэффициентов и среднеквадратичной ошибке. Были получены асимптотические оценки данных функций риска, зависящие от распределения объема выборки и степени гладкости функции, описывающей сигнал. Также получены выражения для вычисления оптимальных пороговых значений. Показано, что асимптотическое поведение функций риска и оптимальных пороговых значений во многом определяется поведением функции распределения объема выборки в окрестности нуля и бесконечности. Показано, что при случайном объеме выборки функции риска могут стремиться к нулю значительно медленнее, чем при неслучайном объеме. Если же предельное распределение нормированного объема выборки вырождено, то оценки функций риска совпадают с оценками при неслучайном объеме выборки. Помимо перечисленных выше запланированных работ, с целью определения направления перспективных разработок, были проведены разведочные исследования в области отыскания удобных условий и оценок скорости сходимости в терминах интенсивностей потоков информативных событий, а также нахождение предельных «выходных» характеристик таких потоков с учетом неоднородности (нестационарности) входных и выходных характеристик при исследовании сезонных факторов (А. И. Зейфман, В. Ю.Королев). Проведенные исследования показали возможность и целесообразность решения целого ряда аналитических задач в указанной области. Эти исследования будут продолжены на следующих этапах реализации проекта.
2 1 января 2019 г.-31 декабря 2019 г. Аналитические методы теории риска, основанные на смешанных вероятностных моделях
Результаты этапа:
3 1 января 2020 г.-31 декабря 2020 г. Аналитические методы теории риска, основанные на смешанных вероятностных моделях
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".