Автоматика и телемеханика, № 9, 2020
© 2020 г. А.Ю. ГОЛУБИН, канд. физ.-мат. наук (e-mail agolubin@hse.ru)
(Национальный исследовательский университет
“Высшая школа экономики”, Москва;
Центр информационных технологий в проектировании РАН,
Одинцово, Московская обл.),
В.Н. ГРИДИН, д-р техн. наук (e-mail info@ditc.ras.ru)
(Центр информационных технологий в проектировании РАН,
Одинцово, Московская обл.)
О ПОСТРОЕНИИ ОПТИМАЛЬНОЙ СТРАТЕГИИ СТРАХОВАНИЯ
В ПРОЦЕССЕ РИСКА С ПОШАГОВЫМИ ВЕРОЯТНОСТНЫМИ
ОГРАНИЧЕНИЯМИ НА ПРИРАЩЕНИЯ ПРОЦЕССА1
Исследована проблема построения оптимальной стратегии страхования
в новой многошаговой модели страхования, где введены пошаговые веро-
ятностные ограничения (Value at Risk (VaR) ограничения) на капитал
страховщика, т.е. вероятностные ограничения на приращения капитала
страховщика в течение одного шага. В качестве целевого функционала ис-
пользуется математическое ожидание финального капитала страховщика.
Суммарный ущерб страховщика на каждом шаге моделируется нормаль-
ным распределением с параметрами, зависящими от выбранной функции
дележа риска. В отличие от традиционных динамических моделей опти-
мизации стратегий страхования, предлагаемый подход, учитывающий по-
шаговые ограничения, позволяет свести построение функций Беллмана
а значит, и нахождение оптимальных дележей риска просто к решению
последовательности статических задач оптимизации страхования. Дока-
зано, что оптимальными дележами риска являются так называемые stop
loss страхования.
Ключевые слова: оптимальное страхование, вероятностное ограничение,
процесс риска.
DOI: 10.31857/S000523102009007X
1. Введение
Проблемы оптимального управления риском в динамических моделях
страхования, основанных на процессе риска Крамера-Лундберга, изучались
в [1-7]. В [2] исследована задача минимизации вероятности разорения стра-
ховой компании выбором перестрахования в классе так называемых stop loss
дележей, применяемых к риску каждого отдельного страхователя. Публика-
ция [3] посвящена решению той же задачи, но в случае, когда страховщику
доступны различные виды перестрахования и инвестирование в безрисковый
и рисковый активы. Процесс риска, возникающий как диффузионная аппрок-
симация процесса Крамера-Лундберга, изучался в [3]. Управляемый процесс
1 Работа поддержана Госзаданием № 0071-2019-0001.
144
риска на бесконечном временном интервале с одновременным выбором стра-
тегий страхования и перестрахования индивидуальных ущербов рассмотрен
в [4, 5] при дополнительных ограничениях на допустимые стратегии. Задача
с иным критерием оптимальности, а именно с максимизируемым коэффици-
ентом Лундберга в оценке вероятности разорения, решена в [6] для процесса
риска с дискретным временем и целого класса принципов начисления пре-
мии перестраховщику. В [7] критерием оптимальности для процесса риска
на конечном интервале был функционал полезности типа Марковица. Полу-
чены дифференциальные уравнения для определения оптимальных страте-
гий перестрахования и инвестирования с использованием так называемого
time-consistent подхода, который позволяет получить уравнение оптимально-
сти беллмановского типа для этого типа критериев оптимальности. С точки
зрения выбора целевого функционала близкие по постановке задачи изуча-
лись в [5, 7]. Но в [7] был рассмотрен процесс риска с непрерывным време-
нем (и была предусмотрена возможность инвестирования текущего капитала
страховщика), что привело к необходимости решения уравнения Гамильтона-
Якоби-Беллмана и отсутствию явного вида оптимальных стратегий. В обоих
случаях в отличие от предлагаемой статьи предусматривалось только пере-
страхование и не учитывались вероятностные ограничения.
Популярным направлением исследований в последние годы стал поиск оп-
тимальных дележей риска в статических моделях при так называемом “Value
at Risk” (VaR) ограничении, которое означает установление нижней грани-
цы на вероятность падения капитала ниже заданного уровня (см., напри-
мер, [8, 9]). Одношаговая задача с целевым функционалом типа Марковица
и VaR ограничением была исследована в [10] (там же приведена библиогра-
фия по оптимизации дележа риска в страховании при VaR ограничениях).
Главным отличием данной статьи от предыдущих исследований, извест-
ных авторам, является то, что предложена новая модификация управляемого
процесса риска с дискретным временем, где предусмотрены пошаговые VaR
ограничения на приращения капитала страховщика. Такой подход позволя-
ет учесть естественное желание страховщика не иметь больших потерь на
каждом шаге с заданной вероятностью а, с другой стороны, позволяет свести
динамическую задачу оптимального управления процессом риска к решению
последовательности относительно простых одношаговых оптимизационных
задач. Анализ таких задач основан на результатах [10]. Показано, что на
каждом шаге оптимальным с точки зрения страховщика оказывается так
называемое stop loss страхование. Приведен численный пример, иллюстри-
рующий доказанные результаты в случае экспоненциального распределения
страховой выплаты.
2. Предварительные результаты
В этом разделе рассматривается одношаговая задача выбора дележа
страхования между страховщиком и страхователями при VaR ограничении,
где максимизируемым функционалом является средний финальный капитал
страховщика. Решение такой задачи будет использоваться в дальнейшем при
анализе многошаговой задачи страхования. Результаты, приведенные в этом
145
разделе, есть просто модификация утверждений, доказанных в [10], на случай
отсутствия дополнительного ограничения сверху с вероятностью единица на
риск страховщика и при использовании среднего значения финального капи-
тала вместо целевого функционала типа Марковица.
Рассматривается модель страхового рынка, состоящего из страховщи-
ка и n клиентов. Потенциальные ущербы (риски) клиентов
независи-
мые неотрицательные случайные величины Xj , j = 1 . . . , n, определенные
на одном вероятностном пространстве (Ω, F, P ). В дальнейшем эта группа
клиентов предполагается однородной: все Xj имеют одинаковое распреде-
= P{X1 ≤ x}, причем математическое ожидание X21 конечно:
EX21 < ∞. Отметим характерную особенность функции распределения F1(x),
а именно скачок в нуле: F1(0) ∈ (0, 1)
вероятность отсутствия страхо-
вого случая для клиента предполагается ненулевой и не равной единице.
Страховщик выбирает функцию дележа страхования I(x) из класса боре-
левских функций, определенных на [0, ∞) и удовлетворяющих неравенствам
0 ≤ I(x) ≤ x, которые означают, что возмещение не может быть отрицатель-
ным и не может превосходить величины ущерба. Случайная величина I(Xj )
есть возмещаемая j-му клиенту часть ущерба, а суммарный риск страховщи-
n
ка XI =
I(Xj ).
j=1
Дополнительное ограничение на дележи I(x), отражающие желание стра-
ховщика защититься от больших потерь, состоит в том, что вероятность пре-
= w + nP - XI над заданным уровнем a
удовлетворяет неравенству
{
}
(2.1)
P
SI ≥ a
≥ β.
Здесь w собственный капитал страховщика, a заданная константа, уро-
вень доверия предполагается достаточно высоким β ∈ (0,5; 1), а страховая
премия P вычисляется по формуле среднего значения, известного в актуар-
ной литературе (см., например, [1]): P = (1 + α)E I(X1), где α > 0 задан-
ный коэффициент нагрузки страховщика.
Максимизируемым функционалом является математическое ожидание
финального капитала страховщика SI . Таким образом, исследуемая задача
имеет вид
(2.2)
J [I] ≡ ESI
→ max
при ограничении 0 ≤ I(x) ≤ x и ограничении (2.1).
Считая численность группы страхователей n достаточно большой (не ме-
нее нескольких десятков) и n(1 - F1(0)) > 10, применим достаточно широ-
ко используемую в актуарной математике нормальную модель для аппрок-
n
симации распределения суммарного риска XI =
I(Xj ) (см., например,
j=1
[1, 10]). Тогда ограничение (2.1) переписывается как
{
}
(
)
I
SI - ES
a - ESI
a - ESI
P
=1-Φ
≥ β,
σ(SI )
σ(SI )
σ(SI )
146
где Φ(x) функция распределения стандартной нормальной случайной вели-
чины, а σ(SI ) =
DSI стандартное отклонение капитала страховщика. По-
следнее неравенство эквивалентно неравенству ESI - a - x σ(SI ) ≥ 0, здесь
x квантиль уровня β стандартного нормального распределения. В резуль-
тате (2.2) преобразуется в задачу
(2.3)
J [I] ≡ w + αnEI(X1
) → max при ограничении I ∈ A,
т.е.
(2.4)
0 ≤ I(x) ≤ x
и
(2.5)
w + αnEI(X1) - a - x
√n√DI(X1
) ≥ 0.
Всюду далее будем использовать обозначения
= x ∧ k, где x ∧ k = min{x,k}.
Для дальнейшего анализа рассмотрим вспомогательную задачу максимиза-
ции функционала в левой части ограничения (2.5)
(2.6)
J0[I] ≡ w + αnEI(X1) - a - x
√n√DI(X1
) → max,
где максимум берется по множеству дележей {I : 0 ≤ I(x) ≤ x}. Выполнение
условия регулярности Слейтера (см., например, [3, гл. 3, с. 119]) для задачи
(2.3)-(2.5) гарантируется следующим утверждением.
Утверждение 1. Условие Слейтера выполнено, если
(2.7)
J0[I0] > 0 и α√n - x F1(0)/F¯1
(0) > 0,
где I0(x) есть stop loss страхование, I0(x) = x ∧ k0. Здесь k0 минимальный
корень на промежутке (0, ∞) уравнения
(2.8)
ψ(k) = 0,
функция
= x(EIk(X1) - k)/
DIk(X1) + α√n.
Теорема 1. Пусть выполнено условие Слейтера (см. (2.7)), тогда зада-
ча (2.3)-(2.5) имеет единственное решение stop loss страхование I(x) =
= x ∧ k. Допустимый дележ I(·) оптимален в (2.3)-(2.5) тогда и только
тогда, когда существует µ ≥ 0 :
(2.9)
µJ0[I
] = 0,
(2.10)
I(x) = x ∧ k,
147
где
(2.11)
k
= 0,
т.е. I(X1) = 0 почти наверное (п.н.) при
(2.12)
(1 + µ)α√n - xµ F1(0)/F¯1
(0) ≤ 0,
иначе k > 0 минимальный корень уравнения
(2.13)
φ(k) = 0,
где
= xµ(EIk(X1) - k)/
DIk(X1) + (1 + µ)α√n.
Заметим, что условие (2.12) в теореме 1 является необходимым и доста-
точным условием отказа страховщика от сделки, т.е. его возмещение клиенту
I(X1) = 0 п.н.
3. Многошаговая задача страхования
Рассмотрим процесс риска с дискретным временем (см., например, [6]) на
интервале {0, . . . , T }, где на каждом шаге t = 0, . . . , T - 1 страховщик заклю-
чает сделку с n клиентами однородной группы. Обозначая через Zt капитал
страховщика на шаге t, получаем уравнение динамики
(3.1)
Zt+1 = Zt + n(1 + α)EIt(Xt1) - It(Xtj), Z0
= w.
j=1
Здесь (Xt1, . . . , Xtn), t = 0, . . . , T - 1, независимые векторы ущербов клиен-
тов с независимыми одинаково распределенными компонентами, имеющими
функцию распределения Ft1(x). Дележ риска It(x) на шаге t выбирается из
множества
{
}
{
}
At = I(·) : 0 ≤ I(x) ≤ x,P
Zt+1 ≥ at + Zt
≥βt ,
t = 0,...,T - 1.
Константы at > 0 и βt ∈ (0,5; 1) обозначают соответственно заданную ниж-
нюю границу допустимого приращения капитала и уровень доверия. Таким
образом, VaR ограничения наложены не на значения процесса Zt, а на его
приращения на каждом шаге, обеспечивая “плавность” поведения процес-
са на всем интервале функционирования. Близкий подход был использован
в [11], но для иной модели, где объектом изучения был процесс риска с
непрерывным временем и возможностью инвестирования с пропорциональ-
ным страхованием рисков.
После применения нормальной аппроксимации для
n(1 + α)EIt(Xt1) -
It(Xtj)
j=1
148
имеем (см. (2.5), где сейчас w = 0)
{
}
(3.2)
At = I(·) : 0 ≤ I(x) ≤ x, αnEI(X1) - at - xt
√n√DI(X1) ≥ 0 ,
где α > 0 и xt > 0 коэффициент нагрузки и квантиль уровня βt стандарт-
ного нормального распределения.
В результате объектом исследования оказывается задача оптимального
управления марковским процессом с дискретным временем
maxI∈A EZT
(3.3)
при ограничениях
 (14) и It ∈ At, t = 0, . . . , T - 1.
Стратегией страхования является вектор-функция I = (I0(·), . . . , IT-1(·)), а
максимум берется по множеству A всех допустимых стратегий страхова-
ния, предсказуемых относительно естественной фильтрации процесса. Огра-
ничимся рассмотрением класса марковских стратегий страхования, который
(см., например, [12]) достаточен для поиска решения задачи (3.3).
Определим функции Беллмана Vt(z) = maxI∈A EZT для рассматриваемо-
го управляемого процесса на интервале [t; T ] (точнее на множестве точек
{t, . . . , T }) с начальным состоянием Zt = z. Обозначим через
Yt = n(1 + α)EIt(Xt1) -
It(Xtj)
j=1
приращение Zt+1 - Zt, которое, в рамках нормальной модели, есть случайная
величина с нормальным распределением и параметрами
µtI = nαEIt(Xt1) и σtI =
√n DIt(Xt1).
Тогда
VT (z) = z,
[
]
VT-1(z) = max
z + EYT-1 = z + max GT-1 [I] = z + GT-1
IT-1∗
,
I∈AT-1
I∈AT-1
[
]
[
]
[
]
VT-2(z) = max z + EYT-2 + GT-1
IT-1∗
=z+GT-1
IT-1∗
+GT-2
IT-2∗
,
I∈AT-2
[
]
[
]
V0(z) = max z +
Gt
It∗
+ EY0 = z + Gt
It∗
,
I∈A0
t=1
t=0
где At множество допустимых дележей страхования I(x) на шаге t опре-
делено в (3.2). Отметим, что введенные выше функции
= max Gt[I], t = 0,... ,T - 1.
I∈At
149
Следующая теорема устанавливает форму оптимальных дележей риска
It∗(x) на каждом шаге t и приводит условия оптимальности для параметров
этих функций.
Теорема 2. Пусть для каждого набора входных параметров α,att и
распределения Ft(x), t = 0, . . . , T - 1, выполнено условие (2.7) с w = 0. То-
гда задача (3.3) имеет решение I = (I0∗(x), . . . , IT-1∗(x)), где каждый дележ
риска есть stop loss страхование, It∗(x) = x ∧ kt∗, не зависящий от текущего
значения z состояния процесса Zt. Допустимый дележ It∗(x) = x ∧ kt∗ опти-
мален тогда и только тогда, когда существует µ ≥ 0:
(3.4)
µJt0[It∗
] = 0,
где выражение для Jt0[I] (2.6) с w = 0, kt∗ > 0 минимальный корень урав-
нения
(3.5)
φt
(k) = 0,
где
= xt µ(EIk(X1) - k)/ DIk(X1) + (1 + µ)α
√n.
Доказательство. Как было показано выше, вычисление оптимального
дележа It∗(x) на шаге t состоит в решении задачи максимизации
(3.6)
Gt[I] ≡ n(1 + α)EI(X1) - E I(
j
) = nαEI(Xt1)
j=1
на множестве At, где нет зависимости от текущего состояния процесса z = Zt.
Применяя для каждой такой задачи теорему 1, в которой теперь at > 0 и,
следовательно, случай It∗(x) ≡ 0 исключен, получаем требуемый результат.
Теорема 2 доказана.
Согласно утверждению теоремы 2 оптимальной является так называемая
“близорукая” стратегия, где на каждом шаге t максимизируется на множе-
стве At среднее значение приращения капитала страховщика, которое не за-
висит от текущего значения капитала Zt.
Замечание 1. В частном случае однородной модели, где параметры
att и распределение ущерба клиента Ft1(x) не зависят от t, легко показать,
что с вероятностью β финальный капитал превысит определенное значение s
при использовании оптимальной стратегии. Действительно, финальный ка-
питал
ZT = w + Tn(1 + α)EI(X1) -
I(Xti)
t=0 i=1
имеет нормальное распределение со средним w + T nαEI(X1) и дисперсией
TnDI(X1). Неравенство nαEI(X1) - x
√n√DI(X1) ≥ a (см. (3.2)) экви-
валентно
w + TnαEI(X1) - x
T
√n√DI(X1) ≥ w +√Ta + (T -√T)nαEI(X1).
150
Отсюда получаем требуемый результат
(3.7)
P {ZT
≥ s} ≥ β,
где
s=w+
Ta + (T -
T )nαEI(X1).
4. Многошаговая задача страхования с учетом ограничений
на приращения капитала
В этом разделе будет получен основной результат данной статьи, касаю-
щийся обобщения рассмотренной выше многошаговой задачи страхования.
Именно: теперь страховщик может установить уровень “безопасности” r ≤ 0
такой, что если на момент t выбора дележа риска It предыдущее прираще-
ние капитала Zt - Zt-1 превышает r, то (см. (3.2)) множество допустимых
дележей есть
{
{
}
}
A+t = I(·) : 0 ≤ I(x) ≤ x, P
(1 + α)nEI(Xt1) -
I(Xti) ≥ at
≥βt
=
+
+
i=1
{
}
√ √
(4.1)
= I(·) : 0 ≤ I(x) ≤ x, αnEI(Xt1) - at+ - xt
n DI(Xt1) ≥ 0
+
Если же Zt - Zt-1 ≤ r, то это не означает “банкротства”, но на шаге t
дележ риска выбирается уже из другого множества
{
}
√ √
(4.2)
A-t = I(·) : 0 ≤ I(x) ≤ x, αnEI(Xt1) - at- - xt
n DI(Xt1) ≥ 0
-
В последнем случае представляется естественным сузить множество A+t пу-
тем увеличения допустимого уровня приращения at- > at+ (> 0) и/или увели-
чением уровня доверия βt- > βt+ (> 0,5) с тем, чтобы добиться на следующем
шаге увеличения (в вероятностном смысле, т.е. в смысле значения VaR) при-
ращения капитала. Такой подход, с одной стороны, обеспечивает плавность
изменения капитала страховщика от шага к шагу с учетом изменения зна-
чений его приращений, а с другой как будет показано, дает относительно
простое решение задачи оптимального управления риском в многошаговой
задаче страхования, в которой на каждом шаге оптимальный дележ риска
зависит лишь от номера шага и знака Zt - Zt-1 - r.
Динамика процесса Zt по-прежнему описывается уравнением (3.1), целе-
вым функционалом остается среднее значение финального капитала EZT , но
теперь множество допустимых дележей в момент t есть
{
A+t при Zt - Zt-1 > r,
At =
A-t при Zt - Zt-1 ≤ r.
Формально, рассматриваемая задача не является задачей оптимального
управления марковским процессом, поскольку множество допустимых реше-
ний At зависит не только от значения процесса Zt, но и от Zt-1. Перейдем
151
к сдвинутому на один шаг процессу приращений Wt = Zt - Zt-1, который
задается уравнением
(4.3)
Wt = (1 + α)nEIt-1(Xt-11) - It-1(Xt-1i), t = 1,... ,T, W0
= w.
i=1
Тогда целевой функционал
(4.4)
J [I] = EZT = E Wt,
t=0
а множество допустимых дележей
{
A+t при Wt > r,
(4.5)
At(Wt) =
A-t при Wt ≤ r,
t = 0,...,T - 1, зависит только от текущего значения Wt.
Найдем функции Беллмана для задачи (4.3)-(4.5) оптимального управ-
T
ления марковским процессом {Wt}. Обозначим Vt(y) = maxI∈A E
Wm
m=t
для рассматриваемого процесса на интервале [t; T ] с начальным состоянием
Wt = y.
Уравнение динамического программирования здесь имеет вид
Vt(y) = y + max EVt+1(Wt+1),
I∈At(y)
где At(y) = A+t при y > r, At(y) = A-t при y ≤ r. Тогда
VT (y) = y,
при y > r
VT-1(y) = y + max
EVT (WT ) = y + nα max
EI(XT-11) =
I∈A+T-1
I∈A+
T -1
= y + nαEIT-1+(XT-11),
при y ≤ r
VT-1(y) = y + max
EVT (WT ) = y + nα max
EI(XT-11) =
I∈A-T-1
I∈A-
T -1
= y + nαEIT-1-(XT-11).
= It+(Xt1) и
= It-(Xt1). Для нахождения
VT-2(y) = y + max EVT-1(WT-1)
I∈AT-2(y)
152
заметим, что случайная величина WT-1 может быть выше или ниже r с веро-
ятностями соответственно P {WT-1 > r} и 1 - P {WT-1 > r}. Следовательно,
при y > r
VT-2(y) = y + max
E[WT-1|WT-1 > r]P {WT-1 > r} +
I∈A+
T -2
+ E[WT-1|WT-1 ≤ r]P{WT-1 ≤ r} =
{
}
(
)
= y + αn EIT-1- + max
EI + EIT-1+ - EIT-1
P {WT-1 > r}
,
-
I∈A+
T -2
при y ≤ r
{
}
(
)
VT-2(y) = y + αn EIT-1- + max
EI + EIT-1+ - EIT-1
-
P {WT-1 > r}
I∈A-
T -2
При y > r
VT-3(y) =
{
(
)
= y + αn EIT-1- + EIT-2+ + EIT-1+ - EIT-1
-
P {WT-1 > r}|IT-2=IT-2 ++
}
(
)
+ max
EI + EIT-2+ - EIT-2
P {WT-2 > r}
,
-
I∈A+
T -3
при y ≤ r
VT-3(y) =
{
(
)
= y + αn EIT-1- + EIT-2- + EIT-1+ - EIT-1
-
P {WT-1 > r}|IT-2=IT-2 +-
}
(
)
+ max
EI + EIT-2+ - EIT-2
P {WT-2 > r}
-
I∈A-
T -3
и т.д.
Нетрудно видеть, что каждый оптимальный дележ риска It∗(·, y) на шаге t
при текущем состоянии процесса y = Wt есть решение задачи максимизации
функционала
(4.6)
Ht[I] ≡ EI + (EIt+1+ - EIt+1-)P{Wt+1 > r} при ограничении I ∈ At
(y),
где дележи It+1+ и It+1- являются соответственно решениями задач максимиза-
ции Ht+1[I] на множествах A+t+1 и A-t+1, t = 0, . . . , T - 2, причем HT-1[I]≡EI.
Учитывая, что Wt+1 моделируется нормальной случайной величиной со
средним µ[It] = αnEIt и дисперсией σ2[It] = nDIt, получаем, что
(
)
P {Wt+1 > r} =Φ
(r - µ[It])/σ[It]
,
153
гдеΦ(x) = 1 - Φ(x) и Φ(x) функция распределения стандартной нормаль-
ной случайной величины. Тогда (4.6) преобразуется к виду
(
)
(4.7)
Ht[I] ≡ EI +
EIt+1+ - EIt+1-
Φ((r - µ[I])/σ[I]) → max, I ∈ At
(y).
Соотношение (4.7) является рекуррентной формулой для вычисления опти-
мальных дележей It+ и It-, начиная с IT-1+ и IT-1-, которые определяются
максимизацией HT-1[I] ≡ EI на AT-1(y). Таким образом, каждый оптималь-
ный дележ зависит от текущего состояния процесса y = Wt очень простым
образом: если y > r, то решается задача (4.7) на A+t, в противном случае
решается задача с той же целевой функцией, но на A-t.
Теорема 3. Пусть для каждого набора параметров α,at+, βt+, at-, βt- и
распределения Ft(x), t = 0, . . . , T - 1, выполнено условие (2.7) с w = 0. Тогда
задача (4.3)-(4.5) имеет решение I = (It∗(·, y), . . . , IT-1∗(·, y)), где каждый де-
леж риска есть stop loss страхование,
{
x ∧ kt+ при y > r,
It∗(x,y) =
x ∧ kt- при y ≤ r.
Уровни kt+ и kt- являются соответственно решениями задач максимизации
функций от скалярной переменной:
(4.8)
maxHt[Ik] при ограничении Ik ∈ A+t,
k>0
(4.9)
maxHt[Ik] при ограничении Ik ∈ A-t,
k>0
где Ik(x) = x ∧ k, а выражение для Ht[I] приведено в (4.7).
Доказательство. Как было показано, вычисление оптимального деле-
жа It∗(·, y) состоит в решении задачи (4.7), которая зависит лишь от номера
шага t и от знака y - r. Отметим, что, как и в теореме 2, нулевой дележ
исключен в силу условия (2.5), где сейчас w = 0 и a = at+( или at-) > 0. Сле-
дующая лемма устанавливает существование решения в этой задаче.
Лемма. Для каждого фиксированного y задача (4.7) имеет решение.
Доказательство леммы приведено в Приложении.
Начнем с изучения случая y > r. Обозначим через Mt+ = EIt+(Xt1), где It+
решение (4.7), существование которого гарантируется леммой. Заметим, что
в силу ограничения P {Wt+1 ≥ at+} ≥ βt+ с at+ > 0 среднее значение Mt+ > 0.
Рассмотрим вспомогательную задачу
Ht[I] → max, EI = Mt+ и I ∈ A+t, где t = 0,... ,T - 2,
где выражение для Ht[I] задано в (4.7). Напомним, что задача HT-1[I] ≡
≡EI → max, I ∈ A+T-1, уже была изучена в теореме 2. Поскольку A-t+1 ⊂A+t+1,
то в (4.7) множитель EIt+1+ - EIt+1- ≥ 0. Учитывая, что по предположению
r ≤ 0, получаем r - µ[It] = r - αnMt+ < 0. Тогда вспомогательная задача эк-
вивалентна
(4.10)
EI2(Xt1
) → min
154
при ограничениях
(4.11)
0 ≤ I(x) ≤ x, EI(Xt1) = Mt+,
(4.12)
= -αnMt+ + at+ + xt
√n EI2(Xt1) - (Mt+)2
≤ 0.
+
Поскольку выполнено условие Слейтера и целевой функционал является
выпуклым, а функционал в ограничении (4.12) является сильно квазивыпук-
лым (см. [10]), то применима теорема Куна-Таккера (см., например, [13]).
Согласно этой теореме дележ It+(·) ∈ At+ оптимален в (4.10)-(4.12) тогда и
только тогда, когда существуют множители Лагранжа λ и γ ≥ 0 такие, что
γJ1[It+] = 0 и It+(·) является решением задачи минимизации функционала
Лагранжа
(
)
(
(
)
)
(4.13)
L[I] ≡ EI2
Xt1
EI
Xt1
-Mt+
+ γJ1[I] → min,
0 ≤ I(x) ≤ x.
I
Необходимое и достаточное условие оптимальности дележа It+ в задаче (4.13)
есть выполнение неравенства
d
[
]
L
ρIt+ + (1 - ρ) I
≤0
ρ=1
для любой функции дележа 0 ≤ I(x) ≤ x. При подстановке выражения для
функционала J1[I] после дифференцирования получаем, что левая часть
неравенства равна
(
)
η (x)
It+ (x) - I(x)
dFt1 (x) ,
0
где
[
]
√ ∕√
η(x) = It+(x)
2 + γxt
n E(It+(Xt1))2 - (Mt+)2
+ λ.
+
Используя лемму Неймана-Пирсона [14], имеем, что оптимальный дележ
определяется как
{
0, η(x) > 0,
(4.14)
It+(x) =
x, η(x) < 0,
с точностью до множества нулевой меры Ft1.
Рассмотрим сначала ситуацию, когда λ < 0. Поскольку η(0) = λ < 0, то
при возрастании x от нуля значение η (x) возрастает (при этом It+ (x) = x в
силу (4.14)). После касания в точке kt+ этой функции оси абсцисс, η (x) не мо-
жет принимать положительных значений, поскольку для таких x (см. (4.14))
значение It+ (x) = 0, т.е. приходим к противоречию: η (x) < 0. Убывание η (x)
от нуля также исключено, так как для таких x выполнено It+ (x) = x, что
означает η (x) > 0. В результате, It+ (x) = x ∧ kt+.
В случае λ ≥ 0 аналогичные рассуждения приводят к тому, что It+ (x) ≡ 0,
но тогда неравенство Mt+ > 0, где Mt+ = EIt+(Xt1), оказывается нарушенным.
Случай y ≤ r рассматривается аналогично. Теорема 3 доказана.
155
Замечание 2. Даже в частном случае однородной модели, где парамет-
ры at+, at-, βt+, βt- и распределение ущерба клиента Ft1(x) не зависят от t, оп-
тимальной является не “близорукая” стратегия, как в теореме 2, а стратегия,
где каждый оптимальный дележ риска It∗(x, y) зависит, в частности, от номе-
ра шага t. С точки зрения вычислений нахождение оптимальной стратегии в
задаче (4.3)-(4.5) сводится к определению 2T значений kT-1+, kT-1-, . . . , k0+, k0-
путем решения последовательности относительно простых задач (4.8)-(4.9)
максимизации функций от скалярной переменной. Выбор k0+ (k0-) в началь-
ный момент t = 0 означает, что начальный капитал w > r (≤ r).
5. Пример
Ниже рассмотрен численный пример, иллюстрирующий теорему 3 о ре-
шении многошаговой задачи (4.3)-(4.5) управления риском при ограниче-
ниях на приращения процесса. Пусть ущербы клиентов имеют распределе-
ние F1(x) = p(1 - exp(-0, 1x)) + 1 - p, не зависящее от номера шага t, где
вероятность страхового случая p = 0,1. Таким образом, функция распределе-
= P{X1 ≤ x|X1 > 0} = 1 - exp(-0,1x) экс-
поненциальна. Пусть численность группы клиентов n = 250, уровни доверия
βt+ = βt- = 0,95 и начальный капитал страховщика w = 1. Интервал функци-
онирования процесса {0, . . . , T } = {0, . . . , 3}. Уровень безопасности, устанав-
ливаемый страховщиком, равен r = 0, т.е. если приращение капитала стра-
ховщика на предыдущем шаге положительно, то дележ риска выбирается из
множества A+t, иначе из A-t (см. (4.1)-(4.2)). Нижняя граница приращения
капитала страховщика a+t в A+t равна 10, нижняя граница a-t в A-t установ-
лена равной 20 для всех t = 0, . . . , 2.
Напомним, что по теореме 3 оптимальными дележами являются stop loss
страхования
{ x∧kt
при y > r,
+
It∗(x,y) =
x ∧ kt- при y ≤ r.
Результаты численного расчета уровней удержания страховщика kt+, kt- и зна-
чения целевого функционала J = J[I] при варьировании коэффициента на-
грузки α приведены в таблице.
Таблица
α
k0+
k1+
k1-
k2+
k2-
J
0,5
118,6861
118,6907
23,6634
119,3200
23,6634
361,0311
0,55
119,3200
119,3200
119,3200
118,8242
118,8242
413,3536
Отметим, что в задачах вычисления оптимального дележа риска на каж-
дом шаге условие регулярности Слейтера оказывается выполненным, по-
скольку даже для “наихудшего” случая с наименьшим коэффициентом на-
грузки α = 0,5 и наибольшей нижней границей приращения капитала a-t = 20
156
соотношение (2.7) выполнено:
J0[I0] = 2,4980 > 0 и α√n - x F1(0)/F¯1(0) = 2,9711 > 0.
Во втором столбце таблицы выбор k0+, а не k0- объясняется тем, что началь-
ный капитал w = 1 > 0 = r. С ростом коэффициента нагрузки α оптимальное
значение J ожидаемо увеличивается, поскольку растет цена страхования.
Как показывает вторая строка таблицы, уровни kt- значимо ниже kt+. При-
чина в том, что максимум в задаче Ht[Ik] → max, Ik ∈ A-t при α = 0,5 дости-
гается для значения kt-, принадлежащего границе допустимого множества
{k : Ik ∈ A-t}, t = 1, 2. Увеличение коэффициента нагрузки α, т.е. стоимости
страхования, до α = 0,55 означает расширение множеств A-t. При этом зна-
чения kt- оказываются уже внутренними точками и, учитыая, что A-t ⊂ A+t,
имеем (см. третью строку таблицы): kt- = kt+.
6. Заключение
Исследована новая задача построения оптимальной стратегии страхова-
ния в процессе риска с дискретным временем, пошаговыми вероятностными
(VaR) ограничениями на капитал страховщика на каждом шаге процесса и
средним значением финального капитала в качестве целевого функционала.
Доказана оптимальность “близорукой” (myopic) стратегии страхования, где
в каждый момент принятия решения максимизируется среднее приращение
капитала на следующем шаге. В обобщении этой модели, где страховщик
устанавливает “уровень безопасности” (неположительный) на предыдущее
приращение капитала, показано, что определение компонент оптимальной
стратегии сводится к решению последовательности относительно простых оп-
тимизационных задач. В обоих случаях оптимальным для страховщика на
каждом шаге оказывается stop loss страхование.
ПРИЛОЖЕНИЕ
Доказательство леммы. Рассмотрим сначала случай y > r. Пусть
{In} максимизирующая последовательность допустимых дележей в зада-
че (4.7), т.е.
lim
= supHt [I] .
n→∞
I
Применяя теорему Хэлли отдельно к√числителю и знаменателю для
дроби (r - µ[In])/σ[In] = (r - αnEIn(Xt1))/
nDIt(Xt1) в целевом функциона-
ле (4{7), (пол)}аем, что существует подпоследовательность случайных вели-
чин
Im
Xt1
, слабо сходящаяся к некоторому пределу ξ. Для доказатель-
ства того, что ξ есть собственная случайная величина, т.е. P {ξ < ∞} = 1,
дос(ат)чно заметить, что в силу определения функций дележа выполн(етс)
Im
Xt1
≤ Xt1 п.н. Поскольку ξ измерима относительно сигма-алгебры σ
Xt1
,
(
)
то эта случайная величина может быть представлена как ξ = I
Xt1
для
некоторого дележа I(·), причем I ∈ A+t.
157
Покажем, что для максимизирующей последовательности {Im} знамена-
тель σ[Im] в (4.7) отделен от нуля. Действительно (см. (4.1)), выполнение
ограничения I ∈ A+t, т.е.
{
}
P
(1 + α)nEI(Xt1) -
I(Xti) ≥ at
≥ βt+ (> 0),
+
i=1
где по предположению at+ > 0,
означает, что из множества допустимых исключен нулевой дележ риска
I(Xt1) = 0 п.н. и, таким образом, σ[I] > 0.
{
(
)}
Равенство H∗t = Ht [I] теперь следует из слабой сходимости
Im
Xt1
и
непрерывности целевого функционала в (4.7) по EI(Xt1) и DI(Xt1).
Случай y ≤ r рассматривается аналогично с заменой множества A+t на A-t.
Лемма доказана.
СПИСОК ЛИТЕРАТУРЫ
1.
Bowers N.L., Gerber H.U., Hickman J.C., et al. Actuarial Mathematics. Itaca, Illi-
nois: The Society of Actuaries, 1986.
2.
Hipp С., Vogt M. Optimal Dynamical XL Reinsurance // ASTIN Bulletin. 2003.
V. 33. P. 193-207.
3.
Hipp C., Taksar M. Optimal Non-proportional Reinsurance Control // Insur. Math.
Econom. 2010. V. 47. P. 246-254.
4.
Golubin A.Y. Optimal Insurance and Reinsurance Policies in the Risk Process //
ASTIN Bulletin. 2008. V. 38. No. 2. P. 383-398.
5.
Голубин А.Ю., Гридин B.H. Оптимизация страхования и перестрахования в ди-
намической модели Крамера-Лундберга // АиТ. 2012. Т. 9. С. 111-123.
Golubin A.Y., Gridin V.N. Optimizing Insurance and Reinsurance in the Dynamic
Cramer-Lundberg Model // Autom. Remote Control. 2012. V. 73. No. 9. P. 1529-
1538.
6.
Guerra М., Centeno M.L. Optimal Reinsurance Policy: The Adjustment Coefficient
and the Expected Utility Criteria // Insur. Math. Econ. 2008. V. 42. P. 529-539.
7.
Li Y., Li Z. Optimal Time-consistent Investment and Reinsurance Strategies for
Mean variance Insurers with State Dependent Risk Aversion // Insur. Math. Econ.
2013. V. 53. P. 86-97.
8.
Кибзун А.И., Кан Ю.С. Задачи стохастического программирования с вероят-
ностными критериями. М.: Физматлит. 2009.
9.
Zhou C., Wu C. Optimal Insurance Under the Insurer’s VaR Constraint // GRIR.
2009. V. 34. P. 140-154.
10.
Голубин А.Ю., Гридин B.H. Оптимальная стратегия страхования в модели ин-
дивидуального риска при вероятностном ограничении на величину финального
капитала // АиТ. 2019. № 4. С. 144-155.
Golubin A.Y., Gridin V.N. Optimal Insurance Strategy in the Individual Risk Model
under a Stochastic Constraint on the Value of the Final Capital // Autom. Remote
Control. 2019. V. 80. No. 4. P. 708-717.
11.
Bi J., Cai J. Optimal investment and reinsurance strategies with state dependent
risk aversion and VaR constraints in correlated markets // Insur. Math. Econ. 2019.
V. 85. P. 1-14.
158
12. Fleming W.H., Rishel R.W. Deterministic and Stochastic Optimal Control. Berlin.
Springer-Verlag, 1975.
13. Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.:
Мир, 1982.
14. Леман Э. Проверка статистических гипотез. М.: Наука, 1964.
Статья представлена к публикации членом редколлегии М.В. Губко.
Поступила в редакцию 11.11.2019
После доработки 04.03.2020
Принята к публикации 25.05.2020
159