Автоматика и телемеханика, № 7, 2019
Интеллектуальные системы управления,
анализ данных
© 2019 г. М.А. ГОРЕЛОВ, канд. физ.-мат. наук (griefer@ccas.ru)
(Федеральный исследовательский центр “Информатика и управление” РАН,
Москва)
УПРАВЛЕНИЕ РИСКАМИ В ИЕРАРХИЧЕСКИХ ИГРАХ
СО СЛУЧАЙНЫМИ ФАКТОРАМИ
Рассматривается теоретико-игровая модель типа Центр-агент, в кото-
рой результат деятельности агента зависит не только от его выбора, но
еще и от некоторого случайного фактора. Предполагается, что Центр вы-
бирает суммарную вероятность негативных событий, которые Центр го-
тов исключить из рассмотрения, а в остальном он осторожен. Выясняется
структура оптимальных стратегий Центра. Рассмотрены две модели, от-
личающиеся информированностью Центра о действиях партнера.
Ключевые слова: теория принятия решений, иерархические системы,
управление рисками, игры со случайными факторами, принцип “Value
at Risk”.
DOI: 10.1134/S0005231019070043
1. Введение
Управление рисками - одна из древнейших задач экономики. Традицион-
но риск связывают с наличием случайных факторов, влияющих на результат
деятельности лица, принимающего решения (оперирующей стороны). В боль-
шинстве интересных случаев минимизация риска не является основной целью
операции. Чаще всего имеется другая цель, например получение дохода. Та-
ким образом, задача управления рисками - это двухкритериальная задача.
Математические методы начали активно проникать в экономику в сере-
дине XX в. Примерно в то же время появились модели управления рисками.
Видимо, одной из первых была модель формирования инвестиционного
портфеля1 Г. Марковица [1]. Риск в этой модели измерялся величиной сред-
неквадратического отклонения дохода оперирующей стороны от его матема-
тического ожидания. Поскольку при таком определении и ожидаемый выиг-
рыш, и риск оцениваются в одних единицах, то в данном случае достаточно
естественно выглядит линейная свертка критериев. Такого рода модели ак-
тивно исследовались и позднее (см., например, библиографию в [2]).
1 Задачи принятия решений на финансовых рынках проще поддаются формализации.
Поэтому не удивительно, что модели управления рисками активнее всего развиваются в
финансовой теории.
105
Другой разумный способ определения риска состоит в следующем. Пусть
оперирующая сторона соглашается пренебречь неким числом “неблагопри-
ятных” событий, суммарная вероятность которых не превосходит заданной
величины 1 - ξ. Тогда за меру риска можно принять эту вероятность 1 - ξ.
В данном случае ожидаемый выигрыш и риск имеют разную размерность,
поэтому разумен иной способ свертки критериев. Можно, например, искать
максимум гарантированного выигрыша при заданной величине риска. Такое
отношение к риску получило название принципа “Value at Risk”. Такие модели
тоже активно исследуются [3-5].
Но все изложенное относится лишь к моделям, в которых присутствует
один субъект, принимающий решения. Естественное обобщение этой задачи -
игры в условиях риска. Такие модели появились тоже достаточно давно.
Много публикаций посвящено изучению моделей конфликтного взаимо-
действия равноправных игроков. Сюда относится, например, концепция рав-
новесия Байеса-Нэша [6-9].
Активно исследовались и модели с иерархией: в теории контрактов [10, 11],
теории иерархических игр [12-14] и в теории активных систем [15-18].
Эти три направления возникли независимо одно от другого, поэтому “ос-
новные” интерпретации вводимых конструкций отличаются. Так в теории
контрактов в вероятностных терминах описываются представления Центра о
“типах” агентов, а в теории иерархических игр стохастика интерпретируется
как наличие внешнего неопределенного фактора. При этом математические
задачи получаются эквивалентными.
В данной статье используются интерпретации, более распространенные
отечественных публикациях.
Впрочем, есть специфика и в выборе “базовых” моделей, на которых про-
веряется предлагаемая техника. Например, в теории иерархических игр в ос-
новном используются модели, в которых выигрыш верхнего уровня не зави-
сит явно от случайного фактора. В теории контрактов эта зависимость есть,
но при этом делается некое специальное предположение о характере этой
зависимости. Сразу же заметим, что отказ от этого предположения приво-
дит к более сложным задачам, решить которые пока не удается. Поэтому то,
что такое предположение найти удалось, является большой “заслугой” теории
контрактов. В данной статье это предположение активно используется.
Но практически во всех теоретико-игровых моделях игроки предполага-
ются риск-нейтральными, т.е. готовыми ориентироваться на математическое
ожидание своих выигрышей. Естественно попытаться как-то иначе учесть на-
личие риска при конфликтном взаимодействии. Одна из таких попыток была
предпринята в [19].
В данной статье исследуется одна из простейших моделей типа Центр-
агент (Principal-agent). Для описания отношения к риску Центра использу-
ется принцип “Value at Risk”. Рассматриваются две модели. В одной Центр
не имеет информации о действиях агента, а в другой Центр получает инфор-
мацию о результатах работы агента.
106
2. Две игры
Начнем с описания более простой игры.
В игре принимают участие два игрока. По традиции будем называть их
первым и вторым. Первый из них выбирает свое управление u из множе-
ства U, а второй - управление v из множества V . На исход игры влияет
еще значение некоторого фактора α, не контролируемого ни одним из игро-
ков. Неопределенный фактор α принимает значение из множества A. Будем
предполагать, что на множестве A задана вероятностная мера ℘, известная
первому игроку.
Если второй игрок выберет управление v ∈ V и реализуется значе-
ние неопределенного фактора α, то на выходе получится некий результат
x = f(v,α) ∈ X. Если при этом первый игрок выберет управление u ∈ U, то
его выигрыш составит величину q (u, x), а выигрыш второго игрока будет
равен h (u, v, α).
Простейшая интерпретация данных конструкций такова. Допустим, вто-
рой игрок занимается производством сельскохозяйственной продукции. Объ-
ем произведенной продукции x зависит от распределения его ресурсов v и
погодных условий, которые описываются значением фактора α. Первый иг-
рок назначает цены, по которым он готов приобрести у партнера произве-
денную продукцию. Его выигрыш определяется полезностью приобретенной
продукции и затратами на ее покупку. Выигрыш второго игрока зависит от
его затрат v, комфортности погоды и дохода от продажи произведенной про-
дукции.
В теории контрактов рассмотрено много более конкретных моделей, кото-
рые хорошо укладываются в описанную схему и имеют более содержательную
интерпретацию [10, 11]. Для понимания дальнейшего достаточно уже изло-
женного.
Будем предполагать, что множества U, V, X и A наделены топологиями
и компактны. Множества U, V и A будем считать компактными в этих то-
пологиях, а функции f : V × A → X, q : U × X → R и h : U × V × A → R -
непрерывными. В этих предположениях, не ограничивая общности, множе-
ство X можно тоже считать компактным. Меру ℘ на множестве A будем
считать борелевской.
Замечание 1. Вероятно, эти предположения можно ослабить. Однако
это значительно усложняет техническую часть работы (см. леммы 1-3). Со-
держательных соображений, по которым предположения казались бы очень
ограничительными, пока нет. Поэтому вряд ли стоит стремиться к большей
общности.
Если определить функцию g : U × V × A → R условием
(1)
g (u,v,α) = q (u,f (v,α)),
то получим стандартную игру со случайным фактором Γ = 〈U, V, A, g, h, ℘〉.
Условие (1) задает некоторую дополнительную структуру этой игры, которая
будет использоваться в дальнейшем.
Опишем вторую модель. Будем считать, что при тех же общих предполо-
жениях первый игрок в момент принятия решения о выборе своего управле-
107
ния u будет иметь информацию о полученном вторым игроком результате x.
Кроме того, второй игрок может передать ему некую информацию о реали-
зовавшемся значении неопределенного фактора. Но эта информация не обя-
зана быть достоверной, и первый игрок не может ее проверить. Тогда можно
полагать, что первый игрок заранее фиксирует некую функцию u∗, принад-
лежащую множеству U∗ всех функций из множества X × A в множество U.
И если такая функция u∗ будет выбрана первым игроком, он получит от парт-
нера информацию о том, что реализовалось значение неопределенного фак-
тора β, и будет получен результат x, то автоматически будет выбрано управ-
ление u∗ (x, β) ∈ U. Соответственно игроки получат выигрыши q (u∗ (x, β) , x)
и h(u∗ (x,β),v,α).
Замечание 2. Может вызвать вопросы включение в рассматриваемую
схему обмена информацией передачу недостоверного сообщения β. В пользу
этого можно привести два аргумента. Во-первых, не понятно, почему нужно
и как можно запретить игрокам обмениваться такой информацией, если им
это выгодно. И как можно проконтролировать выполнение такого запрета.
А во-вторых, при отказе от такого обмена на этапе постановки, обмен будет
возникать в структуре оптимальных стратегий. Это существенно осложняет
анализ модели. А кроме того, решение будет существенно зависеть от “тон-
кой” топологической структуры множества V . Это заметно обострит вопрос
об адекватности построенной модели.
Достаточно естественную интерпретацию также предложить несложно.
Можно считать, что первый игрок (начальник) выплачивает вознагражде-
ние второму игроку (сельхозпроизводителю) в зависимости от объема про-
изведенной продукции. Все остальные детали интерпретации первой модели
остаются неизменными.
Формализуем сказанное. Пусть Φ (Y, Z) обозначает класс всех функций из
множества Y в множество Z. Тогда U∗ = Φ (X × A, U). Второй игрок выби-
рает управление v ∈ V и сообщение β ∈ A, поэтому множество его стратегий
представляет декартово произведение V∗ = V × A. Определим функции
g∗ : U∗ × V∗ × A → R и h∗ : U∗ × V∗ × A → R
условиями
g∗ (u∗,v∗,α) = g (u∗ (f (v,α) ,β) ,f (v,α))
и
h∗ (u∗,v∗,α) = h(u∗ (f (v,α),β),v,α),
где v∗ = (v, β).
Тогда вновь получим игру со случайным фактором
Γ∗ = 〈U∗,V∗,A,g∗,h∗,℘〉.
От игры Γ она отличается другой дополнительной структурой.
108
3. Принцип оптимальности
Для замыкания модели остается задать порядок взаимодействия игроков
и их отношение к неопределенности. Рассмотрим часто встречающийся на
практике и наиболее изученный случай. Эти конструкции не зависят от до-
полнительной структуры, поэтому одинаковы для обеих игр, описанных в
разделе 2.
Будем исходить из того, что игрок номер один обладает правом первого хо-
да, т.е. он первым выбирает стратегию u, и этот выбор становится известным
партнеру. Кроме того, будем считать, что второму игроку в момент принятия
решения о выборе своего управления v становится известным реализовавше-
еся значение неопределенного фактора α. В этих условиях второй игрок при-
нимает решения в условиях полной информированности, поэтому если функ-
ция h действительно описывает его интересы, он выберет свое управление из
множества
{
}
BR(u,α) = v ∈ V : h(u,v,α) = maxh(u,w,α)
w∈V
Проблема возникает, если максимум в этой формуле не достигается. Поэто-
му поступим традиционным образом: доопределим отображение BR (u, α) на
такой случай условием
{
}
BR (u,α) = v ∈ V : h(u,v,α) ≥ sup h(u,w,α) - κ
,
w∈V
где κ - некоторое фиксированное положительное число. Из дальнейшего бу-
дет видно, что от числа κ, да и вообще от способа доопределения мало что
зависит.
При сделанных предположениях первый игрок может с основанием рас-
считывать на то, что его партнер выберет управление из множества BR (u, α).
А поскольку “в пределах этого множества” выигрыши второго игрока “прак-
тически одинаковы”, то еще как-то повлиять на его выбор первый игрок не
может. Этот выбор, а значит, и выигрыш первого игрока, разумеется, зависит
от неизвестного ему значения неопределенного фактора. Предположим, что
первый игрок готов исключить из рассмотрения некоторое число “маловеро-
ятных” значений этого фактора, а в остальном осторожен.
Более точно, будем считать, что первый игрок выбирает некоторое чис-
ло ξ ∈ [0, 1] и желает, чтобы при разумном поведении партнера его гаран-
тированный выигрыш “с вероятностью ξ” был как можно больше. Число ξ
описывает склонность первого игрока к риску. Формализуются изложенные
соображения следующим образом.
Определение 1. Максимальным ξ-гарантированным результатом
первого игрока в игре Γ называется число
R (Γ, ξ) = sup sup
inf
inf
g (u,v,α),
B u∈U
α∈B
v∈BR(u,α)
где первый супремум берется по классу всех измеримых подмножеств B
множества A, для которых ℘(B) ≥ ξ.
109
Замечание 3. Может вызвать какие-то возражения требование измери-
мости множества B в этом определении. Можно поменять постановку, заме-
нив меру ℘ в условии ℘ (B) ≥ ξ соответствующей внешней мерой и отказав-
шись от условия измеримости. Из дальнейшего (см. леммы 2 и 3) будет видно,
что в обоих случаях результат будет одним и тем же. Поэтому был выбран
чуть более простой вариант постановки.
Для работы бывает удобнее эквивалентное условие, которое тоже оформим
в виде определения. Но вновь начнем с содержательной интерпретации.
Поскольку второй игрок принимает свое решение в условиях полной ин-
формации, естественно предположить, что для него все выборы разбиваются
на “рациональные” и “нерациональные”. Можно считать, что это разбиение
происходит по пороговому принципу, т.е. существует такое число λ, что “нера-
циональными” являются те и только те выборы, для которых выигрыш вто-
рого игрока меньше λ. Разумеется, значение λ зависит от условий, в которых
второй игрок принимает решение, т.е. от u и α. Как и ранее, будем пола-
гать, что первый игрок желает, чтобы с вероятностью ξ при рациональном
поведении партнера его выигрыш был достаточно хорош. Это приводит к
следующему определению.
Определение 2. Число γ называется ξ-гарантированным результа-
том первого игрока в игре Γ, если существуют измеримое подмножество B
множества A, удовлетворяющее неравенству ℘(B) ≥ ξ, и такая стратегия
u ∈ U, что для любого α ∈ B найдется число λ, для которого выполняются
условия:
1◦. существует w ∈ V, для которого h(u,w,α) ≥ λ;
2◦. для любого v ∈ V либо g (u,v,α) ≥ γ, либо h(u,v,α) < λ.
Точная верхняя грань R′ (Γ, ξ) всех ξ-гарантированных результатов первого
игрока называется его максимальным ξ-гарантированным результатом.
Использование одного термина для обозначения двух величин оправдано
только в том случае, когда эти величины совпадают. В общем случае это,
конечно же, не так, поскольку в “плохих” играх величина R (Γ, ξ) зависит
от κ, а величина R′ (Γ, ξ) - не зависит. Но в “хороших” играх эти величины
действительно совпадают. В моделях, рассматриваемых в данной статье, это
действительно так.
А именно: справедливо следующее утверждение.
Лемма 1. При сделанных топологических предположениях выполняют-
ся равенства R(Γ,ξ) = R′ (Γ,ξ) и R (Γ∗,ξ) = R′ (Γ∗,ξ).
Доказательство леммы 1 приводится в Приложении.
Далее будем пользоваться равенством величин R (Γ, ξ) и R′ (Γ, ξ) без осо-
бых оговорок, используя для них обозначение R (Γ, ξ). То же относится и к
игре Γ∗.
4. Игра без обратной связи
Обратимся к анализу игры Γ. В определении максимального гарантиро-
ванного результата для этой игры присутствует одна “неэлементарная” опе-
110
рация. В определении 1 - это супремум по классу всех измеримых подмно-
жеств B множества A, а в определении 2 ему соответствует квантор общности
по тому же классу. Цель данного раздела состоит в том, чтобы заменить эту
операцию “элементарной” операцией вычисления математического ожидания.
Поскольку в настоящей статье рассматривается только одна вероятност-
ная мера ℘, будем обозначать операцию вычисления математического ожи-
дания по этой мере просто символом M.
Введем обозначение
m(u, α) = max h(u, v, α).
v∈V
Удобно воспользоваться определением 2. Пусть для некоторых u, w, α
и λ выполняется неравенство h(u,w,α) ≥ λ, как предусмотрено п. 1◦ опре-
деления 2. Тогда тем более выполняется неравенство max h(u, v, α) ≥ λ, т.е.
v∈V
m (u, α) ≥ λ. Обратно: если m (u, α) ≥ λ, то п. 1◦ определения
2
заведо-
мо будет выполнен (достаточно взять любое w, удовлетворяющее условию
h (u, w, α) = max h(u, v, α)). А п. 2◦ этого определения выполнить тем легче,
v∈V
чем больше величина λ. Поэтому можно, не уменьшая общности, считать,
что λ = m (u, α).
Но тогда для всех v ∈ BR (u, α) выполняется условие h(u, v, α) = λ, а, сле-
довательно, в силу п. 2◦ определения 2 должно быть справедливо неравенство
g (u,v,α) ≥ γ по крайней мере для α ∈ B. Последнее условие можно перепи-
сать так: для всех α ∈ B справедливо неравенство
(2)
min
g (u, v, α) ≥ γ.
v∈BR(u,α)
Определим множество
{
}
C(u) = α ∈ A : min g(u, v, α) ≥ γ
v∈BR(u,α)
Справедливо следующее техническое утверждение.
Лемма 2. Множество C (u) измеримо.
Доказательство леммы 2 приведено в Приложении.
Если множество B и стратегия u удовлетворяют условию определения 2,
то в силу неравенства (2) выполнено включение B ⊂ C (u) и, следовательно,
справедливо неравенство ℘ (C (u)) ≥ ℘ (B) ≥ ξ.
И наоборот: если для некоторого u выполнено неравенство ℘ (C (u)) ≥ ξ,
то число γ является ξ-гарантированным результатом, поскольку можно
взять B = ℘ (C (u)), λ = m (u, α) и w, выбрать удовлетворяющее условию
h (u, w, α) = max h(u, v, α).
v∈V
Определим функцию θ (x), положив
{
1, если x ≥ 0,
θ(x) =
0, если x < 0.
111
(
)
Тогда мера множества C (u) равна Mθ
min g(u, v) - γ
. Отсюда немед-
v∈BR(u,α)
ленно получается следующее утверждение.
Теорема 1. Число γ является ξ-гарантированным результатом тогда
и только тогда, когда либо
(
)
maxMθ min g(u, v) - γ
≥ξ
u∈U
v∈BR(u,α)
и максимум в этой формуле достигается, либо
(
)
supMθ min g(u, v) - γ
> ξ.
u∈U
v∈BR(u,α)
Замечание 4. Естественно возникает вопрос: а что будет, если раз-
решить игрокам обмениваться не обязательно достоверной информацией о
неопределенном факторе. Задача вычисления ξ-гарантированного результата
в такой игре легко сводится к только что решенной. Можно просто рассмот-
реть игру, в которой V = V′ × A и f ((u′, β) , α) = (f′ (u′, α) , β), где u′ ∈ U и
β ∈ A. Обратную редукцию, видимо, провести невозможно. Кроме того, фор-
мулы при рассмотрении более общего случая получаются чуть белее корот-
кими. Поэтому была рассмотрена именно такая модель.
Понятно, что добавление новых возможностей (по получению инфор-
мации) не может уменьшить ξ-гарантированный результат первого игро-
ка. Привести пример, когда результат увеличивается, совсем не слож-
но. Можно рассмотреть случай, когда интересы игроков совпадают, т.е.
h (u, v, α) = q (u, f (v, α)). Тогда в случае “общего положения” дополнитель-
ный обмен информацией будет приносить первому игроку не нулевую при-
быль.
5. Игра с обратной связью
Перейдем к исследованию игры Γ∗. В определении максимального гаран-
тированного результата для этой игры присутствуют две “неэлементарные”
операции. Помимо выбора множества B, таковым является выбор стратегии
первого игрока, поскольку множество его стратегий U∗ = Φ (X × A, U ) - это
функциональное пространство.
Как и ранее, целью исследования будет замена этих операций более про-
стыми. К сожалению, в полном объеме эту задачу решить не удается. Поэтому
сделаем дополнительное предположение.
Гипотеза 1. Функция h удовлетворяет следующему условию: существует
такое up ∈ U, что для любого α ∈ A и любого v ∈ V имеет место равенство
h(up, v, α) = min h(u, v, α).
u∈U
По существу, здесь предполагается наличие универсальной стратегии на-
казания. Такого рода гипотезы довольно часто используются и в теории кон-
трактов, и в теории иерархических игр. На практике системы, удовлетворяю-
щие этому условию, встречаются довольно часто. Если рассматривать при-
112
веденную в разделе 2 интерпретацию, то это предположение сводится к тому,
что первый игрок может вовсе не выплачивать своему подчиненному возна-
граждение независимо от полученных результатов. Предположение вполне
реалистичное.
Приступим к решению поставленной задачи. Удобно воспользоваться
определением 2. Для краткости запишем его на языке исчисления преди-
катов.
Число γ является ξ-гарантированным результатом в игре Γ∗ тогда и только
тогда, когда выполнено условие
∃B ∃u∗ ∈ Φ(X × A,U) ∀α ∈ B ∃λ℘(B) ≥ ξ &
(3)
& [∃w ∈ V ∃ς ∈ A : h (u∗
(f (w, α) , ς) , w, α) ≥ λ] &
&[∀v ∈ V, ∀β ∈ A q (u∗ (f (v,α),β),f (v,α)) ≥ γ ∨h(u∗ (f (v,α),β),v,α) < λ] .
Как и в разделе 4, начнем с конкретизации значения λ. Пусть
H (α,γ) = {(u,v) ∈ U × V : q (u,f (v,α)) ≥ γ} ,
l (α,γ) =
max h (u, v, α)
(u,v)∈H(γ,α)
(далее удобно использовать стандартное предположение l (α, γ) = -∞, если
H (α, γ) = ∅).
Докажем, что условие (3) равносильно условию
∃B ∃u∗ ∈ Φ(X × A,U) ∀α ∈ B ℘(B) ≥ ξ &
(4)
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α) , β) , f (v, α)) ≥ γ ∨
∨ h(u∗ (f (v,α),β),v,α) < l(α,γ)].
Пусть условие (3) выполнено. Тогда существуют множество B ⊂ A и стра-
тегия u∗ ∈ U∗, для которых ℘ (B) ≥ ξ и
(5)
∀α ∈ B ∃λ [∃w ∈ V ∃ς ∈ A : h(u∗
(f (w, α) , ς) , w, α) ≥ λ] &
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α), β) , f (v, α)) ≥ γ ∨ h(u∗ (f (v, α), β), v, α) < λ] .
Фиксируем произвольное α ∈ B и подберем число λ так, что
(6)
[∃w ∈ V ∃ς ∈ A : h (u∗
(f (w,α),ς),w,α) ≥ λ] &
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α), β), f (v, α)) ≥ γ ∨ h (u∗ (f (v, α), β), v, α) < λ] .
Если w ∈ V и ς ∈ A удовлетворяют первой части условия (6), то в силу
второй части этого условия верно неравенство
q (u∗ (f (w, α) , ς) , f (w, α)) ≥ γ.
Значит, пара (u∗ (w, ς) , w) принадлежит множеству H (α, γ) , и потому
h(u∗ (f (w,α),ς),w,α) ≤ l (α,γ) .
В сочетании с неравенством из первой части условия (6) это дает λ ≤ l (α, γ).
А тогда из второй части условия (6) следует, что
∀v ∈ V, ∀β ∈ A q (u∗ (f (v,α),β) ,f (v,α)) ≥
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < l(α,γ).
113
В силу произвольности α ∈ B получим отсюда, что
∀α ∈ B, ∀v ∈ V, ∀β ∈ A q (u∗ (f (v,α) ,β) ,f (v,α)) ≥
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < l(α,γ),
и тем более выполняется условие (4).
Итак, из условия (3) следует условие (4). Докажем обратное. Пусть усло-
вие (4) выполнено.
Тогда существуют множество B ⊂ A и стратегия ω∗ ∈ U∗, для которых
℘ (B) ≥ ξ и
∀α ∈ B, ∀v ∈ V, ∀β ∈ A q (ω∗ (f (v,α) ,β) ,f (v,α)) ≥ γ ∨
(7)
∨ h(ω∗ (f (v,α),β),v,α) < l(α,γ).
Подправим функцию ω∗. Для каждого α ∈ A фиксируем пару управлений
(uα, vα) ∈ H (α, γ), для которой h (uα, vα, α) = l (α, γ). Положим
{ uα,
если x = f (vα, α) и β = α,
u∗ (x,β) =
ω∗ (x,α) в остальных случаях.
Для этой стратегии u∗ и любого β ∈ A выполнено условие
∀v ∈ V, ∀β ∈ A q (u∗ (f (v,α),β),f (v,α)) ≥
(8)
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < l(α,γ).
Действительно, фиксируем произвольные α ∈ B, v ∈ V и β ∈ A. Тогда если
u∗ (f (v,α),β) = ω∗ (f (v,α),β), то из условия (7) немедленно следует, что
(9)
q (u∗ (f (v, α) , β) , f (v, α)) ≥ γ ∨ h (u∗
(f (v, α) , β) , v, α) < l (α, γ) .
А если u∗ (f (v(α) , β)) = ω∗ (f (v, α) , β), то по построению v = vβ , а, кроме
того, f (v, α) = f
vβ,β
и (u∗ (f (v, α) , β) , v) = uβ. Значит,
(
(
))
q (u∗ (f (v, α) , β) , f (v, β)) = q uβ, f vβ , β
≥ γ,
и тем более выполняется условие (9). Таким образом, условие (9) выполнено
при всех v ∈ V и β ∈ A, а это и дает условие (8).
Кроме того, для этой стратегии u∗ и любого α ∈ B выполняется условие
∃w ∈ V ∃υ ∈ A : h(u∗ (f (w,α),υ),w,α) ≥ l (α,γ)
(можно взять υ = α и w = vα).
114
Вместе с условием (8) это даст
[∃w ∈ V ∃ς ∈ A : h (u∗ (f (w, α) , ς) , w, α) ≥ l (α, γ)] &
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α) , β) , f (v, α)) ≥
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < l(α,γ)].
Поскольку неравенство ℘ (B) ≥ ξ предполагается выполненным, отсюда
получим, что
∃λ℘(B) ≥ ξ & [∃w ∈ V ∃ς ∈ A : h(u∗ (f (w,α) ,ς) ,w,α) ≥ λ] &
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α) , β) , f (v, α)) ≥
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < λ]
(подходит λ = l (α, γ)). В силу произвольности α ∈ B из этого следует, что
∀α ∈ B ∃λ℘(B) ≥ ξ & [∃w ∈ V ∃ς ∈ A : h(u∗ (f (w,α),ς),w,α) ≥ λ] &
& [∀v ∈ V, ∀β ∈ A q (u∗ (f (v, α) , β) , f (v, α)) ≥
≥ γ ∨ h(u∗ (f (v,α),β),v,α) < λ],
и тем более выполняется условие (3).
Итак, γ является ξ-гарантированным результатом в игре Γ∗ тогда и только
тогда, когда выполнено условие (4).
Обозначим
m(α) = maxmin h (u, v, α) .
v∈V
u∈U
Если выполнено условие (4), то для α ∈ B должно выполняться неравен-
ство m (α) ≤ l (α, γ).
Действительно, допустим противное. Фиксируем значение α, для которого
m (α) > l (α, γ), и выберем w так, что
min h (u, w, α) = m (α) .
u∈U
Тогда
h(u∗ (w,α),w,α) ≥ min h(u,w,α) = m(α) > l (α,γ) .
u∈U
Значит, в силу определения функции l (α, γ) пара (u∗ (w, α) , w) не принад-
лежит множеству H (α, γ), а, следовательно, q (u∗ (f (w, α) , α) , f (w, α)) < γ.
Это уже противоречит условию (4).
А если гипотеза 1 справедлива и m (α) < l (α, γ) для всех α ∈ B, то усло-
вие (4) выполнено.
Для доказательства достаточно предъявить подходящую стратегию u∗.
Очевидно, что если положить u∗ (x, β) ≡ up, то последнее неравенство в усло-
вии (4) будет выполнено при всех α ∈ B, v ∈ V и β ∈ A.
Итак, условие
(10)
∃B : m(α) ≤ l (α,γ)
115
является необходимым, а условие
(11)
∃B : m(α) < l (α,γ)
является достаточным для того, чтобы число γ было ξ-гарантированным ре-
зультатом в игре Γ∗.
В формулах (10) и (11) осталось по одной “неэлементарной” операции, для
замены которой воспользуемся той же идеей, что и в разделе 4. Для этого
понадобится следующее техническое утверждение.
Лемма 3. Множества {α ∈ A: m(α) ≤l(α,γ)} и {α ∈ A: m(α) <l(α,γ)}
измеримы.
Доказательство леммы 3 приведено в Приложении.
Обозначим ϑ (x) = 1 - θ (1 - x).
Повторяя рассуждения раздела 4, придем к следующему результату.
Теорема 2. Для того чтобы число γ было ξ-гарантированным резуль-
татом в игре Γ∗, необходимо, чтобы
(
)
Mθ max
h(u,v,α) - maxmin h (u, v, α)
≥ ξ,
(u,v)∈H(γ,α)
v∈V
u∈U
и достаточно, чтобы
(
)
Mϑ max
h(u,v,α) - maxmin h (u, v, α)
≥ ξ.
(u,v)∈H(γ,α)
v∈V
u∈U
Если достаточное условие из этой теоремы выполнено, то приведенные
ранее рассуждения позволяют построить стратегию, гарантирующую полу-
чение этого результата с вероятностью ξ. Действительно, в качестве множе-
ства B можно взять множество {α ∈ A : m (α) < l (α, γ)}. Тогда при α ∈ B
множество H (α, γ) будет не пусто. В таком случае корректно определена
функция
{
(
)
uβ, если x = f
vβ,β
, β∈B,
u∗ (x,β) =
up в противном случае.
Непосредственно проверяется, что такая стратегия является искомой.
Кроме того, та же непосредственная проверка показывает, что при таком
выборе стратегии u∗ выполняется включение (vα, α) ∈ BR (u∗, α). Содержа-
тельно это означает, что второму игроку достаточно выгодно сообщать ис-
тинную информацию о неопределенном факторе α, т.е. в данном случае спра-
ведлив известный принцип выявления.
Замечание 5. Анализ приведенного доказательства теоремы 2 показыва-
ет, что с сохранением результата гипотеза 1 может быть заменена следующим
предположением.
Гипотеза 2. Функция h удовлетворяет следующему условию: существует
такое up ∈ U, что для любого α ∈ A имеет место неравенство
max h(up, v, α) < l (α, γ) .
v∈V
Это условие сложнее, но кажется гораздо менее ограничительным.
116
Кроме того, анализ того же доказательства показывает, что для того что-
бы число γ было ξ-гарантированным результатом в игре Γ∗, необходимо, что-
бы выполнялось следующее условие: существует такое up ∈ U, что для любого
α ∈ B имеет место неравенство
max h(up, v, α) ≤ l (α, γ)
v∈V
(без каких-либо дополнительных предположений). Это необходимое условие
отличается от гипотезы 2 двумя моментами. Во-первых, в одном условии
неравенство строгое, а в другом - нестрогое. Это условие не слишком прин-
ципиальное. С возникающими из-за этого трудностями, скорее всего, можно
было бы справиться. А, во-вторых, в гипотезе 2 условие распространяется на
все α ∈ A, а в необходимом условии говорится об α, принадлежащих заранее
неизвестному множеству B. Вот здесь лежит корень проблем, из-за которых
задачу не удается решить в общем виде.
6. Заключение
В большинстве публикаций, посвященных исследованию аналогичных мо-
делей, приводятся явные формулы для вычисления максимального гаран-
тированного или максимального ожидаемого результата Центра. В данной
статье основной результат состоит в выписывании уравнения, которому удо-
влетворяет максимальный ξ-гарантированный результат. В значительной сте-
пени это связано с разницей между определениями 1 и 2.
В большинстве исследованных случаев выбор одного из них - это просто
вопрос удобства. Наверное, многим привычнее определение 1. В некоторых
случаях удобнее получить основной результат с помощью определения 2, а за-
тем уже преобразовать его в явную формулу. В данном случае все несколько
иначе. Решить задачу с помощью определения 1 не удается, и преобразовать
полученный результат в явную формулу тоже не получается.
Полученные в статье результаты обобщают теоремы из [19]. Модель из [19]
вкладывается в описанную схему, если положить f (v, α) = v.
Если положить ξ = 1, то получится классическая модель Центр-агент с
осторожным Центром. Как следует из замечания 5, дополнительные пред-
положения типа гипотез 1 или 2 в этом частном случае не нужны, поэтому
результат в данном случае получается достаточно общим. Кроме того, при
ξ = 1 результат можно получить в явном виде и с использованием определе-
ния 1.
В общем случае рассмотренная в данной статье задача оказывается суще-
ственно сложнее.
Видимо, этим обусловлен и тот факт, что до сих пор проблема управления
рисками в теоретико-игровых задачах исследовалась мало. В основном изуча-
лись модели либо с осторожными, либо с риск-нейтральными игроками. Важ-
ность более гибкого учета отношения игроков к риску не вызывает сомнения.
В данной статье предложена техника, позволяющая, хотя и с определенны-
ми трудностями, решать подобные задачи. Пока с ее помощью исследована
лишь простейшая модель. Опыт использования этих методов позволяет на-
деяться, что, используя те же идеи, удастся решить и другие, может быть,
более содержательные задачи.
117
ПРИЛОЖЕНИЕ
Доказательство леммы 1. Сначала докажем что выполняется нера-
венство R (Γ, ξ) ≤ R′ (Γ, ξ).
Пусть γ - произвольное число, удовлетворяющее условию γ < R (Γ, ξ). Вы-
берем измеримое множество B и стратегию u так, что
(Π.1)
inf
inf
g (u, v, α) > γ.
α∈B
v∈BR(u,α)
Фиксируем произвольное α ∈ B.
Положим λ = max h (u, v, α), если максимум в этой формуле достигается, и
v∈V
λ = suph(u,v,α) - κ в противном случае. Тогда для v ∈ BR(u,α) справедли-
v∈V
во неравенство h (u, w, α) ≥ λ, т.е. выполняется п. 1◦ определения 2. Далее для
v ∈ BR(u,α) в силу условия (Π.1) выполняется неравенство g (u,v,α) > γ.
А для v ∈ BR (u, α) имеем h (u, v, α) < λ. Значит, выполняется и п. 2◦ опре-
деления 2.
В силу произвольности α ∈ B число γ является гарантированным резуль-
татом в смысле определения 2. Поэтому γ ≤ R′ (Γ, ξ). А поскольку выбор чис-
ла γ стеснен лишь условием γ < R (Γ, ξ), имеет место нужное неравенство
R(Γ,ξ) ≤ R′ (Γ,ξ).
Неравенство R (Γ∗, ξ) ≤ R′ (Γ∗, ξ) доказывается дословно так же.
Теперь докажем неравенство R (Γ∗, ξ) ≥ R′ (Γ∗, ξ).
Пусть γ - произвольное число, удовлетворяющее условию γ < R′ (Γ, ξ).
Выберем множество B и стратегию u∗ так, как описано сразу после фор-
мулировки теоремы 2. Фиксируем произвольное α ∈ B.
Непосредственно проверяется, что тогда максимум max h∗ (u∗, v∗, α) до-
v∗∈V∗
стигается, например, в точке v∗ = (vα, α). А значит, для всех v∗ ∈ BR (u∗, α)
выполняется равенство
(Π.2)
h∗ (u∗,v∗,α) = max h∗ (u∗,w∗
,α).
w∗∈V∗
Пусть число λ удовлетворяет условию определения 2. Тогда для некото-
рого w∗ справедливо неравенство λ ≤ h∗ (u∗, w∗, α) и тем более
λ ≤ max h∗ (u∗,w∗,α).
w∗∈V∗
Поэтому в силу условия (Π.2) для всех v∗ ∈ BR (u∗, α) выполняется нера-
венство h∗ (u∗, v∗, α) ≥ λ и, значит, в силу п. 2◦ определения 2 будем иметь
g∗ (u∗,v∗,α) ≥ γ. Следовательно,
inf
g∗ (u∗,v∗,α) ≥ γ,
v∗∈BR(u∗,α)
а в силу произвольности α ∈ B выполняется неравенство
inf
inf
g∗ (u∗,v∗,α) ≥ γ.
α∈B
v∗∈BR(u∗,α)
118
Тем более
R (Γ, ξ) = sup sup
inf
inf
g (u,v,α) ≥ γ.
B u∈U
α∈B
v∈BR(u,α)
В силу произвольности γ отсюда следует, что R (Γ∗, ξ) ≥ R′ (Γ∗, ξ).
Неравенство R (Γ, ξ) ≥ R′ (Γ, ξ) доказывается практически так же, только
вместо ссылки на теорему 2 можно сослаться на стандартную теорему из
курса математического анализа.
Лемма 1 доказана.
Замечание П.1. При доказательстве теоремы 2 лемма 1 никак не ис-
пользовалась. Поэтому логического круга здесь нет. Ссылка на теорему ис-
пользована выше исключительно для сокращения доказательства леммы.
Доказательство леммы 2. Для доказательства леммы достаточно
сведений, явно сформулированных в [20] (см. гл. V, § 4), и стандартной то-
пологической техники.
Для того чтобы множество C(u) было измеримо, достаточно, чтобы при
фиксированном u была измеримой функция ϕ (α) = min g(u, v, α). Для
v∈BR(u,α)
этого необходимо и достаточно, чтобы измеримой была функция
-ϕ(α) = 0 - ϕ(α) .
Следовательно, достаточно доказать, что при любом γ измеримо множество
{
}
C0(u) = {α ∈ A : -ϕ(α) < -γ} = α ∈ A : min g(u,v,α) > γ
v∈BR(u,α)
Мера ℘ предполагается борелевской, поэтому достаточно установить, что
множество C0 (u) является открытым.
Пусть это не так. Тогда существуют α ∈ C0 (u) и сходящаяся к α последо-
вательность α1, α2, . . . такая, что αk ∈ C0 (u), k = 1, 2, . . .
Функция h непрерывна, поэтому множество BR (uk, α) замкнуто. Мно-
жество V компактно, значит, компактно и его замкнутое подмноже-
ство BR (uk, α). Следовательно, в некоторой точке vk достигается мини-
мум min g(u, v, αk ). Так как αk ∈ C0 (u), то выполняется неравенство
v∈BR(u,αk )
g (u,vk,αk) = min g(u,v,αk) ≤ γ.
v∈BR(u,αk )
В силу компактности множества V можно, не ограничивая общности, счи-
тать, что последовательность v1, v2, . . . сходится к некоторому элементу v
(в противном случае можно перейти к подходящей подпоследовательности).
Поскольку vk ∈ BR (u, αk), то для любого w ∈ V выполняется неравенство
h (u, vk, αk) ≥ h (u, w, αk ). Функция h непрерывна, поэтому, переходя в этом
неравенстве к пределу при k → ∞, получим h (u, v, α) ≥ h (u, w, α). В силу
произвольности w это означает, что v ∈ BR (u, α).
Из непрерывности функций q и f немедленно следует непрерывность
функции g. Поэтому, переходя к пределу при k → ∞ в неравенстве
g (u,vk,αk) ≤ γ, получим g (u,v,α) ≤ γ. Тем более min g(u,v,α) ≤ γ. Это
v∈BR(u,α)
противоречит условию α ∈ C0 (u)
119
Лемма 2 доказана.
Доказательство леммы 3. Прежде всего заметим, что из непрерыв-
ности функции h и компактности множеств U, V и A стандартным образом
выводится непрерывность функции m.
Для доказательства измеримости обоих множеств достаточно доказать из-
меримость функции ψ (α) = m (α) - l (α, γ). А для этого достаточно доказать
измеримость множества
C1 (α) = {α ∈ A : l (α,γ) < m(α) + c}
(при любом c).
Поскольку мера ℘ - борелевская, достаточно доказать, что это множество
открыто.
Допустим противное. Тогда существуют α ∈ C1 (u) и сходящаяся к α по-
следовательность α1, α2, . . . такая, что αk ∈ C1 (u), k = 1, 2, . . .
По определению множество H (αk, γ) - замкнутое подмножество декарто-
ва произведения U × V (оно задается нестрогим неравенством, а функция
q (u, f (v, α)) непрерывна). Множества U и V компактны, значит, компактно
и множество H (αk, γ). А тогда в некоторой точке (uk, vk) достигается макси-
мум
max h (u, v, αk) .
(u,v)∈H(γ,αk)
В силу компактности множеств U и V без потери общности можно считать,
что последовательность (u1, v1) , (u2, v2) , . . . сходится к точке (u0, v0).
Точки (uk, vk), k = 1, 2, . . . , принадлежат множествам H (αk, γ), поэтому
выполняются неравенства q (uk, f (vk, αk)) ≥ γ. Переходя в этом неравенстве
к пределу при k → ∞, получим q (u0, f (v0, α)) ≥ γ, т.е. (u0, v0) ∈ H (α, γ).
Поэтому h (u0, v0, α) ≤ l (α, γ) < m (α) + c. Но тогда в силу непрерывности
функции h при достаточно больших k должны выполняться неравенства
h(uk,vk,α) < m(α) + c.
Это противоречит условию αk ∈ C1 (u), k = 1, 2, . . .
Полученное противоречие доказывает лемму 3.
СПИСОК ЛИТЕРАТУРЫ
1. Markowitz H.M. Portfolio Selection // J. Finance. 1952. V. 7. No. 1. P. 77-91.
2. Шарп У., Александер Г., Бэйли Дж. Инвестиции. М.: Инфра-М, 1997.
3. Агасандян Г.А. Применение континуального критерия VAR на финансовых
рынках. М.: ВЦ РАН, 2011.
4. Jorion Р. Value at Risk: The New Benchmark for Managing Financial Risk. N.Y.:
McGraw-Hill, 2006.
5. Агасандян Г.А. Континуальный критерий VaR и оптимальный портфель ин-
вестора // Управление большими системами. Вып. 73. М.: ИПУ РАН, 2018.
С. 6-26.
6. Harsanyi J.C. Games with Incomplete Information Played by Bayesian Players.
I // Manage. Sci. 1967. V. 14. No. 3. P. 159-183.
120
7.
Harsanyi J.C. Games with Incomplete Information Played by Bayesian Players.
II // Manage. Sci. 1968. V. 14. No. 5. P. 320-334.
8.
Harsanyi J.C. Games with Incomplete Information Played by Bayesian Players.
III // Manage. Sci. 1968. V. 14. No. 7. P. 486-502.
9.
Fudenberg D., Tirole J. Game theory. Cambridge: MIT Press, 1991.
10.
Bolton P., Dewatripont M. Contract Theory. Cambridge: MIT Press, 2004.
11.
Laffont J.-J., Martimort D. The Theory of Incentives: The Principal-Agent Model.
Cambridge: MIT Press, 2002.
12.
Халезов А.Д. Об одном классе многошаговых конфликтов в условиях риска //
Журн. вычисл. матем. и мат. физ. 1982. Т. 22. № 1. С. 42-48.
Khalezov A.D. On a Class of Multistage Conflicts under Conditions of Risk //
Comput. Math. Math. Phys. 1982. V. 22. No. 1. P. 42-48.
13.
Халезов А.Д. Применение уточняемых стратегий в многошаговых конфликтах
в условиях риска // АиТ. 1990. № 2. С. 113-123.
Khalezov A.D. Application of Tunable Strategies in Multistage Conflicts under
Risky Conditions // Autom. Remote Control. 1990. V. 51. No. 2. Part 2. P. 231-239.
14.
Халезов А.Д. Общее решение задачи Центр-Агент с симметричной информа-
цией в условиях риска // Журн. вычисл. матем. и мат. физ. 2001. Т. 41. № 3.
С. 374-383.
Khalezov A.D. A General Solution of the Principal-Agent Problem with Symmetric
Information under Risk Conditions // Comput. Math. Math. Phys. 2001. V. 41.
No. 3. P. 347-355.
15.
Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулирования в ве-
роятностных моделях социально-экономических систем // АиТ. 1993. № 11.
С. 3-30.
Burkov V.N., Enaleev A.K., Novikov D.A. Stimulation Mechanisms in Probability
Models of Socioeconomic Systems // Autom. Remote Control. 1993. V. 54. No. 11.
P. 1575-1598.
16.
Бурков В.Н., Еналеев А.К., Новиков Д.А. Вероятностная задача стимулирова-
ния // АиТ. 1993. № 12. С. 140-145.
Burkov V.N., Yenaleev A.K., Novikov D.A. Probabilistic Stimulation Problem //
Autom. Remote Control. 1993. V. 54. No. 12. P. 1846-1851.
17.
Бурков В.Н., Новиков Д.А. Оптимальные механизмы стимулирования в ак-
тивной системе с вероятностной неопределенностью. II // АиТ. 1995. № 10.
С. 121-126.
Burkov V.N., Novikov D.A. Optimal Incentive Mechanisms in Active Systems under
Stochastic Uncertainty // Autom. Remote Control. 1995. V. 56. No. 10. P. 121-126.
18.
Enaleev Optimal Incentive Compatible Mechanism in a System with Several Active
Elements // Autom. Remote Control. 2017. V. 78. No. 1. P. 146-158.
19.
Горелов М.А. Принцип “Value at Risk” в иерархической игре // Управление
большими системами. Вып. 72. М.: ИПУ РАН, 2018. С. 6-26.
20.
Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального
анализа. М.: Наука, 1981.
Статья представлена к публикации членом редколлегии М.В. Губко.
Поступила в редакцию 13.09.2018
После доработки 31.01.2019
Принята к публикации 07.02.2019
121