Автоматика и телемеханика, № 7, 2020
© 2020 г. А.С. ШВЕДОВ, д-р физ.-мат. наук (ashvedov@hse.ru)
(Национальный исследовательский университет
“Высшая школа экономики”, Москва)
ВОЙНА НА ИЗНУРЕНИЕ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ
И С НЕЧЕТКИМИ ТИПАМИ ИГРОКОВ
Результат о существовании равновесного в смысле Байеса-Нэша про-
филя чистых стратегий для симметричных игр с неполной информацией
класса ¾война на изнурение¿ обобщается для случая, когда действия и
типы игроков могут быть нечеткими.
Ключевые слова: игра с неполной информацией, нечеткое множество,
нечетко-случайная величина, равновесие Байеса-Нэша.
DOI: 10.31857/S0005231020070090
1. Введение
В последние десятилетия играм класса ¾война на изнурение¿ уделяется
значительное внимание. Для таких игр многие результаты и теоретического,
и прикладного характера были получены при рассмотрении биологических
задач, когда два животных одного вида вступают в спор за некоторый приз,
например пищу или территорию, при этом приз может достаться только од-
ному из них. Однако животные не начинают схватку, а пытаются показать
сопернику свою силу и заставить его отступить. При этом ценность приза
для каждого из соперников уменьшается при увеличении времени противо-
стояния.
В различных работах изучаются игры этого класса и с полной, и с непол-
ной информацией. При рассмотрении игр с неполной информацией каждый
из игроков знает свой тип, но не знает тип соперника (например, типом игро-
ка может быть то, насколько животное голодно). Однако каждому из игроков
известно распределение вероятностей для типа его соперника.
Результат о существовании равновесного в смысле Байеса-Нэша профиля
чистых стратегий для симметричных игр с неполной информацией класса
¾война на изнурение¿ (т.е. для игр с одинаковыми игроками, точнее, с игро-
ками с одинаковыми распределениями вероятностей для типов и с одинако-
выми действиями для каждого типа) представлен в [1]. Доказательство этого
результата можно найти, например, в [2]. В некоторых последующих работах
данный результат назван классическим. Различные модификации игр класса
¾война на изнурение¿ рассматривались многими авторами. Например, в [3]
даются приложения к экономическим задачам. Некоторые обзоры этого на-
правления можно найти в [4, 5]. Подробнее об играх с неполной информацией
и о равновесии Байеса-Нэша см., например, [6].
Теория нечетких множеств применяется при рассмотрении многих игро-
вых задач. Для игр в нормальной форме можно назвать обзор [7]. Если
139
использовать электронные базы научных ресурсов, то нетрудно убедиться,
что число работ, в названиях которых присутствует и слово “fuzzy”, и сло-
во “game”, является значительным, причем многие из этих работ недавние.
Теория нечетких множеств используется и в моделях, где присутствует неко-
торый управляющий центр, но объекты управления активны, т.е. преследуют
и свои интересы [8]. Однако, насколько известно, до сих пор не рассматри-
вались игры с неполной информацией, где типы игроков были бы нечеткими
числами (или нечеткими множествами).
Для игр класса ¾война на изнурение¿ логично предположить, что цен-
ность приза для каждого из игроков (при любом сроке противостояния) из-
вестна лишь приближенно, т.е. является нечетким числом. Тогда и типы иг-
роков должны быть нечеткими числами. Такие задачи рассматриваются в
настоящей работе. Получено обобщение результата о существовании равно-
весного профиля чистых стратегий из [1].
Теория нечетких множеств и теория вероятностей это два различных
подхода к описанию неопределенности. Эти подходы могут использоваться
и независимо друг от друга, и комбинированно. При этом существуют раз-
личные пути, как такое комбинирование может производиться. В настоящей
работе используется подход, при котором понятие нечетко-случайной величи-
ны это прямое обобщение понятия случайной величины, только значениями
измеримой функции являются нечеткие числа, а не обычные действитель-
ные числа. Первые такие определения нечетко-случайных величин даются
в [9-11]. Здесь используется определение нечетко-случайной величины из ра-
боты [12], являющееся модификацией упомянутых определений.
С точки зрения автора для нечетко-случайных величин распределения ве-
роятностей удобнее задавать не при помощи функций распределения, а при
помощи квантильных функций, как это сделано в [13]. В настоящей работе
математический инструментарий, развитый в [13], существенно используется.
В разделе 2 приводится постановка задачи, решение которой дается в раз-
деле 3.
2. Равновесие Байеса-Нэша
Для положительных чисел z, γ, δ рассмотрим функцию
{
z - δ пpи δ < γ,
U (z, γ, δ) =
-γ пpи δ ≥ γ.
Пусть x это тип первого игрока, y тип второго игрока, α действие
первого игрока, β действие второго игрока. Здесь α и β выбранное время
противостояния для каждого игрока. Тогда функция U(x, α, β) определяет
выигрыш первого игрока. Если β < α, то приз достается первому игроку, и
ценность приза для него равняется x - β. Если β ≥ α, то приз не достается
первому игроку, и его потери считаются равными α. Аналогично функция
U (y, β, α) определяет выигрыш второго игрока.
Напомним, что нечеткое число z это фигура (компактное множество)
на плоскости с координатами (ξ, η), лежащая в полосе 0 ≤ η ≤ 1 и определяе-
140
мая двумя функциями zL(η) и zR(η), которые будем называть соответствен-
но левым и правым индексами нечеткого числа z. Функция zL(η) монотон-
но неубывающая, функция zR(η) монотонно невозрастающая, zL(1) ≤ zR(1).
Фигура z состоит из точек (ξ, η) таких, что zL(η) ≤ ξ ≤ zR(η) при любом
η ∈ [0,1]. Если обе функции zL(η) и zR(η) линейные, то фигура z это тра-
пеция и нечеткое число называется трапецоидальным. Если обе эти функции
константы, то фигура z это прямоугольник и нечеткое число называется
прямоугольным. Если, кроме того, эти константы равны одному и тому же
действительному числу, то нечеткое число z можно отождествлять с данным
действительным числом. В общем случае компактность множества z обес-
печивается условием, что функции zL(η) и zR(η) являются непрерывными
слева.
Определение нечетко-случайной величины в настоящей работе то же,
что и в [12]. Квантильная функция случайной величины это монотонно
неубывающая функция q(p) на интервале 0 < p < 1. Квантильная функция
нечетко-случайной величины, определение которой дается в [13], это мно-
жество нечетких чисел q(p), 0 < p < 1. (Нечеткие числа будем обозначать
строчными буквами со знаком ¾тильда¿, нечетко-случайные величины про-
писными буквами со знаком ¾тильда¿.)
ПустьX
Y это две независимые одинаково распределенные нечетко-
случайные величины, которые используются для задания типов первого и
второго игрока соответственно. Под одинаковой распределенностью нечетко-
случайных величин понимается совпадение их квантильных функций. Эта
квантильная функция считается известной обоим игрокам.
Через x и y будем обозначать нечеткие числа, являющиеся типом перво-
го и второго игрока соответственно. Стратегией первого игрока называется
функция A, которая ставит в соответствие каждому типу x первого игрока
некоторое действие α, где α также является нечетким числом. Стратегией
второго игрока называется функция B, которая ставит в соответствие каж-
дому типу y второго игрока некоторое действие
β, где
β также является
нечетким числом.
Пусть функции xL(η) и xR(η) это соответственно левый и правый ин-
дексы нечеткого числа x, функции yL(η) и yR(η) это соответственно левый
и правый индексы нечеткого числа y, функции αL(η) и αR(η) это соответ-
ственно левый и правый индексы нечеткого числа α, функции βL(η) и βR(η)
это соответственно левый и правый индексы нечеткого числ
β, 0 ≤ η ≤ 1.
Наложим ограничение на функции A и B. Будем считать, что существует
функция a: R(→ R)такая, что (ри лю)бом η ∈ [0, 1] выполняются соотноше-
ния αL(η) = a
xL(η)
, αR(η) = a
xR(η)
, и существует функция b: R+ → R+
(
)
такая, что при любом η ∈ [0, 1] выполняются соотношения βL(η) = b
xL(η)
,
(
)
βR(η) = b
xR(η)
. Каждая из функций a и b является строго возрастающей,
непрерывно дифференцируемой, a(0) = b(0) = 0.
Пусть однопараметрические семейства случайных величин XL(η)
и XR(η) это соответственно левый и правый индексы нечетко-случайной
величины
X; однопараметрические семейства случайных величин YL(η)
141
и YR(η) это соответственно левый и правый индексы нечетко-случайной
величин
Y ; параметр η меняется от 0 до 1.
Будем считать, что квантильная функция любой из случайных величин
XL(η), XR(η), YL(η), YR(η), определенная на интервале 0 < p < 1, является
строго возрастающей и непрерывно дифференцируемой, стремится к 0 при
p → 0. Кроме того, все эти квантильные функции на интервале (0,1) огра-
ничены сверху некоторой общей константой. (Последнее условие вытекает из
определения нечетко-случайной величины, данного в [12]).
Будем говорить, что профиль стратегий (A, B) является равновесием
Байеса-Нэша, если при каждом типе x и при каждом η ∈ [0, 1]
(
)
(
(
(
)))
a
xL(η)
∈ arg max E
U
xL(η),αL(η),b
YL(η)
,
αL(η)
(1)
(
)
(
(
(
)))
a
xR(η)
∈ arg max E
U
xR(η),αR(η),b
YR(η)
αR(η)
и при каждом типе y и при каждом η ∈ [0, 1]
(
)
(
(
(
)))
b
yL(η)
∈ arg max E
U
yL(η),βL(η),a
XL(η)
,
βL(η)
(
)
(
(
(
)))
b
yR(η)
∈ arg max E
U
yR(η),βR(η),a
XR(η)
βR(η)
Здесь E означает ожидание соответствующей случайной величины.
3. Определение нечетких действий, составляющих равновесный профиль
Если для краткости писать x вместо xL(η), α вместо αL(η), Y вместо
YL(η), то условие (1) можно записать в виде
(2)
a(x) ∈ arg max
E (U (x, α, b (Y ))) .
α
Пусть q квантильная функция случайной величины Y . Из соотношения (2)
можно вывести, что
y
z
dq-1(z)
(3)
b(y) =
dz.
1 - q-1(z) dz
0
Имеет место аналогичное выражение и для функции a(x). Это дает равно-
весный в смысле Байеса-Нэша профиль чистых стратегий, найденный в [1]
(доказательство приведено, например, в [2]). В Приложении приводится но-
вый вывод формулы (3), более простой, чем другие известные автору доказа-
тельства. При этом используется выражение из [13] для моментов случайных
величин через интеграл, содержащий квантильную функцию.
142
Если обозначить через FL(z; η) функцию распределения случайной вели-
чины YL(η), а через FR(z; η) функцию распределения случайной величи-
ны YR(η), то выражение (3) дает
z
dFL(z; η)
(4)
b(yL(η)) =
dz.
1 - FL(z;η)
dz
0
Аналогично
z
dFR(z; η)
(5)
b(yR(η)) =
dz.
1 - FR(z;η)
dz
0
Остается найти условия, при которых функции b(yL(η)) и b(yR(η)), зада-
ваемые формулами (4), (5), являются левым и правым индексами некоторого
нечеткого числа соответственно.
Обозначим через qL(p; η) квантильную функцию случайной величины
YL(η), а через qR(p;η) квантильную функцию случайной величины YR(η).
Предположим, что существует нечеткое число c, левый и правый индексы
которого обозначаются как cL(η) и cR(η) соответственно, причем cL(0) > 0,
такое что
qL(p;η) = cL(η)q0(p), qR(p;η) = cR(η)q0(p)
при всех p ∈ (0, 1), η ∈ [0, 1], где q0(p)
некоторая квантильная функция.
Функцию распределения, соответствующую квантильной функции q0, обо-
значим через F0.
Ключевым в задаче оказывается соображение, что нужно связать типы
игроков с квантильной функцией нечетко-случайных величинX
Y.
Теорема. Пусть фиксировано p ∈ (0,1) и пусть yL(η) = qL(p;η),
yR(η) = qR(p;η) при любом η ∈ [0,1]. Тогда функции, стоящие в левых ча-
стях равенств (4), (5), являются соответственно левым и правым индек-
сами нечеткого числа γpc, где
u
γp =
F′0(u)du.
1 - F0(u)
0
Доказательство теоремы приводится в Приложении.
4. Заключение
Во многих работах, где изучаются приложения теории нечетких множеств
к игровым задачам, предполагается, что нечеткими являются выирыши. Вы-
игрыши не являются однозначно определенными действительными числами
143
и в настоящей работе. Но это не исходное предположение, а следствие того,
что и типы игроков, и действия нечеткие. В отличие от сложения нечетких
чисел их вычитание это не прямолинейная задача. Многие трудности в
приложениях теории нечетких множеств связаны именно с этим. По смыслу
игр класса ¾война на изнурение¿ вычитание необходимо. В настоящей работе
удалось таким образом наложить все условия, что вычитание не приводит к
выходу из множества нечетких чисел. Получен ответ на вопрос, каким обра-
зом приблизительность в типах игроков (нечеткость) должна влиять на при-
близительность их действий, чтобы профиль стратегий был равновесным.
Результаты могут иметь практическое значение, например, в тех случаях,
когда по смыслу задачи действия являются не мгновенными, а пролонгиро-
ванными.
ПРИЛОЖЕНИЕ
Доказательство формулы (3). Согласно (2) из [13]
1
I(x, α) = E (U (x, α, b (Y ))) = U (x, α, b (q(p))) dp.
0
Если рассмотреть функцию
(
)
ψ(α) = q-1
b-1(α)
,
то последняя формула может быть записана в виде
I(x, α) =
(x - b(q(p))) dp - α(1 - ψ(α)).
0
Из формулы
d
 f(p)dp = f (ψ(α))ψ(α)
0
следует, что
d
(Π.1)
I(x, α) = xψ(α) - αψ(α) + αψ
(α) - (1 - ψ(α)).
Необходимое условие максимума, равенство нулю частной производной, дает
(α) - (1 - ψ(α)) = 0.
Из условия a(x) = α и из симметричности игроков следует, что x = b-1(α).
Следовательно,
(Π.2)
b-1(α)ψ
(α) - (1 - ψ(α)) = 0.
144
Имеем
(
) (
) (
)
ψ(α) =
q-1
b-1(α)
b-1
(α).
Положим z = b-1(α). Тогда с учетом того, что
(
)
1
b-1
(α) =
,
b(z)
соотношение (П.2) записывается в виде
(
)
1
z
q-1
(z)
= 1 - q-1(z).
b(z)
Следовательно,
z
dq-1(z)
b(z) =
1 - q-1(z) dz
Тогда из условия b(0) = 0 вытекает соотношение (3).
Обоснование того, что точка, найденная из необходимого условия эстре-
мума, в данном случае является точкой глобального максимума, проводится
по известной схеме. Из (П.1) вытекает, что
2
(Π.3)
I(x, α) > 0.
∂x∂α
Будем рассматривать функцию a(x), которая в силу симметричности игроков
имеет тот же вид, что и функция b(y), определяемая формулой (3). Предпо-
ложим, что при некотором x0 существует значение α такое, что
(
)
I
x0
> I (x0,a(x0)).
Тогда
α
∂I
(x0, t) dt > 0.
∂α
a(x0)
При любом t
∂I
(a-1(t), t) = 0,
∂α
поэтому
α
(
)
∂I
∂I
(x0, t) -
(a-1(t), t) dt > 0
∂α
∂α
a(x0)
145
или
α
x0
2
(Π.4)
I(x, t) dx dt > 0.
∂x∂t
a(x0) a-1(t)
Пусть a(x0) < α. Тогда для любого t ∈ (a(x0), α] выполняется a-1(t) > x0,
условия (П.3) и (П.4) противоречат друг другу. Пусть a(x0) > α. Тогда для
любого t ∈ [α, a(x0)) выполняется a-1(t) < x0, и вновь условия (П.3) и (П.4)
противоречат друг другу. Показано, что найден глобальный максимум.
Доказательство теоремы. Имеем
z
dFL(z; η)
b(yL(η)) =
dz =
1 - FL(z;η)
dz
0
(
)
z
1
z
=
(
)
F
dz =
0
z
cL(η)
cL(η)
0
1-F0
cL(η)
u
= cL(η)
F′0 (u) du.
1 - F0 (u)
0
Так же проводится преобразование для b(yR(η)). Теорема доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Bishop D.T., Cannings C., Maynard Smith J. The war of attrition with random
rewards // J. Theoret. Biol. 1978. V. 74. P. 377-388.
2. Milgrom P.R., Weber R.J. Distributional strategies for games with incomplete infor-
mation // Math. Oper. Res. 1985. V. 10. P. 619-632.
3. Fudenberg D., Tirole J. A theory of exit in duopoly // Econometrica. 1986. V. 54.
P. 943-960.
4. Hörner J., Sahuguet N. A war of attrition with endogenous effort levels // Econ.
Theory. 2011. V. 47. P. 1-27.
5. Kim G.J., Kim B., Kim J. Equilibrium in a war of attrition with an option to fight
decisively // Oper. Res. Lett. 2019. V. 47. P. 326-330.
6. Алипрантис К.Д., Чакрабарти С.К. Игры и принятие решений. М.: Изд. дом
Высш. шк. эконом., 2016.
7. Larbani M. Non cooperative fuzzy games in normal form: A survey // Fuzzy Sets
Syst. 2009. V. 160. P. 3184-3210.
8. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999.
9. Kwakernaak H. Fuzzy random variables I. Definitions and theorems // Inform.
Sci. 1978. V. 15. P. 1-29.
10. Kwakernaak H. Fuzzy random variables II. Algorithms and examples for the dis-
crete case // Inform. Sci. 1979. V. 17. P. 153-178.
146
11. Puri M.L., Ralescu D.A. Fuzzy random variables // J. Math. Anal. Appl. 1986.
V. 114. P. 409-422.
12. Шведов А.С. Оценивание средних и ковариаций нечетко-случайных величин //
Прикл. эконометрика. 2016. Т. 42. С. 121-138.
http://pe.cemi.rssi.ru/pe_2016_42_121-138.pdf
13. Шведов А.С. Квантильная функция нечетко-случайной величины и выражения
для ожиданий // Мат. заметки. 2016. Т. 100. С. 455-460.
http://www.mathnet.ru/links/2307f468fe7c02264feb6d8cf54c25f5/mzm10879.pdf
Статья представлена к публикации членом редколлегии Ф.Т. Алескеровым.
Поступила в редакцию 17.10.2019
После доработки 23.01.2020
Принята к публикации 30.01.2020
147