Автоматика и телемеханика, № 5, 2023
Управление в социально-экономических
системах
© 2023 г. Г.И. АЛГАЗИН, д-р физ.-мат. наук (algaz46@yandex.ru),
Д.Г. АЛГАЗИНА, канд. техн. наук (darya.algazina@mail.ru)
(Алтайский государственный университет, Барнаул)
УСЛОВИЯ СХОДИМОСТИ ДИНАМИКИ РЕФЛЕКСИВНОГО
КОЛЛЕКТИВНОГО ПОВЕДЕНИЯ В МОДЕЛИ ОЛИГОПОЛИИ
КУРНО ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ
Рассматривается модель олигополии Курно с произвольным числом ра-
циональных агентов в условиях неполной информации для классическо-
го случая линейных функций издержек и спроса. В рамках динамиче-
ской модели рефлексивного коллективного поведения каждый агент в
каждый момент времени корректирует свой объем выпуска, делая шаг
в направлении выпуска, максимизирующего его прибыль при ожидаемом
выборе конкурентов. Обсуждается применение матриц перехода погреш-
ностей динамики к исследованию условий ее сходимости к равновесию
Курно-Нэша. Показаны эффекты от введения ограничений на диапазо-
ны шагов агентов в устранении неопределенности о сходимости динами-
ки. Предложен метод определения максимальных диапазонов шагов, га-
рантирующих сходимость динамики коллективного поведения для произ-
вольного числа агентов.
Ключевые слова: олигополия Курно, неполная информированность, ре-
флексивное коллективное поведение, матрица перехода погрешностей,
диапазоны шагов, условия сходимости.
DOI: 10.31857/S0005231023050045, EDN: AGBJSH
1. Введение
Значительное число математических работ, исследующих динамику кол-
лективного поведения на конкурентных рынках, посвящено выявлению усло-
вий ее сходимости к равновесию Нэша (см., например, [1-9]). Данные иссле-
дования нельзя считать завершенными даже для случая модели олигополии
Курно с линейными функциями затрат и спроса [4, 5, 10]. Настоящая статья
посвящена именно такому случаю модели олигополии.
В рамках модели рефлексивного коллективного поведения каждый агент
независимо от других корректирует свой объем выпуска выбором шага в на-
правлении движения к своей текущей цели [11, 12]. Известно, что динамика
коллективного поведения сходится к рыночному равновесию, если каждый
агент корректирует свои действия малыми шагами (см., например, [13-15]).
45
Также если каждый агент всегда делает максимально допустимый шаг (т.е.
выбирает свой наилучший ответ на ожидаемые действия конкурентов), то
динамика сходится только для рынка, состоящего из двух агентов. Для рын-
ков с числом агентов больше двух такая динамика коллективного поведения
расходится [13, 14].
В настоящей статье развивается подход, основанный на использовании
норм матриц перехода погрешностей динамик коллективного поведения, к
исследованию условий сходимости динамик на рынках олигополии в классе
линейных функций [16]. В рамках этого подхода проблема неопределенности
о сходимости динамик усиливается в том случае, когда при выборе величин
шагов агенты могут действовать разнонаправлено: выбирать «большие» ша-
ги движения к своим текущим целям или, наоборот, «малые» шаги.
В данной статье ставится задача поиска ограничений на диапазоны допу-
стимых откликов агентов, которые формулируются как условия, гарантирую-
щие сходимость к равновесию динамики коллективного поведения в линейной
модели Курно с произвольным числом агентов.
2. Формальная постановка задачи исследования
В качестве базовой рассматривается модель олигополии Курно, которая
состоит из конкурирующих объемами выпуска однородной продукции аген-
тов с целевыми функциями
(1)
Πi(p(Q),qi) = p(Q)qi - φ(qi) max,
qi
линейными функциями затрат
(2)
φi(qi) = ciqi + di
и линейной обратной функцией спроса
(3)
p(Q) = a - bQ.
Здесь: i ∈ N = {1, . . . , n}, qi — выпуск i-го агента, Q =i∈N qi — суммарный
объем выпуска всеми агентами, ci, di — предельные и постоянные издержки
i-го агента соответственно, p(Q) — единая рыночная цена, a, b — параметры
спроса. Полагается, что весь выпуск реализуется, ограничения мощности и
коалиции отсутствуют. Состояние рынка в момент времени t (t = 0, 1, 2, . . .)
задается n-мерным вектором qt = (qt1, . . . , qti, . . . , qtn).
Определим базовый процесс, когда смена состояний рынка удовлетворяет
аксиоме индикаторного поведения [13] — в каждый момент времени (t + 1)
каждый агент наблюдает объемы выпуска всех агентов, выбранные ими в
предыдущий момент времени t и корректирует свой выпуск, делая шаг в
направлении текущего положения цели согласно следующей итерационной
процедуре:
(4)
qt+1i = qti + γt+1i(xi(qt-i) - qti
),
i∈N.
46
Здесь γt+1i [0; 1] — параметр, независимо выбираемый каждым i-м агентом,
определяет величину его шага к текущему положению своей цели. Агент мо-
жет делать полный шаг, полагая γt+1i = 1, тем самым выбирая свой наилуч-
ший ответ, «оставаться на месте», выбирая γt+1i = 0, или делать «неполный
шаг», если γt+1i (0; 1).
Текущее положение цели i-го агента xi(qt-i) — это такой его объем выпус-
ка, который максимизировал бы собственную целевую функцию при условии,
что в текущий момент времени остальные агенты выбрали бы те же объемы
выпуска, что и в предыдущий [13, 17]. Здесь qt-i = (qt1, . . . , qti-1, qti+1, . . . , qtn) —
обстановка i-го агента, вектор объемов выпуска всех агентов в момент вре-
мени t за исключением i-го агента. Известно, что (см., например, [14-16])
h
qtj
hi - Qt-i
j=i
(5)
xi(qt-i) =i -
=
2
2
— суммарный выпуск «окружением» i-го
Здесь: hi =a-cib,Q−i= j=iqj
агента (i, j ∈ N).
Агенты точно знают собственные затраты и целевую функцию, собствен-
ную функцию реакции xi(qt-i), включая параметры спроса a и b ранее произ-
веденный выпуск другими агентами, но не располагают достоверной инфор-
мацией относительно их ожидаемых объемов выпуска, множеств допустимых
действий, функций затрат и целевых функций.
Предполагаем, что в модели олигополии (1)-(3), как в игре в нормальной
форме, равновесие q = (q1, . . . , q∗i, . . . , q∗n), понимаемое как статическое рав-
новесие Нэша, существует и все агенты конкурентоспособны в равновесии,
т.е. q∗i > 0 ∀i ∈ N. В случае линейных издержек агентов и линейного спроса
статическое равновесие существует и единственно.
Равновесие динамики коллективного поведения (4), (5) является статиче-
ским равновесием q в модели олигополии (1)-(3), но не всегда достижимо.
Условия сходимости динамики относятся к параметрам γt+1i, числу агентов
на рынке и начальным приближениям q0 = (q01, . . . , q0i, . . . , q0n). Полагаем так-
же, что q0 > 0.
В данной работе обсуждаются новые аспекты подхода к исследованию
сходимости моделей динамики коллективного поведения, основанного на ис-
пользовании нормы матрицы перехода погрешностей от t-го к (t + 1)-му мо-
менту времени в итерационном процессе (4), (5). Для линейной модели оли-
гополии подход дает простой критерий сходимости по норме матрицы: она
должна быть меньше единицы начиная с некоторого момента времени [16].
Когда агенты независимо друг от друга выбирают шаги в диапазоне [0; 1],
то критерий по норме, за исключением дуополии, не может быть выполнен.
Основная задача статьи для изучаемой прикладной линейной модели олиго-
полии с произвольным числом рациональных агентов — для заданного числа
агентов получение диапазонов величин их шагов, при которых выполняет-
ся критерий по норме. Тогда при любых начальных приближениях q0 будет
47
гарантирована сходимость модели динамики коллективного поведения (4),
(5) к равновесию, которое является статическим равновесием Нэша в модели
олигополии (1)-(3). Также не меньший интерес представляет решение задачи
поиска максимальных таких диапазонов шагов.
3. Методы исследования
Следуя работе [16], приведем формальные выражения для норм матриц
перехода погрешностей в итерационном процессе (4), (5) для базовой модели
олигополии, а также известные результаты о сходимости процесса, основан-
ные на использовании норм.
Погрешность итерационного процесса εt+1 = (εt+11, εt+12, . . . , εt+1n)T =
= (qt+11 - q1, qt+12 - q2, . . . , qt+1n - q∗n)T определяется преобразованием εt+1 =
= Bt+1εt (t = 0,1,2,...), где Bt+1 матрица перехода (пересчета, преобразова-
ния) погрешностей от t-го к (t + 1)-му моменту времени
1t+11 t+11/2
t+11/2
−γt+12/2 1t+12
t+12/2
(6)
Bt+1 = B(γt+1) =
,
.
t+1n/2 t+1n/2
1t+1
n
где γt+1 = (γt+11, . . . , γt+1i, . . . , γt+1n).
Сходимость итерационного процесса (4), (5) означает, что εt 0 по евкли-
довой норме при t → ∞ и полностью определяется матрицей Bt+1. Евклидова
√∑n
норма вектора ε определяется по формуле ∥ε∥ =
ε2j. Последователь-
j=1
ность векторов {qt}∞t=0 сходится к равновесию q по норме при t → ∞ будем
записывать как qt → q. Норма вещественной матрицы B, имеющей n строк и
n столбцов, является подчиненной евклидовой векторной норме и определяет-
ся как ||B|| = max ∥Bε∥. Из определения нормы следует, что ∥Bε∥ < ∥B∥∥ε∥
∥ε∥=1
для всех B, ε или ∥Bε∥ < ∥B∥ для всех B, ∥ε∥ = 1 [18, 19].
Тогда [16]
⎞⎤2
i
(7)
∥Bt+1 = max
∥B(γt+1)ε∥ = max
εi -
εi + εj⎠⎦ ,
∥ε∥=1
∥ε∥=1
2
i∈N
j∈N
где ε = (ε1, . . . , εi, . . . , εn) — произвольный единичный вектор. В (7) опущен
верхний индекс «t» для компонент вектора ε, как не влияющий на результат.
В терминах нормы матрицы Bt+1 можно привести следующие результаты
о сходимости итерационного процесса [16].
48
Лемма 1. Для сходимости к равновесию процесса (4), (5) при любом на-
чальном приближении q0 достаточно начиная с некоторого момента t0 вы-
полнения условия
(8)
∥Bt+1
∥ < 1.
Требование неотрицательности текущих выпусков агентов, возникающее,
например, с точки зрения экономических ограничений, может быть реализо-
вано процессом вида
{
qt
+ γt+1i(xi(qt-i) - qti), xi(qt-i) > 0;
i
(9)
qt+1i =
0,
xi(qt-i) 0.
Утверждение 1. Если начиная с некоторого момента t0 ∥Bt+1∥ < 1,
то процесс (9), (5) сходится при любом начальном приближении q0.
По этому утверждению если для процесса (4), (5) норма матрицы пе-
ресчета погрешностей меньше единицы, то будет сходиться также и про-
цесс (9), (5), в котором не допускаются отрицательные текущие выпуски.
Обозначим через f(γt+1) подкоренное выражение в (7), т.е.
⎞⎤2
i
(10)
f (γt+1) =
εi -
εi + εj ⎠⎦ .
2
i∈N
j∈N
Утверждение 2. Пусть векторы γt+1,
γt+1,
γt
+1 такие, что
+1
+1
+1
γt+1i [
γt+1i;
γt
],
[
γt+1i;
γt
][0;1] и γt+1i =αt+1i
γt+1i +βt+1i
γt
,
i
i
i
где αt+1i, βt+1i [0; 1], αt+1i + βt+1i = 1, i ∈ N.
Тогда функция f(γt+1) удовлетворяет неравенствам:
(
+1
+1
f
αt+11
γt+11 +βt+11
γt
,...,αt+1i
γt+1i +βt+1i
γt
,...
1
i
)
+1
...,αt+1n
γt+1n +βt+1n
γt
n
(11)
y1 · ... yi · ... yn ·
y1∈{αt+11t+11}
yi∈{αt+1it+1i}
yn∈{αn+1n+1}
(
)
·f
zt+11,... ,zt+1i,... ,zt+1n
,
{ →γt+1
, yi =αt+1i;
i
где αt+1i, βt+1i [0; 1], αt+1i + βt+1i = 1, zt+1i =
+1
γt
, yi =βt+1i.
i
(
+1
+1
f
αt+11
γt+11 +βt+11
γt
,...,αt+1i
γt+1i +βt+1i
γt
,...
1
i
)
+1
(12)
...,αt+1n
γt+1n +βt+1n
γt
n
⎞⎤2
⎞⎤2
∑⎨
+1
γt+1i
γt
i
αt+1iεi -
εi +
εj⎠⎦ + βt+1i
εi -
εi + εj⎠⎦
2
2
i∈N
j∈N
j∈N
49
В левой части неравенства (11) — значение функции f(γt+1) во внутренней
[→γt+1
+1
точке n-мерного прямоугольного параллелепипеда
,
γt
;...;
γt+1i,
1
1
]
+1
+1
γt
;...;
γt+1n,
γt
, в правой части — специального вида линейная комби-
i
n
нация значений функции f(γt+1) в крайних точках параллелепипеда. В част-
ности, для случая n = 3 неравенство имеет вид
(
)
+1
+1
+1
f
αt+11
γt+11 +βt+11
γt
t+12
γt+12 +βt+12
γt
t+13
γt+13 +βt+13
γt
1
2
3
)
)
(→γt+1
(
+1
αt+11αt+12αt+13f
,
γt+12,
γt+13
+βt+11αt+12αt+13f
γt
,
γt+12,
γt+13
+
1
1
)
)
(→γt+1
+1
(→γt+1
+1
+αt+11βt+12αt+13f
,
γt
,
γt+13
+αt+11αt+12βt+13f
,
γt+12,
γt
+
1
2
1
3
)
)
(
+1
+1
(
+1
+1
+βt+11βt+12αt+13f
γt
,
γt
,
γt+13
+βt+11αt+12βt+13f
γt
,
γt+12,
γt
+
1
2
1
3
)
)
(→γt+1
+1
+1
(
+1
+1
+1
+αt+11βt+12βt+13f
,
γt
,
γt
+βt+11βt+12βt+13f
γt
,
γt
,
γt
1
2
3
1
2
3
4. Результаты исследования и их обсуждение
Введем обозначения
(
)
(
(
)
(
)
(
))
γt+1
βt+1
=
γt+11
βt+11
,...,γt+1i
βt+1i
,...,γt+1n
βt+1n
,
(
)
(
(
)
)→γt+1
+1
γt+1
βt+1
=
1t+1i
+βt+1i
γt
i∈N
и
i
i
(
(
))
ft+1 = f
γt+1
βt+1
Идея применения результатов раздела 3 к решению задачи сходимости
состоит в следующем.
+1
+1
Для крайней точки параллелепипеда [
γt+11,
γt
; ...;
γt+1i,
γt
;...;
1
i
+1
γt+1n,
γt
] формула (12) приводится к виду ft+1 1 - εT Ft+1ε, где Ft+1
n
симметрическая матрица размера n × n. Если Ft+1 положительно определена
(т.е. εT Ft+1ε > 0 для каждого набора действительных чисел ε1, . . . , ε2, . . . , εn,
не все из которых равны нулю), то для данной крайней точки ft+1 < 1.
Если для всех крайних точек ft+1 < 1, то по неравенству (11) для любой
внутренней точки параллелепипеда будет ft+1 < 1 и по (7), (10) для нее бу-
дет ∥Bt+1 max
1 - εTFt+1ε < 1. То есть для всех точек параллелепипе-
∥ε∥=1
]
[→γt+1
+1
+1
+1
да
,
γt
;...;
γt+1i,
γt
;...;
γt+1n,
γt
выполняется критерий схо-
1
1
i
n
димости (8) для процесса (4), (5). Если у всех агентов одинаковые левые и
правые границы диапазонов, то трудоемкость решения данной задачи суще-
ственно уменьшается за счет сокращения числа анализируемых крайних то-
чек с 2n до (n - 1). К тому же современные пакеты компьютерной математи-
ки располагают необходимыми средствами для проверки на положительную
определенность матриц практически любого размера.
Результаты, представленные в разделе 3, используются и для решения
задачи нахождения максимальных диапазонов шагов агентов (параллелепи-
педа максимального объема), гарантирующих сходимость к равновесию ди-
намики коллективного поведения, что также составляет важный результат
данной статьи.
50
Но вначале остановимся подробнее на предпосылках к ограничению диапа-
зонов шагов агентов. Для этого первым рассмотрим классический диапазон
+1
[
γt+1i,
γt
] = [0;1] (∀i ∈ N; t = 0, 1, 2, . . .).
i
Соответствующее этому диапазону неравенство (12) имеет вид
2
1
(13)
ft+1 = f(γt+1(βt+1)) 1 -
βt+1i(εi)2 +
βt+1
εj .
i
4
i∈N
i∈N
j∈N\{i}
В (13) использовано, что γt+1i = (1 - βt+1i) · 0 + βt+1i · 1 = βt+1i.
Если симметрическая квадратичная форма
2
1
βt+1i(εi)2 +
β
t+1
εj
i
4
i∈N
i∈N
j∈N\{i}
является положительно определенной для каждого набора действительных
чисел ε1, . . . , εi, . . . , εn, то это равносильно тому, что она положительно опре-
делена для каждого набора действительных чисел таких, что
(εi)2 = 1.
i∈N
Тогда ft+1 < 1 и по (7), (10) ∥Bt+1∥ < 1. Отметим, что ft+1 0, поскольку
βt+1i(εi)2 1.
i∈N
Соответствующая данной квадратичной форме симметрическая матрица
имеет вид
(14)
Ft+1 = F(γt+1(βt+1
)) =
1
1
1
βt+11 -
βt+1i
-
βt+1i
-
βt+1i
4
4
4
i∈N\{1}
i∈N\{1,2}
i∈N\{1,n}
1
1
1
βt+1i
βt+12 -
βt+1i ...
-
βt+1i
4
4
4
=
i∈N\{2,1}
i∈N\{2}
i∈N\{2,n}
1
1
1
-
βt+1i
-
βt+1i
... βt+1n -
βt+1
i
4
4
4
i∈N\{n,1}
i∈N\{n,2}
i∈N\{n}
Используем следующий известный результат (см., например, [19]): дей-
ствительная квадратичная форма является положительно определенной в
том и только в том случае, если определители всех главных (угловых) мино-
ров соответствующей ей матрицы положительны (или, что равносильно, если
матрица положительно определена).
Более подробно рассмотрим частные случая рынка, когда n = 2, 3, 4.
51
Вначале рассмотрим хрестоматийный случай — дуополию Курно. Соот-
ветствующие неравенство (13) и матрица (14) имеют вид
βt+11
ft+1 1 - βt+11(ε1)2 +
(ε2)2 - βt+12(ε2)2 +β2+1
(ε1)2 ,
4
4
)
( βt+11 - βt+12/4
0
Ft+1 =
0
βt+12 - βt+11/4
Если 4βt+11 - βt+12 > 0 и, по симметрии, 4βt+12 - βt+11 > 0, то определите-
ли главных миноров матрицы Ft+1 положительны. Процесс сходится, когда
эти неравенства выполнены (т.е. шаг каждого агента больше одной четвертой
шага другого) начиная с некоторого момента времени t. В частности, это так,
когда βt+11 = βt+12 = 1, т.е. каждый агент выбирает наилучшие ответы на ожи-
даемые действия конкурента. Когда агенты действуют разнонаправленно и
указанные неравенства не выполняются, вопрос о сходимости по норме оста-
ется без ответа, хотя известно, что процесс сходится при βt+11, βt+12 (0; 1].
Для случая олигополии Курно с тремя агентами соответствующие нера-
венство (13) и матрица (14) имеют вид
βt+11
ft+1 1 - βt+11(ε1)2 - βt+12(ε2)2 - βt+13(ε3)2 +
(ε2 + ε3)2 +
4
βt+12
+
(ε1 + ε3)2 +β3+1
(ε1 + ε2)2 ,
4
4
βt+12
βt+13
βt+13
βt+12
βt+11 -
-
-
-
4
4
4
4
βt+13
βt+11
βt+13
βt+11
Ft+1 =
βt+12 -
-
-
4
4
4
4
βt+12
βt+11
βt+12
-
-
βt+13 - βt+11 -
4
4
4
Проверено, что для каждого набора действительных чисел βt+11, βt+12, βt+13
определитель неположителен, т.е. на основе неравенства (13) не удается под-
твердить сходимость процесса. Довольно неожиданный вывод, поскольку из-
вестно, что процесс сходится для многих наборов параметров βt+1i. Такой
+1
вывод обусловлен значительной разницей в значениях
γt+1i =0 и
γt
= 1,
i
агенты могут выбирать любые шаги: от близких к нулю, практически оста-
ваясь «на месте», до максимально возможных, т.е. оптимальных по прибыли.
+1
Также для n > 3 и классического диапазона шагов [
γt+1i;
γt
] = [0;1]
i
не удается подтвердить сходимость процесса ни для одного набора парамет-
ров βt+1i. Отметим, что при равных для всех агентов параметрах βt+1i мат-
рица Ft+1 для n > 2 не является положительно определенной. Достаточно
в этом убедиться для какого-либо одного значения параметра. При n = 4 и
равных параметрах уже определитель второго главного минора матрицы от-
рицателен.
52
Для преодоления неопределенности в подтверждении гипотезы «процесс
сходится» предполагаем ограничивать диапазоны выбора шагов агентами.
При определении границ диапазонов будем исходить из того, что для аген-
тов большие шаги часто являются предпочтительнее малых шагов, поэтому
правые границы желательно иметь как можно ближе к единице.
В дальнейшем помогут следующие утверждения и леммы, доказательство
которых приведено в Приложении.
Утверждение 3. В модели олигополии Курно процесс (4), (5) сходит-
+1
ся для диапазонов шагов [
γt+1i;
γt
], если начиная с некоторого момента
i
времени t0 положительно определены матрицы Ft+1, элементы которых
имеют вид
ft+1ii = 3(μt+1i - ηt+1i) + μt+1i -
ηt+1k,
k∈N
(15)
ft+1ij = (μt+1i - ηt+1i) + (μt+1j - ηt+1j) -
ηt+1k, i,j ∈ N, i = j.
k∈N
Здесь
+1
μt+1i = [
γt+1i +βt+1i(
γt
-
γ t+1i)]/2,
i
+1
ηt+1i = [(
γt+1i)2 + βt+1i((
γt
)2 - (
γ t+1i))2]/4, βt+1i [0;1].
i
Лемма 2. Пусть A квадратная матрица размера m × m с элементами
вида aii = a, aij = b, i, j ∈ M = {1 . . . , m}, i = j. Тогда det(A) = (a-b)m-1[a+
+ b(m - 1)].
Лемма 3. Матрица (15) положительно определена при γt+1i =
γt+1 <
<41+n, i ∈ N.
По лемме 3 для случая n = 2 имеем
γt
+1 <43, поэтому процесс придет
в равновесие, когда все агенты выбирают максимальные шаги, равные еди-
нице. Для случая n = 3 должно быть
γt
+1 < 1, поэтому не подтверждается
сходимость процесса, когда все агенты выбирают максимальные шаги. Для
случая n = 4 можно подтвердить сходимость процесса только, когда шаги
агентов не выходят за правую границу диапазона, равную 0,8.
Рассмотрим снова модель дуополии, но изменим границы диапазона. По-
+1
ложим
γt+1i =0,2 и
γt
= 1, т.е. теперь агенты не могут выбирать «самые
i
маленькие» шаги. По (15) μt+1i = 0,1 + βt+1i0,4, ηt+1i = 0,01 + βt+1i0,24, Ft+1 =
(
)
0,35 + 0,64βt+1
- 0,24βt+12
0,16 - 0,08βt+11 - 0,08βt+12
1
=
. Здесь матри-
0,16 - 0,08βt+11 - 0,08βt+12
0,35 + 0,64βt+12 - 0,24βt+1
1
ца Ft+1 положительно определена при βt+11, βt+11 [0; 1]. Положительность
определителя первого главного минора очевидна, положительность опреде-
лителя второго главного минора следует уже из того, что каждый из диаго-
нальных элементов больше каждого из недиагональных элементов. Поэтому
53
+1
если агенты выбирают шаги в диапазоне [
γt+1i;
γt
] = [0,2;1], то процесс
i
(4), (5) сходится при βt+11, βt+11 [0; 1]. В следующем утверждении для дуопо-
лии доказывается в Приложении, что нижняя граница диапазона может быть
уменьшена.
Утверждение 4. Если в дуополии Курно агенты начиная с некоторо-
го момента времени t0 выбирают шаги в диапазоне γt+11, γt+12 [0,136;1],
то матрицы перехода погрешностей Ft+1 будут положительно определе-
ны, ∥Bt+1∥ < 1 и процесс (4), (5) сходится.
Эти выводы согласуется с известными результатами, полученными други-
ми методами [3-5, 14, 15], в том числе экспериментами.
Вернемся к модели олигополии с тремя агентами. Ранее для диапа-
зона [0; 1] не подтвердилась гипотеза «процесс сходится» ни для одно-
го набора параметров β. Теперь изменим диапазон шагов. Положим, что
+1
γt+1i =0,6 и
γt
= 1. Агенты выбирают неравные шаги, пусть βt+11 = 0,4,
i
βt+12 = 0,5, βt+13 = 0,6. По (15) μt+11 = 0,38; η1+1=0,154;μ2+1=0,4;η2+1 =0,17;
0,548
-0,054
-0,05
μt+13 = 0,42; ηt+13 = 0,186; Ft+1 = -0,054
0,58
-0,56. Матрица поло-
0,05
-0,56
0,612
жительно определена (с большим запасом), т.е. условие сходимости процесса
заведомо имеет место при γt+11 = 0,76, γt+12 = 0,8, γt+13 = 0,84.
Для максимального диапазона шагов, гарантирующего сходимость про-
цесса, справедливо
Утверждение 5. Если в дуополии Курно агенты начиная с некоторого
момента времени t0 выбирают шаги в диапазоне γt+11, γt+12, γt+13 [0,334; 1],
то матрицы перехода погрешностей Ft+1 будут положительно определены,
∥Bt+1∥ < 1 и процесс (4), (5) сходится.
Для модели олигополии Курно с четырьмя и более агентами для получе-
ния максимальных диапазонов шагов, гарантирующих сходимость процессов
коллективного поведения, может быть рекомендован метод, который был ис-
пользован при доказательстве утверждений 4 и 5 для случаев n = 2 и n = 3.
Суть метода состоит в следующем:
1. Определяется единая для всех агентов и моментов времени t правая гра-
ница
γ
диапазонов выбора ими шагов. По лем{е 2 ж}аемая максималь-
4
ная граница определяется из условия
γ
= min
;1
При n = 2 имеем
1+n
γ
= 1, при n = 3 имеем
γ
= 1 (для трех агентов сама единица не включа-
ется в диапазон), n = 4 —
γ
= 0,8, n = 5 —
γ
= 2/3 и т.д.
Имеем, что для n агентов в (10) будет f(
γ
,
γ
,...,
γ
) < 1 (в скобках
n-мерный вектор) для каждого набора действительных чисел ε1, . . . , εn тако-
го, что
(εi)2 = 1.
i∈N
2. Определяется единая для всех агентов и моментов t нижняя граница
γ
54
диапазонов шагов. Для этого решаются (n-1) задач на положительную опре-
деленность матриц F .
Для набора параметров (
γ,
γ
,
γ
,...,
γ
) положив βt+11 = 0 и βt+12 =
= βt+13 = ... = βt+1n = 1 определяем матрицу по (15). Пусть
γ (1)
— ми-
нимальное значение параметра
γ , при котором матрица положительно
определена. Имеем, что f(
γ
,
γ
,...,
γ
) < 1, если
(εi)2 = 1. Так-
γ (1),
i∈N
же будет f(
γ
,
γ (1),
γ
,...,
γ
)<1, f(
γ
,
γ
,
γ (1),
γ
,...,
γ
) < 1, ...,
f(
γ
,
γ
,
γ
,...,
γ
,
γ (1)) < 1.
Для набора параметров (
γ,
γ,
γ
,
γ
,...,
γ
) при βt+11 = βt+12 = 0 и
βt+13 =...=βt+1n = 1 определяем матрицу по (15). Обозначим через
γ (2) мини-
мальное значение параметра
γ , при котором матрица положительно опреде-
лена. Имеем, что f(
γ (2), f
γ (2),
γ
,...,
γ
)<1, если
(εi)2 =1. Также бу-
i∈N
дет, что f(
γ
,
γ
,...,
γ
)<1, f(
γ
,
γ
,...,
γ
)<1,
γ (2),
γ (2),
γ (2),
γ (2),
...,f(
γ
,
γ
,...,
γ
,
γ (2),
γ (2)) < 1.
Подобным образом определяются
γ (3),
γ (4), . . . ,
γ (n-1).
При определении нижней границы
γ (n) имеем, что для набора парамет-
ров (
γ,
γ,...,
γ)будетdet(F)=
γn(1 + n)(2 -
γ)n-1(2 - (1 + n)
γ ) и мат-
рица F положительно определена, если
γ = 0.
Единая нижняя граница диапазонов определяется из условия
γ =
= max
{
γ (i); i = 1, (n - 1)}.
i
5. Заключение
Один из возможных подходов к аналитическому исследованию условий
сходимости динамических процессов коллективного поведения в линейной
модели олигополии основан на использовании матриц перехода погрешно-
стей процессов от t-го к (t + 1)-му моменту времени. С помощью этого подхо-
да предпринята попытка исследовать условия сходимости для модели Курно
за счет введения ограничений на диапазоны шагов агентов в направлении
их текущих целей. Предложен метод определения максимальных диапазонов
шагов, гарантирующих сходимость процессов для произвольного числа аген-
тов. Получаемые диапазоны не зависят от параметров рынка и агентов, но
зависят от числа агентов на рынке. Для рынков с двумя и тремя агентами
по предложенному методу рассчитаны максимальные диапазоны шагов.
По утверждению 1 если процесс (4), (5) сходится по норме, то в этих диапа-
зонах будет сходиться и процесс (9), (5), в котором в каждый момент времени
выполнены условия конкурентоспособности агентов.
Задачи поиска равновесия или условий сходимости ставятся и решаются
в рамках других моделей рефлексии (см., например, [20]). Предложенный в
статье подход здесь может иметь перспективу для будущих исследований, ес-
ли поиск решения этих задач приводит к последовательностям типа εt+1 0
иεt+1 =Bt+1εt.
55
ПРИЛОЖЕНИЕ
Доказательство утверждения 3. Доказательство сводится к пре-
образованиям правой части (12).
⎞⎤2
∑⎨(
t+1
γ
i
1t+1i
)⎣εi -
εi + εj⎠⎦ +
2
i∈N
j∈N
⎞⎤2
+1
γt
i
+ βt+1iεi -
εi + εj ⎠⎦
=
2
j∈N
2
)2
(
+1
γt
i
= (εi)2 - εi
γ t+1iεi +
εj +
εi + εj -
2
i∈N
i∈N
j∈N
j∈N
⎧⎡
⎞⎤2
⎞⎤2
+1
γt+1i
γt
i
-
βt+1
εi -
εi +
εj⎠⎦ -εi -
εi + εj ⎠⎦
=
i
2
2
i∈N
j∈N
j∈N
2
(→γt+1
)2
i
=1- εi
γ t+1iεi +
εj +
εi + εj -
2
i∈N
j∈N
i∈N
j∈N
⎞⎤
)
(
+1
γt
γt+1i
i
-
βt+1i2εi -
+
εi + εj ⎠⎦ ×
2
2
i∈N
j∈N
)
(
+1
γt
γt+1
i
i
×
-
εi + εj =
2
2
j∈N
)]
[
+1
(
+1
γt
γt
γt+1i
i
i
=1-
2εiεi +
εj
+βt+1
-
+
i
2
2
2
i∈N
j∈N
2 [(
)
2
)2
((
+1
(→γt+1)2)]
γt+1i
γt
i
i
+
εi + εj
+βt+1
-
=
i
2
2
2
i∈N
j∈N
2
=1-
2εiεi +
εjμt+1i +
εi + εj ηt+1i =
i∈N
j∈N
i∈N
j∈N
=1-2
(εi)2μt+1i -
2εiμt+1
εj+
i
i∈N
i∈N
j∈N
2
+ (εi)2ηt+1i +
2εiηt+1
εj +
εj ηt+1i =
i
i∈N
i∈N
j∈N
i∈N j∈N
56
(
)
=1-
(εi)2
4μt+1i - 3ηt+1i -
ηt+1
-
k
i∈N
k∈N
[
]
(
)
(
)
-
εiεj
μt+1i - ηt+1i
+ μt+1jt+1
- ηt+1
j
k
i∈N j∈N\{i}
k∈N
Если определители главных миноров матрицы (15) положительны, то
(
)
квадратичная форма
(εi)2
4μt+1i - 3ηt+1i -
ηt+1
+
εiεj×
k
i∈N
k∈N
i∈N i∈N\{i}
[
]
× (μt+1i - ηt+1i) + (μt+1j - ηt+1j) -
ηt+1
является положительно опреде-
k
k∈N
ленной и по (7), (10) ∥Bt+1∥ < 1. То есть процесс (4), (5) сходится при данных
+1
значениях параметров
γt+1i,
γt
t+1i.
i
Утверждение 3 доказано.
Доказательство леммы 2. Будут полезными свойства определите-
лей: 1) определитель не изменится, если к элементам любой строки приба-
вить соответствующие элементы какой-либо другой, умноженные на одно и
то же произвольное число; 2) определитель треугольной квадратной матрицы
равен произведению его диагональных элементов.
Прибавлением к элементам каждой строки соответствующих элементов
следующей строки, умноженных на (-1), получаем
a b b ... b
a-b b-a
0
0
b a b ... b
b
a
b ...
b
det(A) =
=
=
b
b b ... a
b
b
b ... a
a-b b-a
0
0
0
a-b b-a ...
0
=
.
b
b
b
a
Затем разложением по последней строке с использованием форму-
лы вычисления треугольных определителей имеем det (A) = a(a - b)m-1 +
+ (m - 1)b(a - b)m-1 = (a - b)m-1[a + (m - 1)b].
Лемма 2 доказана.
+1
Доказательство леммы 3.Имеемγt+1i =
γt
, при βt+1i = 1 и по (15)
i
)2
+1
(
+1
γt
γt
i
i
μt+1i =
,
ηt+1i =
,
2
2
)2
)2
(
+1
(
+1
γt
γt
+1
i
+1
i
ft+1ii = 2
γt
- (3 + n)
, ft+1ij =
γt
- (2 + n)
,
i
i
2
2
i, j ∈ N, i = j.
57
(←-
)n (
+1
)n-1 [
+1
]
γt+1i
γt
γt
i
i
По лемме 2 det (Ft+1) = (1 + n)
2-
2 - (1 + n)
2
2
2
+1
Определитель положителен при
γt
<41+n. При выполнении данного нера-
i
венства также положителен определитель k-го главного минора матрицы
[
]
+1
+1
Ft+1
(k < n). Имеем a + (k - 1)b =
γt
2(1 + k) - (1 + 2k + nk)
γt
/2
/2.
i
i
+1
+1
При
γt
=41+n будет a + (k - 1)b =4(n-k)(1+n)2 > 0. При
γt
<41+n положи-
i
i
тельность определителя k-го главного минора очевидна.
Лемма 3 доказана.
Доказательство утверждения 4. При определении границ диапа-
зонов правые границы желательно иметь как можно ближе к единице. Также
будем исходить из единого для всех агентов и моментов времени диапазона.
Поэтому при f и F будем опускать верхний индекс (t + 1).
На основании леммы 2 для дуополии правую границу
γ диапазона следует
взять равной единице и f(1, 1) < 1.
Рассмотрим f(
γ ;1). Соответствующая этой квадратичной фор-
ме матрица
(15) определяется при β1 = 0 и β2 = 1 и имеет вид
(
)
2
γ -
γ2 - 0,25
γ /2 -
γ2/2
F =
. Определитель этой матрицы можно
γ /2 -
γ2/2
1-
γ2/4
3,75
γ /2 - 2
преобразовать к более простому виду det (F ) =
γ /2 - 2
1-
γ2/4
Матрица положительно определена, если
γ0,136. Поэтому f(0,136;1) < 1
∀ε12.
Естественно, что f(0,136; 1) = f(0,136; 1) < 1
Рассмотрим f(
γ;
γ ). Соответствующая матрица (15) определяется при
(
)
2
2
γ -5
γ2/4
γ -
γ
β1 = β2 = 0 и имеет вид F =
. Матрица поло-
γ -
γ2
2
γ -5
γ2/4
жительно определена, если
γ = 0. Поэтому f(0,136;0,136) < 1 ∀ε12.
Из (11) следует доказываемое утверждение 4.
Доказательство утверждения 5.
Рассмотрим f(1; 1;
γ ). Соответствующая этой квадратичной форме
матрица
(15) определяется при β1 = β2 = 1 и β3 = 0. Она имеет вид
0,75 -
γ2/4
-
γ2/4
-0,25 +
γ /2 -
γ2/2
F =
-
γ2/4
0,75 -
γ2/4
-0,25 +
γ /2 -
γ2/2
.
0,25 +
γ /2 -
γ2/2
-0,25 +
γ /2 -
γ2/2
-0,5 + 2
γ -
γ2
Определитель матрицы можно преобразовать к более удобному для вычи-
0,75
-
γ2/4
-0,25 +
γ /2 -
γ2/2
лений виду det (F ) =
0
0,75 -
γ2/2
-0,25 +
γ /2 -
γ2
.
0
-0,25 +
γ /2 -
γ2/2
-0,5 + 2
γ -
γ2
Минимальное значение
γ , для которого матрица F положительно определе-
на, равно 0,334. Поэтому f(1; 1; 0,334) < 1
∀ε12.
58
Имеем также, что f(1; 1; 0,334) = f(1; 0,334; 1) = f(0,334; 1; 1) < 1 ∀ε1, ε2.
Рассмотрим f(1;
γ;
γ ). Соответствующая матрица (15) определяется при
β1 = 1, и β2 = β3 = 0. Она имеет вид
1-
γ2/2
γ /2 - 3
γ2/4
γ /2 - 3
γ2/4
F =
γ /2 - 3
γ2/4
-0,25 + 2
γ -5
γ2/4
-0,25 +
γ -
γ2
.
γ /2 - 3
γ2/4
-0,25 +
γ -
γ2
-0,25 + 2
γ -5
γ2/4
Определитель матрицы можно преобразовать к более удобному для вычисле-
1-
γ2/2
γ -3
γ2/2
1-3
γ2/4
ний виду det (F ) =
γ /2 - 3
γ2/4
-0,5 + 3
γ -9
γ2/4
-0,25 +
γ -
γ2
.
0
0
γ -
γ2/4
Минимальное значение
γ , для которого матрица F положительно определе-
на, равно 0,22. Поэтому f(1; 0,22; 0,22) < 1 ∀ε1, ε2.
Также f(0,22; 1; 0,22) = f(0,22; 0,22; 1) = f(1; 0,22; 0,22) < 1 ∀ε1, ε2.
Рассмотрим f(
γ;
γ;
γ ). Соответствующая матрица (15) определяется при
β1 = β2 = β3 = 0 и имеет вид
2
γ -3
γ2/2
γ -5
γ2/4
γ -5
γ2/4
F =
γ -5
γ2/4
2
γ -3
γ2/2
γ -5
γ2/4
.
γ -5
γ2/4
γ -5
γ2/4
2
γ -3
γ2/2
По лемме 2 det(F ) =
γ3(2 -
γ /2)2(1 -
γ ). Матрица положительно опреде-
лена, если
γ = 0,1. Из полученных значений для нижней границы надо вы-
брать максимальное, т.е. 0,334.
На основании леммы 2 для олигополии с тремя агентами правую грани-
цу
γ диапазона следует брать меньше единицы.
Из (11) следует доказываемое утверждение 5 для диапазона [0,334; 1).
СПИСОК ЛИТЕРАТУРЫ
1. Nash J. Non-Cooperative Games // Ann. Math. 1951. No. 54. P. 286-295.
2. Askar S.S., Elettrebybc M.F. The Impact of Cost Uncertainty on Cournot Oligopoly
Games // Appl. Math. Comput. 2017. V. 312. P. 169-176.
3. Al-Khedhairi A. Dynamical Study of Competition Cournot-like Duopoly Games
Incorporating Fractional Order Derivatives and Seasonal Influences // Int. J. Nonlin.
Sci. Numer. Simulat. 2020. V. 21. P. 339-359.
4. Elsadany A.A. Dynamics of a Cournot Duopoly Game with Bounded Rationality
Based on Relative Profit Maximization // Appl. Math. Comput. 2017. V. 294.
P. 253-263.
5. Ueda M. Effect of Information Asymmetry in Cournot Duopoly Game with Bounded
Rationality // Appl. Math. Comput. 2019. V. 362.
https://doi.org/10.1016/j.amc.2019.06.049.124535
6. Fedyanin D.N. Monotonicity of Equilibriums in Cournot Competition with Mixed
Interactions of Agents and Epistemic Models of Uncertain Market // Procedia
Computer Science. 2021. V. 186(3). P. 411-417.
59
7.
Гераськин М.И. Анализ равновесий в нелинейной модели олигополии // АиТ.
2022. № 8. С. 140-158.
Geraskin M.I. Analysis of Equilibria in a Nonlinear Oligopoly Model // Autom.
Remote Control. 2022. No. 83. P. 1261-1277.
8.
Корепанов В.О. Управление рефлексивным поведением агентов в модели оли-
гополии Курно // УБС. 2010. Т. 31. С. 225-249.
9.
Скаржинская Е.М., Цуриков В.И. О возможности последовательного прибли-
жения к равновесию в коалиционной игре при повторении коллективных дей-
ствий // Экономика и математические методы. 2020. № 4. С. 103-115.
10.
Cournot A. Researches into the Mathematical Principles of the Theory of Wealth.
London: Hafner, 1960. (Original 1838).
11.
Novikov D.A., Chkhartishvili A.G. Reflexion and Control: Mathematical Models.
Leiden: CRC Press, 2014.
12.
Novikov D., Korepanov V., Chkhartishvili A. Reflexion in Mathematical Models
of Decision-Making // Int. J. Parallel Emerg. Distrib. Syst. 2018. V. 33. No. 3.
P. 319-335.
13.
Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения.
М.: Наука, 1977.
14.
Алгазин Г.И., Алгазина Ю.Г. Рефлексивная динамика в условиях неопределен-
ности олигополии Курно // АиТ. 2020. № 2. С. 115-133.
Algazin G.I., Algazina Yu.G. Reflexive Dynamics in the Cournot Oligopoly under
Uncertainty // Autom. Remote Control. 2020. V. 81. No. 2. P. 345-359.
15.
Алгазин Г.И., Алгазина Д.Г. Моделирование динамики коллективного поведе-
ния в рефлексивной игре с произвольным числом лидеров // Информатика и
автоматизация. 2022. Т. 21. № 2. С. 339-375.
16.
Алгазин Г.И., Алгазина Ю.Г. К аналитическому исследованию условий сходи-
мости процессов рефлексивного коллективного поведения в моделях олигопо-
лии // АиТ. 2022. № 3. С. 84-109.
Algazin G.I., Algazina Yu.G. To the Analytical Investigation of the Convergence
Conditions of the Processes of Reflexive Collective Behavior in Oligopoly Models //
Autom. Remote Control. 2022. V. 83. No. 3. P. 367-388.
17.
Малишевский А.В. Качественные модели в теории сложных систем. М.: Наука,
1998.
18.
Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989.
19.
Белицкий Г.Р., Любич Ю.И. Нормы матриц и их приложения. Киев: Наукова
думка, 1984.
20.
Гераськин М.И. Рефлексивный анализ равновесий в игре триполии при линей-
ных функциях издержек агентов // АиТ. 2022. № 3. С. 110-131.
Geraskin M.I. Reflexive Analysis of Equilibria in a Triopoly Game with Linear Cost
Functions of the Agents’// Autom. Remote Control. 2022. V. 83. No. 3. P. 389-406.
Статья представлена к публикации членом редколлегии Д.А. Новиковым.
Поступила в редакцию 07.10.2022
После доработки 02.02.2023
Принята к публикации 15.02.2023
60