Автоматика и телемеханика, № 3, 2022
Управление в социально-экономических
системах
© 2022 г. Г.И. АЛГАЗИН, д-р физ.-мат. наук (algaz46@yandex.ru)
(Алтайский государственный университет, Барнаул),
Ю.Г. АЛГАЗИНА, канд. эконом. наук (algazina@inbox.ru)
(Алтайский государственный технический университет им. И.И. Ползунова,
Барнаул)
К АНАЛИТИЧЕСКОМУ ИССЛЕДОВАНИЮ УСЛОВИЙ СХОДИМОСТИ
ПРОЦЕССОВ РЕФЛЕКСИВНОГО КОЛЛЕКТИВНОГО ПОВЕДЕНИЯ
В МОДЕЛЯХ ОЛИГОПОЛИИ
Представлено исследование динамик коллективного поведения взаи-
мосвязанных рациональных агентов в условиях неполной информации.
Доказываются утверждения, позволяющие унифицировать условия схо-
димости к равновесию для двух траекторий реакции агентов на ожидае-
мые действия окружения: 1) “классического” оптимизационного поведе-
ния, при котором агенты стараются выбрать оптимальные ответы, иг-
норируя возможные текущие “отрицательные состояния”; 2) поведения,
гарантирующего каждому агенту движение в направлении к цели и неот-
рицательные текущие состояния. Показывается применение полученных
результатов в моделях олигополии Курно и Штакельберга с рефлексив-
ным поведением агентов. Получены достаточные условия сходимости про-
цессов коллективного поведения в олигополии с произвольным числом
лидеров по Штакельбергу.
Ключевые слова: рефлексивное коллективное поведение, равновесие,
условия сходимости, модели олигополии, неполная информированность,
аналитические результаты.
DOI: 10.31857/S0005231022030072
1. Введение
Значительное число математических работ посвящено рефлексивному по-
ведению (см., например, [1, 2]) агентов с реакцией по Курно [3] и/или Шта-
кельбергу [4] на действия окружения. “Классические” модели оптимизаци-
онного поведения, когда каждый агент в процессе принятия решений выби-
рает свой наилучший ответ на ожидаемые действия других агентов, часто
сильно упрощены, недостаточно реалистичны, не учитывают их информи-
рованность, реальные условия и экономические ограничения (см., например,
[1, 5-8]).
Однако с усложнением моделей более проблематичным становится анали-
тическое исследование условий существования равновесия, его единственно-
сти и сходимости к нему процесса принятия решений. Один из возможных
84
подходов к этой проблеме состоит в поиске общих закономерностей функцио-
нирования систем на основе простых и усложненных моделей и универсали-
зации аналитических решений (см., например, [9-11]).
В данной статье показывается возможность унификации условий сходи-
мости для двух траекторий реакции рефлексирующих агентов на ожидаемые
состояния окружения: 1) “классического” оптимизационного поведения, при
котором агенты на каждом шаге процесса принятия решений стараются вы-
брать оптимальные ответы, игнорируя возможные текущие “отрицательные
состояния”; 2) поведения, гарантирующего каждому агенту движение в на-
правлении к цели и неотрицательные состояния на каждом шаге процесса.
Это позволяет аналитические результаты об условиях сходимости для более
простых моделей (первого случая траектории) обобщить на более сложные
модели (траектории) поведения агентов.
Полученные результаты проиллюстрированы для рефлексивных моделей
олигополии с линейными функциями затрат агентов и спроса с различной ре-
акцией агентов на действия окружения: 1) все агенты рефлексируют по Кур-
но; 2) один или несколько агентов рефлексирует по Штакельбергу, осталь-
ные по Курно.
При этом в условиях допустимости ответов агентов на ожидаемые дей-
ствия конкурентов рассматриваются случаи, когда учитываются и не учи-
тываются такие экономические категории как конкурентоспособность и убы-
точность агентов.
2. Постановка задачи исследования
Пусть динамическая система состоит из n взаимосвязанных целенаправ-
ленных агентов и функционирует в дискретном времени. Состояние системы
(
)
в момент времени t дается n-мерным вектором qt =
qt1,... ,qti,... ,qtn
, i∈
∈ N = {1,...,n}, t = 0,1,2,... , и текущее положение цели i-го агента xi(qt-i)
(
зависит от состояний (действий) остальных агентов, где qt-i =
qt1,... ,qti-1,
)
qti+1 ... ,qtn
. Текущее положение цели агента такое его действие, которое
максимизировало бы его целевую функцию при условии, что в текущий мо-
мент времени остальные агенты выбрали бы те же действия, что и в преды-
дущий (см., например, [1, 9, 10]).
Определим процесс 1, если смена состояния системы при переходе от
предыдущего момента времени t к последующему (t + 1), т.е. преобразова-
ние компонент вектора qt в qt+1, представляется в виде
(1)
qt+1i = xi(qt-i
),
i ∈ N, t = 0,1,2,...
Требование неотрицательности состояний агентов, возникающее, напри-
мер, с точки зрения экономических ограничений, может быть реализовано
по формуле
{ xi(q−i), xi(q−i) > 0;
(2)
qt+1i =
0,
xi(qt-i) ≤ 0.
85
Определим итерационное преобразование (2) состояний агентов как про-
цесс 2.
Определим процесс 3, когда смена состояний системы удовлетворяет ак-
сиоме индикаторного поведения [9, 10] в каждый момент времени каждый
из агентов изменяет свое состояние, делая шаги в направлении текущего по-
ложения цели и следуя итерационной процедуре
(
(
)
)
(3)
qt+1i = qti + γt+1i
xi
qt-i
-qti
Здесь γt+1i ∈ [0; 1] параметры, выбираемые агентами, определяют величины
их шагов.
В процессе 4 учтено требование неотрицательности состояний агентов
{
(
(
)
)
qti + γt+1i
xi
qt-i
-qti
, xi(qt-i) > 0;
(4)
qt+1i =
0,
xi(qt-i) ≤ 0.
В (3) и (4) агент выбором параметра γt+1i ∈ [0; 1] может делать “непол-
ный шаг” от своего предыдущего состояния к текущему положению цели, а
в (1) и (2) всегда делает полный шаг, полагая γt+1i ≡ 1, тем самым выбирает
свой наилучший ответ. Естественно, чтобы при γt+1i ≡ 1 (3) переходило в (1),
а (4)
в (2). Также в (4) и (2) агенту целесообразно, желая максимизиро-
вать свою целевую функцию, обнулять свой выпуск, если его текущее поло-
жение цели равно нулю или отрицательно. Подобным образом в процессах
реализована идея градиентных методов оптимизации для поиска равновесий
динамической системы.
Очевидно, что аналитическое исследование сходимости процесса 1 менее
сложно, чем процесса 2, а процесса 3 чем процесса 4. В разделе 4 приведены
основные утверждения, позволяющие аналитические результаты об условиях
сходимости процесса 1 обобщить на процесс 2, а процесса 3 на процесс 4,
а также представлены иллюстрации доказанных результатов для различных
моделей олигопольного рынка.
3. Базовая модель олигополии
В качестве примера возможных приложений доказанных результатов бу-
дет рассмотрена классическая модель олигополии, состоящая из n конкури-
рующих объемами выпуска однородной продукции агентов с целевыми функ-
циями
(5)
Πi(p(Q),qi) = p(Q)qi - φi(qi) → max,
i∈N,
qi
линейными функциями затрат
(6)
φi(qi) = fiqi + di
,
i∈N,
86
и с линейной обратной функцией спроса вида
(7)
p(Q) = a - bQ.
Здесь: qi
выпуск i-го агента, Q =i∈N qi суммарный объем выпуска,
fi,di
предельные и постоянные издержки агентов, p(Q) единая рыноч-
ная цена, a, b параметры спроса. Полагается, что весь выпуск реализуется,
ограничения мощности и коалиции отсутствуют.
Пусть каждый агент может реагировать на действия окружения одним из
двух способов: 1) рефлексировать по Курно; 2) рефлексировать по Штакель-
бергу.
Обозначим: Nc множество агентов с реакцией по Курно, Ns множество
агентов с реакцией по Штакельбергу; Nc
⋃Ns = N и Nc ⋂Ns = ⊗, |Nc| = nc,
|Ns| = ns, nc + ns = n. Определим расчетные формулы для текущего поло-
жения цели (см., например, [3, 4, 12-15]).
Агент i ∈ Nc с рефлексией по Курно, точно зная выпуски qt-i остальных
агентов в предыдущий момент времени и не ожидая их изменения в теку-
щий момент времени, рассчитывает текущее положение цели (оптимальный
отклик) по формуле
hi - Qt-i
(8)
xi(qt-i) =
2
Агент i ∈ Ns с рефлексией по Штакельбергу, зная выпуски qt-i остальных
агентов в предыдущий момент времени и ожидая в текущий момент вре-
мени от них поведения по Курно, полагает, что в точности знает реакцию
остальных агентов на свои действия, и рассчитывает текущее положение це-
ли (оптимальный отклик) по формуле
(
)
n
hi -Qt
-i
(9)
xi(qt-i) =
1+n
Здесь обозначено: hi =a-fib,Q−i= j=iqj,i,j∈N.
Поясним вывод формул (8) и (9) для положения цели xi(qt-i).
Оптимальный текущий выпуск агента можно определить из условия∂Πi
=
∂qt
i
= ∂pt
qti + pt -∂φ
= 0. Отсюда (полагая, что оптимальный выпуск не равен
∂qti
(qt
i
)
∂φ
нулю)∂pt
=1
-pt
. Из формулы цены (7) имеем∂pt
= -b∂Qt. Тогда с
∂qti
qt
i
∂qti
∂qti
∂qt
i
учетом (6) и (7) имеем, что b∂Qt
= -1
(fi - a + bQt) или 1 +∂Q−i
=1
hi -
∂qti
qti
∂qti
qt
i
-1-1
Qt-i.
qti
Получаем окончательно, что qti =hi-Q−i
(i ∈ N; t = 0,1,2,...) .
∂Qt-i
2+
∂qt
i
Сначала рассмотрим применение полученной формулы к ведомому аген-
ту. Допустим, что i-й агент является ведомым. Согласно определению диф-
∂Qt-i
ференциала имеем dQt
dqtj. По предположению Курно следует,
−i
= j∈N∂qt
j
87
что dQt-i = 0. Тогда для i-го агента должны быть равны нулю не только dqtj
(j = i), но и∂Q−i, так как в противном случае при dqti = 0 будет dQt-i = 0.
∂qti
Итак,∂Q−i
∂qti
= 0, и имеем выражение qti = hi-Q− i2 (i ∈ Nc) для оптимального
текущего выпуска агента с реакцией по Курно на предполагаемые им выпус-
ки конкурентов.
Теперь рассмотрим применение полученной формулы к агенту-лидеру.
Допустим, что i-й агент является лидером. Из его предположения, что
остальные агенты действуют как ведомые, следует, что dqtj = 0 и dQt-j = 0
∂Qt-i
при j ∈ N\ {i}. Имеем
∂qti
= 0, а также qtj = hj -Q− j2 , откуда получа-
∂qtj
∂qtj
ем
или
= -1 - ∂Q− i
∂qti
qti
qti
+1∂qt2
qti
+1∂qt2
∂qti
∂qti
i
i
при j ∈ N\ {i}. Суммируя левые и правые части последних равенств по
∂Qt-i
j ∈ N\{i}, получаем, что∂Q− i
= -(n - 1) - (n - 1)∂Q− i, т.е.
=-n-1n.
∂qti
∂qti
∂qti
Тогда qti =hi-Q−i
или qti =n(hi-Q−i)1+n (i ∈ Ns)
оптимальный текущий вы-
2-n-1
n
пуск агента с реакцией по Штакельбергу на предполагаемые выпуски осталь-
ных агентов.
Поясним также отличие рефлексивной модели олигополии от классиче-
ской игры Штакельберга и информированность агентов. Здесь выбор реаль-
ных действий всеми агентами осуществляется синхронно (одновременно). По-
добный прием упрощает реальный процесс последовательных реакций. Он
использован, например, в [8, 12] и, как отмечается в [8], адекватен в случае,
когда достигнутое равновесие стабильно. В игре Штакельберга лидер пер-
вым делает ход, который становится известен другим агентам. Здесь агенты
с реакцией по Курно не знают хода лидера, синхронного своему ходу. Более
того, они не знают, что у них есть лидер (лидеры), полагая, что он, как и
другие агенты, оставит свой объем выпуска неизменным (например, считая
остальных агентов менее “интеллектуальными”, чем они сами, или что оппо-
ненты достигли равновесия и им не выгодно от него отклониться). Агенты,
действующие по Курно, не знают, что другие такие агенты действуют так
же.
Следуя [1], агенты, выбирающие действия по Курно, обладают низким
(“нулевым”) рангом рефлексии. Лидеры обладают более высоким (“первым”)
рангом рефлексии, считая всех остальных нерефлексирующими (агентами
с нулевым рангом рефлексии), и в соответствии с этим предсказывают их
выбор. Выбор лидеров будет ориентирован на наилучший ответ на ту обста-
новку, которая, по их мнению, должна сложиться. Предполагается, что все
агенты не допускают существования агентов, имеющих такой же или более
высокий ранг рефлексии, чем они сами.
Также все агенты точно знают собственные затраты и целевую функцию,
собственную функцию реакции, включающую параметры спроса a и b, ра-
нее произведенный выпуск другими агентами, но не располагают достовер-
ной априорной информацией относительно ожидаемых объемов их выпуска,
88
множеств допустимых действий, функций затрат и целевых функций конку-
рентов. Лидер также знает общее число агентов на рынке.
4. Методы исследования
Выведем формальные выражения для норм матриц перехода от t-го к
(t + 1)-му моменту времени в итерационных процессах (1)-(4) для базовой
модели олигополии.
Сначала рассмотрим классическую модель индикаторного поведения (3).
Эту модель для агента с реакцией по Курно перепишем с учетом (8) в виде
γt+1
i
i
(10)
qt+1i = qti -
2qt
+ qt+
hi, γt+1i ∈ [0;1] , i ∈ Nc.
i
j
2
2
j=i
Модель индикаторного поведения агента с реакцией по Штакельбергу пе-
репишем с учетом (9) в виде
n
n
qt 1+n
+γt+1
qt+1i = qti - γt+1
+ qt
hi,
i
j
i
1+n
i n
1+n
(11)
j=i
γt+1i ∈ [0;1] , i ∈ Ns.
Здесь и далее для определенности будем считать, что первые ns аген-
тов действуют по Штакельбергу, остальные по Курно и qt = (qt1, . . . , qtns ,
qtns+1,... ,qn).
Исследование сходимости к равновесию процесса (10)-(11) может быть
сведено к итерационному решению системы линейных алгебраических урав-
нений. С целью упрощения записи выражений проведем замену переменных
γt+1i
n
(12)
λt+1i =
,
i∈Nc; λt+1it+1
,
i∈Ns.
i
2
1+n
Запишем (10)-(11) в эквивалентной матричной форме
(13)
qt+1 = qt - Λt+1Aqt + Λt+1
h, t = 0, 1, 2, . . . ,
где
As
0
·
A=
·······
········ клеточная матрица, т.е. квадратная матрица раз-
·
0
Ac
мера n × n, вдоль диагонали которой идут квадратная подматрица As раз-
мера ns × ns и квадратная подматрица Ac размера nc × nc;
(1 + n)/n
1
1
2
1
1
1
(1 + n) /n . . .
1
1
2
1
As =
Ac =
,
 ···············;
1
1
(1 + n)/n
1
1
2
89
λt+11
0
...0
0
λt+12 ... 0
Λt+1 =
иагональная матрица параметров λt+1, зада-
 д
0
0
λt+1
n
(
)
ющих тот или иной итерационный процесс; qt =
qt1,qt2,... ,qtn
вектор-
столбец в вещественном n-мерном пространстве Rn (где q обозначает вектор-
(
)
a-f1
строку, транспонированную к q) и h =
b
,a-f2b,...,a
b
Для модели олигополии с линейными функциями затрат агентов и ли-
нейной обратной функцией спроса равновесный выпуск q = (q∗1, q∗2, . . . , q∗n)
определяется как решение системы уравнений Aq = h (см., например, [13]).
Поскольку матрица A имеет обратную матрицу, то существует един-
ственное решение этой системы уравнений при любой правой части h =
= (h1, h2, . . . , hn).
Используя
(13), Aq = h и очевидное равенство q = q - Λt+1Aq+
t+1Aq, получаем, что погрешность итерационного процесса
t =
(
)
= (∂t1, ∂t2, . . . , ∂tn) =
qt1 - q∗1,qt2 - q∗2,... ,qtn - q∗n
удовлетворяет уравнению
t+1 = ∂t - Λt+1A∂t (t = 0,1,2,...), которое отличается от (13) только тем,
что является однородным.
Положим
0
·
(14)
Bt = E - Λt+1A = ··· ····
·
·······,
·
0
Bt
c
t+1
1 - (1 + n)λt+11/n
t+11
1
−λt+12
1 - (1 + n)λt+12/n ...
t+12
где Bts =
 и
−λt+1n
t+1n
1 - (1 + n)λt+1n/n
s
s
s
t+1
1 - 2λt+1n
t+1n
s+1
s+1
ns+1
−λt+1n
1 - 2λt+1n
t+1n
Btc =
s+2
s+2
s+2
t+1n
t+1n ... 1 - 2λt+1
n
Тогда
(
)
1 - λt+11/n
t1 - λt+1
ti
1
i∈Ns
······························
(
)
1-λt+1n/n
tns - λt+1
ti
s
ns
i∈Ns
(15)
t+1 = Btt =
······························
,
t = 0,1,2,...
(
)
1-λt+1n
ti
s+1
tns+1n++
s
1
i∈Nc
··························· ···
(
)
1-λt+1n
tn - λt+1
t
n
i
i∈Nc
90
Сходимость итерационного процесса (15) означает, что ∂t → 0 по норме
при t → ∞, и полностью определяется матрицей Bt матрицей перехода
от t-го к (t + 1)-му моменту времени (см., например, [16]). Здесь E единич-
ная матрица.
Под нормой вектора x, обозначаемой как ∥x∥ , понимаем евклидову нор-
√∑n
му, которая определяется по формуле ∥x∥ =
x2j. Последовательность
j=1
{
}
векторов
xt
сходится к равновесию x по норме при t → ∞ (будем за-
t=0
писывать как xt → x), если
xt - x→ 0 при t → ∞. Норма вещественной
матрицы B, имеющей n строк и n столбцов, является подчиненной евклидо-
вой векторной норме и определяется как ∥B∥ = max∥Bx∥, или как в следую-
∥x∥
∥x∥=0
щей эквивалентной форме ∥B∥ = max ∥Bx∥. Из определения нормы следует,
∥x∥=1
что ∥Bx∥ ≤ ∥B∥ · ∥x∥ для всех B, x или ∥Bx∥ ≤ ∥B∥ для всех B, ∥x∥ = 1 [16].
Тогда
(16)
Bt=max
Btxt
=
∥xt∥=1
v
u
2
2
u∑
= max
xti - λt+1i
xi
+ xtj+
xti - λt+1i
xti +
xtj,
∥xt∥=1
n
i∈Ns
j∈Ns
i∈Nc
j∈Nc
где xt произвольный единичный вектор.
Перейдем к построению матрицы перехода для модели (4).
Обозначим: Ntc множество агентов с реакцией по Курно, для которых
xi(qt-i) ≤ 0; Nts множество агентов с реакцией по Штакельбергу, для кото-
рых xi(qt-i) ≤ 0.
Ats
0
·
Определим клеточную матриц
At =·············, где на главной диа-
0
At
c
гонали для i ∈ Nts стоят числа“1n ”, для i ∈ Ntc стоят числа “1”, другие элемен-
ты в этих строках нулевые. Остальные элементы матри
At и A совпадают.
Определим диагональную матрицу параметровΛt+1, в которой на главной
диагонали для i ∈ Nts стоят числа “n”, для i ∈ Ntc стоят числа “1”. Остальные
элементы матрицΛt+1 и Λt+1 совпадают.
Процесс 4 запишем в эквивалентной матричной форме
(17)
qt+1 = qtt+1tqtt+1h -Ht
,
t = 0,1,2,... ,
где
Ht вектор-столбец, в котором для i ∈ Nts стоят величины “nhi”, для
i ∈ Ntc стоят величины “hi”, остальные элементы нулевые.
Для оценки погрешности итерационного процесса
(17) введем фик-
тивный процесс q = qt+1tqt+1tq = qt+1tqtt+1 Aq-()
t+1
A
At q, t = 0,1,2,...
91
Разность между (17) и последним выражением с учетом Aq = h дает урав-
нение для этой погрешности в виде
(
)
(18)
t+1 = ∂tt+1tt -Htt+1 A
At q
,
t = 0,1,2,...
(
(
)
)
Отметим, что в (18) выражение
-Htt+1 A
At q определяет
вектор-столбец, в котором стоят величины “ -q∗i - nj∈Nc q∗j ” для i ∈ Nts
и “ -q∗i -j∈Ns q∗j ” для i ∈ Ntc. Остальные элементы нулевые.
Положим
(19)
Bt = E -Λt+1t.
По (18)-(19) имеем неравенство
(20)
t+1 ≤Btt
,
t = 0,1,2,...
МатрицаBt и вектор-столбецBtt отличаются от Bt и Btt соответственно
тем, что строки i ∈ Nts
⋃Ntc нулевые.
Тогда норма вещественной матрицыBt, подчиненной евклидовой вектор-
ной норме, определяется выражением
t
(21)
B
 = max
B
txt
=
∥xt∥=1
v
u
2
2
u
u
= max
xti - λt+1i
xi
+ xtj+
xti - λt+1ixti + xtj
.
∥xt∥=1
n
i∈Ns\
s
j∈Ns
i∈Nc\
c
j∈Nc
Пример. На рынке 5 агентов. Пусть два агента реагируют по Штакель-
бергу и у одного из них (для определенности первого, i = 1) в момент време-
ни t расчетное текущее положение цели оказалось неположительным. Пусть
в тот же момент времени у одного из трех агентов, действующих по Курно
(для определенности последнего, i = 5), также неположительное положение
цели. Тогда
6/5
1
0
0
0
1/5
0
0
0
0
1
6/5
0
0
0
1
6/50
0
0
A=
0
0
2
1
1
,
At =
0
0
2
1
1
,
 0
0
1
2
1
 0
0
1
2
1
0
0
1
1
2
0
0
00
1
5
0
0
0
0
6h1
0
λt+12
0
0
0
0
Λt+1 =
0
0
λt+13
0
0
,
Ht =
0
,
 0
0
0
λt+14
0
 0
0
0
0
0
1
h5
92
-q∗1 - 5
q∗j
j=3
0
(
)
0
-
Htt+1
A
At q =
,
0
 -q∗5 - q
j
j=1
0
0
0
0
0
−λt+12 1 - 6λt+12/5
0
0
0
Bt =
0
0
1 - 2λt+13
t+13
t+13
,
0
0
t+14
1 - 2λt+14 - λt+14
0
0
0
0
0
0
1
t2 - λt+1
t2 +
t
2
j
5
j=1
Btt =
∂t
,
t3 - λt+13
+
t
3
j
j=3
t4 - λt+1
∂t
+
t
4
4
j
j=3
0
v
u
2
2
u
u
t
2
B
 = max
√xt
t+1xt
+ xtj+
xti - λt+1ixti + xtj
.
2
2
∥xt∥=1
5
j=1
i=3
j=3
5. Результаты и их обсуждение на рефлексивной
модели олигополии
Наряду с изучением свойств матриц перехода процессов представим новые
результаты об условиях сходимости процессов к положению равновесия.
В терминах нормы матрицы перехода Bt можно привести следующие до-
статочные условия сходимости процесса 3 с произвольным числом лидеров
по Штакельбергу.
93
Лемма. Для сходимости к равновесию процесса (15) при любом началь-
ном приближении q0 достаточно выполнения условия
(22)
Bt
<1
начиная с некоторого момента t0.
Доказательство. Сходимость к решению q при любом начальном
приближении q0 следует из того, что для каждого k > 0
qt0+k - q=
∂t0+k
≤
Bt0+k-1
·
∂t0+k-1
≤
Bt0+k-1
·
Bt0+k-2
·
∂t0+k-2
≤
Bt0
∂t0
Bt0+k-1
·
Bt0+k-2
·...·
·
и
qt0+k - q
→0
при k → ∞.
Лемма доказана.
(
)
(
)
[
]
t
Утверждение 1.
B
λt+1
≤
B
λt+1
 для λt+1i
0;12
, i∈Nc;
[
]
λt+1i
0;n1+n
, i ∈ Ns; t = 0,1,2,...
Доказательство этого утверждения приведено в Приложении.
<1,
Утверждение 2. Если начиная с некоторого момента t0
Bt
то процессы 3 и 4 сходятся при любом начальном приближении q0.
∂t+1
≤
t
∂t
Доказательство. Для процесса 4 по (20)
B
·
, по
t
Bt
<1.Справедливостьутверждения2для
утверждению 1 имеем
B
≤
обоих процессов следует из доказанной леммы. Утверждение 2 доказано.
Обозначим через f(λ) подкоренное выражение в (16), т.е.

2
f (λt+1) =
xti - λt+1i
xi
+
xtj
+
n
i∈Ns
j∈Ns
(23)

2
xt
xt

+
i
t+1i
i
+
xtj
i∈Nc
j∈Nc
В следующем утверждении приводятся свойства функции f(λt+1), кото-
рые могут быть полезны при выводе условий сходимости процессов.
Утверждение 3. Пусть векторы λt+1t+1,
λt+1 такие, что λt+1i
[
]
[
]
[
]
[
]
[
]
λt+1
; λt+1i
, где
λt+1
; λt+1i
0;12
, если i ∈ Nc, и
λt+1
; λt+1i
0;n1+n
,
i
i
i
если i ∈ Ns.
94
Тогда функция f(λt+1) :
а) выпукла вниз по каждой отдельной i-й компоненте на отрезке
[
]
λt+1
; λt+1i
, т.е.
i
(
)
f
λt+11,... ,λt+1i-1t+1iλt+1i + βt+1i
λt+1it+1i+1,... ,λn+1
(
)
≤αt+1if
λt+11,... ,λt+1i-1t+1it+1i+1,... ,λt+1n
+
(
)
t+1if
λt+11,... ,λt+1i-1t+1it+1i+1,... ,λn+1
,
если αt+1i, βt+1i ∈ [0; 1] и αt+1i + βt+1i = 1;
б) выпукла вниз на n-мерном прямоугольном параллелепипеде
[
]
λt+1
, λt+11;... ;λt+1i, λt+1i;... ;λn+1, λn+1
,
1
т.е.
(
)
(
)
(
)
λt+1
f
ηt+1λt+1 + µt+1
λt+1
≤ηt+1f
t+1f
λt+1
,
если ηt+1, µt+1 ∈ [0; 1] и ηt+1 + µt+1 = 1;
в) удовлетворяет неравенству
(
)
t+1
f
αt+11λt+11 + βt+11
λt+11,... ,αt+1iλt+1i + βt+1i
λt+1i,... ,αn+1λn+1 + βn+1
λ
n
(24)
y1 · ... · yi · ... · yn ×
y1{αt+11t+11}
yi{αt+1it+1i}
yn{αn+1n+1}
(
)
×f
zt+11,... ,zt+1i,... ,zt+1n
,
{ λt+1
, yit+1i,
i
где αt+1i, βt+1i ∈ [0; 1] , αt+1i + βt+1i = 1, zt+1i =
λt+1i, yi =
,
i
y1 · ... · yi · ... · yn = 1;
y1{αt+11t+11}
yi{αt+1it+1i}
yn{αn+1n+1}
г) достигает максимума по крайней мере в одной из крайних точек n-
мерного прямоугольного параллелепипеда
[
]
λt+1
, λt+11;... ;λt+1i, λt+1i;... ;λn+1, λn+1
;
1
95
д) удовлетворяет неравенству
(
)
f
αt+11λt+11t+11
λt+11,... ,αt+1iλt+1it+1i
λt+1i,... ,αn+1λn+1n+1
λn+1

2
αt+1i
xtit+1i
xi
+
xtj
+
n
i∈Ns
j∈Ns

2
xt

+
αt+1i
xtit+1i
i
+
xtj
+
i∈Nc
j∈Nc
(25)

2
+
βt+1i
xt
-
λt+1i
xi
+
xtj
+
i
n
i∈Ns
j∈Ns

2
xt
xt

+
βt+1i
i
-
λt+1i
i
+
xtj
,
i∈Nc
j∈Nc
где αt+1i, βt+1i ∈ [0; 1] , αt+1i + βt+1i = 1.
Доказательство утверждения 3 приведено в Приложении.
5.1. Олигополия Курно
Рассмотрим применение результатов, ранее полученных в этом разделе, к
сходимости процессов 1-4.
Определяя процесс 1, учтем, что его можно рассматривать как част-
[
]
[
]
λt+1
ный случай процесса 3. Для этого положим
; λt+1i
=
0;12
и αt+1i = 0,
i
βt+1i = 1 (∀i ∈ N;t = 0,1,2,...), что по формуле замены переменных (12) со-
ответствует выбору агентами значений параметров γi = 1 (∀i ∈ N), т.е. их
наилучшим ответам на действия конкурентов.
Тогда для процесса 1 неравенство (25) (с учетом соотношения
(xti)2 =
i∈N
= 1) принимает вид

2
1
f(
xt
-
xt
+
xtj
=
λt+1) ≤
i
i
2
i∈N
j∈N
2
xtj
∑(
)2
j∈N\{i}
=1-
xti
-
.
2
i∈N
i∈N
96
(
)2
xtj
(
)2
j∈N\{i}
Если симметрическая квадратичная форма
xti
-
яв-
2
i∈N
i∈N
ляется положительно определенной, то f(λt+1) < 1 и
Bt < 1. Соответст-
вующая этой квадратичной форме симметрическая матрица имеет вид F =
1-n-14
-n-24
-n-24
n-24
1-n-14
-n-24
=
.
-n-24
-n-24
1-n-14
Используем следующий известный результат (см., например, [17]): дей-
ствительная квадратичная форма является положительно определенной в
том и только в том случае, если определители всех главных (угловых) мино-
ров соответствующей ей матрицы положительны (или, что равносильно, если
матрица положительно определена).
Имеем, что при n = 2 определители главных миноров матрицы F положи-
тельны. При n = 3 определитель главного минора 3-го порядка равен нулю,
при n = 4 определитель главного минора 2-го порядка отрицателен, при n ≥ 5
определитель главного минора 1-го порядка неположителен, т.е. только для
дуополии F является положиелно определенной. Поэтому если n = 2, то
t
Bt< 1 и по утверждению 1
B
≤
Bt, а по утверждению 2 процессы 1, 2
сходятся.
Это полностью согласуется с известными результатами, полученными дру-
гими методами [14, 15, 18, 19], в том числе и только экспериментами (см., на-
пример, [13]), что в олигополии Курно (5)-(8) процессы 1 и 2: а) сходятся при
n = 2 при любых начальных условиях, б) при n ≥ 3 расходятся.
Рассмотрим процесс 3.
[
]
[
]
λt+1
1
Положим
; λt+1i
=
0;
, что по (12) соответствует значениям
i
1+n
2
параметров
γt+1
= 2
(∀i ∈ N; t = 0,1,2,...). Выбор такого диа-
i
λt+1i =
1+n
пазона объясняется тем, что для него есть доказанные результаты [14].
(
)2
Для процесса 3, принимая во внимание
xti
= 1, неравенство (25)
i∈N
принимает вид
)
t+11
βt+1i
βt+1n
f
,...,
,...,
1+n
1+n
1+n

2
∑(
)(
)2
1
1-βt+1i
xti
+
βt+1i
xti -
xt
+
xtj
=
i
1+n
i∈N
i∈N
j∈N
2
(n - 1)xti -
xtj
∑
(
)2
j∈N\{i}
=1-
βt+1i
xti
-
βt+1i
.
1+n
i∈N
i∈N
97
Элементы симметрической матрицы Ft, соответствующей квадратичной
(
)2
(
)
(n-1)xti-j∈N\{i} xtj
формеi∈N βt+1i
xti
2 -i∈N βt+1
, имеют вид:
i
1+n
t+1
β
βt+1k
k
(n - 1)2 βt+1i
k∈N\{i}
4nβt+1i
k∈N\{i}
ftii = βt+1i -
=
-
,
2
(1 + n)2
(1 + n)2
(1 + n)
(1 + n)2
(
)
t+1
β
k
(n - 1) βt+1i + βt+1
j
k∈N\{i,j}
ftij =
(i, j ∈ N; i = j) .
2
(1 + n)
(1 + n)2
Если определители всех главных миноров матрцыFt положительны, то
Bt
<1,апроцессы3и4
квадратичная форма положительно определена и
сходятся.
t+11t+12
βt+11t+12
9
9
.
Для n = 2 матрица Ft имеет вид Ft =
βt+12t+11
t+12t+11
9
9
Эта матрица положительно определена, если
t+11 - βt+12 > 0 и
[
]
+1 - βt+12 βt+11 + βt+12
(
)2
(
)2
8β1
= 9 7βt+11βt+12 -
βt+11
-
βt+12
> 0. Пусть
 βt+12t+11
t+12 - βt+11
t+1
45
βt+11 = 0. Имеем общее решение двух этих неравенств в видеβ2
<7+
βt+1
2
1
t+1
≈ 6,85. Поскольку агенты однородные, то иβ1
< 6,85. Таким образом,
βt+1
2
t+1
еслиβ2
и β1+1
меньше, чем 6,85, то процессы 3 и 4 сходятся к равнове-
βt+11
βt+1
2
сию. Это согласуется с результатами публикации [14], но в данном случае
применяемый здесь метод: 1) с одной стороны, дает меньшую общность,
(
)
поскольку по
[14] процессы сходятся в диапазоне γt+11, γt+12
0;23
, т.е.
∀βt+11t+12 ∈ (0;1) ; 2) но, с другой стороны, дает новые точки сходимости
γt+11 =23 ∨ γt+12 =23, т.е. когда βt+11 = 1 ∨ βt+12 = 1.
Особенности условий сходимости процессов при использовании норм, по
мнению авторов, обусловлены тем обстоятельством, что если одни агенты
выбирают параметры λ (соответственно и β) равными или лиими к нулю, а
другие ближе к верхней границе диапазона, то заведомо
Bt
>1.Поясним
на следующем примере. Пусть n = 2 и λ1 = 0, λ2 = 0. Тогда, полагая xt1 = 1,
xt2 = 0, по (16) имеем
=max
Bt
(xt1)2 + [xt2 - λ2 (xt2 + xt1 + xt2)]2
1 + (λ2)2 > 1.
∥xt∥=1
В этом, видимо, проявляется определенная ограниченность методов, основан-
ных на нормах.
98
5.2. Олигополия с агентами, рефлексирующими по Штакельбергу
[
]
[
]
λt+1
Сначала рассмотрим процесс 1, полагая
; λt+1i
=
0;n1+n
для i ∈ Ns
i
[
]
[
]
и
λt+1
;
=
0;12
для i ∈ Nc, а также αt+1i = 0, βt+1i = 1
(∀i ∈ N; t =
i
λt+1i
= 0, 1, 2, . . .), что по формуле замены переменных (12) соответствует выбору
агентами значений параметров γi = 1 (∀i ∈ N) , т.е. их наилучшим ответам
на действия конкурентов.
Тогда неравенство (25) принимает вид
2
(
∑(
)2
)2
n
f(λt+1) ≤ 1 -
xti
-
xtj
-
1+n
i∈N
i∈Ns
j∈Ns\{i}
2
1
.
xtj
4
i∈Nc
j∈Nc\{i}
Для квадратичной формы, представленной выражением в квадратных
скобках, соответствующая симметрическая матрица представляет собой кле-
точную матрицу размера n × n, вдоль диагонали которой идут квадратная
подматрица Fs размера ns × ns и квадратная подматрица Fc размера nc × nc.
При этом
n2 (ns - 1)
n2 (ns - 2)
n2 (ns - 2)
1-
-
-
(1 + n)2
(1 + n)2
(1 + n)2
n2 (ns - 2)
n2 (ns - 1)
n2 (ns - 2)
1-
-
Fs =
(1 + n)2
(1 + n)2
(1 + n)2
,
n2 (ns - 2)
n2 (ns - 2)
n2 (ns - 1)
-
-
1-
(1 + n)2
(1 + n)2
(1 + n)2
nc - 1
nc - 2
nc - 2
1-
-
-
4
4
4
nc - 2
nc - 1
nc - 2
1-
-
Fc =
4
4
4
nc - 2
nc - 2
nc - 1
-
-
1-
4
4
4
Клеточная матрица будет положительно определена в том и только в том
случае, если положительно определены обе ее подматрицы Fs и Fc.
Для рынка Курно ранее было показано, что подматрица Fc положительно
определена только при nc ≤ 2. Поэтому рассмотрим соответствующие послед-
нему неравенству случаи:
99
1) nc = 0. Тогда ns = n и для подматрицы Fs определитель первого главного
минора положителен только при ns = 1 или ns = 2. При ns = 2 положите-
лен также определитель второго главного минора;
2) nc = 1. Тогда ns = n - 1 и для подматрицы Fs определитель первого глав-
ного минора положителен только, если ns = 1 или ns = 2. При ns = 2 по-
ложителен также и определитель второго главного минора;
3) nc = 2. Если ns = 1 (n = 3), то для подматрицы Fs определитель перво-
го главного минора положителен. Если ns = 2 (n = 4), то для подматри-
цы Fs положительны определители первого и второго главных миноров.
Если ns > 2 (n > 4), то для подматрицы Fs определитель первого главного
минора отрицателен.
Обобщим полученные результаты в утверждении 4.
Утверждение 4. В олигополии (5)-(9) с одним илнеколькими лиде-
рами по Штакельбергу для процессов 1 и 2 неравенство
Bt
< 1 имеет ме-
сто только на рынке, на котором не более четырех агентов и 1) ns,nc ≤ 2;
2) если ns = 1, то n = 2 или n = 3; 3) если ns = 2, то n = 3 или n = 4. В этих
случаях процесс 1 и процесс 2 сходятся к равновесию.
Для процесса 2 утверждение 4 следует из утверждений 1 и 2.
Полученные для процессов 1 и 2 выводы согласуются с известными ре-
зультатами (см., например, [15, 20, 21]).
Перейдем к процессу 3.
[
]
[
]
λt+1
1
Здесь, как и для рынка Курно, положим
; λt+1i
=
0;
. Это
i
1+n
[
]
[
]
2
по (12) соответствует тому, что γt+1i
0;1n
, если i ∈ Ns, и γt+1i
0;
,
1+n
если i ∈ Nc.
Неравенство (25) принимает вид
)
t+11
βt+1i
βt+1n
f
,...,
,...,
1+n
1+n
1+n

2
∑(
)(
)2
1
1-βt+1i
xti
+
βt+1i
xti -
xi
+
xtj
+
1+n
n
i∈N
i∈Ns
j∈Ns

2
1
xt

+
βt+1i
xti -
i
+
xtj
=
1+n
i∈Nc
j∈Nc
2
(
)2
(
)
βt+1i
=1-
βt+1i
xti
+
n2 - 1
xti - n
xtj
+
n2 (1 + n)2
i∈N
i∈Ns
j∈Ns\{i}
2
βt+1i
(n-1)xt
+
i
-
xtj
(1 + n)2
i∈Nc
j∈Nc\{i}
100
Элементы симметрической подматрицы Fts, соответствующей квадратич-
]2
(
)
[(
)
βt+1i
ной формеi∈Ns βt+1i
xti
2 -
n2 - 1
i∈Nsn2(1+n)2
xti - nj∈Ns\{i}xj
по агентам с реакцией по Штакельбергу, имеют вид:
(
)2
βt+1k
βt+1k
n2 - 1
βt+1
(2n - 1) βt+1
i
k∈Ns\{i}
i
k∈Ns\{i}
ftii = βt+1i -
-
=
-
,
n2 (1 + n)2
(1 + n)2
n2
(1 + n)2
)
(
)(
βt+1k
n
n2 - 1
βt+1
t+1
i
j
k∈Ns\{i,j}
ftij =
-
=
2
n2 (1 + n)
(1 + n)2
(
)
t+1
β
k
(n - 1) βt+1i + βt+1
j
k∈Ns\{i,j}
=
(i, j ∈ Ns; i = j) .
n (1 + n)
(1 + n)2
Элементы симметрической подматрицы Ftc, соответствующей квадратич-
[
]2
(
)
βt+1i
ной формеi∈Nc βt+1i
xti
2 -
, имеют
i∈Nc
(1+n)2
(n - 1)xti -j∈Nc\{i}xj
вид
t+1
β
k
4nβt+1i
k∈Nc\{i}
ftii =
,
(1 + n)2
(1 + n)2
(
)
t+1
β
k
(n - 1) βt+1i + βt+1
j
k∈Nc\{i,j}
ftij =
(i, j ∈ Nc; i = j) .
2
(1 + n)
(1 + n)2
Если определители всех главных миноров подматриц Fts и Ftc положитель-
ны, то процессы 3 и 4 сходятся.
Для n = 4 и ns = 2 (i = 1, 2), nc = 2 (i = 3, 4) выпишем подматрицы Fts и Ftc
(
)
t+1
βt+12
3
βt+11 + βt+1
1
2
-
16
25
20
Fts =
)
3(
,
βt+12 + βt+1
t+12
βt+11
1
-
20
16
25
(
)
t+1
16β
βt+14
3
βt+13 + βt+1
3
4
-
25
25
25
Ftc =
)
3(
.
βt+14 + βt+1
16βt+14
βt+13
3
-
25
25
25
Пусть βt+1i = 0, i = 1, 2, 3, 4. Определители главных миноров подматри-
t+1
цы Fts положительны, еслиβ2
< 3,4. Определители главных миноров под-
βt+1
1
t+1
матрицы Ftc положительны, еслиβ4
< 9,45. Такие же неравенства должны
βt+1
3
101
выполняться для обратных отношений. Запишем условия сходимости процес-
сов 3 и 4, переходя к параметрам γ
γt+11
γt+12
γt+13
γt+14
(26)
,
< 3,4;
,
< 9,45.
γt+12
γt+11
γt+14
γt+1
3
Таким образом, на рынке олигополии с четырьмя агентами, из которых
первые два действуют по Штакельбергу, другие два по Курно, процессы 3
и 4 с диапазонами шагов γt+11t+12 ∈ (0;0,25] и γt+13t+14 ∈ (0;0,4] сходятся к
{
}
равновесию при любых начальных выпусках агентов
q0i,i ∈ N
, если начи-
ная с некоторого момента t0 выбираемые агентами величины шагов удовле-
творяют условиям (26).
Если один из агентов, действующих по Штакельбергу, выбирает верхнюю
границу своего диапазона (равную 0,25), то (26) будет выполнено, когда дру-
гой выбирает шаг больше 0,074. Если один из агентов, действующих по Кур-
но, выбирает верхнюю границу диапазона (равную 0,4), то (26) будет выпол-
нено, когда другой выбирает шаг больше 0,043.
Аналогичные условия сходимости процессов можно получить для рынков
с произвольным числом агентов и лидеров по Штакельбергу, а также для
произвольных диапазонов выбора агентами величин шагов.
Так, для того же примера рынка, но с максимально возможными для аген-
тов диапазонами шагов γt+1i ∈ (0; 1] (i = 1, 2, 3, 4), условия типа (26) имеют
t+1
видγ1
, γ2+1
< 1,56,γ3+1
, γ4+1
< 4. В частности, если γt+11 = 1, то γt+12 >
γt+12
γt+11
γt+14
γt+1
3
> 0,64, если γt+13 = 1, то γt+14 > 0,25.
6. Заключение
Введение в модели динамических систем предположений об информиро-
ванности взаимосвязанных агентов, реальных экономических ограничений и
условий приводит к повышению адекватности, но и к усложнению моделей.
С усложнением моделей более проблематичным становится аналитическое ис-
следование. Для моделей рефлексивного коллективного поведения рассмат-
ривается один из возможных подходов к исследованию условий их сходимо-
сти к равновесию, основанный на использовании норм матриц перехода от
от t-го к (t + 1)-му моменту времени в процессах итерационного решения си-
стем линейных алгебраических уравнений, а также на обобщении аналитиче-
ских решений. Получены важные свойства норм. Проведены доказательства
утверждений, позволяющих перенести результаты о сходимости для простых
динамик на более сложные модели коллективного поведения. Полученные ре-
зультаты проиллюстрированы для рефлексивных моделей олигополии с ли-
нейными функциями затрат агентов и спроса с реакцией агентов по Курно
и Штакельбергу на действия окружения. Представлены новые результаты о
сходимости процессов коллективного поведения в олигополии с произволь-
ным числом лидеров по Штакельбергу.
102
ПРИЛОЖЕНИЕ
Доказательство утвердения
1.
Доказательство проведем от
(
)
t
противного. Пусть xt ∈ Arg max
B
λt+1
xt для некоторого произвольно-
∥xt∥=1
[
]
[
]
го набора параметров λt+1i
0;12
,i∈Nct+1i
0;n1+n
, i ∈ Ns. Допустим,
(
)
(
)
t
что
B
λt+1
>
Bt
λt+1
, т.е.
v
u


2
2
u
u
xi


xti - λt+1i
+
xtj
+
xti - λt+1i
xti +
xtj
>
n
i∈Ns\
s
j∈Ns
i∈Nc\
c
j∈Nc
(
)
>
Bt
λt+1
.
Но тогда
v
u


2
2
u
u
xt
t+1i
xi
+
xtj
+
xt
t+1i
xi
+
xtj
+
i
i
n
n
i∈Ns\
s
j∈Ns
i∈Nts
j∈Ns
)


2
2
+
xti - λt+1i
xti +
xtj
+
xti - λt+1i
xti +
xtj
>
i∈Nc\
c
j∈Nc
i∈Ntc
j∈Nc
(
)
>
Bt
λt+1
,
(
)
(
)
>
означающее
Bt
λt+1
xt
Bt
λt+1
 при
xt= 1. Что противоречит
определению нормы
Bt.
Утверждение 1 доказано.
Доказательство утверждения 3. Сначала докажем положение п. а.
Пусть i произвольный агент и, для определенности, этот агент действует
по Курно. Для агента с реакцией по Штакельбергу доказательство аналогич-
но. По (23) имеем
(
)
f
λt+11,... ,λt+1i-1t+1iλt+1i + βt+1i
λt+1it+1i+1,... ,λn+1
=


2
2
xk


=
xtk - λt+1k
+
xtj
+
xtk - λt+1k
xtk +
xtj
+
n
k∈Ns
j∈Ns
k∈Nc\{i}
j∈Nc

2
(
)
+xti -
αt+1iλt+1i + βt+1i
λt+1i
xt
+
xtj

=
i
j∈Nc


2
2
xk


=
xtk - λt+1k
+
xtj
+
xtk - λt+1k
xtk +
xtj
+
n
k∈Ns
j∈Ns
k∈Nc\{i}
j∈Nc
103


2
+αt+1i
xtit+1i
xti +
xtj+βt+1xtit+1ixti +
xtj
=
i
j∈Nc
j∈Nc

2
xt
xk

t+1i
k
t+1k
+
xtj
+
n
k∈Ns
j∈Ns


2
2
+
xtk - λt+1k
xtk +
xtj
+
xt
t+1i
xt
+
xtj
+
i
i
k∈Nc\{i}
j∈Nc
j∈Nc

2
xt
xk

t+1i
k
t+1k
+
xtj
+
n
k∈Ns
j∈Ns


2
2
+
xtk - λt+1k
xtk +
xtj
+
xt
t+1i
xt
+
xtj
-
i
i
k∈Nc\{i}
j∈Nc
j∈Nc



2
2
−αt+1iβt+1i
xtit+1i
xti +
xtj
+
xti -
λt+1i
xt
+
xtj
-
i
j∈Nc
j∈Nc


xt
xt

−2
i
t+1i
i
+
xtj
·
xti -
λt+1i
xti +
xtj
j∈Nc
j∈Nc
(
)2
(
)2
Здесь использовано равенство αt+1iβt+1i = αt+1i -
αt+1i
t+1i -
βt+1i
Поскольку в последних фигурных скобках выражение представляет собой
развернутый квадрат разности двух чисел, получаем требуемое неравенство
(
)
f
λt+11,... ,λt+1i-1t+1iλt+1i + βt+1i
λt+1it+1i+1,... ,λn+1
(
)
≤αt+1if
λt+11,... ,λt+1i-1t+1it+1i+1,... ,λt+1n
+
(
)
t+1if
λt+11,... ,λt+1i-1t+1it+1i+1,... ,λn+1
Положение п. а доказано.
Справедливость положения п. б следует из равенства
(
)
f
ηλt+1 + µλt+1
=
(
)
=f
ηλt+11 + µλt+11,... ,ηλt+1i + µλt+1i,... ,ηλn+1 + µλn+1
=
104


2
=
η
xtit+1i
xi
+
xtj+µxtit+1ixi
+
xtj
+
n
n
i∈Ns
j∈Ns
j∈Ns


2
+
η
xt
t+1i
xt
+
xtj+µxti -
xt
+
xtj
=
i
i
λt+1i
i
i∈Nc
j∈Nc
j∈Nc


2
2
∑
xi


xtit+1i
+
xtj
+
xtit+1i
xti +
xtj
+
n
i∈Ns
j∈Ns
i∈Nc
j∈Nc


2
2
∑
xi


xtit+1i
+
xtj
+
xtit+1i
xti +
xtj
-
n
i∈Ns
j∈Ns
i∈Nc
j∈Nc



2
− ηµ
xt
t+1i
xi
+
xtj-
xt
-
λt+1i
xi
+
xtj
-
i
i
n
n
i∈Ns
j∈Ns
j∈Ns



2
− ηµ
xt
t+1i
xti +
xtj-
xt
-
λt+1i
xt
+
xtj
=
i
i
i
i∈Nc
j∈Nc
j∈Nc
= ηf(λt+1) + µf(λt+1) -



2
− ηµ
xtit+1i
xi
+
xtj-
xti -
λt+1ixi
+
xtj
-
n
n
i∈Ns
j∈Ns
j∈Ns



2
− ηµ
xtit+1i
xt
+
xtj-
xti -
λt+1i
xti +
xtj
i
i∈Nc
j∈Nc
j∈Nc
Здесь η, µ ∈ [0; 1] и η + µ = 1.
Перейдем к доказательству положения п. в.
Доказательство проведем, основываясь на методе математической индук-
ции.
По доказанному положению п. а для одного (первого) агента имеем
(
)
f
αt+11λt+11 + βt+11
λt+11t+12,... ,λn+1
(
)
(
)
λt+1
≤αt+11f
t+12,...,λt+1n
t+11f
λt+11t+12,... ,λn+1
1
Для двух (первых) агентов имеем
(
)
f
αt+11λt+11 + βt+11
λt+11t+12λt+12 + βt+12
λt+12t+13,... ,λn+1
105
(
)
λt+1
≤αt+11f
t+12λt+12 + βt+12
λt+12t+13,... ,λn+1
+
1
(
)
t+11f
λt+11t+12λt+12 + βt+12
λt+12t+13,... ,λn+1
[
(
)]
(
)
λt+1
λt+1
≤αt+11
αt+12f
t+12t+13,... ,λt+1n
t+12f
,
λt+12t+13,... ,λn+1
+
1
1
[
(
)
(
)]
t+11
αt+12f
λt+11t+12t+13,... ,λn+1
t+12f
λt+11,
λt+12t+13,... ,λn+1
Это подтверждает справедливость утверждения 3 для двух агентов.
Пусть (24) имеет место для k (первых) агентов. Тогда
(
f
αt+11λt+11 + βt+11
λt+11,... ,αt+1kλt+1k + βt+1k
λt+1k,
)
αt+1k+1λt+1k+1 + βt+1k+1
λt+1k+1t+1k+2,... ,λn+1
(
≤αt+1k+1f
αt+11λt+11 + βt+11
λt+11,... ,
)
αt+1kλt+1k + βt+1k
λt+1kt+1k+1t+1k+2,... ,λn+1
+
(
t+1k+1f
αt+11λt+11 + βt+11
λt+11,... ,
)
αt+1kλt+1k + βt+1k
λt+1k,
λt+1k+1t+1k+2,... ,λn+1
≤αt+1k+1
y1 · ... · yk ×
y1{αt+11t+11}
yk{αt+1kt+1k}
(
)
×f
zt+11,... ,zt+1kt+1k+1t+1k+2,... ,λt+1n
+
t+1k+1
y1 · ... · yk ×
y1{αt+11t+11}
yk{αt+1kt+1k}
(
)
×f
zt+11,... ,zt+1kt+1k+1t+1k+2,... ,λn+1
=
(
)
=
y1 · ... · yk+1 · f
zt+11,... ,zt+1k+1t+1k+2,... ,λt+1n
y1{αt+11t+11}
yk+1{αt+1k+1t+1k+1}
106
Показано, что (24) имеет место для первых (k + 1) агентов. Проведенные
выкладки справедливы для любых, не только первых агентов.
Положение п. в доказано.
Положение п. г следует из (24) и того, что
y1 · ... · yi · ... · yn = 1.
y1{αt+11t+11}
yi{αt+1it+1i}
yn{αn+1n+1}
Докажем положение п. д. Имеем равенство
(
)
f
αt+11λt+11 + βt+11
λt+11,... ,αt+1iλt+1i + βt+1i
λt+1i,... ,αn+1λn+1 + βn+1
λn+1
=


2
xi
+βt+1
xi

=
αt+1i
xtit+1i
+
xtj
xtit+1i
+
xtj
+
i
n
n
i∈Ns
j∈Ns
j∈Ns


2
+
αt+1i
xtit+1i
xti +
xtj+βt+1xti -
λt+1ixti +
xtj

=
i
i∈Nc
j∈Nc
j∈Nc


2
2
=
αt+1i
xtit+1i
xi
+
xtj
+
αt+1i
xtit+1i
xti +
xtj
+
n
i∈Ns
j∈Ns
i∈Nc
j∈Nc


2
2
+
βt+1i
xtit+1i
xi
+
xtj
+
βt+1i
xtit+1i
xti +
xtj
-
n
i∈Ns
j∈Ns
i∈Nc
j∈Nc



2
xi
-
xi

αt+1iβt+1i
xtit+1i
+
xtj
xti -
λt+1i
+
xtj
-
n
n
i∈Ns
j∈Ns
j∈Ns



2
-

αt+1iβt+1i
xtit+1i
xti +
xtj
xti -
λt+1ixti +
xtj
i∈Nc
j∈Nc
j∈Nc
Здесь использовано, что αt+1i, βt+1i ∈ [0; 1], αt+1i + βt+1i = 1 и αt+1iβt+1i =
(
)2
(
)2
t+1i -
αt+1i
t+1i -
βt+1i
Из полученного равенства следует положение п. д. Положение п. д может
быть также получено из (24). Утверждение 3 доказано.
СПИСОК ЛИТЕРАТУРЫ
1. Novikov D.A., Chkhartishvili A.G. Reflexion and Control: Mathematical Models.
Leiden: CRC Press, 2014.
2. Novikov D., Korepanov V., Chkhartishvili A. Reflexion in Mathematical Models
of Decision-Making // Int. J. Parallel Emerg. Distrib. Syst. 2018. V. 33. No. 3.
P. 319-335.
107
3.
Cournot A. Researches into the Mathematical Principles of the Theory of Wealth.
London: Hafner, 1960. (Original 1838).
4.
Stackelberg H. Market Structure and Equilibrium: 1 st Edition. Translation into
English, Basin, Urch&Hill. Springer, 2011. (Original 1934).
5.
The Handbook of Experimental Economics / Ed. by Kagel J. and Roth A. Princeton:
Princeton University Press, 1995.
6.
Wright J., Leyton-Brown K. Beyond Equilibrium: Predicting Human Behavior in
Normal Form Games // Proc. Conf. Associat. Advancement of Artificial Intelligence
(AAAI-10), 2010. P. 461-473.
7.
Айзенберг Н.И., Зоркальцев В.И., Мокрый И.В. Исследование нестационарных
олигопольных рынков // Сиб. журн. индустр. мат. 2017. Т. 20. № 1. С. 11-20.
8.
Гераськин М.И., Чхартишвили А.Г. Анализ игровых моделей рынка олигополии
при ограничениях по мощности и конкурентоспособности агентов //АиТ. 2017.
№ 11. С. 105-121.
Geras’kin M.I., Chkhartishvili A.G. Analysis of Game-Theoretic Models of an
Oligopoly Market under Constrains on the Capacity and Competitiveness of
Agents // Autom. Remote Control. 2017. V. 78. No. 11. P. 2025-2038.
9.
Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения.
М.: Наука, 1977.
10.
Малишевский А.В. Качественные модели в теории сложных систем. М.: Наука,
1998.
11.
Kalashnikov V.V., Bulavsky V.A., Kalashnykova N.I. Existence of the Nash-Optimal
Strategies in the Meta-Game // Studies in Syst., Decision and Control. 2018. V. 100.
P. 95-100.
12.
Алгазин Г.И., Алгазина Д.Г. Коллективное поведение в модели Штакельберга
в условиях неполной информации // АиТ. 2017. № 9. C. 91-105.
Algazin G.I., Algazina D.G. Collective Behavior in the Stackelberg Model under In-
complete Information // Autom. Remote Control. 2017. V. 78. No. 9. P. 1619-1630.
13.
Дюсуше О.М. Статическое равновесие Курно-Нэша и рефлексивные игры оли-
гополии: случай линейных функций спроса и издержек // Эконом. журн. ВШЭ.
2006. № 1. С. 3-32.
14.
Алгазин Г.И., Алгазина Ю.Г. Рефлексивная динамика в условиях неопределен-
ности олигополии Курно // АиТ. 2020. № 2. С. 115-133.
Algazin G.I., Algazina Yu.G. Reflexive Dynamics in the Cournot Oligopoly under
Uncertainty // Autom. Remote Control. 2020. V. 81. No. 2. P. 345-359.
15.
Алгазин Г.И., Алгазина Д.Г. Процессы рефлексии и равновесие в модели оли-
гополии с лидером // АиТ. 2020. № 7. С. 113-128.
Algazin G.I., Algazina D.G. Reflecxive Processes and Equilibrium in an Oligopoly
Model with a Leader // Autom. Remote Control. 2020. V. 81. No. 7. P. 1258-1270.
16.
Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989.
17.
Белицкий Г.Р., Любич Ю.И. Нормы матриц и их приложения. Киев: Наукова
думка, 1984.
18.
Ueda M. Effect of Information Asymmetry in Cournot Duopoly Game with Bounded
Rationality // Appl. Math. Comput. 2019. V. 362. 124535.
19.
Elsadany A.A. Dynamics of a Cournot Duopoly Game with Bounded Rational-
ity Based on Relative Profit Maximization // Appl. Math. Comput. 2017. V. 294.
P. 253-263.
108
20. Askar S., Simos T. Tripoly Stackelberg Game Model: One Leader Versus Two Fol-
lowers // Appl. Math. Comput. 2018. V. 328. P. 301-311.
21. Wu R., Van Gorder R.A. Nonlinear Dynamics of Discrete Time Multi-Level Leader-
Follower Games // Appl. Math. Comput. 2018. V. 320. P. 240-250.
Статья представлена к публикации членом редколлегии М.В. Губко.
Поступила в редакцию 23.07.2020
После доработки 23.11.2021
Принята к публикации 24.12.2021
109