Автоматика и телемеханика, № 2, 2020
Управление в социально-экономических
системах
© 2020 г. Г.И. АЛГАЗИН, д-р физ.-мат. наук (algaz46@yandex.ru)
(Алтайский государственный университет, Барнаул),
Ю.Г. АЛГАЗИНА, канд. эконом. наук (algazina@inbox.ru)
(Алтайский государственный технический
университет им. И.И. Ползунова, Барнаул)
РЕФЛЕКСИВНАЯ ДИНАМИКА В УСЛОВИЯХ
НЕОПРЕДЕЛЕННОСТИ ОЛИГОПОЛИИ КУРНО
Представлена модель динамического поведения на рынке Курно в клас-
се линейных функций спроса и издержек агентов. Агенты, наблюдая сло-
жившееся состояние рынка и учитывая текущие экономические ограни-
чения, в динамике от игры к игре уточняют объемы выпуска, делая шаги
в направлении текущего положения своей цели. Получены достаточные
условия на величины шагов, выбираемые агентами независимо друг от
друга, для сходимости динамики к статичному равновесию Курно-Нэша.
Ключевые слова: олигополия, неполная информированность, рефлексив-
ное поведение, равновесие Курно-Нэша, условия сходимости.
DOI: 10.31857/S0005231020020087
1. Введение
Наблюдая текущее состояние рынка, агент может убедиться в том, что
его объемы выпуска продукции не являются оптимальными. К такому выво-
ду могут прийти не один, а несколько или сразу все, конкурирующие друг с
другом объемами выпуска, агенты. Естественно, что у каждого из них возни-
кает желание уточнить свой объем выпуска так, чтобы он был оптимальным
ответом на действия остальных агентов. Если это удастся сделать всем аген-
там, то при отсутствии кооперации на рынке выбранные объемы выпуска
будут равновесными, так как агенты не будут заинтересованы, чтобы в оди-
ночку изменить их (см., например, [1-4]). Агент принимает решение на основе
доступной ему информации. Поскольку в олигополии состояние рынка зави-
сит от действий всех агентов, то в условиях неполной информированности он
вынужден рефлексировать, т.е. предсказывать их действия.
Исследование моделей олигополии Курно с учетом неполноты информиро-
ванности агентов приводит к возникновению различных моделей рефлексии,
выявлению условий существования равновесия, его единственности и сходи-
мости к нему динамики.
Рефлексивное поведение в моделях олигополии с реакцией фирм по Курно
обсуждается при различных предпосылках. Динамика изучается в непрерыв-
115
ном [5, 6] или дискретном времени [7-14]. Функции полных издержек аген-
тов предполагаются нелинейными [10-17] или линейными [9, 18, 19], функ-
ции спроса, предпочтительно, линейными. Особенности моделирования ди-
намики поведения по Курно с применением рефлексивных игр с различным
порядком (одновременным, последовательным, последовательно-групповым,
хаотичным) ходов игроков можно найти в [7, 18, 20, 21]. Возможности измене-
ния правил поведения или ранга рефлексии агентов обсуждается в [3-5, 13].
Исходная информация для развития динамики может быть представлена из-
вестными всем агентам функциями издержек или целевыми функциями кон-
курентов [12, 13], текущими действиями или состояниями конкурентов [3, 6,
10-15, 19], текущей рыночной ценой и эластичностью спроса [5, 9] и т.д.
Результаты исследований сходимости динамик представлены в различных
формах. В [5] они получены в виде функций предложения, приводящих к
равновесию с использованием динамических имитационных моделей в непре-
рывном времени. В [18] обсуждаются условия сходимости для процессов ре-
флексии с различным порядком ходов. В [8, 22-24] можно найти условия
сходимости, области притяжений, условия на величины шагов, обеспечиваю-
щих сходимость динамики коллективного поведения при предположениях,
что каждому агенту при продвижении к цели надо знать текущие действия
или состояния всех агентов. В [7, 10, 11] аналогичные условия рассмотрены
для других видов динамик. В [3, 4, 25] ставится задача определения равнове-
сий и управления поведением агентов с применением метода рефлексивных
разбиений, а в [13] для частного случая рефлексивного управления показа-
на возможность применения этого метода для управления рыночной ценой и
формулируются условия приведения рынка к равновесной цене. В [17] форму-
лируются условия равновесия Нэша для процесса последовательных реакций
при текущих ограничениях по мощности и конкурентоспособности агентов.
В [9] получены достаточные условия сходимости к равновесию модели коллек-
тивного поведения, с помощью которой агенты уточняют свои представления
о предельных издержках конкурентов. В [20, 21] дается анализ «хаотичных»
процессов поведения фирм с реакцией по Курно при динамическом взаимо-
действии. В [14-16, 18] условия сходимости динамик получены только для
случая дуополии.
Работы в этом направлении остаются актуальными ввиду значимости про-
блемы сближения теоретических моделей равновесий Нэша с эмпирическими
параметрами состояний реальных рынков олигополии.
В настоящей статье основное внимание уделяется анализу традиционных
моделей рефлексии; построению адекватного процесса рефлексии, учитываю-
щего недостатки традиционных; условиям и аналитическим оценкам сходи-
мости этого процесса. Во внимание принимаются такие экономические кате-
гории, как конкурентоспособность и убыточность агентов, а также начальное
состояние рынка.
Теоретической основой динамического процесса являются теория рефлек-
сивных игр и теория коллективного поведения. Их подходы дополняют друг
друга тем, что в условиях неполной информированности агентов и неадек-
ватности предсказаний действий конкурентов рефлексивные игры позволяют
116
использовать процессы коллективного поведения и результаты размышлений
игроков, приводящие к равновесию [3, 4].
2. Базовая модель олигополии
Пусть i ∈ N = {1, . . . , n} — множество агентов, конкурирующих на рынке
объемами выпуска однородной продукции. Каждый агент продает произве-
денный им выпуск qi по единой рыночной цене p(Q), которая определяется∑
общим объемом выпуска Q =i∈N qi. Действия агентов направлены на мак-
симизацию собственной прибыли:
(1)
Πi(p(Q),qi) = p(Q)qi - φi(qi) → max,
i∈N.
qi
Цена p(Q) и полные издержки фирм φi(qi) заданы линейными функциями
(2)
p(Q) = a - bQ, φi(qi) = ciqi + di
,
i∈N,
где a, b — параметры спроса, ci, di — предельные и постоянные издержки
фирм.
Предпосылки базовой модели: 1) дискретность процесса; 2) однородность
продукции; 3) конкуренция объемами выпусков, весь выпуск реализуется;
4) единая рыночная цена; 5) произвольное число агентов на рынке; 6) линей-
ность функций спроса и полных затрат агентов, имеющих различные пре-
дельные издержки; 7) отсутствие ограничений мощности и коалиций; 8) ра-
циональное поведение агентов, направленное на максимизацию собственной
прибыли; 9) одновременный порядок ходов.
3. Анализ и постановка проблемы
Агенты вынуждены прибегать к рефлексии, если в базовой модели отсут-
ствует общее знание относительно множества агентов, множеств их допусти-
мых действий, параметров и целевых функций конкурентов. Традиционный
процесс пошаговой рефлексии предполагает, что агенты выбирают оптималь-
ный отклик в соответствии со своей функцией реакции.
∕
Оптимальный отклик i-го агента находится из условия ∂Πi
∂qi = 0 с уче-
том (2)
hi - Q-i
(3)
qi =
∕
(i ∈ N),
2+∂Q-i
∂qi
где использованы обозначения:
a-ci
(4)
hi =
,
b
∑
(5)
Q-i = qj.
j=i
117
Согласно предположению Курно [26] относительно объемов выпуска каж-
дая фирма действует так, что не ожидает от своих конкурентов изменения
объемов выпуска, даже если сама сделает это. Формально его можно запи-
сать в виде условий равенства нулю предположительных вариаций [26, 27]
∂qj = 0, i = j; i,j ∈ N. Отсюда
∂qi
∂Q-i
(6)
= 0, i ∈ N.
∂qi
Если система условий (3)-(6) имеет решение, то состояние, в которое при-
ходит рынок, когда агенты выбирают в качестве своей стратегии это решение,
называется равновесием Курно [26]. Для базовой модели олигополии это со-
стояние является равновесием Нэша [28].
Тогда из (3) и (6) имеем выражение для оптимального отклика (см., на-
пример, [18])
hi - Q-i
(7)
qi =
2
Преобразуем (1) с учетом (2) к виду Πi = b(hi - Q-i - qi)qi - di. При ожи-
даниях hi - Q-i > 0 агент выбирает положительный выпуск, который опре-
деляется выражением (7). При ожиданиях hi - Q-i ≤ 0 положительный вы-
пуск дает отрицательную валовую прибыль (т.е. прибыль без учета постоян-
ных издержек di) и, чтобы минимизировать потери, агент выбирает нулевой
выпуск.
Рекуррентные соотношения соответствующей многошаговой рефлексив-
ной игры, предложенной в [18], имеют вид:
1. Каждый из агентов независимо от других, используя наблюдаемые вы-
пуски каждого агента qti и полагая, что в текущем (t + 1)-м моменте вре-
мени все остальные агенты выберут те же действия, как и в предыдущем
t-м моменте, на основе (7) рассчитывает свой текущий оптимальный выпуск
(оптимальный отклик на действия конкурентов) xti по формуле
1
(8)
xti =
(hi - Qt-i
).
2
Здесь i ∈ N, t = 0, 1, 2, . . . — моменты времени (периоды, номера партий
или сеансы игры и пр.). Начальный вектор выпусков q0 = (q01, . . . , q0n) счита-
ется заданным. Остальные правила игры определяются условиями базовой
модели олигополии 1)-9) в разделе 2.
2. Каждый агент изменяет свой выпуск за предыдущий t-й момент времени
по формуле
{ xti, xti > 0;
(9)
qt+1i =
(i ∈ N; t = 0, 1, 2, . . .).
0, xti ≤ 0
Затем процесс повторяется с п.1.
118
Условно процесс (8)-(9) определим как вариант 1 рефлексивной игры.
Достоинства такого процесса: целевая направленность, агент в каждый
момент выбирает наилучший ответ, экономическая содержательность про-
цесса, выраженная в том, что гарантируются неотрицательный текущий вы-
пуск (конкурентоспособность) и неотрицательная текущая валовая прибыль
агентов.
Недостатки процесса: плохо поддается аналитическому исследованию схо-
димость процесса в зависимости от параметров и начального состояния рын-
ка, поэтому как основной используется метод численного моделирования;
численными экспериментами показано [18], что «при числе фирм не больше
двух процесс сходится, иначе расходится»; текущая цена товара может быть
ниже предельных издержек, что приводит к убыткам агента и ставит под
сомнение целесообразность продолжения его участия в процессе. Возможна
отрицательная текущая цена. Имеется возможность зацикливания процесса,
препятствующего достижению агентами равновесия, что иллюстрируется на
следующем простом примере. Здесь и далее верхним индексом “(c)” обозна-
чим показатели в статическом равновесии Курно-Нэша для базовой модели.
Пример 1. Пусть q0 = (0,...,0). Тогда по (8) и (9) получим q1i = hi
и
∑
2
hi - Q1-i = hi -12j=i hj. Пусть также все агенты имеют одинаковые пре-
дельные издержки, ci = c, i ∈ N. Тогда hi = h и hi - Q1-i =(3-n)h2 . При n = 3
имеем hi - Q1-i = 0, при n > 3 имеем hi - Q1-i < 0 для i ∈ N и q2 = (0, . . . , 0).
Процесс вернулся в исходное состояние, очевидно, что q0 = (0, . . . , 0) = q2 =
(h
)
=q4 =... и q1 =
,...,h2
=q3 =q5 =
При этом статичное равновесие
2
q(c) =a-c(1+n)b =h1+n, как решение (3)-(6) не достигается. Зацикливание так-
же может иметь место, если взять начальный вектор с малыми компонен-
∑
тами. Пусть q0 = (ε, . . . , ε). Тогда q1i =hi-(n-1)ε2 и hi - Q1-i = hi -1
hj+
2
j=i
+(n-1)2ε2. Для случая одинаковых предельных издержек всех агентов 2x1i =
= hi - Q1-i = (3-n)h2 + (n-1)2ε2. Так, при n > 3 зацикливание будет, если x1i ≤ 0,
т.е. ε ≤(n-3)h(n-1)2 . При n = 2 и нулевом начальном векторе агентов с различными
предельными издержками имеем
(
)
(
)
hi
1
h2
3
h1
3
q1i =
,
q21 = x11 =
h1 -
=
q(c)1, q22 = x12 =1
h2 -
=
q(c)2,
2
2
2
4
2
2
4
(
)
)
1
(
)
1
h2
h1
1
(3
1
3
q31 = x21 =
h1 - q22
=
h1 -
+
=
q(c)1 +h1
=
h1 +
q(c)1,
2
2
2
4
2
2
4
8
4
1
(
)
1
3
q32 = x22 =
h2 - q21
=
h2 +
q(c)2
и т.д.
2
8
4
Зацикливания не происходит. Здесь использовано, что q(c)1 =13b (a - 2c1 + c2)
1
иq(c)2 =
(a + c1 - 2c2) есть решение (3)-(6) при n = 2.
3b
Для аналитического исследования динамики рефлексии нередко применя-
ются технически более удобные рекуррентные соотношения, когда вместо (9)
119
используется следующая формула (вариант 2 рефлексивной игры)
(10)
qt+1i = xti
(i ∈ N; t = 0, 1, 2, . . .).
Как отмечается в [18], тогда «имеют место адаптивные ожидания, кото-
рые нерациональны в том смысле, что выпуск конкурентов на текущем шаге
изменяется и, в общем, не соответствует ожиданиям. В этом случае фирма не
попадает на свою функцию реакции». Также для такого процесса не гаранти-
руются текущие неотрицательные выпуски, положительная валовая прибыль
агентов, положительная цена товара.
Хотя факт того, что процессы (8), (9) и (8), (10) сходятся или расходятся
одновременно, формально не доказан, но численным моделированием для
(8), (9) и аналитически для (8), (10) показывается [18], что при n = 2 как тот,
так и другой варианты процесса сходятся при любых начальных условиях, а
при n > 2 расходятся.
С учетом достоинств и недостатков рассмотренных традиционных схем
пошаговой рефлексии, в настоящей статье предложены их модификации, ко-
торые представлены в следующем разделе.
4. Адаптивная динамика в модели олигополии Курно
Отсутствие сходимости является основным недостатком рассмотренных
традиционных схем пошаговой рефлексии. Поэтому авторами предложены их
модификации, в основу которых положена адаптивная динамика движения
агентов к цели.
Рассмотрим динамический процесс (вариант 3), в котором в каждый мо-
мент каждый из агентов рассчитывает свое текущее положение цели и изме-
няет свое состояние в направлении текущего положения цели:
1. Каждый из агентов независимо от других, используя наблюдаемые вы-
пуски каждого агента qti и полагая что в текущем (t + 1)-м моменте време-
ни все остальные агенты выберут те же действия, как и в предыдущем t-м
моменте, рассчитывает свой текущий оптимальный выпуск xti по прежней
формуле (8).
Начальный вектор выпусков q0 также считается заданным, а остальные
правила игры определяются условиями 1)-9) в разделе 2.
2. Каждый агент изменяет свой выпуск за предыдущий t-й момент време-
ни, делая от него шаг по направлению к текущему оптимальному выпуску xti
по формуле
{
qti + γt+1i(xti - qti), xti > 0;
(11)
qt+1i =
0,
xti ≤ 0.
Здесь: i ∈ N; t = 0, 1, 2, . . .; γt+1i ∈ [0; 1] — параметры, определяющие величи-
ны шагов. Условия (11) гарантируют, что выпуск qt+1i и валовая прибыль
агента не могут быть отрицательными.
Затем процесс повторяется с п.1.
120
Если (11) заменить на формулу
(12)
qt+1i = qti + γt+1i(xti - qti
) (i ∈ N; t = 0, 1, 2, . . .),
то получим соответствующий варианту 2 аналог рефлексивной игры. Назо-
вем его вариант 4. Он характерен для таких процессов, когда агенты имити-
руют автоматы, формально выполняя выбор действий, невзирая на возмож-
ные текущие отрицательные выпуски, отрицательные цены и убытки. Хотя,
в конечном счете, процесс может быть сходящимся [9, 19]. В теории коллек-
тивного поведения (12) описывает динамику выбора решений, основанного
на аксиоме индикаторного поведения [4, 23, 24].
Примечание: варианты 1 и 2 процессов можно рассматривать как частные
случаи вариантов 3 и 4 соответственно при γt+1i ≡ 1; в последних же допус-
кается «неполный» щаг.
5. Результаты и обсуждение
Аналитическое исследование варианта 3 рефлексивной игры (динамиче-
ского процесса (8), (11)) представляет не меньшую сложность, чем вариан-
та 1, для которого основным является метод численного моделирования. Оно
также существенно сложнее, чем для варианта 4 (процесса (8), (12)).
Поэтому основная идея статьи состоит в том, чтобы найти условия схо-
димости для процесса (8), (12), в котором в отличие от процесса (8), (11)
агенты не обнуляют свой выпуск, если xti ≤ 0. Затем обобщить полученные
результаты на динамику (8), (11).
Введем в рассмотрение функции-индикаторы [29, с. 49], характеризующие
отклонения текущих выпусков от текущих оптимумов, вида αti = 2(xti - qti).
Присутствие коэффициента «2» объясняется последующими удобствами. Ис-
пользуя (11), а также то, что по (7) hi = Q(c) + q(c)i, имеем
(13)
αti = Q(c) + q(c)i - Qt - qti.
Равенство нулю отдельных αti еще не означает, что агенты достигли рав-
новесия. В равновесии все αti равны нулю и из соответствующей однородной
системы уравнений (13) находится, что qti = q(c)i. Ниже будет показана важ-
{
}
ная роль, которую играет также выражение max
αti - αt
в исследовании
j
i,j∈N
и доказательстве сходимости процессов.
В Приложении приводятся доказательства следующих утверждений.
Утвер}ждение 1. Если для процесса (8), (12) в последовательности
{
αti, i ∈ N
имеются не только положительные члены, то
{
}
{
}
max
αt+1i - αt+1
< max
αti - αtj
j
i,j∈N
i,j∈N
Ут{вержде}ие 2. Если для процесса
(8),
(12) в последовательно-
сти
αti, i ∈ N
имеются не только положительные члены, то при
121
(
]
{
}
2
γt+1
∈
0;1+
в последовательности
αt+1i, i ∈ N
есть члены с разными
i
n
знаками.
{
}
Утверждение 3. Если в последовательности
α0, i∈N
имеются не
(
i
]
2
только положительные члены, то при γt+1i ∈
0;
(t = 0, 1, 2, . . .) про-
1+n
цесс (8), (12) сходится.
Следующее утв{рждение т}кже связано с начальными условиями процесса
(8), (12), когда в
α0i, i ∈ N
все члены: а) положительны, б) меньше или
равны нулю.
(
)
2
Утверждение 4. Пусть γ1i ∈
0;
(i ∈ N). Тогда справедливы нера-
1+n
венства: а) 0 < Q(c) - Q1 < Q(c) - Q0, если α0i > 0 (i ∈ N); б) 0 < Q1 - Q(c) <
< Q0 - Q(c), если α0i ≤ 0 (i ∈ N).
Примечания. 1. Если α0i = 0 (∀i ∈ N), то исходное состояние уже является
равновесным. 2{Утвержд}ние 4 имеет место также для любого момента вре-
мени t, если в
αti, i ∈ N
все αti > 0 или все αti ≤ 0. 3) Неравенства можно
Q(c)-Q1
<
Q(c)-Q0
.
записать одним неравенством
Основной результат работы для процесса (8), (12) сформулирован в сле-
дующем утверждении.
(
)
2
Утверждение 5. При γt+1i ∈
0;
(i ∈ N; t = 0, 1, 2, . . .) процесс
1+n
{
}
(8), (12) сходится при любых начальных выпусках агентов
q0i, i ∈ N
Следующий основной результат работы относится к процессу (8), (11), в
котором агенты обнуляют свой выпуск при xti ≤ 0.
(
)
2
Утверждение 6. При γt+1i ∈
0;
(i ∈ N; t = 0, 1, 2, . . .) процесс
1+n
{
}
(8), (11) сходится при любых начальных выпусках агентов
q0i, i ∈ N
Доказательство утверждения 6, формулировки и доказательства вспо-
могательных утверждений П.1-П.5 приведены в Приложении. Результаты,
сформулированные в виде вспомогательных утверждений, используются при
доказательстве основного утверждения 6 и отчасти повторяют результаты
утверждений 1-4, но вместе с тем их доказательства имеют отличия в виду
специфики процесса (8), (11). Ниже показан пример этого процесса.
Пример 2. Исходные данные: на рынке с параметрами a = 100, b = 0,1
присутствуют три агента с предельными издержками c1 = 10, c2 = 20, c3 = 40
соответственно. По (4) имеем h = (900, 800, 600). В табл. 1 и табл. 2 представ-
лены начальный и завершающий фрагменты процесса.
Согласно (12) на 1-й итерации q2 = q3 = 0, поскольку на 0-й x2 = 0, x3 < 0;
а на 2-й, 3-й и 7-й итерациях q3 = 0, поскольку на 1-й, 2-й и 6-й итерациях
x3 < 0. В этих случаях параметр γ не используется и поэтому его значения
в таблице отсутствуют. Чтобы получить сходящийся процесс, значения па-
раметра γ для n = 3 выбраны в диапазоне (0; 0,5). Начиная с 1-й итерации
{
}
max
αti - αt
монотонно убывает по t, поскольку αt1, αt2, αt3 не одного знака
j
i,j∈N
122
Таблица 1. Начальные итерации процесса (8), (11) для трех агентов
Текущие
Текущие
Значения
Параметры
выпуски
цели
функций-
шагов
агентов
агентов
индикаторов
t
q1
q2
q3
x1
x2
x3
α1
α2
α3
γ1
γ2
γ3
0 750,0
100, 50,0 375,0
0,0
-125,0 -750,0 -200,0 -350,0
550,0
1 675,0
0,0
0,0 450,0 62,5
-37,5
-450,0
125,0
-75,0
0,2
575,0
2 585,0 25,0
0,0 437,5 107,5
-5,0
-295,0
165,0
-10,0
0,4
0,4
460,0
3 548,1 49,8
0,0 425,1 125,9
1,1
-246,0
152,4
2,1
0,25 0,3 0,25 398,4
4 517,4 72,6
0,3 413,5 141,2
5,0
-207,7
137,1
9,4
0,25 0,3
0,3
344,8
5 501,8 86,3
1,3 406,2 148,5
5,9
-191,2
124,3
9,4
0,15 0,2
0,2
315,5
6 492,2 114,3 1,3 392,2 153,3
-3,3
-200,0
77,9
-9,0
0,1 0,45
278,0
7 452,2 122,1 0,0 389,0 173,9
12,8
-126,6
103,6
25,7
0,4
0,2 0,35 230,2
8 426,9 142,8 5,1 376,0 184,0
15,1
-101,8
82,3
20,0
0,4
0,4
0,4
184,1
9 406,6 161,3 9,1 364,8 192,1
16,1
-83,6
61,6
13,8
0,4 0,45 0,4
145,2
Таблица 2. Завершающие итерации сходящегося процесса (8), (11) для трех агентов
Текущие
Текущие
Значения
Параметры
выпуски
цели
функций-
шагов
агентов
агентов
индикаторов
t
q1
q2
q3
x1
x2
x3
α1
α2
α3
γ1
γ2
γ3
23
329,8
221,6
23,7
327,3
223,3
24,3
-4,9
3,3
1,2
0,25
0,35
0,2
8,2
24
329,1
222,1
24,0
327,0
223,4
24,4
-4,4
2,7
0,8
0,25
0,3
0,4
7,1
25
328,3
222,7
24,1
326,6
223,8
24,5
-3,3
2,2
0,9
0,4
0,48
0,2
5,5
26
327,9
223,1
24,2
326,3
224,0
24,5
-3,0
1,8
0,6
0,25
0,3
0,4
4,8
27
327,5
223,4
24,3
326,1
224,1
24,5
-2,7
1,3
0,5
0,25
0,4
0,3
4,1
28
327,1
223,6
24,4
326,0
224,2
24,6
-2,3
1,2
0,5
0,25
0,3
0,2
3,5
29
326,6
223,9
24,5
325,8
224,5
24,7
-1,6
1,2
0,6
0,45
0,4
0,4
2,8
30
326,4
224,0
24,5
325,7
224,5
24,8
-1,4
1,1
0,5
0,25
0,2
0,25
2,4
31
326,1
224,2
24,6
325,6
224,6
24,8
-1,1
0,8
0,4
0,45
0,4
0,4
1,9
32
326,0
224,3
24,7
325,5
224,7
24,9
-0,9
0,8
0,4
0,25
0,2
0,22
1,7
для каждого t ≥ 1. Процесс сходится к q(c) = (325, 225, 25), как показано в
c)
табл. 2. Критерий останова процесса в примере
q(
-qti ≤ 1.
i
6. Заключение
Проведено исследование процессов рефлексивного поведения в традици-
онной теоретико-игровой модели конкурентного рынка Курно в классе ли-
нейных функций спроса и издержек агентов. Получены следующие основные
результаты:
— предложен адаптивный процесс рефлексивного коллективного поведе-
ния, учитывающий текущую информированность и экономические ограни-
чения агентов, обобщающий традиционные процессы рефлексии в условиях
неполного знания;
123
— представлены аналитические исследования процесса. Получены доста-
точные условия на выбор агентами независимо друг от друга величин те-
кущих шагов для сходимости в дискретном времени процесса к статичному
равновесию Курно-Нэша. Доказаны соответствующие утверждения.
ПРИЛОЖЕНИЕ
Доказательство утверждения 1. По (8) xti - qti = 12(hi - Qt - qti)
и по (7) hi = Q(c) + q(c)i. С учетом (13) xti - qti =αi2.Тогдаперепишем(12)в
виде
γt+1i
(Π.1)
qt+1i = qti +
αti.
2
Из (13) и (П.1) имеем
(
)
γt+1i
(Π.2)
αt+1i =
1-
αti + Qt - Qt+1.
2
Тогда
(
)
(
)
γt+1i
γt+1j
(Π.3)
αt+1i - αt+1j =
1-
αti -
1-
αtj.
2
2
{
}
{
}
Обозначим αt+1
= max
αt+1i, i ∈ N
и αt+1
= min
αt+1i, i ∈ N
. То-
Mt+1
mt+1
i
i
гда по (П.3)
(
)
(
)
t+1
γM
t+1
γt+1
mt+1
αt+1
-αt+1
=
1-
αtMt+1 -
1-
αtmt+1.
Mt+1
mt+1
2
2
Но αtMt+1 ≤ αtMt > 0 и 0 ≥ αtmt ≤ αtmt+1 . Поэтому
{
}
{
}
max
αt+1i - αt+1
=αt+1
-αt+1
< αtMt - αtmt = max
αti - αtj
j
Mt+1
mt+1
i,j∈N
i,j∈N
Что и требовалось доказать.
Доказательство утверждения 2. Для процесса (8), (12) из (П.1)
имеем
∑
γt+1j
(Π.4)
Qt+1 = Qt +
αtj.
2
j∈N
Соответственно, (П.2) представимо в виде
(
)
γt+1i
∑
γt+1j
(Π.5)
αt+1i =
1-
αti -
αtj.
2
2
j∈N
124
Из (П.5) получаем, что
⎛
⎞
(
)
t+1
∑
∑
γm
t
γt+1j
γt+1j
γt+1mt
αt+1mt <
1-
αtmt - αt
=αt
⎝1-
-
⎠.
mt
mt
2
2
2
2
j∈N
j∈N
∑
γt+1j
γt+1
По условию αt
≤ 0, и если 1 -j∈N
-
≥ 0, то αt+1mt < 0, т.е. в по-
mt
{
}
2
mt2
следовательности
αt+1i, i ∈ N
есть отрицательный член.
С другой стороны, также по (П.5) имеем, что
⎛
⎞
(
)
t+1
∑
∑
γM
t
γt+1j
γt+1j
γt+1Mt
αt+1Mt >
1-
αtMt - αt
=αt
⎝1-
-
⎠.
Mt
Mt
2
2
2
2
j∈N
j∈N
∑
γt+1j
γt+1
Mt
По предположению αt
> 0, и если 1 -j∈N
-
> 0, то αt+1Mt > 0, т.е.
2
2
{
}
в последовательности
αt+1i, i ∈ N
есть положительный член.
Таким об(азом, ]сли для каждого агента выбор параметра ограничить
{
}
2
диапазоном
0;
, то в последовательности
αt+1i, i ∈ N
будут члены с
1+n
разными знаками.
Утверждение доказано.
Доказательство утвержд {ния 3. }огласно утверждению 2 для
каждого t > 0 в последовательности
αti, i ∈ N
будут члены с разными зна-
ками. Тогда по утверждению 1 имеем
{
}
{
}
max
αt+1i - αt+1
< max
αti - αtj
<
j
i,j∈N
i,j∈N
{
}
{
}
< max
αt-1i - αt-1
< ... < max
α0i - α0j
j
i,j∈N
i,j∈N
{
}
Таким образом, max
αti - αt
→ 0 при t → ∞. Поскольку знаки αtmt и αtMt
j
i,j∈N
не совпадают, если αtmt = 0, то αti → 0 при t → ∞ и Qt → Q(c), qti → q(c)i.
Утверждение 3 доказано.
Доказательство утверждения 4. По (П.5) и (13) имеем
(
)
∑
(n + 1) Q(c) - Q1
= α1j =
j∈N
(
)
{
∑
}∑
1+n
1+n
=
1-
γ1
j
α0j < max
1-
γ1
i
α0j =
2
i∈N
2
j∈N
j∈N
{
}
(
)
1+n
= max
1-
γ1
(n + 1) Q(c) - Q0
i
i∈N
2
{
}
Из условия 0 < max
1-1+n2γ1i
< 1 следует первая часть доказываемого
i∈N
утверждения. Аналогичным образом доказывается его вторая часть.
125
Доказательство утверждения 5. Возможны 3 сценария нача-
{а и разви}ия процесса (8), (12). Первый сценарий: в последовательности
α0i, i ∈ N
не только положительные члены, есть и другие (отрицательные
и/или нулевые члены). Такой процесс сходится согласно утверждению 3. Вто-
рой сценарий: процесс начинается с последовательности, в которой все α0i > 0
или все α0i < 0, и в какой-то момент времени появится последовательность с
членами разных знаков. Тогда в силу утверждения 2 все последующие по-
следовательности будут с членами разных знаков и опять в силу утвержде-
ния 3 процесс сходится. Третий сценарий: процесс начинается с последова-
тельности, в которой все α0i > 0 или все α0i < 0, и знаки всех членов после-
довательностей не меняются в течение всего процесса. Тогдасогласно твер-
Q(c)-Q0
>
Q(c)-Q1
>...
ждению 4 (см. примечание) для каждого t > 1
>
...>
Q(c) - Qt
Q(c) - Qt+1
и Qt → Q(c). По (П.2) αti → 0, а по
(13)
qti → q(c)i (i ∈ N). Процесс (8), (12) сходится к истинному равновесию.
Утверждение 5 доказано.
Примечание. Если αti > 0 или αti < 0 (∀i ∈ N), то в (t + 1)-й момент знаки
всех членов не могут измениться на противоположные. Так, если αt1 > 0, то
в условиях утверждения 5 на выбор параметров γ, как показано в ходе дока-
зательства утверждения 2, αt+1Mt > 0. Аналогично, если αti < 0, то αt+1mt < 0.
Доказательство утверждения 6. Доказательство начнем с вве-
дения новых обозначений и соотношений, затем докажем вспомогательные
утверждения и их следствия, опираясь на которые завершим доказательство
утверждения 6.
xt
xt
Обозначим: Nt1 = {i
> 0, i ∈ N}, Nt2 = {i
≤ 0, i ∈ N}. Тогда Nt1 ∩ Nt2 = ⊗
i
i
иNt1 ∪Nt2 =N.
С учетом введенных обозначений и (13) запишем (11) как
⎧
⎨
γt+1i
qti +
αti, i ∈ Nt1;
(Π.6)
qt+1i =
2
⎩
0,
i∈Nt2.
Далее имеем:
∑
γt+1
∑
j
(Π.7)
Qt+1 = Qt +
αtj -
qtj;
2
j∈Nt1
j∈Nt
2
i
Q(c) +q(c)i -Qt+1 -qt+1i = Q(c) +q(c)i -Qt -qti -
αti -Qt+1 +Qt, i ∈ Nt1;
2
(
)
γt+1i
αt+1i =
1-
αti - Qt+1 + Qt =
2
(Π.8)
(
)
∑
γt+1
∑
γt+1i
j
=
1-
αti -
αtj +
qtj,
i∈Nt1;
2
2
j∈Nt1
j∈Nt
2
Q(c) + q(c)i - Qt+1 - qt+1i = Q(c) + q(c)i - Qt - qti + qti - Qt+1 + Qt, i ∈ Nt2;
126
∑
γt+1
∑
j
(Π.9)
αt+1
=αti +qti -Qt+1 +Qt =αti +qti -
αtj +
qtj,
i∈Nt2.
i
2
j∈Nt1
j∈Nt
2
Результат, полученный в утверждении П.1, повторяет результат утвержде-
ния 1 для процесса (8), (12), однако его доказательство усложняется с введе-
нием множеств Nt1 и Nt2.
Утв{рждени} П.1. Если для процесса
(8),
(11) в последователь-
ности
αt
i∈N
имеются не только положительные члены, то
{ i,
}
{
}
max
αt+1i - αt+1
< max
αti - αt
j
j
i,j∈N
i,j∈N
Доказатель{тво. Возм}жно 4 случая для агентов i и j, на которых
достигается max
αt+1i - αt+1
:
j
i,j∈N
1) i, j ∈ Nt1;
2) i ∈ Nt1, j ∈ Nt2;
3) i ∈ Nt2, j ∈ Nt1;
4) i, j ∈ Nt2.
Рассмотрим первый случай. Пусть i, j ∈ Nt1. Обозначим αt+1
=
Mt+11
{
}
{
}
= max
αt+1i,i∈ Nt1
и αt+1
= min
αt+1i,i∈ Nt1
. По (П.8) αt+1
-αt+1
=
i
mt+11
i
Mt+11
mt+1
(
)
(
)
1
γt+1
γt+1
Mt+1
mt+1
1
t
1
=
1-
α
-
1-
αtmt+1. Но αtMt+1
≤αtMt >0 и αtmt+1 ≥
2
Mt+11
2
1
1
1
≥ αtmt ≤ 0. Поэтому
{
}
{
}
(Π.10) max
αt+1i - αt+1
<αtMt+1
- αtmt < αtMt - αtmt = max
αti - αtj
j
i,j∈Nt1
1
i,j∈N
, j ∈ Nt2. По (П.8) и (П.9)
)
1
t+1
имеем, что αt+1i - αt+1j =
1-γi
αti - (αtj + qtj). Или αt+1
-αt+1
=
2
Mt+11
mt+1
(
)
2
γt+1
(
)
t+1
{
}
M1
t
=
1-
α
- αt
+qt
. Здесь αt+1
= min
αt+1i, i ∈ Nt2
и
2
Mt+11
mt+12
mt+12
mt+12
i
αt
≤ αtMt > 0. Тогда
Mt+11
{
}
{
}
(Π.11)
max
αt+1i -αt+1
< αtMt -αtmt+1
≤ αtMt -αtmt = max
αti -αtj
j
i∈Nt1,j∈Nt2
2
i,j∈N
Рассмотрим следующий случай, когда i ∈ Nt2, j ∈ Nt1. По (П.8) и (П.9)(
)
t+1
γj
αt+1i -αt+1j = (αti +qti)-
1-
αtj и, используя, что αti +qti < αtMt, имеем
2
⎛
⎞
(
)
γt+1
mt+11
⎠αt
αt+1
-αt+1
= αtMt+1
+qtMt+1
-⎝1 -
<
Mt+12
mt+11
mt+1
2
2
2
1
127
⎛
⎞
γt+1
mt+11
{
}
<αt
-⎝1 -
⎠αt
< αtMt - αtmt = max
αti - αtj
Mt
mt
2
i,j∈N
Пусть теперь i, j ∈ Nt2. Тогда по (П.9) αt+1i - αt+1j = (αti + qti) - (αtj + qtj).
{
}
Поскольку αti + qti = 2xti - qti ≤ 0, а αtMt > 0, то max
αt+1i - αt+1
<
j
1
i,j∈Nt
{
}
2
< max
αt+1i - αt+1
. Далее доказываемое следует из (П.11).
j
i∈Nt1,j∈Nt
2
Обобщая рассмотренные случаи, имеем, что
{
{
}
{
}
{
}
max
αt+1i - αt+1
= max max
αt+1i - αt+1
,
max
αt+1i - αt+1
,
j
j
j
i,j∈N
i,j∈Nt1
i∈Nt1,j∈Nt
2
⎫
⎬
{
}
{
}
{
}
max
αt+1i - αt+1
, max
αt+1i - αt+1
< max
αti - αtj
j
j
i∈Nt2,j∈Nt1
i,j∈Nt2
⎭
i,j∈N
Утверждение П.1. доказано.
Следующие два утверждения П.2 и П.3 для процесса (8), (11) отчасти
повторяют утверждение 2 для процесса (8), (12).
Утверждение П.2. Если для процесса
(8), (11) в последовательно-
(
]
{
}
2
сти
αti, i ∈ N
есть положительные члены, то при γt+1i ∈
0;
в
1+n
{
}
αt+1i, i ∈ N
также есть положительные члены.
1
(
)
t+1
γ
∑
γt+1j
γt+1
∑
γt+1j
Mt
Mt
По (П.5) αt+1Mt >
1-
αtMt - αt
=αtMt
1-
-
2
Mt
2
2
2
j∈Nt1
j∈Nt
1
(
]
γt+1
∑
γt+1j
2
Mt
Если γt+1i ∈
0;
, то 1 -
-
> 0 и αt+1Mt > 0. Что доказывает
1+n
2
2
j∈Nt
1
утверждение.
Из доказанного утверждения П.2 вытекает следствие, которое может быть
полезным при исследовании хода процесса и его сходимости.
Следствие. Если для процесса (8), (11) в последовательности {αti,i∈N}(
]
{
}
2
есть положительные члены, то при γt+1i ∈
0;
в
αt+1i, i ∈ N
не мо-
1+n
гут быть только отрицательные и нулевые члены.
Другими словами, могут быть только a) положительные члены, б) поло-
жительные и нулевые, в) члены с разными знаками и нулевые члены.
Утвер}ждение П.3. Если для процесса (8), (11) в последовательности
{
αti, i ∈ N
есть отрицательные или нулевые члены и Nt
= N, то при
(
]
1
{
}
2
γt+1i ∈
0;
в
αt+1i, i ∈ N
есть отрицательные члены.
1+n
128
Доказательство утверждения П.3. Из (П.8) получаем, что αt+1<
(
)
(
)
mt
t+1
γ
∑
γt+1j
∑ γt+1j
γt+1
mt
mt
<
1-
αtmt - αt
=αt
1-j∈N
-
. По усло-
2
mt j∈N
2
mt
2
2
∑
γt+1j
γt+1
вию αt
≤ 0, и если 1 -j∈N
-
≥ 0, то αt+1mt < 0, т.е. в после-
mt
2
mt2
{
}
довательности
αt+1i, i ∈ N
есть отрицательный член. Утверждение П.3
доказано.
Из утверждения П.3 вытекает следствие.
Следствие. Если для процесса (8), (11) в последовательности {αi ](,i∈N}
2
нет положительных членов и Nt1 = N, то при γt+1i∈
0;
в {αt+1i, i ∈ N}
1+n
не могут быть только положительные и нулевые члены.
Другими словами, могут быть только a) отрицательные члены, б) отрица-
тельные и нулевые, в) члены с разными знаками и нулевые члены.
Для процесса (8), (11) докажем утверждение, аналогичное утверждению 4
для процесса (8), (12)
(
)
2
Утверждение П.4. Пусть γt+1i ∈
0;
(i ∈ N). Тогда справедливы
1+n
неравенства: а) 0 < Q(c)-Qt+1 < Q(c)-Qt, если αti > 0 (∀i ∈ N); б) 0 < Qt+1-
- Q(c) < Qt - Q(c), если αti ≤ 0, αt+1i ≤ 0 (∀i ∈ N).
Доказательство утверждения П.4. Первая часть утверждения
доказывается так же, как для утверждения 4, и поэтому здесь приводить не
{уд}м. {ока }ем его вторую часть. Исключая равновесие, допускаем, что в
αti
и
αt+1i
есть хотя бы один отрицательный член. Также случай, когда
Nt2 пусто, доказан в утверждении 4. Пусть Nt2 не пусто.
Суммируя по индексу i формулы (П.8) и (П.9), с учетом (13) имеем
(
)
(
)
∑
∑
∑
∑
(1 + n)
Q(c) -Qt+1
=
αt+1j =
1-1+n2γt+1
αtj +
αtj +(1+n)
qtj.
j
j∈N
j∈Nt1
j∈Nt2
j∈Nt
(
)
(
)(
2
)
(
)
∑
∑
Тогда 0 < (1 + n)
Qt+1 - Q(c)
=
-αt+1
<
1-1+n2γt+1j
-αt
+
j
j
j∈N
j∈Nt
1
(
)
(
)
(
)
(
)
∑
{
} ∑
∑
∑
+
-αt
< max
1-1+n2γt+1
-αt
+
-αt
≤
-αt
=
j
i
j
j
j
j∈Nt2
i∈Nt1
j∈Nt1
j∈Nt2
j∈N
(
)
{
}
= (n+1)
Qt -Q(c)
. Использовано, что по условию 0 < max
1-1+n2γt+1i
< 1.
i∈N
Утверждение П.4. доказано.
Приведем еще одно вспомогательное утверждение, связанное со сменой
знаков при переходе процесса (8), (11) из t-го в (t + 1)-й момент времени.
Утверждение П.5. Если в пр{цессе (8} ({1) a) неко}орый отрица-
тельный член последовательности
αti,i ∈ N
в
αt+1i,i ∈ N
станет поло-
{
}
жительным, то все положительные члены
αti,i ∈ N
сохранят свои зна-
{
}
ки в
αt+1i,i ∈ N
; б) некоторый положительный член последовательности
{
}
{
}
αti, i ∈ N
в
αt+1i, i ∈ N
станет отрицательным, то все отрицатель-
{
}
{
}
ные члены
αti, i ∈ N
сохранят свои знаки в
αt+1i, i ∈ N
129
Доказательство утверждения П.5. Докажем часть a) утвержде-
ния. Пусть k — индекс отрицательного члена, переходящего в положитель-
+1
∑
∑
ный. Пусть k ∈ Nt1. По (П.8) -j∈Ntγj
αtj +j∈Nt
qtj > 0, и поскольку для
1
2
2
положительных αti значение αt+1i рассчитывается по (П.8), то их знаки не
изменятся. Пусть k ∈ Nt2. По (П.9), учитывая что 2xtk = αtk + 2qtk ≤ 0, так-
∑
γt+1j
∑
же имеем -j∈Nt
αtj +j∈Nt
qtj > 0. Поэтому новые значения αt+1i для
1
2
2
положительных αti, рассчитанные по (П.8), будут тех же знаков. Часть a)
доказана. Часть б) утверждения доказывается аналогичным образом.
Утверждение П.5 доказано.
После доказательства вспомогательных утверждений вернемся непосред-
ственно к доказательству утверждения 6.
Вначале обратим внимание на последовательности только с отрицатель-
ными членами и нулевыми членами. Такая последовательность может в сле-
дующий момент времени перейти в последовательности 1) имеющие положи-
тельные члены, 2) не имеющие положительных членов.
Если реализуется первый случай, то последовательность только с отрица-
тельными и нулевыми членами далее не встретится. Действительно, согласно
следствию утверждению П.2 последо(ательн]сть с хотя бы одним положи-
2
тельным членом не может при γt+1i ∈
0;
перейти в последовательность
1+n
только с отрицательными и нулевыми членами. Поэтому во всех последую-
щих моментах времени будут положительные члены.
Если реализуется второй случай, то согласно утверждению П.4 0 < Qt+1 -
-Q(c) < Qt-Q(c). Опять возможно, что в (t+2)-й момент времени окажутся
только отрицательные и нулевые члены. Таким образом, последовательности
только с отрицательными и нулевыми членами могут иметь место либо в на-
чальной стадии процесса, либо на протяжении всего процесса. Последнее рас-
смотрим подробнее. Последовательное применение утверждения П.4 дает це-
почку неравенств Q0 - Q(c) > Q1 - Q(c) > . . . > Qt - Q(c) > Qt+1 - Q(c) >
... > 0 (t > 1), из которой следует Qt → Q(c). Покажем, что αti → 0 и qti → q(c)i.
Пусть αti ≤ 0 (∀i ∈ N) и вначале i ∈ Nt2. По (П.9) и (П.6) 2xt+1i = αt+1i = αti +
+1
+1
∑
∑
∑
∑
+qti -j∈Ntγj
αtj +j∈Nt
qtj
= αti + 2qti -j∈Nt γj
αtj +j∈Nt
qtj =
2
2
\i
1
2
1
2
∑
+1
∑
= 2xti -j∈Nt γj
αtj +j∈Nt
qtj > 2xti. Для i ∈ Nt1 по (П.8) и (П.6) 2xt+1i =
1
2
2
\i
(
t+1
)
+1
∑
∑
= αt+1i + 2qt+1i =
1-γi
αti -j∈Ntγj
αtj +j∈Nt
qtj + 2qti + γt+1iαti =
2
1
2
2
∑
γt+1j
∑
γt+1j
= αti + 2qt
αtj = 2xt
αtj > 2xti. Таким образом,
i
- j∈Nt1\{i}
2
i
- j∈Nt1\{i}
2
если в последующие моменты времени последовательности будут только с
отрицательными и нулевыми членами, то будут расти текущие оптималь-
ные выпуски и после некоторого t∗ окажется, что xt∗i > 0 (∀i ∈ N). Тогда при
t > t∗ будет i ∈ Nt1 = N, по (П.8) αti → 0, а по (14) qti → q(c)i. Такой процесс
сходится к статичному равновесию.
Пусть теперь αti > 0
(∀i ∈ N). Поскольку αti = 2(xti - qti), то xti > 0
∀(i ∈ N), и агенты рассчитывают свой текущий выпуск по формуле (12). То-
130
(
)
2
гда при γt+1
∈
0;1+
из утверждения П.4, справедливого для любого мо-
i
n
мента времени, следует неравенство 0 < Q(c) - Qt+1 < Q(c) - Qt, указываю-
щее на приближение к равновесию в (t + 1)-й момент времени. Если и в по-
следующие моменты знаки всех членов останутся положительными, то из
цепочки неравенств Q(c) - Qt > Q(c) - Qt+1 > . . . > Q(c) - Qt+k > Q(c) -
- Qt+k+1 > ... > 0 (k > 1) следует, что Qt → Q(c). По (П.8) αti → 0, а по (14)
qti → q(c)i (i ∈ N).
{
}
Пусть в последовательности
αti, i ∈ N
не только положительные члены.
По утверждению П.1 п{оцесс сдела}т после {ватель}е приближение к рав-
новесию, так как max
αt+1i - αt+1
< max
αti - αt
. По утверждению П.2
j
j
i,j∈N
i,j∈N
{
}
в
αt+1i, i ∈ N
есть положительные члены. Если в ней есть также отри-
цательные или нуле{ые члены, т}процесс с{лает следу}щее приближение
к равновесию max
αt+2i - αt+2
< max
αt+1i - αt+1
. Если подобная
j
j
i,j∈N
i,j∈N
ситуация повто{яется на пр}яжении{всего пр}цесса, т{по утвержд}нию П.1
имеем
max
αt+1i - αt+1
< max
αti - αt
< max
αt-1i - αt-1
<...<
j
j
j
i,j∈N
i,j∈N
i,j∈N
{
}
{
}
< max
α0i - α0
. Таким образом, max
αti - αt
→ 0 при t → ∞. Посколь-
j
j
i,j∈N
i,j∈N
ку знаки αtmt и αtMt не совпадают, если αtmt = 0,то ∀i ∈ N αti → 0 при t → ∞
и Qt → Q(c), qti → q(c)i. Процесс сходится. В дополнение отметим, что ряд
полезных результатов, связанных со сменой или сохранением знаков при
переходе процесса (8), (11) из t-го в (t + 1)-й момент времен, приведены в
утверждениях П.3 и П.5.
Сформулированные положения указываю{на сходи}ость процесса (8),
(11) при любых начальных выпусках агентов
q0i, i ∈ N
Утверждение 6 доказано.
СПИСОК ЛИТЕРАТУРЫ
1. Myerson R. Game Theory: Anaysis of Conflict. London: Harvard Univ. Press, 1991.
2. Mas-Collel A., Whinston D., Green J. Microeconomic Theory. N.Y.: Oxford Univ.
Press, 1995.
3. Novikov D.A., Chkhartishvili A.G. Reflexion and Control: Mathematical Models.
Leiden: CRC Press, 2014.
4. Новиков Д.А. Модели стратегической рефлексии // АиТ. 2012. № 1. С. 3-18.
Novikov D.A. Models of Strategic Behavior // Autom. Remote Control. 2012. V. 73.
No. 1. P. 1-19.
5. Айзенберг Н.И., Зоркальцев В.И., Мокрый И.В. Исследование нестационарных
олигопольных рынков // Сиб. журн. индустр. мат. 2017. Т. 20. № 1. С. 11-20.
6. Васин А.А., Васина П.А., Рулева П.Ю. Об организации рынков однородных
товаров //Изв. РАН. Теория и системы управления. 2007. № 1. С. 98-112.
7. Kukushkin N.S. Best Response Dynamics in Finite Games with Additive
Aggregation // Games Econom. Behavior. 2004. No. 48. P. 94-110.
8. Weihong H. Theory of adaptive adjustment // Discret. Dynam. Nature Soc. 2000.
V. 5. No. 4. Р. 247-263.
131
9.
Алгазин Г.И., Алгазина Д.Г. Информационное равновесие в модели динамики
коллективного поведения на конкурентном рынке // Управление большими си-
стемами. 2016. № 64. С. 112-136.
10.
Kamalinejad H., Majda V.J., Kebriaei H., Kian A.R. Cournot Games with Linear
Regression Expectations in Oligopolistic Markets // Math. Comput. Simulat. 2010.
V. 80. No. 9. Р. 1874-1885.
11.
Gao X., Zhong W., Mei S. Convergence of a Cournot Oligopoly Game with
Extrapolative Expectations. Southeast University. China, 2012.
12.
Новиков Д.А., Чхартишвили А.Г. Модели рефлексивных игр в задачах управ-
ления эколого-экономическими системами // Управление большими системами.
2015. № 55. С. 362-372.
13.
Корепанов В.О. Управление рефлексивным поведением агентов в модели оли-
гополии Курно // Управление большими системами. 2010. № 31. С. 225-249.
14.
Yang H., Zhang Y. Complex Dynamics Analisis for Cournot Game with Bounded
Rationality in Power Market // J. Electromagnet. Anal. & Appl. 2009. No. 1.
P. 48-60.
15.
Agiza H.N., Elsadany A.A. Chaotic Dynamics in Nonlinear Duopoly Game with
Heterogeneous Players // Appl. Math. Comput. 2004. V. 149. No. 4. P. 843-860.
16.
Bischi G.I., Kopel M. Equilibrium Selection in a Nonlinear Duopoly Game with
Adaptive Expectations // J. Econom. Behavior & Organ. 2001. No. 46. P. 73-100.
17.
Гераськин М.И., Чхартишвили А.Г. Анализ игровых моделей рынка олигополии
при ограничениях по мощности и конкурентоспособности агентов // АиТ. 2017.
№ 11. С. 105-121.
Geras’kin M.I., Chkhartishvili A.G. Analysis of Game-Theoretic Models of an
Oligopoly Market under Constrains on the Capacity and Competitiveness of
Agents // Autom. Remote Control. 2017. V. 78. No. 11. P. 2025-2038.
18.
Дюсуше О.М. Статическое равновесие Курно-Нэша и рефлексивные игры оли-
гополии: случай линейных функций спроса и издержек // Эконом. журн. ВШЭ.
2006. № 1. С. 3-32.
19.
Алгазин Г.И., Алгазина Д.Г. Коллективное поведение в модели Штакельберга
в условиях неполной информации // АиТ. 2017. № 9. C. 91-105.
Algazin G.I., Algazina D.G. Collective Behavior in the Stackelberg Model under
Incomplete Information // Autom. Remote Control. 2017. V. 78. No. 9. P. 1619-
1630.
20.
Puu T. Attractors, Difurcations, & Chaos: Nonlinear Phenomena in Economics.
Berlin: Heidelberg, 2003.
21.
Matsumoto A. Controlling the Cournot-Nash Chaos // J. Optim. Theory Appl. 2006.
V. 128. No. 2. P. 379-392.
22.
Васин А.А. Модели динамики коллективного поведения. М.: Изд-во МГУ, 1989.
23.
Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения.
М.: Наука, 1977.
24.
Беленький В.З., Волконский В.А. Иванков С.А. др. Итеративные методы в тео-
рии игр и программировании. М.: Наука, 1974.
25.
Гераськин М.И. Моделирование рефлексии в нелинейной модели трехагентной
олигополии Штакельберга для телекоммуникационного рынка России // АиТ.
2018. № 5. С. 83-106.
132
Geras’kin M.I. Modeling Reflection in the Non-Linear Model of the Stakelberg Three-
Agent Oligopoly for the Russian Telecommunication Market // Autom. Remote
Control. 2018. V. 79. No. 5. P. 841-859.
26. Cournot A. Researches into the Mathematical Principles of the Theory of Wealth.
London: Hafner, 1960. (Original 1838.)
27. Frisch R. Monopoly-Polypoly-the Concert of Force in the Economy // Internat.
Econom. Papers. London-N.Y., 1951. No. 1. P. 23-36. (Original 1933.)
28. Nash J. Non-Cooperative Games // Ann. Math. 1951. No. 54. P. 286-295.
29. Малишевский А.В. Качественные модели в теории сложных систем. М.: Наука,
1998.
Статья представлена к публикации членом редколлегии Д.А. Новиковым.
Поступила в редакцию 14.08.2018
После доработки 29.10.2019
Принята к публикации 28.11.2019
133