Автоматика и телемеханика, № 2, 2020

Управление в социально-экономических

системах

(Алтайский государственный университет, Барнаул),

Ю.Г. АЛГАЗИНА, канд. эконом. наук (algazina@inbox.ru)

(Алтайский государственный технический

университет им. И.И. Ползунова, Барнаул)

РЕФЛЕКСИВНАЯ ДИНАМИКА В УСЛОВИЯХ

НЕОПРЕДЕЛЕННОСТИ ОЛИГОПОЛИИ КУРНО

Представлена модель динамического поведения на рынке Курно в клас-

се линейных функций спроса и издержек агентов. Агенты, наблюдая сло-

жившееся состояние рынка и учитывая текущие экономические ограни-

чения, в динамике от игры к игре уточняют объемы выпуска, делая шаги

в направлении текущего положения своей цели. Получены достаточные

условия на величины шагов, выбираемые агентами независимо друг от

друга, для сходимости динамики к статичному равновесию Курно-Нэша.

Ключевые слова: олигополия, неполная информированность, рефлексив-

ное поведение, равновесие Курно-Нэша, условия сходимости.

DOI: 10.31857/S0005231020020087

1. Введение

Наблюдая текущее состояние рынка, агент может убедиться в том, что

его объемы выпуска продукции не являются оптимальными. К такому выво-

ду могут прийти не один, а несколько или сразу все, конкурирующие друг с

другом объемами выпуска, агенты. Естественно, что у каждого из них возни-

кает желание уточнить свой объем выпуска так, чтобы он был оптимальным

ответом на действия остальных агентов. Если это удастся сделать всем аген-

там, то при отсутствии кооперации на рынке выбранные объемы выпуска

будут равновесными, так как агенты не будут заинтересованы, чтобы в оди-

ночку изменить их (см., например, [1-4]). Агент принимает решение на основе

доступной ему информации. Поскольку в олигополии состояние рынка зави-

сит от действий всех агентов, то в условиях неполной информированности он

вынужден рефлексировать, т.е. предсказывать их действия.

Исследование моделей олигополии Курно с учетом неполноты информиро-

ванности агентов приводит к возникновению различных моделей рефлексии,

выявлению условий существования равновесия, его единственности и сходи-

мости к нему динамики.

Рефлексивное поведение в моделях олигополии с реакцией фирм по Курно

обсуждается при различных предпосылках. Динамика изучается в непрерыв-

115

ном [5, 6] или дискретном времени [7-14]. Функции полных издержек аген-

тов предполагаются нелинейными [10-17] или линейными [9, 18, 19], функ-

ции спроса, предпочтительно, линейными. Особенности моделирования ди-

намики поведения по Курно с применением рефлексивных игр с различным

порядком (одновременным, последовательным, последовательно-групповым,

хаотичным) ходов игроков можно найти в [7, 18, 20, 21]. Возможности измене-

ния правил поведения или ранга рефлексии агентов обсуждается в [3-5, 13].

Исходная информация для развития динамики может быть представлена из-

вестными всем агентам функциями издержек или целевыми функциями кон-

курентов [12, 13], текущими действиями или состояниями конкурентов [3, 6,

10-15, 19], текущей рыночной ценой и эластичностью спроса [5, 9] и т.д.

Результаты исследований сходимости динамик представлены в различных

формах. В [5] они получены в виде функций предложения, приводящих к

равновесию с использованием динамических имитационных моделей в непре-

рывном времени. В [18] обсуждаются условия сходимости для процессов ре-

флексии с различным порядком ходов. В [8, 22-24] можно найти условия

сходимости, области притяжений, условия на величины шагов, обеспечиваю-

щих сходимость динамики коллективного поведения при предположениях,

что каждому агенту при продвижении к цели надо знать текущие действия

или состояния всех агентов. В [7, 10, 11] аналогичные условия рассмотрены

для других видов динамик. В [3, 4, 25] ставится задача определения равнове-

сий и управления поведением агентов с применением метода рефлексивных

разбиений, а в [13] для частного случая рефлексивного управления показа-

на возможность применения этого метода для управления рыночной ценой и

формулируются условия приведения рынка к равновесной цене. В [17] форму-

лируются условия равновесия Нэша для процесса последовательных реакций

при текущих ограничениях по мощности и конкурентоспособности агентов.

В [9] получены достаточные условия сходимости к равновесию модели коллек-

тивного поведения, с помощью которой агенты уточняют свои представления

о предельных издержках конкурентов. В [20, 21] дается анализ «хаотичных»

процессов поведения фирм с реакцией по Курно при динамическом взаимо-

действии. В [14-16, 18] условия сходимости динамик получены только для

случая дуополии.

Работы в этом направлении остаются актуальными ввиду значимости про-

блемы сближения теоретических моделей равновесий Нэша с эмпирическими

параметрами состояний реальных рынков олигополии.

В настоящей статье основное внимание уделяется анализу традиционных

моделей рефлексии; построению адекватного процесса рефлексии, учитываю-

щего недостатки традиционных; условиям и аналитическим оценкам сходи-

мости этого процесса. Во внимание принимаются такие экономические кате-

гории, как конкурентоспособность и убыточность агентов, а также начальное

состояние рынка.

Теоретической основой динамического процесса являются теория рефлек-

сивных игр и теория коллективного поведения. Их подходы дополняют друг

друга тем, что в условиях неполной информированности агентов и неадек-

ватности предсказаний действий конкурентов рефлексивные игры позволяют

116

использовать процессы коллективного поведения и результаты размышлений

игроков, приводящие к равновесию [3, 4].

2. Базовая модель олигополии

Пусть i ∈ N = {1, . . . , n} — множество агентов, конкурирующих на рынке

объемами выпуска однородной продукции. Каждый агент продает произве-

денный им выпуск q_i по единой рыночной цене p(Q), которая определяется_∑

общим объемом выпуска Q =_i∈N q_i. Действия агентов направлены на мак-

симизацию собственной прибыли:

(1)

Π_i(p(Q),q_i) = p(Q)q_i - φ_i(q_i) → max,

i∈N.

q_i

Цена p(Q) и полные издержки фирм φ_i(q_i) заданы линейными функциями

(2)

p(Q) = a - bQ, φ_i(q_i) = c_iq_i + d_i

i∈N,

где a, b — параметры спроса, c_i, d_i — предельные и постоянные издержки

фирм.

Предпосылки базовой модели: 1) дискретность процесса; 2) однородность

продукции; 3) конкуренция объемами выпусков, весь выпуск реализуется;

4) единая рыночная цена; 5) произвольное число агентов на рынке; 6) линей-

ность функций спроса и полных затрат агентов, имеющих различные пре-

дельные издержки; 7) отсутствие ограничений мощности и коалиций; 8) ра-

циональное поведение агентов, направленное на максимизацию собственной

прибыли; 9) одновременный порядок ходов.

3. Анализ и постановка проблемы

Агенты вынуждены прибегать к рефлексии, если в базовой модели отсут-

ствует общее знание относительно множества агентов, множеств их допусти-

мых действий, параметров и целевых функций конкурентов. Традиционный

процесс пошаговой рефлексии предполагает, что агенты выбирают оптималь-

ный отклик в соответствии со своей функцией реакции.

∕

Оптимальный отклик i-го агента находится из условия ∂Π_i

∂q_i = 0 с уче-

том (2)

h_i - Q_-i

(3)

q_i =

∕

(i ∈ N),

2+∂Q_-i

∂q_i

где использованы обозначения:

a-c_i

(4)

h_i =

∑

(5)

Q_-i = q_j.

j=i

117

Согласно предположению Курно [26] относительно объемов выпуска каж-

дая фирма действует так, что не ожидает от своих конкурентов изменения

объемов выпуска, даже если сама сделает это. Формально его можно запи-

сать в виде условий равенства нулю предположительных вариаций [26, 27]

∂q_j = 0, i = j; i,j ∈ N. Отсюда

∂q_i

∂Q_-i

(6)

= 0, i ∈ N.

∂q_i

Если система условий (3)-(6) имеет решение, то состояние, в которое при-

ходит рынок, когда агенты выбирают в качестве своей стратегии это решение,

называется равновесием Курно [26]. Для базовой модели олигополии это со-

стояние является равновесием Нэша [28].

Тогда из (3) и (6) имеем выражение для оптимального отклика (см., на-

пример, [18])

h_i - Q_-i

(7)

q_i =

Преобразуем (1) с учетом (2) к виду Π_i = b(h_i - Q_-i - q_i)q_i - d_i. При ожи-

даниях h_i - Q_-i > 0 агент выбирает положительный выпуск, который опре-

деляется выражением (7). При ожиданиях h_i - Q_-i ≤ 0 положительный вы-

пуск дает отрицательную валовую прибыль (т.е. прибыль без учета постоян-

ных издержек d_i) и, чтобы минимизировать потери, агент выбирает нулевой

выпуск.

Рекуррентные соотношения соответствующей многошаговой рефлексив-

ной игры, предложенной в [18], имеют вид:

1. Каждый из агентов независимо от других, используя наблюдаемые вы-

пуски каждого агента q^ti и полагая, что в текущем (t + 1)-м моменте вре-

мени все остальные агенты выберут те же действия, как и в предыдущем

t-м моменте, на основе (7) рассчитывает свой текущий оптимальный выпуск

(оптимальный отклик на действия конкурентов) x^ti по формуле

(8)

x^ti =

(h_i - Q^t-i

Здесь i ∈ N, t = 0, 1, 2, . . . — моменты времени (периоды, номера партий

или сеансы игры и пр.). Начальный вектор выпусков q⁰ = (q⁰¹, . . . , q0n) счита-

ется заданным. Остальные правила игры определяются условиями базовой

модели олигополии 1)-9) в разделе 2.

2. Каждый агент изменяет свой выпуск за предыдущий t-й момент времени

по формуле

^{ x^ti, x^ti > 0;

(9)

qt+1i =

(i ∈ N; t = 0, 1, 2, . . .).

0, x^ti ≤ 0

Затем процесс повторяется с п.1.

118

Условно процесс (8)-(9) определим как вариант 1 рефлексивной игры.

Достоинства такого процесса: целевая направленность, агент в каждый

момент выбирает наилучший ответ, экономическая содержательность про-

цесса, выраженная в том, что гарантируются неотрицательный текущий вы-

пуск (конкурентоспособность) и неотрицательная текущая валовая прибыль

агентов.

Недостатки процесса: плохо поддается аналитическому исследованию схо-

димость процесса в зависимости от параметров и начального состояния рын-

ка, поэтому как основной используется метод численного моделирования;

численными экспериментами показано [18], что «при числе фирм не больше

двух процесс сходится, иначе расходится»; текущая цена товара может быть

ниже предельных издержек, что приводит к убыткам агента и ставит под

сомнение целесообразность продолжения его участия в процессе. Возможна

отрицательная текущая цена. Имеется возможность зацикливания процесса,

препятствующего достижению агентами равновесия, что иллюстрируется на

следующем простом примере. Здесь и далее верхним индексом “(c)” обозна-

чим показатели в статическом равновесии Курно-Нэша для базовой модели.

Пример 1. Пусть q⁰ = (0,...,0). Тогда по (8) и (9) получим q1i = hi

∑

h_i - Q1-i = h_i -12j=i h_j. Пусть также все агенты имеют одинаковые пре-

дельные издержки, c_i = c, i ∈ N. Тогда h_i = h и h_i - Q1-i =(3-n)h2 . При n = 3

имеем h_i - Q1-i = 0, при n > 3 имеем h_i - Q1-i < 0 для i ∈ N и q² = (0, . . . , 0).

Процесс вернулся в исходное состояние, очевидно, что q⁰ = (0, . . . , 0) = q² =

(_h

)

=q⁴ =... и q¹ =

,...,h2

=q³ =q⁵ =

При этом статичное равновесие

q(c) =a-c(1+n)b =h1+n, как решение (3)-(6) не достигается. Зацикливание так-

же может иметь место, если взять начальный вектор с малыми компонен-

∑

тами. Пусть q⁰ = (ε, . . . , ε). Тогда q1i =hi-(n-1)ε2 и h_i - Q1-i = h_i -¹

h_j+

j=i

+(n-1)2ε₂. Для случая одинаковых предельных издержек всех агентов 2x1i =

= h_i - Q1-i = (3-n)h2 + (n-1)2ε₂. Так, при n > 3 зацикливание будет, если x1i ≤ 0,

т.е. ε ≤(n-3)h(n-1)2 . При n = 2 и нулевом начальном векторе агентов с различными

предельными издержками имеем

(

)

(

)

h_i

h₂

h₁

q1i =

q²¹ = x¹¹ =

h₁ -

q(c)1, q²² = x¹² =1

h₂ -

q(c)2,

(

)

(

)

h₂

h₁

⁽3

q³¹ = x²¹ =

h₁ - q²²

h₁ -

q(c)1 +h1

h₁ +

q(c)1,

(

)

q³² = x²² =

h₂ - q²¹

h₂ +

q(c)2

и т.д.

Зацикливания не происходит. Здесь использовано, что q(c)1 =13b (a - 2c₁ + c₂)

иq(c)2 =

(a + c₁ - 2c₂) есть решение (3)-(6) при n = 2.

Для аналитического исследования динамики рефлексии нередко применя-

ются технически более удобные рекуррентные соотношения, когда вместо (9)

119

используется следующая формула (вариант 2 рефлексивной игры)

(10)

qt+1i = x^ti

(i ∈ N; t = 0, 1, 2, . . .).

Как отмечается в [18], тогда «имеют место адаптивные ожидания, кото-

рые нерациональны в том смысле, что выпуск конкурентов на текущем шаге

изменяется и, в общем, не соответствует ожиданиям. В этом случае фирма не

попадает на свою функцию реакции». Также для такого процесса не гаранти-

руются текущие неотрицательные выпуски, положительная валовая прибыль

агентов, положительная цена товара.

Хотя факт того, что процессы (8), (9) и (8), (10) сходятся или расходятся

одновременно, формально не доказан, но численным моделированием для

(8), (9) и аналитически для (8), (10) показывается [18], что при n = 2 как тот,

так и другой варианты процесса сходятся при любых начальных условиях, а

при n > 2 расходятся.

С учетом достоинств и недостатков рассмотренных традиционных схем

пошаговой рефлексии, в настоящей статье предложены их модификации, ко-

торые представлены в следующем разделе.

4. Адаптивная динамика в модели олигополии Курно

Отсутствие сходимости является основным недостатком рассмотренных

традиционных схем пошаговой рефлексии. Поэтому авторами предложены их

модификации, в основу которых положена адаптивная динамика движения

агентов к цели.

Рассмотрим динамический процесс (вариант 3), в котором в каждый мо-

мент каждый из агентов рассчитывает свое текущее положение цели и изме-

няет свое состояние в направлении текущего положения цели:

1. Каждый из агентов независимо от других, используя наблюдаемые вы-

пуски каждого агента q^ti и полагая что в текущем (t + 1)-м моменте време-

ни все остальные агенты выберут те же действия, как и в предыдущем t-м

моменте, рассчитывает свой текущий оптимальный выпуск x^ti по прежней

формуле (8).

Начальный вектор выпусков q⁰ также считается заданным, а остальные

правила игры определяются условиями 1)-9) в разделе 2.

2. Каждый агент изменяет свой выпуск за предыдущий t-й момент време-

ни, делая от него шаг по направлению к текущему оптимальному выпуску x^ti

по формуле

{

q^ti + γt+1i(x^ti - q^ti), x^ti > 0;

(11)

qt+1i =

x^ti ≤ 0.

Здесь: i ∈ N; t = 0, 1, 2, . . .; γt+1i ∈ [0; 1] — параметры, определяющие величи-

ны шагов. Условия (11) гарантируют, что выпуск qt+1i и валовая прибыль

агента не могут быть отрицательными.

Затем процесс повторяется с п.1.

120

Если (11) заменить на формулу

(12)

qt+1i = q^ti + γt+1i(x^ti - q^ti

) (i ∈ N; t = 0, 1, 2, . . .),

то получим соответствующий варианту 2 аналог рефлексивной игры. Назо-

вем его вариант 4. Он характерен для таких процессов, когда агенты имити-

руют автоматы, формально выполняя выбор действий, невзирая на возмож-

ные текущие отрицательные выпуски, отрицательные цены и убытки. Хотя,

в конечном счете, процесс может быть сходящимся [9, 19]. В теории коллек-

тивного поведения (12) описывает динамику выбора решений, основанного

на аксиоме индикаторного поведения [4, 23, 24].

Примечание: варианты 1 и 2 процессов можно рассматривать как частные

случаи вариантов 3 и 4 соответственно при γt+1i ≡ 1; в последних же допус-

кается «неполный» щаг.

5. Результаты и обсуждение

Аналитическое исследование варианта 3 рефлексивной игры (динамиче-

ского процесса (8), (11)) представляет не меньшую сложность, чем вариан-

та 1, для которого основным является метод численного моделирования. Оно

также существенно сложнее, чем для варианта 4 (процесса (8), (12)).

Поэтому основная идея статьи состоит в том, чтобы найти условия схо-

димости для процесса (8), (12), в котором в отличие от процесса (8), (11)

агенты не обнуляют свой выпуск, если x^ti ≤ 0. Затем обобщить полученные

результаты на динамику (8), (11).

Введем в рассмотрение функции-индикаторы [29, с. 49], характеризующие

отклонения текущих выпусков от текущих оптимумов, вида α^ti = 2(x^ti - q^ti).

Присутствие коэффициента «2» объясняется последующими удобствами. Ис-

пользуя (11), а также то, что по (7) h_i = Q(c) + q(c)i, имеем

(13)

α^ti = Q(c) + q(c)i - Q^t - q^ti.

Равенство нулю отдельных α^ti еще не означает, что агенты достигли рав-

новесия. В равновесии все α^ti равны нулю и из соответствующей однородной

системы уравнений (13) находится, что q^ti = q(c)i. Ниже будет показана важ-

{

}

ная роль, которую играет также выражение max

α^ti - α^t

в исследовании

i,j∈N

и доказательстве сходимости процессов.

В Приложении приводятся доказательства следующих утверждений.

Утвер}ждение 1. Если для процесса (8), (12) в последовательности

{

α^ti, i ∈ N

имеются не только положительные члены, то

{

}

{

}

max

αt+1i - αt+1

< max

α^ti - α^tj

i,j∈N

Ут{вержде}ие 2. Если для процесса

(8),

(12) в последовательно-

сти

α^ti, i ∈ N

имеются не только положительные члены, то при

121

(

]

{

}

γt+1

∈

0;₁₊

в последовательности

αt+1i, i ∈ N

есть члены с разными

знаками.

{

}

Утверждение 3. Если в последовательности

α⁰, i∈N

имеются не

(

]

только положительные члены, то при γt+1i ∈

(t = 0, 1, 2, . . .) про-

1+n

цесс (8), (12) сходится.

Следующее утв{рждение т}кже связано с начальными условиями процесса

(8), (12), когда в

α0i, i ∈ N

все члены: а) положительны, б) меньше или

равны нулю.

(

)

Утверждение 4. Пусть γ1i ∈

(i ∈ N). Тогда справедливы нера-

1+n

венства: а) 0 < Q(c) - Q¹ < Q(c) - Q⁰, если α0i > 0 (i ∈ N); б) 0 < Q¹ - Q(c) <

< Q⁰ - Q(c), если α0i ≤ 0 (i ∈ N).

Примечания. 1. Если α0i = 0 (∀i ∈ N), то исходное состояние уже является

равновесным. 2{Утвержд}ние 4 имеет место также для любого момента вре-

мени t, если в

α^ti, i ∈ N

все α^ti > 0 или все α^ti ≤ 0. 3) Неравенства можно



_Q(c)_-Q1

_<

_Q(c)_-Q0

_.

записать одним неравенством

Основной результат работы для процесса (8), (12) сформулирован в сле-

дующем утверждении.

(

)

Утверждение 5. При γt+1i ∈

(i ∈ N; t = 0, 1, 2, . . .) процесс

1+n

{

}

(8), (12) сходится при любых начальных выпусках агентов

q0i, i ∈ N

Следующий основной результат работы относится к процессу (8), (11), в

котором агенты обнуляют свой выпуск при x^ti ≤ 0.

(

)

Утверждение 6. При γt+1i ∈

(i ∈ N; t = 0, 1, 2, . . .) процесс

1+n

{

}

(8), (11) сходится при любых начальных выпусках агентов

q0i, i ∈ N

Доказательство утверждения 6, формулировки и доказательства вспо-

могательных утверждений П.1-П.5 приведены в Приложении. Результаты,

сформулированные в виде вспомогательных утверждений, используются при

доказательстве основного утверждения 6 и отчасти повторяют результаты

утверждений 1-4, но вместе с тем их доказательства имеют отличия в виду

специфики процесса (8), (11). Ниже показан пример этого процесса.

Пример 2. Исходные данные: на рынке с параметрами a = 100, b = 0,1

присутствуют три агента с предельными издержками c₁ = 10, c₂ = 20, c₃ = 40

соответственно. По (4) имеем h = (900, 800, 600). В табл. 1 и табл. 2 представ-

лены начальный и завершающий фрагменты процесса.

Согласно (12) на 1-й итерации q₂ = q₃ = 0, поскольку на 0-й x₂ = 0, x₃ < 0;

а на 2-й, 3-й и 7-й итерациях q₃ = 0, поскольку на 1-й, 2-й и 6-й итерациях

x₃ < 0. В этих случаях параметр γ не используется и поэтому его значения

в таблице отсутствуют. Чтобы получить сходящийся процесс, значения па-

раметра γ для n = 3 выбраны в диапазоне (0; 0,5). Начиная с 1-й итерации

{

}

max

α^ti - α^t

монотонно убывает по t, поскольку αt1, αt2, αt3 не одного знака

i,j∈N

122

Таблица 1. Начальные итерации процесса (8), (11) для трех агентов

Текущие

Значения

Параметры

выпуски

цели

функций-

шагов

агентов

индикаторов

q₁

q₂

q₃

x₁

x₂

x₃

α₁

α₂

α₃

γ₁

γ₂

γ₃

0 750,0

100, 50,0 375,0

0,0

-125,0 -750,0 -200,0 -350,0

550,0

1 675,0

0,0

0,0 450,0 62,5

-37,5

-450,0

125,0

-75,0

0,2

575,0

2 585,0 25,0

0,0 437,5 107,5

-5,0

-295,0

165,0

-10,0

0,4

460,0

3 548,1 49,8

0,0 425,1 125,9

1,1

-246,0

152,4

2,1

0,25 0,3 0,25 398,4

4 517,4 72,6

0,3 413,5 141,2

5,0

-207,7

137,1

9,4

0,25 0,3

0,3

344,8

5 501,8 86,3

1,3 406,2 148,5

5,9

-191,2

124,3

9,4

0,15 0,2

0,2

315,5

6 492,2 114,3 1,3 392,2 153,3

-3,3

-200,0

77,9

-9,0

0,1 0,45

278,0

7 452,2 122,1 0,0 389,0 173,9

12,8

-126,6

103,6

25,7

0,4

0,2 0,35 230,2

8 426,9 142,8 5,1 376,0 184,0

15,1

-101,8

82,3

20,0

0,4

184,1

9 406,6 161,3 9,1 364,8 192,1

16,1

-83,6

61,6

13,8

0,4 0,45 0,4

145,2

Таблица 2. Завершающие итерации сходящегося процесса (8), (11) для трех агентов

Текущие

Значения

Параметры

выпуски

цели

функций-

шагов

агентов

индикаторов

q₁

q₂

q₃

x₁

x₂

x₃

α₁

α₂

α₃

γ₁

γ₂

γ₃

329,8

221,6

23,7

327,3

223,3

24,3

-4,9

3,3

1,2

0,25

0,35

0,2

8,2

329,1

222,1

24,0

327,0

223,4

24,4

-4,4

2,7

0,8

0,25

0,3

0,4

7,1

328,3

222,7

24,1

326,6

223,8

24,5

-3,3

2,2

0,9

0,4

0,48

0,2

5,5

327,9

223,1

24,2

326,3

224,0

24,5

-3,0

1,8

0,6

0,25

0,3

0,4

4,8

327,5

223,4

24,3

326,1

224,1

24,5

-2,7

1,3

0,5

0,25

0,4

0,3

4,1

327,1

223,6

24,4

326,0

224,2

24,6

-2,3

1,2

0,5

0,25

0,3

0,2

3,5

326,6

223,9

24,5

325,8

224,5

24,7

-1,6

1,2

0,6

0,45

0,4

2,8

326,4

224,0

24,5

325,7

224,5

24,8

-1,4

1,1

0,5

0,25

0,2

0,25

2,4

326,1

224,2

24,6

325,6

224,6

24,8

-1,1

0,8

0,4

0,45

0,4

1,9

326,0

224,3

24,7

325,5

224,7

24,9

-0,9

0,8

0,4

0,25

0,2

0,22

1,7

для каждого t ≥ 1. Процесс сходится к q(c) = (325, 225, 25), как показано в



табл. 2. Критерий останова процесса в примере

q⁽

-q^ti ≤ 1.

6. Заключение

Проведено исследование процессов рефлексивного поведения в традици-

онной теоретико-игровой модели конкурентного рынка Курно в классе ли-

нейных функций спроса и издержек агентов. Получены следующие основные

результаты:

— предложен адаптивный процесс рефлексивного коллективного поведе-

ния, учитывающий текущую информированность и экономические ограни-

чения агентов, обобщающий традиционные процессы рефлексии в условиях

неполного знания;

123

— представлены аналитические исследования процесса. Получены доста-

точные условия на выбор агентами независимо друг от друга величин те-

кущих шагов для сходимости в дискретном времени процесса к статичному

равновесию Курно-Нэша. Доказаны соответствующие утверждения.

ПРИЛОЖЕНИЕ

Доказательство утверждения 1. По (8) x^ti - q^ti = ¹²(h_i - Q^t - q^ti)

и по (7) h_i = Q(c) + q(c)i. С учетом (13) x^ti - q^ti =αi2.Тогдаперепишем(12)в

виде

γt+1i

(Π.1)

qt+1i = q^ti +

α^ti.

Из (13) и (П.1) имеем

(

)

γt+1i

(Π.2)

αt+1i =

α^ti + Q^t - Qt+1.

Тогда

(

)

(

)

γt+1i

γt+1j

(Π.3)

αt+1i - αt+1j =

α^ti -

α^tj.

{

}

{

}

Обозначим αt+1

= max

αt+1i, i ∈ N

и αt+1

= min

αt+1i, i ∈ N

. То-

Mt+1

mt+1

гда по (П.3)

(

)

(

)

t+1

γ_M

t+1

γt+1

mt+1

αt+1

-αt+1

αtMt+1 -

αtmt+1.

Mt+1

mt+1

Но αtMt+1 ≤ αtMt > 0 и 0 ≥ αtmt ≤ αtmt+1 . Поэтому

{

}

{

}

max

αt+1i - αt+1

=αt+1

-αt+1

< α^tMt - α^tmt = max

α^ti - α^tj

Mt+1

mt+1

i,j∈N

Что и требовалось доказать.

Доказательство утверждения 2. Для процесса (8), (12) из (П.1)

имеем

∑

γt+1j

(Π.4)

Qt+1 = Q^t +

α^tj.

j∈N

Соответственно, (П.2) представимо в виде

(

)

γt+1i

∑

γt+1j

(Π.5)

αt+1i =

α^ti -

α^tj.

j∈N

124

Из (П.5) получаем, что

⎛

⎞

(

)

t+1

∑

γ_m

γt+1j

γt+1mt

αt+1mt <

α^tmt - α^t

=α^t

⎝1-

⎠_.

m^t

j∈N

∑

γt+1j

γt+1

По условию α^t

≤ 0, и если 1 -_j∈N

≥ 0, то αt+1mt < 0, т.е. в по-

m^t

{

}

^mt2

следовательности

αt+1i, i ∈ N

есть отрицательный член.

С другой стороны, также по (П.5) имеем, что

⎛

⎞

(

)

t+1

∑

γ_M

γt+1j

γt+1Mt

αt+1Mt >

α^tMt - α^t

=α^t

⎝1-

⎠_.

M^t

j∈N

∑

γt+1j

γt+1

По предположению α^t

> 0, и если 1 -_j∈N

> 0, то αt+1Mt > 0, т.е.

{

}

в последовательности

αt+1i, i ∈ N

есть положительный член.

Таким об(азом, ]сли для каждого агента выбор параметра ограничить

{

}

диапазоном

, то в последовательности

αt+1i, i ∈ N

будут члены с

1+n

разными знаками.

Утверждение доказано.

Доказательство утвержд {ния 3. }огласно утверждению 2 для

каждого t > 0 в последовательности

α^ti, i ∈ N

будут члены с разными зна-

ками. Тогда по утверждению 1 имеем

{

}

{

}

max

αt+1i - αt+1

< max

α^ti - α^tj

i,j∈N

{

}

{

}

< max

αt-1i - αt-1

< ... < max

α0i - α0j

i,j∈N

{

}

Таким образом, max

α^ti - α^t

→ 0 при t → ∞. Поскольку знаки αtmt и αtMt

i,j∈N

не совпадают, если αtmt = 0, то α^ti → 0 при t → ∞ и Q^t → Q(c), q^ti → q(c)i.

Утверждение 3 доказано.

Доказательство утверждения 4. По (П.5) и (13) имеем

(

)

∑

(n + 1) Q(c) - Q¹

= α1j =

j∈N

(

)

{

∑

}∑

1+n

γ¹

α0j < max

γ¹

α0j =

i∈N

j∈N

{

}

(

)

1+n

= max

γ¹

(n + 1) Q(c) - Q⁰

i∈N

{

}

Из условия 0 < max

1-1+n2γ1i

< 1 следует первая часть доказываемого

i∈N

утверждения. Аналогичным образом доказывается его вторая часть.

125

Доказательство утверждения 5. Возможны 3 сценария нача-

{а и разви}ия процесса (8), (12). Первый сценарий: в последовательности

α0i, i ∈ N

не только положительные члены, есть и другие (отрицательные

и/или нулевые члены). Такой процесс сходится согласно утверждению 3. Вто-

рой сценарий: процесс начинается с последовательности, в которой все α0i > 0

или все α0i < 0, и в какой-то момент времени появится последовательность с

членами разных знаков. Тогда в силу утверждения 2 все последующие по-

следовательности будут с членами разных знаков и опять в силу утвержде-

ния 3 процесс сходится. Третий сценарий: процесс начинается с последова-

тельности, в которой все α0i > 0 или все α0i < 0, и знаки всех членов после-

довательностей не меняются в течение всего процесса. Тогдасогласно твер-

_Q(c)_-Q0

_>

_Q(c)_-Q1

_>...

ждению 4 (см. примечание) для каждого t > 1



_>

...>

^Q(c) - Q^t

^Q(c) - Qt+1

 и Q^t → Q(c). По (П.2) α^ti → 0, а по

(13)

q^ti → q(c)i (i ∈ N). Процесс (8), (12) сходится к истинному равновесию.

Утверждение 5 доказано.

Примечание. Если α^ti > 0 или α^ti < 0 (∀i ∈ N), то в (t + 1)-й момент знаки

всех членов не могут измениться на противоположные. Так, если αt1 > 0, то

в условиях утверждения 5 на выбор параметров γ, как показано в ходе дока-

зательства утверждения 2, αt+1Mt > 0. Аналогично, если α^ti < 0, то αt+1mt < 0.

Доказательство утверждения 6. Доказательство начнем с вве-

дения новых обозначений и соотношений, затем докажем вспомогательные

утверждения и их следствия, опираясь на которые завершим доказательство

утверждения 6.



_xt

Обозначим: Nt1 = {i

> 0, i ∈ N}, Nt2 = {i

≤ 0, i ∈ N}. Тогда Nt1 ∩ Nt2 = ⊗

иNt1 ∪Nt2 =N.

С учетом введенных обозначений и (13) запишем (11) как

⎧

⎨

γt+1i

q^ti +

α^ti, i ∈ Nt1;

(Π.6)

qt+1i =

⎩

i∈Nt2.

Далее имеем:

∑

γt+1

∑

(Π.7)

Qt+1 = Q^t +

α^tj -

q^tj;

j∈Nt1

j∈N^t

Q(c) +q(c)i -Qt+1 -qt+1i = Q(c) +q(c)i -Q^t -q^ti -

α^ti -Qt+1 +Q^t, i ∈ Nt1;

(

)

γt+1i

αt+1i =

α^ti - Qt+1 + Q^t =

(Π.8)

(

)

∑

γt+1

∑

γt+1i

α^ti -

α^tj +

q^tj,

i∈Nt1;

j∈Nt1

j∈N^t

Q(c) + q(c)i - Qt+1 - qt+1i = Q(c) + q(c)i - Q^t - q^ti + q^ti - Qt+1 + Q^t, i ∈ Nt2;

126

∑

γt+1

∑

(Π.9)

αt+1

=α^ti +q^ti -Qt+1 +Q^t =α^ti +q^ti -

α^tj +

q^tj,

i∈Nt2.

j∈Nt1

j∈N^t

Результат, полученный в утверждении П.1, повторяет результат утвержде-

ния 1 для процесса (8), (12), однако его доказательство усложняется с введе-

нием множеств Nt1 и Nt2.

Утв{рждени} П.1. Если для процесса

(8),

(11) в последователь-

ности

α^t

i∈N

имеются не только положительные члены, то

{ i^,

}

{

}

max

αt+1i - αt+1

< max

α^ti - α^t

i,j∈N

Доказатель{тво. Возм}жно 4 случая для агентов i и j, на которых

достигается max

αt+1i - αt+1

i,j∈N

1) i, j ∈ Nt1;

2) i ∈ Nt1, j ∈ Nt2;

3) i ∈ Nt2, j ∈ Nt1;

4) i, j ∈ Nt2.

Рассмотрим первый случай. Пусть i, j ∈ Nt1. Обозначим αt+1

Mt+11

{

}

{

}

= max

αt+1i,i∈ Nt1

и αt+1

= min

αt+1i,i∈ Nt1

. По (П.8) αt+1

-αt+1

mt+11

Mt+11

mt+1

(

)

(

)

γt+1

Mt+1

mt⁺¹

αtmt+1. Но αtMt+1

≤αtMt >0 и αtmt+1 ≥

Mt+11

≥ αtmt ≤ 0. Поэтому

{

}

{

}

(Π.10) max

αt+1i - αt+1

<αtMt+1

- α^tmt < α^tMt - α^tmt = max

α^ti - α^tj

i,j∈Nt1

i,j∈N

, j ∈ Nt2. По (П.8) и (П.9)

)

t+1

имеем, что αt+1i - αt+1j =

1-γi

α^ti - (α^tj + q^tj). Или αt+1

-αt+1

Mt+11

mt+1

(

)

γt+1

(

)

t+1

{

}

- α^t

+q^t

. Здесь αt+1

= min

αt+1i, i ∈ Nt2

Mt+11

mt+12

α^t

≤ αtMt > 0. Тогда

Mt+11

{

}

{

}

(Π.11)

max

αt+1i -αt+1

< α^tMt -α^tmt+1

≤ α^tMt -α^tmt = max

α^ti -α^tj

i∈Nt1,j∈Nt2

i,j∈N

Рассмотрим следующий случай, когда i ∈ Nt2, j ∈ Nt1. По (П.8) и (П.9)₍

)

t+1

γ_j

αt+1i -αt+1j = (α^ti +q^ti)-

α^tj и, используя, что α^ti +q^ti < αtMt, имеем

⎛

⎞

(

)

γt+1

mt+11

⎠_αt

αt+1

-αt+1

= αtMt+1

+qtMt+1

-^⎝1 -

Mt+12

mt+11

mt+1

127

⎛

⎞

γt+1

mt+11

{

}

<α^t

-^⎝1 -

⎠αt

< α^tMt - α^tmt = max

α^ti - α^tj

M^t

m^t

i,j∈N

Пусть теперь i, j ∈ Nt2. Тогда по (П.9) αt+1i - αt+1j = (α^ti + q^ti) - (α^tj + q^tj).

{

}

Поскольку α^ti + q^ti = 2x^ti - q^ti ≤ 0, а αtMt > 0, то max

αt+1i - αt+1

i,j∈N^t

{

}

< max

αt+1i - αt+1

. Далее доказываемое следует из (П.11).

i∈Nt1,j∈N^t

Обобщая рассмотренные случаи, имеем, что

{

}

{

}

{

}

max

αt+1i - αt+1

= max max

αt+1i - αt+1

max

αt+1i - αt+1

i,j∈N

i,j∈Nt1

i∈Nt1,j∈N^t

⎫

⎬

{

}

{

}

{

}

max

αt+1i - αt+1

, max

αt+1i - αt+1

< max

α^ti - α^tj

i∈Nt2,j∈Nt1

i,j∈Nt2

⎭

i,j∈N

Утверждение П.1. доказано.

Следующие два утверждения П.2 и П.3 для процесса (8), (11) отчасти

повторяют утверждение 2 для процесса (8), (12).

Утверждение П.2. Если для процесса

(8), (11) в последовательно-

(

]

{

}

сти

α^ti, i ∈ N

есть положительные члены, то при γt+1i ∈

1+n

{

}

αt+1i, i ∈ N

также есть положительные члены.

(

)

t+1

∑

γt+1j

γt+1

∑

γt+1j

По (П.5) αt+1Mt >

αtMt - α^t

=αtMt

M^t

j∈Nt1

j∈N^t

(

]

γt+1

∑

γt+1j

Если γt+1i ∈

, то 1 -

> 0 и αt+1Mt > 0. Что доказывает

1+n

j∈N^t

утверждение.

Из доказанного утверждения П.2 вытекает следствие, которое может быть

полезным при исследовании хода процесса и его сходимости.

Следствие. Если для процесса (8), (11) в последовательности {α^ti,i∈N}₍

]

{

}

есть положительные члены, то при γt+1i ∈

αt+1i, i ∈ N

не мо-

1+n

гут быть только отрицательные и нулевые члены.

Другими словами, могут быть только a) положительные члены, б) поло-

жительные и нулевые, в) члены с разными знаками и нулевые члены.

Утвер}ждение П.3. Если для процесса (8), (11) в последовательности

{

α^ti, i ∈ N

есть отрицательные или нулевые члены и N^t

= N, то при

(

]

{

}

γt+1i ∈

αt+1i, i ∈ N

есть отрицательные члены.

1+n

128

Доказательство утверждения П.3. Из (П.8) получаем, что αt+1<

(

)

(

)

m^t

t+1

∑

γt+1j

∑ γt+1j

γt+1

αtmt - α^t

=α^t

1-_j∈N

. По усло-

m^t j∈N

m^t

∑

γt+1j

γt+1

вию α^t

≤ 0, и если 1 -_j∈N

≥ 0, то αt+1mt < 0, т.е. в после-

m^t

^mt2

{

}

довательности

αt+1i, i ∈ N

есть отрицательный член. Утверждение П.3

доказано.

Из утверждения П.3 вытекает следствие.

Следствие. Если для процесса (8), (11) в последовательности {αi ](,i∈N}

нет положительных членов и Nt1 = N, то при γt+1i∈

в {αt+1i, i ∈ N}

1+n

не могут быть только положительные и нулевые члены.

Другими словами, могут быть только a) отрицательные члены, б) отрица-

тельные и нулевые, в) члены с разными знаками и нулевые члены.

Для процесса (8), (11) докажем утверждение, аналогичное утверждению 4

для процесса (8), (12)

(

)

Утверждение П.4. Пусть γt+1i ∈

(i ∈ N). Тогда справедливы

1+n

неравенства: а) 0 < Q(c)-Qt+1 < Q(c)-Q^t, если α^ti > 0 (∀i ∈ N); б) 0 < Qt+1-

- Q(c) < Q^t - Q(c), если α^ti ≤ 0, αt+1i ≤ 0 (∀i ∈ N).

Доказательство утверждения П.4. Первая часть утверждения

доказывается так же, как для утверждения 4, и поэтому здесь приводить не

{уд}м. {ока }ем его вторую часть. Исключая равновесие, допускаем, что в

α^ti

αt+1i

есть хотя бы один отрицательный член. Также случай, когда

Nt2 пусто, доказан в утверждении 4. Пусть Nt2 не пусто.

Суммируя по индексу i формулы (П.8) и (П.9), с учетом (13) имеем

(

)

(

)

∑

(1 + n)

Q(c) -Qt+1

αt+1j =

1-1+n2γt+1

α^tj +

α^tj +(1+n)

q^tj.

j∈N

j∈Nt1

j∈Nt2

j∈N^t

(

)

(

)(

)

(

)

∑

Тогда 0 < (1 + n)

Qt+1 - Q(c)

-αt+1

1-1+n2γt+1j

-α^t

j∈N

j∈N^t

(

)

(

)

(

)

(

)

∑

{

} ∑

∑

-α^t

< max

1-1+n2γt+1

-α^t

≤

-α^t

j∈Nt2

i∈Nt1

j∈Nt1

j∈Nt2

j∈N

(

)

{

}

= (n+1)

Q^t -Q(c)

. Использовано, что по условию 0 < max

1-1+n2γt+1i

< 1.

i∈N

Утверждение П.4. доказано.

Приведем еще одно вспомогательное утверждение, связанное со сменой

знаков при переходе процесса (8), (11) из t-го в (t + 1)-й момент времени.

Утверждение П.5. Если в пр{цессе (8} ({1) a) неко}орый отрица-

тельный член последовательности

α^ti,i ∈ N

αt+1i,i ∈ N

станет поло-

{

}

жительным, то все положительные члены

α^ti,i ∈ N

сохранят свои зна-

{

}

ки в

αt+1i,i ∈ N

; б) некоторый положительный член последовательности

{

}

{

}

α^ti, i ∈ N

αt+1i, i ∈ N

станет отрицательным, то все отрицатель-

{

}

{

}

ные члены

α^ti, i ∈ N

сохранят свои знаки в

αt+1i, i ∈ N

129

Доказательство утверждения П.5. Докажем часть a) утвержде-

ния. Пусть k — индекс отрицательного члена, переходящего в положитель-

∑

ный. Пусть k ∈ Nt1. По (П.8) -_j∈Ntγj

α^tj +_j∈Nt

q^tj > 0, и поскольку для

положительных α^ti значение αt+1i рассчитывается по (П.8), то их знаки не

изменятся. Пусть k ∈ Nt2. По (П.9), учитывая что 2x^tk = α^tk + 2q^tk ≤ 0, так-

∑

γt+1j

∑

же имеем -_j∈Nt

α^tj +_j∈Nt

q^tj > 0. Поэтому новые значения αt+1i для

положительных α^ti, рассчитанные по (П.8), будут тех же знаков. Часть a)

доказана. Часть б) утверждения доказывается аналогичным образом.

Утверждение П.5 доказано.

После доказательства вспомогательных утверждений вернемся непосред-

ственно к доказательству утверждения 6.

Вначале обратим внимание на последовательности только с отрицатель-

ными членами и нулевыми членами. Такая последовательность может в сле-

дующий момент времени перейти в последовательности 1) имеющие положи-

тельные члены, 2) не имеющие положительных членов.

Если реализуется первый случай, то последовательность только с отрица-

тельными и нулевыми членами далее не встретится. Действительно, согласно

следствию утверждению П.2 последо(ательн]сть с хотя бы одним положи-

тельным членом не может при γt+1i ∈

перейти в последовательность

1+n

только с отрицательными и нулевыми членами. Поэтому во всех последую-

щих моментах времени будут положительные члены.

Если реализуется второй случай, то согласно утверждению П.4 0 < Qt+1 -

-Q(c) < Q^t-Q(c). Опять возможно, что в (t+2)-й момент времени окажутся

только отрицательные и нулевые члены. Таким образом, последовательности

только с отрицательными и нулевыми членами могут иметь место либо в на-

чальной стадии процесса, либо на протяжении всего процесса. Последнее рас-

смотрим подробнее. Последовательное применение утверждения П.4 дает це-

почку неравенств Q⁰ - Q(c) > Q¹ - Q(c) > . . . > Q^t - Q(c) > Qt+1 - Q(c) >

... > 0 (t > 1), из которой следует Q^t → Q(c). Покажем, что α^ti → 0 и q^ti → q(c)i.

Пусть α^ti ≤ 0 (∀i ∈ N) и вначале i ∈ Nt2. По (П.9) и (П.6) 2xt+1i = αt+1i = α^ti +

∑

+q^ti -_j∈Ntγj

α^tj +_j∈Nt

q^tj

= α^ti + 2q^ti -_j∈Nt γj

α^tj +_j∈Nt

qtj =

∑

= 2x^ti -_j∈Nt γj

α^tj +_j∈Nt

q^tj > 2x^ti. Для i ∈ Nt1 по (П.8) и (П.6) 2xt+1i =

(

t+1

)

∑

= αt+1i + 2qt+1i =

1-γi

α^ti -_j∈Ntγj

α^tj +_j∈Nt

q^tj + 2q^ti + γt+1iα^ti =

∑

γt+1j

∑

γt+1j

= α^ti + 2q^t

α^tj = 2x^t

α^tj > 2x^ti. Таким образом,

- j∈Nt₁\{i}

если в последующие моменты времени последовательности будут только с

отрицательными и нулевыми членами, то будут расти текущие оптималь-

ные выпуски и после некоторого t^∗ окажется, что xt∗i > 0 (∀i ∈ N). Тогда при

t > t^∗ будет i ∈ Nt1 = N, по (П.8) α^ti → 0, а по (14) q^ti → q(c)i. Такой процесс

сходится к статичному равновесию.

Пусть теперь α^ti > 0

(∀i ∈ N). Поскольку α^ti = 2(x^ti - q^ti), то x^ti > 0

∀(i ∈ N), и агенты рассчитывают свой текущий выпуск по формуле (12). То-

130

(

)

гда при γt+1

∈

0;₁₊

из утверждения П.4, справедливого для любого мо-

мента времени, следует неравенство 0 < Q(c) - Qt+1 < Q(c) - Q^t, указываю-

щее на приближение к равновесию в (t + 1)-й момент времени. Если и в по-

следующие моменты знаки всех членов останутся положительными, то из

цепочки неравенств Q(c) - Q^t > Q(c) - Qt+1 > . . . > Q(c) - Qt+k > Q(c) -

- Qt+k+1 > ... > 0 (k > 1) следует, что Q^t → Q(c). По (П.8) α^ti → 0, а по (14)

q^ti → q(c)i (i ∈ N).

{

}

Пусть в последовательности

α^ti, i ∈ N

не только положительные члены.

По утверждению П.1 п{оцесс сдела}т после {ватель}е приближение к рав-

новесию, так как max

αt+1i - αt+1

< max

α^ti - α^t

. По утверждению П.2

i,j∈N

{

}

αt+1i, i ∈ N

есть положительные члены. Если в ней есть также отри-

цательные или нуле{ые члены, т}процесс с{лает следу}щее приближение

к равновесию max

αt+2i - αt+2

< max

αt+1i - αt+1

. Если подобная

i,j∈N

ситуация повто{яется на пр}яжении{всего пр}цесса, т{по утвержд}нию П.1

имеем

max

αt+1i - αt+1

< max

α^ti - α^t

< max

αt-1i - αt-1

<...<

i,j∈N

{

}

{

}

< max

α0i - α⁰

. Таким образом, max

α^ti - α^t

→ 0 при t → ∞. Посколь-

i,j∈N

ку знаки αtmt и αtMt не совпадают, если αtmt = 0,то ∀i ∈ N α^ti → 0 при t → ∞

и Q^t → Q(c), q^ti → q(c)i. Процесс сходится. В дополнение отметим, что ряд

полезных результатов, связанных со сменой или сохранением знаков при

переходе процесса (8), (11) из t-го в (t + 1)-й момент времен, приведены в

утверждениях П.3 и П.5.

Сформулированные положения указываю{на сходи}ость процесса (8),

(11) при любых начальных выпусках агентов

q0i, i ∈ N

Утверждение 6 доказано.

СПИСОК ЛИТЕРАТУРЫ

1. Myerson R. Game Theory: Anaysis of Conflict. London: Harvard Univ. Press, 1991.

2. Mas-Collel A., Whinston D., Green J. Microeconomic Theory. N.Y.: Oxford Univ.

Press, 1995.

3. Novikov D.A., Chkhartishvili A.G. Reflexion and Control: Mathematical Models.

Leiden: CRC Press, 2014.

4. Новиков Д.А. Модели стратегической рефлексии // АиТ. 2012. № 1. С. 3-18.

Novikov D.A. Models of Strategic Behavior // Autom. Remote Control. 2012. V. 73.

No. 1. P. 1-19.

5. Айзенберг Н.И., Зоркальцев В.И., Мокрый И.В. Исследование нестационарных

олигопольных рынков // Сиб. журн. индустр. мат. 2017. Т. 20. № 1. С. 11-20.

6. Васин А.А., Васина П.А., Рулева П.Ю. Об организации рынков однородных

товаров //Изв. РАН. Теория и системы управления. 2007. № 1. С. 98-112.

7. Kukushkin N.S. Best Response Dynamics in Finite Games with Additive

Aggregation // Games Econom. Behavior. 2004. No. 48. P. 94-110.

8. Weihong H. Theory of adaptive adjustment // Discret. Dynam. Nature Soc. 2000.

V. 5. No. 4. Р. 247-263.

131

Алгазин Г.И., Алгазина Д.Г. Информационное равновесие в модели динамики

коллективного поведения на конкурентном рынке // Управление большими си-

стемами. 2016. № 64. С. 112-136.

10.

Kamalinejad H., Majda V.J., Kebriaei H., Kian A.R. Cournot Games with Linear

Regression Expectations in Oligopolistic Markets // Math. Comput. Simulat. 2010.

V. 80. No. 9. Р. 1874-1885.

11.

Gao X., Zhong W., Mei S. Convergence of a Cournot Oligopoly Game with

Extrapolative Expectations. Southeast University. China, 2012.

(http://www.ecocyb.ase.ro/32012/Xing%20Gao.pdf)

12.

Новиков Д.А., Чхартишвили А.Г. Модели рефлексивных игр в задачах управ-

ления эколого-экономическими системами // Управление большими системами.

2015. № 55. С. 362-372.

13.

Корепанов В.О. Управление рефлексивным поведением агентов в модели оли-

гополии Курно // Управление большими системами. 2010. № 31. С. 225-249.

14.

Yang H., Zhang Y. Complex Dynamics Analisis for Cournot Game with Bounded

Rationality in Power Market // J. Electromagnet. Anal. & Appl. 2009. No. 1.

P. 48-60.

15.

Agiza H.N., Elsadany A.A. Chaotic Dynamics in Nonlinear Duopoly Game with

Heterogeneous Players // Appl. Math. Comput. 2004. V. 149. No. 4. P. 843-860.

16.

Bischi G.I., Kopel M. Equilibrium Selection in a Nonlinear Duopoly Game with

Adaptive Expectations // J. Econom. Behavior & Organ. 2001. No. 46. P. 73-100.

17.

Гераськин М.И., Чхартишвили А.Г. Анализ игровых моделей рынка олигополии

при ограничениях по мощности и конкурентоспособности агентов // АиТ. 2017.

№ 11. С. 105-121.

Geras’kin M.I., Chkhartishvili A.G. Analysis of Game-Theoretic Models of an

Oligopoly Market under Constrains on the Capacity and Competitiveness of

Agents // Autom. Remote Control. 2017. V. 78. No. 11. P. 2025-2038.

18.

Дюсуше О.М. Статическое равновесие Курно-Нэша и рефлексивные игры оли-

гополии: случай линейных функций спроса и издержек // Эконом. журн. ВШЭ.

2006. № 1. С. 3-32.

19.

Алгазин Г.И., Алгазина Д.Г. Коллективное поведение в модели Штакельберга

в условиях неполной информации // АиТ. 2017. № 9. C. 91-105.

Algazin G.I., Algazina D.G. Collective Behavior in the Stackelberg Model under

Incomplete Information // Autom. Remote Control. 2017. V. 78. No. 9. P. 1619-

1630.

20.

Puu T. Attractors, Difurcations, & Chaos: Nonlinear Phenomena in Economics.

Berlin: Heidelberg, 2003.

21.

Matsumoto A. Controlling the Cournot-Nash Chaos // J. Optim. Theory Appl. 2006.

V. 128. No. 2. P. 379-392.

22.

Васин А.А. Модели динамики коллективного поведения. М.: Изд-во МГУ, 1989.

23.

Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения.

М.: Наука, 1977.

24.

Беленький В.З., Волконский В.А. Иванков С.А. др. Итеративные методы в тео-

рии игр и программировании. М.: Наука, 1974.

25.

Гераськин М.И. Моделирование рефлексии в нелинейной модели трехагентной

олигополии Штакельберга для телекоммуникационного рынка России // АиТ.

2018. № 5. С. 83-106.

132