Автоматика и телемеханика, № 7, 2022
Управление в социально-экономических
системах
© 2022 г. Е.М. СКАРЖИНСКАЯ, д-р экон. наук
(yelena.skarzhinsky@gmail.com)
(Костромской государственный университет),
В.И. ЦУРИКОВ, д-р экон. наук, канд. физ.-мат. наук
(tsurikov@inbox.ru)
(Костромская государственная сельскохозяйственная академия)
КООРДИНАЦИЯ КОЛЛЕКТИВНЫХ ДЕЙСТВИЙ
С ПОМОЩЬЮ СТРАТЕГИИ ШТАКЕЛЬБЕРГА
Статья посвящена теоретическому исследованию координации дей-
ствий членов самоуправляемого коллектива с помощью стратегии Шта-
кельберга, направленной на повышение их индивидуальных выигрышей.
Предполагается, что коллектив создает совокупный доход, возрастающий
с ростом усилий, прилагаемых каждым агентом, и подчиняющийся зако-
ну убывающей отдачи. Существующее в условиях полной автономии всех
агентов единственное равновесие по Нэшу является неэффективным по
Парето. Показано, что для перехода к Парето-предпочтительному исходу
достаточно образования в коллективе малой группы (коалиции), члены
которой доверяют друг другу и не склонны к оппортунистическому по-
ведению. Следуя коалиционной стратегии, направленной на достижение
максимума коалиционного выигрыша, члены коалиции увеличивают раз-
меры своих усилий, что приводит к росту совокупного дохода. Найдены
условия, при которых коалиция может использовать стратегию лидера по
Штакельбергу. Показано, что равновесный по Штакельбергу исход доми-
нирует по Парето над равновесными исходами Нэша как в бескоалицион-
ной игре, так и в коалиционной.
Ключевые слова: коллективные действия, координация, равновесие по
Нэшу, равновесие по Штакельбергу, эффективность по Парето, коалиция.
DOI: 10.31857/S0005231022070066, EDN: AEMECW
1. Введение
В статье исследуется деятельность самоуправляемого коллектива, создаю-
щего общий доход в результате приложения его членами индивидуальных
усилий. Цель каждого агента состоит в максимизации собственного индиви-
дуального выигрыша.
Главный источник проблем коллективных действий коренится в эгоисти-
ческих устремлениях агентов, которые в условиях действия закона убываю-
100
щей отдачи приводят к несовпадению индивидуальных оптимумов с коллек-
тивным. Следствием независимого выбора агентами объемов прилагаемых
ими усилий является равновесие Нэша, которое достигается в неэффектив-
ном по Парето исходе, что наглядно иллюстрируется моделью, известной под
названием ¾Дилемма заключенных¿ [1, 2]. Те же факторы создают пробле-
му морального риска, описанную в модели Бенгта Хольмстрёма [3], а так-
же в моделях неполного контракта Гроссмана-Харта-Мура [4, 5] и Тироля-
Фуруботна-Рихтера [6, т. 1, с. 50-54; 7, с. 293-301]. Отметим, что в моделях
неполного контракта рассматривается, как правило, взаимодействие только
двух агентов, и поэтому многие проблемы коллективных действий в них про-
сто не отражаются.
Предполагаем, что в коллективе как в большой группе агентов может
сформироваться малая группа коалиция, способная координировать уси-
лия ее участников. Цель статьи заключается в исследовании возможности
образования коалиции, использующей стратегию лидера по Штакельбергу,
для повышения эффективности коллективной деятельности.
Напомним, что первоначально модели Курно [8] и Штакельберга [9] были
разработаны для описания дуополии, но впоследствии они получили распро-
странение на произвольное количество фирм [10, 11] и на многопродуктовые
рынки [12]. Как известно, модель Штакельберга основана на отказе от сим-
метрии, положенной в основу модели Курно. В модели Штакельберга пред-
полагается, что одна из конкурирующих фирм играет роль лидера (leader),
который делает первый шаг, а другая роль последователя (follower). По-
следователь выбирает свою стратегию с учетом известной ему стратегии ли-
дера, считая ее заданной. Предварительно лидер инкорпорирует известную
ему кривую реагирования конкурента в свою функцию прибыли, в результате
чего его прибыль становится функцией только им выбираемой стратегии, и
ему остается только найти ту стратегию, при которой его прибыль достигает
максимума.
Следует отметить работы [13, 14], в которых анализируются возможно-
сти достижения олигополией равновесия по Штакельбергу в случаях, ко-
гда агенты не располагают достоверной информацией относительно разме-
ров предельных издержек конкурентов или их выбора. В модели олигополии
М.И. Гераськина [15] исследуется зависимость выигрышей агентов в равно-
весии Штакельберга от вида функций издержек. В работах Ю.Б. Гермейера
[16], М.А. Горелова [17], М.В. Губко и Д.А. Новикова [18] стратегия Штакель-
берга анализируется в рамках моделей иерархической системы типа Центр-
агент. Система представляется двумя игроками, один из которых играет роль
Центра, ограничивающего своим первым ходом множество возможных дей-
ствий второго (пассивного) игрока. Задача решается, как правило, в общем
виде, и в качестве одного из возможных вариантов анализируется стратегия
Штакельберга. При этом выигрыш пассивного агента явно зависит только от
его собственного выбора.
101
При распространении разработанной для олигополистического рынка мо-
дели Штакельберга на коллективные действия следует учитывать принципи-
альное различие между коллективом, целью деятельности которого является
производство общего блага, и олигополией. В частности, для коллективных
действий характерны отношения сотрудничества, а для олигополии отно-
шения конкуренции. Соответственно, каждый член коллектива заинтересо-
ван в высокой активности своих партнеров, в то время как любой фирме в
условиях олигополии, напротив, выгодна низкая активность конкурентов.
В работе Д.А. Новикова [19] рассматривается класс задач о минимизации
издержек коллектива, выполняющего работы в заданном объеме, при различ-
ных предположениях относительно иерархии представлений агентов о типах
друг друга, объемах выполняемых работ, наличия или отсутствия управляю-
щего центра и др. Задача данной статьи наряду с определенным сходством
с задачами этого класса имеет и существенные отличия. В частности, здесь
ищется не то оптимальное распределение объемов работ между членами кол-
лектива, при котором минимизируются суммарные издержки, а стимулы для
каждого агента повысить уровень своих усилий (а значит, и издержек) отно-
сительно объемов усилий, отвечающих равновесному по Нэшу исходу.
В рассматриваемой модели предполагается отсутствие какой-либо асим-
метрии в распределении информации, причем функции совокупного дохода и
индивидуальных выигрышей, как и состав коалиции и стремление ее членов к
максимуму коалиционного выигрыша, а каждого некооперированного агента
к максимуму своего индивидуального выигрыша, являются общим знанием.
Технология влияния одних агентов на выбор других вполне конкретна, ли-
шена всяких элементов директивного (административного) управления и ос-
новывается исключительно на свойстве комплементарности усилий и общем
знании агентов. Выигрыш любого агента явным образом зависит от выбора
каждого члена коллектива.
В ранее вышедших работах авторов данной статьи показано, что в слу-
чае образования в коллективе коалиции, которая реализует стратегию, на-
правленную на максимизацию коалиционного выигрыша, достигается исход,
доминирующий по Парето неэффективное равновесие Нэша, достигаемое в
бескоалиционной игре [20, 21]. Если функция дохода обеспечивает комплемен-
тарность усилий членов коллектива, т.е. свойство предельного дохода по уси-
лиям агента увеличиваться с ростом усилий, прилагаемых другим агентом,
то данный положительный эффект образуется не только за счет повышения
равновесных значений усилий членов коалиции, но и благодаря увеличению
усилий остальных агентов, не входящих в коалицию.
Указанная возможность, порождаемая положительной зависимостью
между усилиями членов коллектива, уже подвергалась теоретическому ис-
следованию. Например, в модели команды, состоящей из двух агентов, кото-
рую предложили S. Huck и P. Rey-Biel [22], полезность последователя растет
по мере сокращения разрыва между осуществляемыми им и лидером объема-
ми усилий. В работе Жерве и Гольдштейна [23] улучшение по Парето свя-
102
зывается с неадекватной оценкой одним из агентов собственных усилий, т.е.
фактически с нерациональным поведением. В этих работах равновесие по
Штакельбергу не достигается. В полной мере стратегия Штакельберга реа-
лизуется в модели коллектива, которую предложил J. Kim [24]. В его работе,
в отличие от модели данной статьи, лидера фактически назначает принци-
пал, который условиями контракта способен оказывать влияние на стимулы
агента.
Важно подчеркнуть, что члены коалиции могут оказывать стимулирую-
щее воздействие на размеры усилий некооперированных агентов только раз-
мерами своих собственных усилий и только тогда, когда некооперированные
агенты выбирают размеры своих усилий на основе достоверной информации
о значениях усилий членов коалиции [25]. В последовательной двухпериодной
игре некооперированные агенты осуществляют свои усилия только после чле-
нов коалиции, и поэтому получают эту информацию непосредственно, наблю-
дая усилия членов коалиции. Следует заметить, что описание коллективных
действий в рамках последовательной игры не всегда может быть адекватным.
Например, если деятельность коллектива связана с технологическим процес-
сом, требующим одновременного приложения усилий со стороны всех членов
коллектива.
В случае одновременной игры некооперированные агенты могут получить
информацию об усилиях, которые приложат члены коалиции, только на ос-
нове сообщения от самой коалиции или определенных предварительных дей-
ствий коалиции, не оставляющих места для сомнений в ее намерениях. Общее
знание относительно размеров усилий, которые члены коалиции осуществят
в одновременной игре, является необходимым и достаточным для рациональ-
ных агентов условием успешной координации усилий [26]. При его выполне-
нии коалиция может оптимизировать значения усилий своих членов, опреде-
ляя их методом обратной индукции, т.е. применяя стратегию Штакельберга, с
доведением до начала игры этой информации до некооперированных агентов.
Однако для достижения в одновременной игре того же исхода, который
отвечает в двухпериодной игре равновесию по Штакельбергу, простой декла-
рации коалиции о своих намерениях может оказаться недостаточно. Дело в
том, что в одновременной игре, как будет показано дальше, коалиционный
выигрыш достигает свой максимум при более низком значении усилий членов
коалиции, чем в двухпериодной игре при одном и том же уровне усилий неко-
оперированных агентов. Поэтому если хотя бы один из некооперированных
агентов усомнится в намерении членов коалиции осуществить свои усилия в
обещанном размере, то он осуществит свои усилия в размере, недостаточном
для достижения равновесия по Штакельбергу. В результате не будет достиг-
нут максимум не только коалиционного выигрыша, но и тех некоопериро-
ванных агентов, которые поверят обещаниям коалиции и осуществят свои
усилия в объемах, отвечающих равновесию по Штакельбергу. Так как этим
знанием обладает каждый член коллектива, то тот исход, который отвечает
103
в двухпериодной игре равновесию по Штакельбергу, в одновременной игре
может оказаться недостижимым.
Избежать такого рода неопределенности коалиция может путем внесения
залога или заключения соответствующего контракта, или же инвестирования
в соответствующий специфический ресурс, лучшее альтернативное исполь-
зование которого менее выгодно, чем осуществление усилий в обещанных
объемах. В одновременной игре именно в этом действии фактически и со-
стоит первый шаг коалиции, который необходим для надежного достижения
исхода, совпадающего с равновесием по Штакельбергу в двухпериодной иг-
ре. Этот первый шаг в виде выполнения одного из перечисленных действий
равносилен непосредственному наблюдению усилий членов коалиции.
В настоящей работе рассматривается общий случай несепарабельной
функции дохода и линейной функции издержек. Будет показано, что поло-
жительная зависимость оптимальной стратегии каждого автономного агента
от вкладов членов коалиции создает предпосылки для использования коали-
цией стратегии лидера по Штакельбергу. Для успешного осуществления этой
стратегии члены коалиции должны быть уверены в том, что все остальные
агенты следуют стратегии последователей, т.е. определяют свои оптимальные
усилия как функции усилий членов коалиции. Результатом является равнове-
сие Штакельберга, достигаемое в исходе, который доминирует не только над
неэффективным равновесием Нэша в бескоалиционной игре, но и над равно-
весным исходом в игре, в которой коалиция выступает единым игроком, но
не использует стратегию Штакельберга, а следует стратегии Курно.
2. Базовая модель
Обозначим через n число индивидов, составляющих коллектив, в котором
путем осуществления индивидуальных усилий, где σ1, . . . , σn их денежные
эквиваленты, создается совокупный доход D = D(σ1, . . . , σn). Считаем, что
при всех σi ∈ (0, ∞), где i = 1, . . . , n, выполняются следующие условия.
1. Величина дохода возрастает с ростом прилагаемых усилий:
∂D
(1)
> 0.
∂σi
2. Для того чтобы функции выигрышей имели единственный максимум,
функция дохода строго выпукла вверх. Из этого условия следует, что функ-
ция дохода удовлетворяет закону убывающей отдачи:
2D
(2)
< 0.
∂σ2
i
3. Чтобы решение не уходило в нуль или бесконечность, выполняются усло-
вия:
∂D
∂D
(3)
lim
= ∞, lim
= 0.
σi→0∂σi
σi→∞∂σi
104
4. Усилия каждого агента оказывают положительное влияние на величину
предельного дохода по усилиям любого другого члена коллектива:
2D
(4)
>0
при i = k.
∂σi∂σk
Будем считать, что функции дохода и выигрышей являются общим зна-
нием для всех членов коллектива, а размеры приложенных усилий являются
наблюдаемыми для них после их полного осуществления. На этапе ex ante
в коллективе устанавливается правило распределения будущего ожидаемо-
го совокупного дохода D, согласно которому агенту i принадлежит относи-
n
тельная доля αi: 0 < αi < 1,
αi = 1. В неструктурированном коллективе
i=1
каждый индивид автономно выбирает объем прилагаемых им усилий, пресле-
дуя цель максимизации своего выигрыша
(5)
Uk = αkD(σk-k) - σk
,
k = 1,...,n,
где σ-k значения усилий всех членов коллектива за исключением индиви-
да k.
В [27] доказано, что в бескоалиционной игре, где выигрыши агентов за-
даются формулами (5), для любого набора αk существует и притом един-
ственное равновесие Нэша N, определяемое из условий максимума первого
порядка для функций Uk, т.е. системой уравнений
∂D
(6)
αk
= 1, k = 1, . . . , n.
∂σk
Используем следующие обозначения: σNk с k = 1, . . . , n решение систе-
мы (6); DN величина совокупного дохода; UN суммарный выигрыш всех
членов коллектива, UNk индивидуальный выигрыш агента k. В [27] пока-
зано, что этот равновесный исход не является эффективным по Парето, так
как справа от него, т.е. при σi > σNi (если доинвестирование осуществляют
не менее двух агентов), находятся Парето-предпочтительные состояния.
Каждому агенту выгодно, чтобы все остальные члены коллектива уве-
личили прилагаемые ими усилия сверх равновесного уровня, определяемого
системой (6), но при этом ему самому невыгодно (в силу закона убываю-
щей отдачи) подобное повышение объема собственных усилий. Поэтому ра-
циональный агент увеличит свои усилия только в случае, когда он уверен,
что хотя бы один из его партнеров поступит так же. Иными словами, для
достижения любого Парето-предпочтительного исхода необходима координа-
ция усилий хотя бы двух членов коллектива. Следовательно, при условии
автономности всех членов коллектива переход от равновесия Нэша к любому
доминирующему над ним исходу противоречит принципу индивидуальной ра-
циональности. Таким образом, неструктурированный коллектив, состоящий
из автономных эгоистических агентов, обречен находиться в ловушке неэф-
фективного равновесия Нэша1.
1
Этот вывод полностью совпадает с выводом, полученным в работе Хольмстрема [3],
в модели ¾дилемма заключенных¿, в моделях неполного контракта [4-7].
105
Важной характеристикой коллективных действий является существование
исхода, соответствующего общественному оптимуму. Здесь, как и в экономи-
ческой теории контрактов, общественный оптимум определяется как исход, в
котором максимальное значение достигается совокупным выигрышем всего
коллектива, равным разности общего дохода и суммы издержек всех членов
коллектива:
(7)
U = Ui =D- σi.
i=1
i=1
Условия максимума первого порядка для функции U имеют вид системы
уравнений
∂D
(8)
= 1, i = 1, . . . , n.
∂σi
Используем следующие обозначения: σPk с k = 1, . . . , n решение системы (8);
DP величина соответствующего совокупного дохода; UP величина сум-
марного выигрыша всех членов коллектива; UPk величина индивидуального
выигрыша агента k.
Данный исход игры, который обозначим через P , будет Парето-оптималь-
ным2 при осуществлении в коллективе распределения совокупного дохода,
отвечающего следующим условиям:
(9)
UPk ≥ UNk
,
где k = 1, . . . , n.
n
n
Так как согласно условиям (1)-(2) UP =
UPk >
UNk = UN, то су-
k=1
k=1
ществует такое распределение дохода между членами коллектива, при кото-
ром общественно оптимальный исход будет Парето-оптимальным.
3. Стимулирующее воздействие коалиционной стратегии
Теперь покажем, что образование в коллективе коалиции и осуществле-
ние коалиционной стратегии, дает возможность для преодоления равновесия
Нэша. Предположим, что в коллективе образовалась коалиция, члены кото-
рой способны координировать значения своих усилий в целях достижения
максимума коалиционного выигрыша. Вопросы образования и устойчивости
коалиции представляют отдельную проблему, частично рассмотренную авто-
рами в [28], и поэтому здесь не затрагиваются. Здесь будем предполагать,
что координация между членами коалиции основана на отношениях дове-
рия, так как именно в этом случае минимальны трансакционные издержки
2 Чтобы убедиться, что в исходе P суммарный выигрыш U выше, чем в исходе N, доста-
точно обратиться к градиенту функции U. В точке равновесия Нэша N каждая координата
gradU больше нуля, откуда следует, что функция U достигает более высоких значений при
уровнях усилий, превышающих равновесные.
106
координации. Кроме того, полагаем, что стремление коалиции к максимуму
коалиционного выигрыша является общим знанием.
Обозначим коалицию через C. Некооперированные агенты (не вошедшие
в коалицию) образуют множество NC. Используем следующие обозначения:
i] с i ∈ C
кортеж значений усилий членов коалиции; [σj] с j ∈ NC∑
кортеж значений усилий некооперированных агентов; αC =i∈C αi отно-
сительная доля коалиции в общем доходе D. Выражение для коалиционного
выигрыша запишем в виде
(10)
UC = αCD([σi],[σj]) -
σi
,
i∈C, j ∈NC.
i∈C
Значения усилий членов коалиции, при которых их совокупный выигрыш
достигает максимума, определяется системой уравнений
∂D
1
(11)
=
,
i∈C.
∂σi
αC
Некооперированные агенты выбирают объемы своих усилий из условий мак-
симума собственных индивидуальных выигрышей, т.е. из уравнений, анало-
гичных (6):
∂D
1
(12)
=
,
j ∈NC.
∂σj
αj
Игра, сложившаяся в результате образования коалиции C, отличается от
первоначальной бескоалиционной игры тем, что в ней наряду с автономны-
ми (некооперированными) игроками j ∈ NC участвует один агрегированный
игрок в лице коалиции C. Совокупность систем уравнений (11) и (12) име-
ет единственное решение и, соответственно, новая игра имеет единственный
равновесный исход, который обозначим чере
C. Значения усилий агентов в
C
C
этом исходе обозначим как
и
, i ∈ C, j ∈ NC, величину совокупного
i
j
C
дохода как
C, значения выигрыша коалиции как
, агентов
как
C
C
UĈi и
j
Покажем, что исход
C доминирует по Парето над исходом N и в нем
справедливы следующие неравенства:
C
C
(13)
i
Ni, i∈C;
j
Nj
,
j∈NC;
C
(14)
UĈj >UNj, j ∈NC;
>UNC = UNi.
C
i∈C
Сравним совместное решение систем (11) и (12), определяющее исхо
C,с
решением системы (6), определяющим исход N. Можно считать, что система
(11)-(12) образована из системы (6) путем замены в правых частях уравнений∑
с i ∈ C величин αi на превышающую их величину αC =i∈C αi. Так как
107
решение системы (6) согласно (2) положительно зависит от значений αk, то
эта замена приводит к более высоким значениям σi, отвечающим решению
систем (11)-(12)3.
Левые части уравнений (12) являются функциями усилий σj некоопери-
рованных агентов и усилий σi членов коалиции. При любых фиксированных
значениях σi система (12) имеет единственное решение относительно пере-
менных σj с j ∈ NC, определяющее значения этих величин в виде функций
переменных σi с i ∈ C. Обозначим эти решения как
(15)
σj = Rj([σi
]),
i∈C, j ∈NC.
Функции (15) представляют собой функции реагирования некооперированных
агентов на известные им значения усилий членов коалиции. В силу нера-
венств (4) левые части уравнений (12) являются возрастающими функциями
переменных σi с i ∈ C. Следовательно, решения этих уравнений, т.е. функ-
ции реагирования σj = Rj([σi]), также возрастают по всем переменным σi с
i∈C.
Из неравенств (13) согласно условию (1) следует, что
C > DN. Так как
каждая функция выигрыша (и Uj , и UC ) имеет единственный максимум,
то их максимумы в исход
C превышают соответствующие максимумы, до-
стигаемые в исходе N, т.е. неравенства (14) справедливы. Можно полагать,
что отношения взаимного доверия, связывающие членов коалиции, способны
обеспечить бесконфликтное распределение между ними коалиционного вы-
игрыша в целях обеспечения условий индивидуальной рациональности для
C
всех членов коалиции, и поэтому неравенство
> UNC совместимо с нера-
C
венствами
C
(16)
>UNi
,
i∈C.
i
Таким образом, реализация коалиционной стратегии приводит к исходу,
доминирующему по Парето над равновесием Нэша, достигаемому в бескоа-
лиционной игре.
4. Стратегия Штакельберга
В модели олигополистического рынка Штакельберга предполагается, что
лидер осуществляет первый ход: он либо первым осуществляет свою страте-
гию (например, выпускает продукцию в определенном объеме), либо демон-
стративно производит безвозвратные инвестиции, убеждающие конкурентов
в том, что лидер выбрал определенную стратегию. Только при этом условии
конкуренты поверят в его выбор и будут учитывать его при выборе своих
оптимальных стратегий.
3 Строгое доказательство теоремы о возрастании всех переменных, образующих реше-
ние системы (6), при уменьшении значения хотя бы одного из параметров, представляющих
собой ее правые части, приводится в [25].
108
В модели данной статьи предполагается, что коалиция, как уже было
сказано выше, своим первым ходом убедила некооперированных агентов
в том, что члены коалиции произведут усилия в объемах [σi], i ∈ C. До
начала игры коалиция находит из уравнений (12) функции реагирования
σj = Rj([σi]). Совокупность этих функций определяет в пространстве значе-
ний σk (k = 1, . . . , n) поверхность реагирования, в каждой точке которой вы-
полняются условия максимума выигрышей некооперированных агентов (12).
На поверхности реагирования величина совокупного дохода является функ-
цией соответствующих усилий членов коалиции:
(17)
D ([σi],Rj([σi
])) , i ∈ C, j ∈ NC.
Таким образом, коалиция как лидер по Штакельбергу инкорпорирует
функции реагирования некооперированных агентов в свою функцию чистого
дохода, которая принимает следующий вид:
(18)
UC = αCD ([σi],Rj([σi])) -
σi
i∈C
с условиями максимума в виде
(19)
αCD
− 1 = 0, i ∈ C,
σi
где D′σi полная производная по σi от функции (18), взятая на поверхности
реагирования:
∂D
∂D ∂Rj
(20)
D′σ
=
+
,
i∈C.
i
∂σi
∂σj ∂σi
j∈NC
С учетом (12) выражения для производных (20) принимают вид
∂D
1 ∂Rj
(21)
D′σ
=
+
i
∂σi
αj ∂σi
j∈NC
С учетом (21) уравнения (19) преобразуются к виду
∂D
1 ∂Rj
1
(22)
+
=
,
i∈C.
∂σi
αj ∂σi
αC
j∈NC
Обозначим исход игры, соответствующий решению Штакельберга, ка
S,
S
S
значения усилий членов коалиции в этом исходе как
с i∈C и
i
j
сj ∈NC,величину совокупного дохода как
S, значения выигрышей ко-
S
S
S
алиции как
, агентов
как
и
. Сравним результаты исходо
S
C
i
j
и
C.
В силу уравнений (12) исход
C так же, как исхо
S, соответствует точ-
ке на поверхности реагирования. Следовательно, и доход D, и предельные
109
доходы∂D∂σ
являются функциями переменных σi, i ∈ C. Обозначим значение
i
S
∂D
C
предельного дохода∂D∂σ
в точке [
] как
S), а в точке [
] как
∂D
C).
i
i
∂σi
i
∂σi
Тогда согласно уравнениям (11) уравнения (22) можно записать в виде
1 ∂Rj
(23)
∂D
S) +
=
∂D(C
),
i∈C.
∂σi
αj ∂σi
∂σi
j∈NC
Так как функции Rj([σi]) возрастают по всем переменным, то из (23) следуют
неравенства
∂D
(24)
S) <
∂D(C
),
i∈C,
∂σi
∂σi
откуда согласно условиям (2) вытекают неравенства
S
C
(25)
>
i
i
Из (25) и возрастания Rj ([σi]) следуют неравенства
S
C
(26)
>
,
j ∈NC.
j
j
Таким образом, можно сформулировать 1-й вывод. При переходе от ис-
хода
C единственного равновесия Нэша в игре, в которой коалиция C и
некооперированные агенты максимизируют свои чистые доходы исходя из
симметричных ожиданий в отношении всех остальных игроков, к исход
S,
достигаемому в случае, когда коалиция C применяет стратегию лидера по
Штакельбергу, возрастают значения усилий всех игроков как членов коа-
лиции, так и некооперированных агентов.
Сравним значения чистого дохода коалиции в исхода
S
C. Если коали-
ция применяет стратегию Штакельберга, то это означает, что она максими-
зирует свой выигрыш UC на поверхности реагирования, заданной уравнения-
ми (15). Значит, уравнения (22) определяют точку максимума чистого дохода
коалиции на поверхности реагирования, соответствующую исход
S. Точка,
соответствующая исходу
C, также лежит на поверхности реагирования, но
ее координаты согласно неравенствам (25) и (26) не совпадают с координата-
ми максимума функции UC на поверхности реагирования. Следовательно, в
силу единственности максимума справедливо неравенство
S
C
(27)
C
>
C
Так как согласно введенному ранее предположению члены коалиции спо-
собны произвести между собой пропорциональный дележ общего выигрыша
коалиции, то из (27) следуют неравенства
S
C
(28)
>
,
i∈C.
i
i
110
Сравним выигрыши некооперированных агентов в исхода
S
C. На по-
верхности реагирования функции чистого дохода некооперированных агентов
имеют вид:
(29)
Uj = αjD ([σi],Rj([σi])) - Rj([σi
]),
i∈C, j ∈NC.
Обратимся к производной (Uj )′σi = αj D′σi - (Rj ) , которая с учетом (21)σ
i
принимает вид
∂D
αj ∂Rk
(30)
(Uj )
j
+
,
i∈C, j ∈NC.
σi
∂σi
αk ∂σi
k∈NC,
k=j
Все слагаемые в правой части (30) положительны для любого j ∈ NC, сле-
довательно, (Uj )
> 0.
σi
Таким образом, приходим ко 2-му выводу. Если коалиция C занимает по-
зицию лидера по Штакельбергу, а все некооперированные агенты занимают
позиции последователей, то выигрыши всех некооперированных агентов воз-
растают на поверхности реагирования по всем независимым переменным σi.
Соответственно, из (25) следует
S
C
(31)
>
,
j ∈NC.
j
j
Неравенства (28) и (31) позволяют сделать 3-й вывод. Исхо
S равнове-
сие в игре, в которой коалиция C занимает позицию лидера по Штакельбергу,
а все некооперированные агенты занимают позиции последователей, домини-
рует по Парето над исходо
C равновесием Нэша в игре, в которой коали-
ция C и некооперированные агенты максимизируют свои выигрыши исходя
из симметричных ожиданий в отношении всех остальных игроков.
Теперь обратимся к рассмотрению причины, в силу которой коалиции
в одновременной игре необходимо послать предварительный информацион-
ный сигнал, способный полностью убедить некооперированных агентов в том,
S
что все члены коалиции осуществят свои усилия в объемах
, i ∈ C. Если
i
коллективу предстоит последовательная игра, в которой некооперированные
агенты прилагают свои усилия только после членов коалиции, то коалиция
находит объемы усилий своих членов в результате решения задачи на отыс-
кание условного максимума своей функции выигрыша (18) при условии (19).
S
Соответствующая система уравнений принимает вид (22) с решением: σi =
i
S
и σj =
, i ∈ C, j ∈ NC. И в этом случае никому из агентов невыгодно от-
j
клоняться в своем выборе от этого решения.
В одновременной игре коалиция выбирает уровень усилий своих членов ис-
ходя из предположения, что все некооперированные агенты непременно осу-
S
ществят свои усилия в объемах
. В этом случае она решает задачу отыска-
j
ния безусловного максимума и находит уровень усилий своих членов из урав-
S
нений (11) при σj =
, j ∈ NC. Из сравнения (22) и (11) видно, что значения
j
111
частных производных∂D в уравнениях (22) ниже, чем в уравнениях (11). Это∂σ
i
S
означает, что значения
, являющиеся решениями уравнений (22), превы-
i
шают значения σi, являющиеся решениями уравнений (11), хотя в решениях
обеих систем размеры усилий некооперированных агентов совпадают. Имен-
но поэтому в одновременной игре всем членам коалиции, если они уверены в
том, что все некооперированные агенты непременно осуществят свои усилия
S
в размере σj =
, выгодно осуществить свои усилия в объемах ниже, чем в
j
первом периоде последовательной игры. Соответственно, для достижения в
одновременной игре того же исхода, который достигается в последовательной
игре в результате стратегии Штакельберга, коалиция и вынуждена сделать
соответствующий первый шаг, убеждающий всех некооперированных аген-
S
тов, что ее члены осуществят усилия в объемах
i
5. Заключение
На основе представленных выше моделей приходим к следующим выво-
дам.
1. Если в коллективе образуется малая группа (коалиция), члены которой
стремятся к увеличению коалиционного выигрыша, то коллектив способен
выбраться из ловушки неэффективного равновесия Нэша, в которую попа-
дает неструктурированный коллектив. Следствием коалиционной стратегии
является повышение индивидуальных выигрышей всех членов коллектива от-
носительно их значений в равновесии Нэша, достигаемого в бескоалиционной
игре.
2. Если размеры предельных доходов некооперированных членов кол-
лектива возрастают с увеличением усилий членов коалиции, то коалицион-
ная стратегия оказывает стимулирующее воздействие на некооперированных
агентов, в результате которого объем прилагаемых ими усилий также увели-
чивается. Существование такой зависимости составляет необходимую пред-
посылку для реализации стратегии, разработанной Штакельбергом в модели
дуополии.
3. Инкорпорирование коалицией функций реагирования некооперирован-
ных агентов в свою функцию чистого дохода создает возможность для до-
стижения коллективом нового равновеси
S, доминирующего по Парето над
равновесие
C, достигаемым в той коалиционной игре, в которой коалиция
и некооперативные агенты независимо друг от друга максимизируют свои
выигрыши.
4. Достижение равновесного по Штакельбергу исход
S возможно толь-
ко при условии существования определенных взаимных ожиданий со сторо-
ны как членов коалиции, так и некооперированных агентов. Эти ожидания
должны исходить из общего знания о функциях выигрыша, наличии коали-
ции, ее составе и объемах усилий, которые обязуются осуществить ее члены.
5. При выполнении принятых в данной модели предположений иерархиче-
ская структура коллектива, в которой коалиция занимает положение лидера
112
по Штакельбергу, оказывается более эффективной, чем неиерархическая ко-
алиционная структура.
ПРИЛОЖЕНИЕ
Рассмотрим демонстрационный пример полученных выше результатов.
Пусть функция совокупного дохода имеет вид
(Π.1)
D=λ σai,
i=1
где λ > 0, 0 < a < 1/n. Функция (П.1) удовлетворяет всем условиям (1)-(4).
Считаем, что все члены коллектива имеют равные доли в доходе: αi = 1/n.
1. Сначала рассмотрим бескоалиционную игру, в которой каждый член
коллектива стремится к максимуму своего индивидуального выигрыша:
(Π.2)
Ui = λ/n
σaj - σi → max,
i = 1,...,n.
σi>0
j=1
Так как функция дохода (П.1) удовлетворяет условиям постоянной эластич-
ности
σi ∂D
(Π.3)
= a,
D ∂σi
то условия максимума (8) индивидуального выигрыша (П.2) можно записать
в виде:
aD
(Π.4)
σi =
,
i = 1,...,n.
n
Подставив выражения для усилий (П.4) в (П.1), получим уравнение отно-
сительно D, из которого найдем величину совокупного дохода в равновесии
Нэша:
(Π.5)
DN = (λ(a/n)an)1/(1-an) .
Используя (П.5), (П.4) и (П.2), найдем значения усилий и выигрышей:
(Π.6)
σNi = aDN/n; UNi = DN
(1 - a)/n; i = 1, . . . , n.
Для λ = 12 · 103, n = 100, a = 1/120 получим:
(
( 0,01)5/6)6
DN =
12 · 103
= 12 · 103;
(Π.7)
120
σNi = 1,0; UNi = 119; i = 1,... ,100.
113
2. Обратимся к рассмотрению коалиционной игры. Пусть коалиция со-
стоит из первых m членов коллектива. Уравнение (10) для усилий члена
коалиции можно записать в виде
am
(Π.8)
σi =
D, i = 1,... ,m,
n
а уравнение (11) для усилий некооперированных агентов в виде
aD
(Π.9)
σj =
,
j = m + 1,...,n.
n
Подставив выражения для усилий из (П.8) и (П.9) в функцию дохода D =
m
n
σa
σaj, получим уравнение относительно D:
i=1
i
j=m+1
D = λ(a/n)anmam (D)an,
из которого найдем выражение для значения совокупного дохода в равновес-
ном исход
C:
1
(Π.10)
C = (λ(a/n)anmam)1-an .
Используя (П.8), (П.9) и (П.10), получим выражения для размеров усилий:
1
1-a(n-m)
σ Ĉi = (λa/n)
1-an m
1-an
,
i ∈ 1,...,m;
(Π.11)
1
am
C
= (λa/n)
1-an m
1-an , j = m + 1, . . . , n.
j
Используя (П.2), (П.10) и (П.11), получим выражения для значений индиви-
дуальных выигрышей:
C
(Π.12)
UĈi =DĈ(1-am)/n; UĈj =
(1 - a)/n.
Для n = 100, a = 1/120, m = 10 найдем отношения значений параметров в
исхода
C и N.
DĈ
am
=m1-an =
10;
DN
C
1-a(n-m)
i
(Π.13)
= m 1-an
= 10 ·
10;
σN
i
C
am
j
=m1-an =
10;
σN
j
C
C (1 - am)
110
i
=
=
10 ·
≈ 2,9;
UNi
DN(1 - a)
119
(Π.14)
C
C
j
=
=
10 ≈ 3,2;
i ∈ 1,...,m, j = m + 1,...,n.
UNj
DN
114
Как видим, переход от равновесия N к равновеси
C приводит к возрас-
танию индивидуальных выигрышей всех членов коллектива.
3. Предположим, что коалиция C заняла позицию лидера по Штакельбер-
гу, а некооперированные агенты позиции последователей. Из (П.9) следует
aD = nσj с j ∈ NC. Подставив в (П.1) вытекающее отсюда выражение для D,
получим уравнение относительно σj, решив которое найдем значения усилий
некооперированных агентов как функции усилий членов коалиции, т.е. полу-
чим функции реагирования
1
a
(Π.15)
σj = Rj([σi]) = (λa/n)1-a(n-m)
,
j ∈NC.
σ1-a(n-m)k
k=1
Частные производные от этих функций с учетом идентичности агентов мож-
но записать в виде
an-1
∂Rj
a
1
(Π.16)
=
,
j ∈NC, k,i∈C.
(λa/n)1-a(n-m) σ1-a(n-m)k
∂σi
1 - a(n - m)
Частные производные от функции дохода по переменным σi найдем из урав-
нений (П.3) и (П.1):
∂D
aD
(Π.17)
=
= aλσam-1iσa(n-m)j
,
j ∈NC, i∈C.
∂σi
σi
Подставив в (П.17) выражения для σj из (П.15), с учетом идентичности аген-
тов получим
an-1
∂D
1
(Π.18)
,
i∈C.
= (λa/n)1-a(n-m)1-a(n-m)i
∂σi
Выражения для производных из (П.16) и (П.18) подставим в уравнения (22).
В результате преобразования соответствующего уравнения получим
1
an-1
1
1
(Π.19)
=
,
i∈C.
· (λa/n)1-a(n-m) · n · σ1-a(n-m)i
αC
1 - a(n - m)
Разрешив уравнение (П.19) относительно σi, найдем выражения для объемов
усилий членов коалиции в исход
S:
1
(
) 1-a(n-m)
an
1-an
( λa)1-
m
S
(Π.20)
=
i
n
1 - a(n - m)
Используя (П.20) и (П.11), получим выражение для отношения размеров уси-
лий членов коалиции в исхода
S
C:
(
)
1-a(n-m)
S
1-an
1
i
(Π.21)
=
,
i∈C.
C
1 - a(n - m)
i
115
Из уравнения (12), свойства (П.3) и вида функции (П.1) следует:
S
)am (
)a(n-m)
aD
λa(
S
S
S
(Π.22)
=
=
,
j ∈NC.
j
i
j
n
n
S
Подставив в правую часть (П.22) выражение для
из (П.20), получим урав-
i
S
нение относительно
, решив которое найдем:
j
1
(
) am
( λa)1-
an
m
S
(Π.23)
=
1-an .
j
n
1 - a(n - m)
Из (П.20) и (П.23) следует выражение для отношения усилий члена коалиции
и некооперированного агента:
S
m
i
(Π.24)
=
,
i∈C, j ∈NC.
S
1 - a(n - m)
j
Для случая, когда n = 100, a = 1/120, m = 10, из (П.21) и (П.24) следует:
S
C
S
S
1-a
/
=41,5 =8,
/
= 40. Так как Uj = 1n D - σj = σj
jj
, то с
i
i
i
j
a
a
учетом (П.9) и (П.22) получим:
S
S
(
) am
)1
S
2
j
j
1
( 120
=
=
=
1-an =
= 2, j ∈ NC.
C
C
1 - a(n - m)
30
DĈ
j
j
(
)
(1-a
)
S
S
S
S
S
S
S
S
1
Так как
=
+
-
=
+1
-
=
-σi
, то с учетом
i
j
j
i
j
a
i
j
a
S
j
(
)
S
S
S
a
j
1
i
(П.12) и (П.9), получимUi
=
-
=1611 ≈ 1,45.
C
C
(1-am)
a
S
i
j
j
Таким образом, в результате перехода от исхода
C к равновесному по
Штакельбергу исход
S некооперированные агенты увеличивают свои усилия
в 2 раза, члены коалиции в 8 раз. Выигрыши некооперированных агентов
увеличиваются в 2 раза, а выигрыши членов коалиции возрастает на 45%.
СПИСОК ЛИТЕРАТУРЫ
1. Остром Э. Управляя общим: эволюция институтов коллективной деятельности.
М.: ИРИСЭН, 2011.
2. Капелюшников Р.И. Множественность институциональных миров: Нобелевская
премия по экономике-2009: Препринт WP3/2010/02 (Часть 1). М.: ГУ-ВШЭ,
2010.
3. Holmstrom B. Moral Hazard in Teams // The Bell J. Econom. 1982. V. 13. No. 2.
P. 324-340.
4. Grossman S., Hart O. The Cost and Benefits of Ownership: A Theory of Vertical
and Lateral Integration // J. Polit. Econom. 1986. V. 94. No. 4. P. 691-719.
116
5.
Hart O.D., Moore J. Incomplete Contracts and Renegotiation // Econometrica. 1988.
V. 56. No. 4. P. 755-785.
6.
Тироль Ж. Рынки и рыночная власть: теория организации промышленности.
В 2-х т, т. 1. СПб.: Экономическая школа, 2000.
7.
Фуруботн Э.Г., Рихтер Р. Институты и экономическая теория: Достиже-
ния новой институциональной экономической теории. СПб.: Издательский Дом
СПбГУ, 2005.
8.
Cournot A. Researches into the Mathematical Principles of the Theory of Wealth.
London: Hafner, 1960. (Original 1838.)
9.
Stackelberg H. Marktform und Gleichgewicht.
1934. Wien; placeStateBerlin:
J. Springer.
10.
Anderson S., Engers M. Stacelberg Versus Cournot Oligopoly Equilibrium // Int.
J. Indust. Organizat. 1992. V. 10. No. 1. P. 127-135.
11.
Julien L. Stakcelberg Games. In Handbook of Game Theory and Industial Organi-
sation. 2018. V. 1. Chap. 10. P. 261-311.
12.
Nocke V., Shutz N. (2018). Multiproduct-Firm Oligopoly: An Aggregative Games
Approach // Econometrica. V. 86. No. 2. P. 523-557.
13.
Алгазин Г.И., Алгазина Д.Г. Процессы рефлексии и равновесие в модели оли-
гополии с лидером // АиТ. 2020. № 7. С. 113-128.
Algazin G.I., Algazina D.G. Reflexion Processes and Equilibrium in an Oligopoly
Model with a Leader // Autom. Remote Control. 2020. V. 81. No. 7. P. 1258-1270.
14.
Алгазин Г.И., Алгазина Д.Г. Коллективное поведение в модели Штакельберга
в условиях неполной информации // АиТ. 2017. № 7. С. 91-105.
Algazin G.I., Algazina D.G. Collective Behavior in the Stackelberg Model under
Incomplete Information // Autom. Remote Control. 2017. V. 78. No. 9. P. 1619-1630.
15.
Гераськин М.И. Приближенное вычисление равновесий в нелинейной модели
олигополии Штакельберга на основе линеаризации // АиТ. 2020. № 9. С. 120-143.
Geraskin M.I. Approximate Calculation of Equilibria in the Nonlinear Stackelberg
Oligopoly Model: a Linearization Based Approach // Autom. Remote Control. 2020.
V. 81. No. 9. P. 1659-1678.
16.
Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976.
17.
Горелов М.А. Модель управления ограничениями деятельности // Проблемы
управления. 2019. № 4. С. 43-49.
18.
Губко М.В., Новиков Д.А. Теория игр в управлении организационными систе-
мами. М.: Институт проблем управления им. В.А. Трапезникова РАН, 2005.
19.
Новиков Д.А. Математические модели формирования и функционирования ко-
манд. М.: Издательство физико-математической литературы, 2008.
20.
Скаржинская Е.М., Цуриков В.И. Модель коллективных действий. Часть 1.
Равновесие, справедливость, эффективность // Экономика и математические
методы. 2017. № 2. С. 118-133.
21.
Скаржинская Е.М., Цуриков В.И. Модель коллективных действий. Часть 2.
Лидирующая коалиция // Экономика и математические методы. 2017. № 4.
С. 89-104.
22.
Huck S., Rey-Biel P. Endogenous Leadership in Teams // J. Institut. Theoret.
Econom. 2006. V. 162. No. 2. P. 253-261.
117
23. Gervais S., Goldstein I. The Positive Effects of Biased Self-Perceptions in Firms //
Review of Finance. 2007. V. 11. No. 3. P. 453-496.
24. Kim J. Endogenous Leadership in incentive Contracts // J. Econom. Behavior Or-
ganizat. 2012. V. 82. No. 1. P. 256-266.
25. Скаржинская Е.М., Цуриков В.И. О возможности последовательного прибли-
жения к равновесию в коалиционной игре при повторении коллективных дей-
ствий // Экономика и математические методы. 2020. № 4. С. 103-115.
26. Скаржинская Е.М., Цуриков В.И. Эндогенное формирование в команде лидер-
ства по Штакельбергу. Эффект образования коалиции // Журн. Новой эконо-
мической ассоциации. 2021. № 1 (49). С. 53-79.
27. Скаржинская Е.М., Цуриков В.И. Экономико-математический анализ эффек-
тивности принципа ¾От каждого - по способностям, каждому - по труду¿ //
Журн. экономической теории. 2017. № 2. С. 110-122.
28. Скаржинская Е.М., Цуриков В.И. Моделирование коллективных действий: зна-
чимость кооперативных соглашений // Российский журнал менеджмента. 2019.
№ 3. С. 337-366.
Статья представлена к публикации членом редколлегии М.В. Губко.
Поступила в редакцию 14.11.2021
После доработки 04.03.2022
Принята к публикации 31.03.2022
118