ПРОБЛЕМЫ ПЕРЕДАЧИ ИНФОРМАЦИИ
Том 55
2019
Вып. 2
УДК 621.391 : 621.394/395.74
© 2019 г.
А.А. Пухальский
ГЕОМЕТРИЯ БОЛЬШИХ ОЧЕРЕДЕЙ
Предлагается подход к нахождению наиболее вероятных траекторий, веду-
щих к образованию длинных очередей в эргодической сети Джексона, основан-
ный на решении уравнений Гамильтона. Так как соответствующий гамильто-
ниан является разрывным и кусочно липшицевым, возникает необходимость
использовать аппарат негладкого анализа. Обращение уравнений Гамильто-
на во времени приводит к уравнениям жидкостной динамики двойственной
сети. Соответственно, оптимальные траектории есть обращенные во времени
жидкостные траектории двойственной сети. Эти траектории с необходимостью
проходят через области, удовлетворяющие некоторому условию “существенно-
сти”. Результаты проиллюстрированы на примере сети Джексона из двух узлов.
Установлены также свойства субстохастических матриц, которые могут пред-
ставлять самостоятельный интерес.
Ключевые слова: теория массового обслуживания, сеть Джексона, большие
уклонения, принцип больших уклонений, оптимальные траектории, уравнения
Гамильтона, двойственные марковские процессы, жидкостная динамика.
DOI: 10.1134/S0555292319020050
§1. Оптимальные траектории в сети Джексона
и вариационные задачи с нефиксированным временем
Принцип больших уклонений позволяет находить грубые асимптотики вероятно-
стей достижения случайным процессом нетипичных значений и наиболее вероятные
сценарии осуществления редких событий. Для этого необходимо решить вариацион-
ную задачу минимизации функции уклонений (называемую также “функционалом
действия”) по траекториям, которые реализуют такие события. Как правило, ищет-
ся решение уравнения Эйлера - Лагранжа (см., например, [1, 2]). В данной статье
на примере сети Джексона изучаются возможности подхода, состоящего в решении
уравнений Гамильтона.
Рассматривается (экспоненциальная) сеть Джексона из K узлов с матрицей
маршрутизации P = (pkℓ) спектрального радиуса меньше единицы, с интенсивно-
стями входящих потоков λk > 0 и интенсивностями обслуживания в узлах μk > 0
(см., например, [3]). Обозначим через Qk(t) длину очереди в узле k в момент t,
и пусть Q(t) = (Q1(t), . . . , QK (t))T , гдеT - оператор транспонирования. Для J ⊂
⊂ {1, 2, . . ., K} обозначим через FJ множество векторов x = (x1, . . . , xK)T , таких
что xi = 0 при i ∈ J и xi > 0 при i ∈ J. Как обычно принято, Jc = {1, 2, . . . , K} \ J.
Обозначим также π(u) = u lnu - u + 1, если u > 0, и положим π(0) = 1. Пусть 1Γ
представляет собой индикаторную функцию множества Γ, которая равна 1 на Γ
и 0 вне Γ. Обозначим через SK×K+ множество субстохастических (по строкам) мат-
риц размера K×K, через I - единичную матрицу размера K×K, а через D(R+, RK+ ) -
пространство Скорохода непрерывных справа и имеющих пределы слева функций,
82
заданных на R+ и принимающих значения в RK+ , снабженное метрикой, превраща-
ющей его в полное метрическое сепарабельное пространство (см., [4,5]). Следующий
результат получен в [6]. (Предполагается, что произведение функции π и числа 0
равно нулю, даже если аргумент функции π равен бесконечности, и что 0/0 = 0.)
Теорема 1. Пусть Q(0) = 0 RK+. Тогда при n → ∞ процессы (Q(nt)/n,
t ∈ R+) удовлетворяют принципу больших уклонений в D(R+, RK+) с фyнкцией
уклонений I(q), которая для абсолютно непрерывных функций q = (q(t), t ∈ R+),
таких что q(0) = 0 RK+, имеет вид
I(q) = L(q(t),
˙q(t)) dt,
0
где
L(x, y) =
1FJ (x)LJ(y),
J⊂{1,2,...,K}
LJ(y) =
inf
ψJ(a, d, ϱ)
(1.1)
(a,d,ϱ)RK+ ×RK+ ×SK×K+ :
y=a+(ϱT -I)d
и
)
(ak)
(dk)
(dk
ψJ (a, d, ϱ) =
π
λk +
π
μk +
π
1(μk,∞)(dk)μk +
λk
μk
μk
k=1
k∈Jc
k∈J
⎞(
)⎤
1-
ϱkℓ
K
)
(ϱkℓ
+ dk
π
pkℓ
+π=1
1- pkℓ.
(1.2)
pkℓ
k=1
=1
1- pkℓ
=1
=1
Если функция q не является абсолютно непрерывной или если q(0)
= 0, то
I(q) = ∞.
В развернутом виде утверждение теоремы означает следующее: множества
{q ∈ D(R+, RK) : I(q) u} являются компактами при всех u 0 и выполняют-
ся неравенства
1
lim inf
ln P(q ∈ G) - inf I(q)
n→∞ n
q∈G
при условии, что G - открытое подмножество D(R+, RK+ ), и
1
lim sup
ln P(q ∈ F ) - inf I(q)
n→∞ n
q∈F
при условии, что F - замкнутое подмножество D(R+, RK+ ). Заметим, что форму-
лируемый в теореме 1 принцип больших уклонений установлен также в [7, 8], где
функция LJ имеет другой вид.
Из принципа больших уклонений следует, что в широких предположениях лога-
рифм вероятности попадания процесса Q(nt)/n в заданное множество S на больших
интервалах времени близок к - inf I(q), где S = {q : q(0) = 0, q(T ) ∈ S для неко-
q∈S
торого T > 0}. Если последний инфимум достигается единственной функцией q, то
попадание Q(nt)/n в множество S происходит с вероятностью, близкой к единице,
движением в малой окрестности этой функции. В данной статье основное внима-
83
ние уделяется вопросу нахождения для эргодической сети Джексона такой функ-
ции q, начинающейся в начале координат и достигающей фиксированной точки в
некоторый момент T , для которой L(q(t),
˙q(t)) dt минимален. Показано, что обра-
0
щение во времени уравнений Гамильтона для оптимальных траекторий приводит
к уравнениям жидкостной динамики двойственной сети. Это наблюдение позволяет
подтвердить для эргодической сети Джексона справедливость “фольклорной” теоре-
мы, утверждающей, что наиболее вероятная траектория, обеспечивающая “большое
уклонение” эргодического марковского процесса, является обращенной во време-
ни траекторией жидкостного предела двойственного процесса (см., например, [9]).
(В статфизической литературе соответствующее свойство известно как обобщенный
принцип Онзагера - Махлупа: траектория флуктуации есть обращенная во време-
ни траектория релаксации двойственной динамики; см., например, [10].) Показано,
что найденная оптимальная траектория представляет собой предел (условного) за-
кона больших чисел при условии, что длины очередей в сети достигают аномально
больших значений. Найдено необходимое и достаточное условие, при выполнении
которого грань FJ может содержать часть оптимальной траектории, а следователь-
но, жидкостной траектории. В заключение на примере эргодической сети Джексона
из двух узлов рассматриваются геометрические аспекты построения оптимальных
траекторий. Кроме того, в статье установлены свойства субстохастических матриц,
которые могут представлять самостоятельный интерес.
Так как функции LJ (y) являются выпуклыми по лемме 4.2 в [6], то в силу нера-
венства Йенсена оптимальное движение в области с постоянной динамикой, т.е.
в грани FJ , происходит по прямой. Заметим также, что если J ⊂ J′′, то ψJ(a, d, ϱ)
ψJ′′(a,d,ϱ), и как следствие, LJ(y) LJ′′(y). Поэтому если начальная и конечная
точки участка траектории принадлежат FJ , то движение по прямой “выгоднее”, чем
движение через смежные области FJ, где J ⊂ J. Более того, будет показано, что оп-
тимальные траектории состоят из конечного числа отрезков, которые принадлежат
граням FJ с убывающими по включению множествами J, если не считать конеч-
ную точку, для которой свойство убывания J может не выполняться. В частности,
каждая из граней FJ содержит не более одного отрезка.
Для нахождения оптимальных траекторий в гранях FJ будет использоваться
следующий общий результат. Для функции f(y), удовлетворяющей условию Лип-
шица локально, будем обозначать через ∂f(y) обобщенный градиент f в точке y
(см. [11]). Если f выпукла, что верно для приложений в данной статье, то обобщен-
ный градиент совпадает с субдифференциалом (см., например, [12]). Определение
конуса, нормального к непустому замкнутому множеству в точке этого множества,
как сопряженного к касательному конусу в этой точке можно найти в [11, с. 19].
Для случая выпуклого множества определение сводится к определению, данному
в [12, с. 32] как совокупности векторов, нормальных к множеству в рассматривае-
мой точке, где вектор z называется нормальным к выпуклому множеству S в точке
x ∈ S, если z · (y - x) 0 для всех y ∈ S. (Здесь и далее a · b используется для обо-
значения скалярного произведения векторов a и b. Кроме того, сокращение “п.в.”
означает “почти всюду по мере Лебега”.)
Лемма 1. Пусть L(x,y) - функция из Rk ×Rk в R, удовлетворяющая условию
Липшица по (x, y) локально и выпуклая по y. Предположим, что функция
H (x, p) = sup (p · y - L(x, y))
(1.3)
y∈Rk
удовлетворяет условию Липшица локально (по (x, p)). Пусть g(x) - полунепре-
рывная сверху функция, удовлетворяющая условию Липшица локально. Пусть S -
84
выпуклое замкнутое подмножество Rk и x0 Rk. Если минимум
L(x(t), x(t)) dt
0
по T 0 и по абсолютно непрерывным функциям x(t), таким что x(0) = x0,
x(T ) ∈ S и g(x(t)) 0 для всех t T , достигается для T = T и x(t) = x(t), то
существуют мера μ на [0, T], a также μ-измеримая функция γ(t) и абсолютно
непрерывная функция p(t), обе принимающие значения в Rk, такие что имеют
место следующие свойства:
1. γ(t) ∈ ∂>g(x(t)) для μ-почти всех t ∈ [0, T], и носитель меры μ содержится
в множестве {t ∈ [0, T] :>g(x(t)) =}, где ∂>g(x) представляет собой вы-
пуклую оболочку пределов последовательностей γi, удовлетворяющих условиям
γi ∈ ∂g(xi), xi → x, g(xi) > 0;
(
t
)
]
[
− p(t)
2.
∈ ∂H x(t),p(t) + γ(s)(s) п.в. на [0,T];
x(t)
0
(
t
)
3. H x(t), p(t) + γ(s)(s)
= 0 на [0,T];
0
T
4. p(T) + γ(s)(s) ∈ -NS(x(T)),
0
где NS (x(T)) - нормальный конус к S в точке x(T).
Доказательство леммы см. в Приложении. Ее применение облегчается тем об-
стоятельством, что в отличие от лагранжиана LJ соответствующий гамильтониан
HJ (θ) = sup (θ ·y -LJ(y)), где θ ∈ RK, имеет сравнительно простой вид. Пусть для
y∈RK
θ = (θ1,...,θK)T и k = 1,2,...,K
(
)
hk(θ) = ek
(eθ - 1)pkℓ + 1
- 1.
(1.4)
=1
Вычисления, приводимые в Приложении, показывают, что
(
)
LJ(y) = sup
θkyk - (eθk - 1)λk -
hk(θ)+μk -
hk(θ)μk
,
(1.5)
θ∈RK k=1
k=1
k∈J
k∈Jc
где используется обозначение u+ = max(u, 0). Отсюда, в частности, вытекает, что
функция LJ выпукла и полунепрерывна снизу. Кроме того,
HJ (θ) = (eθk - 1)λk + hk(θ)+μk +
hk(θ)μk.
(1.6)
k=1
k∈J
k∈Jc
Обозначим также
H0(θ) = H(θ) = (eθk - 1)λk + hk(θ)μk.
(1.7)
k=1
k=1
Следующее утверждение вытекает из леммы 1 с L(x, y) = LJ (y) и g(x) =
x2i, так
что мера μ равна нулю.
i∈J
Лемма 2. Оптимальное движение в грани FJ происходит с постоянным им-
пульсом θ, таким что HJ (θ) = 0, а уравнение для оптимальной траектории имеет
85
вид
˙q(t) ∈ ∂HJ (θ) п.в.
(1.8)
Эта лемма оставляет открытым вопрос о существовании оптимальных траекто-
рий. К сожалению, в отличие от случая фиксированного интервала времени, в рас-
сматриваемой постановке существование оптимальной траектории не следует из
компактности множеств {q : I(q) u}, где u 0. Далее, как правило, будем предпо-
лагать, что оптимальная траектория существует, и будем исследовать ее свойства.
Существование и единственность будут доказаны с помощью ad hoc рассуждений.
§ 2. Свойства гамильтониана
В этом параграфе найдены кандидаты для оптимальных импульсов θ при движе-
нии в гранях FJ . Предварительно введем некоторые обозначения. Для квадратной
матрицы B через B(i | j) обозначается матрица, получающаяся из B выбрасыванием
i-й строки и j-го столбца. Аналогично, через b·ℓ обозначим-й столбец матрицы B
без-го элемента, а через bℓ· --ю строку без-го элемента.
(
)T
Пусть вектор θ(m) =
θ(m)1, . . . , θ(m)K
= 0, где m ∈ {1, 2, . . ., K}, удовлетворяет
уравнениям hk(θ(m)) = 0 при k = m и H0(θ(m)) = 0. В силу (1.4) отношения amℓ =
= (eθℓm) - 1)/(eθmm) - 1) при m = удовлетворяют системе уравнений
amk - amℓpkℓ = pkm, k = m.
(2.1)
=m
(Заметим, что если θmm) = 0, то θ(m)k = 0 для всех k в силу (1.4).) Уравнения (2.1)
имеют единственное решение
(
)-1
aTm· =
(I - P )(m | m)
p·m.
(2.2)
Кроме того, amm = 1. Числа amℓ определяются этими условиями единственным об-
разом и являются неотрицательными. Подстановка в условие H0(θ(m)) = 0 (см. (1.7))
показывает, что
1- amℓpmℓ
=1
eθmm) =
μm.
(2.3)
amℓλ
=1
(
)T
Обозначим θ =
θ(1)1, θ(2)2, . . . , θ(K)K
и
ν = (I - PT)-1λ,
(2.4)
где λ = (λ1, . . . , λK )T . В стационарном режиме ν = (ν1, . . . , νK )T - это вектор сред-
них потоков через узлы сети. Положим ρm = νmm, где m ∈ {1, 2, . . . , K}. Сле-
дующая теорема показывает, в частности, что точка пересечения гиперплоскостей
: θm = θmm)} лежит на поверхности H0(θ) = 0.
Теорема 2. Имеют место соотношения H0(θ) = 0 и emm) = ρm для m ∈
∈ {1, 2, . . ., K}.
Предпошлем доказательству ряд лемм. Будем предполагать, что B = (bij ) -
(K × K)-матрицa с ненулевым определителем и ненулевыми главными минорами.
Ниже adj используется для обозначения присоединенной матрицы, det - для обо-
значения определителя, а через Mij (ℓ | ℓ) обозначается минор (i, j)-го элемента мат-
86
рицы B(ℓ | ℓ). Для = m положим
{em,
если m < ℓ,
fmℓ =
(2.5)
em-1, если m > ℓ,
где ei - i-й вектор стандартного базиса в RK-1.
Лемма 3. Если ℓ = m, то
fTmℓ adj(B(ℓ|ℓ))b·ℓ = (-1)m++1 det(B(ℓ|m)).
Доказательство. Пусть ℓ > m. Имеем
eTm adj(B(ℓ|ℓ))b·ℓ =
(-1)m+j Mjm(ℓ | ℓ)bjℓ +
(-1)m+j-1Mj-1,m(ℓ | ℓ)bjℓ.
j=1
j=+1
Так как Mjm(ℓ | ℓ) = Mj,ℓ-1(ℓ | m) при j ℓ - 1 и Mj-1,m(ℓ | ℓ) = Mj-1,ℓ-1(ℓ | m) при
j+ 1, получаем, что eTm adj(B(ℓ|ℓ))b·ℓ = (-1)m++1 det(B(ℓ|m)).
Рассмотрим случай ℓ < m. Рассуждая аналогичным образом, получаем
eTm-1 adj(B(ℓ|ℓ))b·ℓ =
(-1)m+j-1Mj,m-1(ℓ | ℓ)bjℓ +
j=1
+
(-1)m+j Mj-1,m-1(ℓ | ℓ)bjℓ =
(-1)m+j-1Mjℓ(ℓ | m)bjℓ +
j=+1
j=1
+
(-1)m+j Mj-1,ℓ(ℓ | m)bjℓ = (-1)m++1 det(B(ℓ | m)).
j=+1
Лемма 4. Для произвольного ℓ ∈ {1,2,...,K} имеет место равенство
bℓℓ det(B(ℓ|ℓ)) - bℓ· adj(B(ℓ|ℓ))b·ℓ = det(B).
Доказательство. Так как
bℓ· adj(B(ℓ|ℓ))b·ℓ =
bℓjfTjℓ adj(B(ℓ|ℓ))b·ℓ,
j=
то применяя лемму 3, получаем
bℓ· adj(B(ℓ|ℓ))b·ℓ =
bℓj(-1)j++1 det(B(ℓ|j)) = - det(B) + bℓℓ det(B(ℓ|ℓ)).
j=
Лемма 5. Имеют место равенства
(
)-1
(
)-1
b
B(m | m)
b·m
bℓmfTmℓ
B(ℓ | ℓ)
b·ℓ
(
)-1
=
(
)-1
(2.6)
bmm - b
B(m | m)
b·mℓ=m bℓℓ - bℓ·
B(ℓ | ℓ)
b·ℓ
и
bmmfTℓm(B(m|m))-1b·m
bℓm
-
=-
+
bmm - b(B(m|m))-1b·m
bℓℓ - bℓ·(B(ℓ|ℓ))-1b·ℓ
bkmfTlk(B(k |k))-1b·k
+
(2.7)
bkk - b(B(k |k))-1b·k
k=ℓ,
k=m
87
Доказательство. Умножая числители и знаменатели в обеих частях (2.6) на
определители обращаемых матриц, видим, что (2.6) равносильно равенству
b adj(B(m|m))b·m
=
bmm det(B(m|m)) - b adj(B(m|m))b·m
bℓmfTmℓ adj(B(ℓ|ℓ))b·ℓ
=
(2.8)
bℓℓ det(B(ℓ|ℓ)) - bℓ· adj(B(ℓ|ℓ))b·ℓ
=m
По лемме 4 знаменатели в (2.8) равны det(B) = 0. Поэтому нужно доказать, что
b adj(B(m|m))b·m =
bℓmfTmℓ adj(B(ℓ|ℓ))b·ℓ.
=m
Применяя лемму 3, получаем
bℓmfTmℓ adj(B(ℓ|ℓ))b·ℓ =
bℓm(-1)m++1 det(B(ℓ|m)) =
=m
=m
= -det(B) + bmm det(B(m|m)),
что завершает доказательство (2.6) в силу леммы 4.
Аналогично доказательству (2.6) имеем, что (2.7) эквивалентно равенству
-bmmfTℓm adj(B(m|m))b·m = -bℓm det(B(ℓ|ℓ)) +
bkmfTlk adj(B(k |k))b·k.
(2.9)
k=ℓ,
k=m
По лемме 3
bkmfTlk adj(B(k |k))b·k =
bkm(-1)k++1 det(B(k |ℓ)).
(2.10)
k=
k=
Так как
bkm(-1)k+ det(B(k |ℓ)) = 0 в силу того, что сумма в левой части яв-
k=1
ляется определителем матрицы, получающейся из матрицы B заменой-го столбца
на m-й, то правая часть (2.10) равна bℓm det(B(ℓ | ℓ)). Полученное равенство эквива-
лентно (2.9).
Доказательство теоремы 2. Будем доказывать сначала второе утвержде-
ние. Покажем, что
1
akmpkm
=1+
(2.11)
1- amℓpmℓ
k=1 1 - akℓpkℓ
=1
=1
и
amℓ
akℓpkm
=
при условии, что = m.
(2.12)
1-
amkpmkk=1 1 -
akℓ pkℓ
k=1
=1
Так как amm = 1, то равенство (2.11) можно представить в виде
amℓpmℓ
=m
akmpkm
=
(2.13)
1-pmm -
amℓpmℓ
1-pkk - akℓpkℓ
k=m
=m
=k
В силу равенств (2.1), (2.2) и (2.5) имеем amℓ = fTℓm((I - P)(m|m))-1p·m и akm =
= fTmk((I - P)(k |k))-1p·k. Это позволяет представить (2.13) в виде
88
(
)-1
(
)-1
p
(I - P )(m | m)
p·m
pkmfTmk
(I - P )(ℓ | ℓ)
p·k
(
)-1
=
(
)-1
,
1-pmm -p
(I - P )(m | m)
p·mk=m 1 - pkk - p
(I - P )(ℓ | ℓ)
p·k
что является частным случаем (2.6) в утверждении леммы 5 при B = I - P . Равен-
ство (2.11) доказано. Докажем (2.12). Перепишем это равенство в виде
amℓ(1 - pmm)
pℓm
=
+
1-pmm - amkpmk
1-pℓℓ -
aℓℓ pℓℓ
k=m
=
akℓpkm
+
,
где = m.
(2.14)
1-pkk -
akℓ pkℓ
k=ℓ,
=k
k=m
Как и выше, в силу (2.2) и (2.5) равенство (2.14) эквивалентно соотношению
(1 - pmm)fTℓm((I - P )(m | m))-1p·m
pℓm
=
+
1 - pmm - p((I - P)(m|m))-1p·m
1 - pℓℓ - pℓ·((I - P)(ℓ|ℓ))-1p·ℓ
pkmfTlk((I - P)(k |k))-1p·k
+
1 - pkk - p((I - P)(k |k))-1p·k
k=ℓ,
k=m
и выполнено в силу (2.7) в утверждении леммы 5. Это завершает доказательство
равенства (2.12).
Положим
amk
cmk =
(2.15)
1- amℓpmℓ
=1
и C = (cmk). Покажем, что
C = (I - PT)-1.
(2.16)
В силу (2.15) соотношение (2.12) принимает вид cmℓ =
pkmckℓ, так что (m, ℓ)-эле-
k=1
менты матриц C и PT C совпадают, если m =. Так как amm = 1, соотношение (2.15)
позволяет переписать (2.11) в виде cmm = 1+ pkmckm. Следовательно, диагональ-
k=1
ные элементы матриц C и I + PT C совпадают. Таким образом, C = I + PT C, что
доказывает (2.16). Так как amm = 1, то в силу (2.15) имеем 1- amℓpmℓ = 1/cmm и
=1
cmk
amk =
(2.17)
cmm
С учетом (2.3), (2.4) и (2.16) получаем eθmm) = μm
cmkλk = μmm = 1m.
k=1
Для завершения доказательства теоремы 2 заметим, что в силу (1.4), (1.7) и
определения θ
(
)
∑(
)
H0(θ) =
eθmm) - 1
λm + ekk)pkmμk - em )
μm
m=1
k=1
Так как ekk) = νkk и ν = λ + PT ν, то λm +
ekk) pkmμk - emm) μm = 0.
k=1
89
)T
(θ(J)
θ(J)
Пусть
θ(J) =
,...,θ(J)K
задается соотношениями
= θ(k)k, если k ∈ J,
1
k
и hk(θ(J)) = 0 при k ∈ J. Заметим, что если J = {1, 2, . . ., K} \ {m}, то
θ(J) = θ(m).
В силу (1.6) и (1.7)
HJ (θ(J)) = H0(θ(J)).
(2.18)
Если движение происходит в гранях FJ1, . . . , FJ
k
со смещениями s1, . . . , sk в течение
промежутков времени t1, . . . , tk соответственно, то поскольку H0(θ(J)) = 0, как будет
показано в лемме 6, а также поскольку
θ(J) ·x = θ ·x при x ∈ FJ и имеет место (2.18),
затраты равны
(s )
)
(θ(J)·s
tlLJ
= sup (θ · s - tlHJ
(θ))
- tlHJ(θ(J))
=
t
θ∈RK
=1
=1
=1
∑(
)
=
θ · s - tlH0(θ(J))
= θ · (s1 + ... + sk) = θ · r,
(2.19)
=1
где через r обозначена точка, в которую необходимо попасть. В общем случае, если
q(0) = 0 и q(t) = r, то с учетом того, что
˙qk(s) = 0 для k ∈ J п.в. на множестве
{s : q(s) ∈ FJ },
t
t
L(q(s),
˙q(s)) ds =
1FJ (q(s))LJ (
˙q(s)) ds
J
0
0
t
)
(θ(J)
1FJ (q(s))
q(s) - H0(θ(J))
ds =
J
0
t
(
)
=
1FJ (q(s))
θ ·
q(s) - H0(θ(J))
ds = θ · r.
(2.20)
J
0
Если траектория из O в r такова, что в (2.19) и (2.20) достигаются равенства, т.е. вы-
полнены равенства (1.8) с θ =
θ(J), то эта траектория оптимальна. С другой стороны,
поскольку функции HJ (θ) строго выпуклы, так что их производные инъективны, ес-
t
ли для некоторого J с
1FJ (q(s))ds > 0 не выполнено соотношение (1.8) с θ =
θ(J),
0
то неравенство в (2.20) является строгим. Поэтому для достижения нижней грани-
цы в (2.20) необходимо, чтобы движение в грани FJ п.в. происходило с импульсом
θ=
θ(J).
Следующая лемма обобщает соотношение H0(θ) = 0.
Лемма 6. Имеет место равенство H0(θ(J)) = 0.
Доказательство. В силу (1.4), (1.7), определения
θ(J) и равенства emm) =
= ρm имеем
H0(θ(J)) =
(eθmm) - 1)λm +
(eθmJ) - 1)λm +
m∈J
m∈J
(
)
)
(∑
(m)
+
ekk)
(eθm
1)pkm + (eθmJ) - 1)pkm + 1
-1
μk =
k∈J
m∈J
m∈J
90
(
)
=
(eθmm) - 1) λm +
ekk) pkmμk - em )
μm
+ (eθmJ) - 1) ×
m∈J
k∈J
m∈J
(
)
(
)
× λm + ekk)pkmμk
= (eθm)
- 1) λm + pkmνk - νm
+
k∈J
m∈J
k∈J
(
)
+ (eθm)
- 1) λm + pkmνk
(2.21)
m∈J
k∈J
Так как ввиду определения ν (см. (2.4)) λm +
pkmνk = νm - pkmνk, то
k∈J
k∈J
(
)
(eθm)
- 1) λm + pkmνk
=
m∈J
k∈J
= (eθm)
- 1)νm - νk (eθmJ) - 1)pkm.
(2.22)
m∈J
k∈J m∈J
Так как hk(θ(J)) = 0 при k ∈ J, то
(eθmJ) - 1)pkm = eθkJ) - 1 -
(eθmm) - 1)pkm.
(2.23)
m∈J
m∈J
Таким образом, правая часть (2.22) равна
(eθmm) - 1)
pkmνk. В силу (2.21)
m ∈J
k∈J
(
)
H0(θ(J)) =
(eθm )
- 1) λm + pkmνk - νm
m∈J
k=1
Так как λm + pkmνk - νm = 0 в силу (2.4), то H0(θ(J)) = 0.
k=1
§ 3. Существенные и несущественные грани
В этом параграфе исследуется движение в гранях и приводится основной ре-
зультат. Скажем, что грань FJ является существенной, если существует траектория,
проходящая через FJ и удовлетворяющая на этом множестве утверждению леммы 2
с θ(J). В противномслучае грань называетсянесущественной. Поскольку
˙qk(t) = 0
п.в. при k ∈ J, если грань FJ существенна, то
0 ∈ ∂kHJ(θ(J)) при k ∈ J,
(3.1)
где черезkHJ (θ(J)) обозначено множество, получающееся проектированием мно-
жества ∂HJ (θ(J)) на k-ю координатную ось. Заметим (см. (1.4)), что
(
)
khk(θ) = -ek
1-
pkℓ +
eθ
pkℓ
(3.2)
=1
=k
и
hk(θ) = ek eθ pkℓ, ℓ = k.
(3.3)
Как следствие, получаем
lhk(θ) > 0, если = k и
khk(θ) < 0.
(3.4)
91
Заметим также, что если hk(θ) = 0, то ∂hk(θ)+ - это множество векторов α∇hk(θ),
где α ∈ [0, 1].
В силу (1.8) с θ =
θ(J), (3.2), (3.3) и равенства h(θ(J)) = 0 при ℓ ∈ J, если грань FJ
является существенной, то существуют числа α(J), ℓ ∈ J, из интервала [0, 1], такие
что при k ∈ J п.в.
0=
qk(t) = eθkJ) λk +
kh(θ(J))μ +
α(J)kh(θ(J))μ =
ℓ∈J
ℓ∈J
=eθkJ)λk +
eℓℓ) eθkJ) plkμ +
α(J)eℓJ) eθkJ) plkμ -
ℓ ∈J
ℓ∈J,
=k
(
)
(J)kekJ)
1-
pkℓ +
eθℓJ)pkℓ μk.
=1
=k
Так как hk(θ(J)) = 0, то
1-
pkℓ +
eθℓJ) pkℓ = eθkJ) (1 - pkk).
(3.5)
=1
=k
Поэтому требуется, чтобы при k ∈ J
λk + plkν + α(J)eℓJ) plkμ - α(J)kekJ) μk = 0.
ℓ ∈J
ℓ∈J
Так как λk + plkν = νk - plkν, то эквивалентным образом
ℓ∈J
ℓ∈J
α(J)kekJ) μk -
α(J)eℓJ) plkμ = νk -
plkν.
ℓ∈J
ℓ∈J
В векторной форме -
(I - PT )(Jc | Jc)(α(J)eℓJ) μ, ℓ ∈ J)T = (I - PT )(Jc | Jc)(ν, ℓ ∈ J)T .
Здесь и далее используются следующие обозначения: для матрицы W через W(U |V )
обозначена матрица, получающаяся из W выбрасыванием строк и столбцов с номе-
рами из множеств U и V соответственно.
Так как матрица (I - PT )(Jc | Jc) невырождена, то при ℓ ∈ J
α(J)eℓJ) μ = ν.
(3.6)
Поэтому для того чтобы грань FJ была существенной, необходимо, чтобы
ρ(J) ρ, ℓ ∈ J,
(3.7)
где использовано обозначение
ρ(J) = eℓJ) .
(3.8)
Так как в силу (2.23)
(I - P )(Jc | Jc)((ρ(J))-1 - 1, ℓ ∈ J)T = P (Jc | J)(ρ-1 - 1, ℓ ∈ J)T ,
92
то
(
)T
(
)-1
(ρ(J))-1 - 1, ℓ ∈ J
=
(I - P )(Jc | Jc)
P (Jc | J)(ρ-1 - 1, ℓ ∈ J)T .
(3.9)
(
)-1
Так как матрица
(I - P )(Jc | Jc)
P (Jc | J) неотрицательна, то ρ(J) 1 при ℓ ∈ J.
Кроме того, условие существенности (3.7) эквивалентно тому, что покомпонентно
(
)-1
(ρ-1 - 1, ℓ ∈ J)T
(I - P )(Jc | Jc)
P (Jc | J)(ρ-1 - 1, ℓ ∈ J)T .
(3.10)
Если k ∈ J, то в силу (1.8) с θ =
θ(J), (2.4), (3.2), (3.3) и (3.6) для траектории
с импульсом
θ(J) в грани FJ имеем
qk(t) = eθkk) λk +
eℓℓ) eθkk) plkμ +
α(J)eℓJ) eθkk) plkμ -
ℓ ∈J,
ℓ∈J
=k
(
)
(
)
-ekk)
1-
pkℓ +
eθℓJ)pkℓ μk = ρ-1
λk + plkν
-
k
=1
=k
=1
(
)
(
-
1 + (eθℓJ)
- 1)pkℓ νk = μk -
1 + (ρ-1 - 1)pkℓ +
=1
ℓ ∈J
)
∑(
)
+
(ρ(J))-1 - 1
pkℓ νk.
(3.11)
ℓ∈J
Аналогичные рассуждения (или формальная подстановка J = в последнее выра-
жение в (3.11)) показывают, что для любого k
(
)
kH0(θ) = μk -
1 + (ρ-1
- 1)pkℓ νk,
(3.12)
=1
так что при k ∈ J
∑(
)
˙qk(t) =kH0(θ) +
ρ-1 - (ρ(J))-1
pkℓνk.
(3.13)
ℓ∈J
Так как в силу (3.5) и (3.8) для k ∈ J равенство (3.12) может быть записано в виде
(
)
(
)
kH0(θ) =
ρ-1k - (ρ(J)k)-1
νk - pkℓ
ρ-1 - (ρ(J))-1
νk
(3.14)
=1
и
˙qk(t) = 0 п.в., то п.в. для k ∈ J
(
)
∑(
)
˙qk(t) =kH0(θ) -
ρ-1k - (ρ(J)k)-1
νk +
ρ-1 - (ρ(J))-1
pkℓνk.
(3.15)
ℓ∈J
Напомним определение двойственной сети Джексона. В такой сети интенсивности
обслуживания в узлах те же, что в исходной сети. Потоки двойственной сети имеют
те же интенсивности, что и в исходной, но направлены в противоположную сторо-
ну. Таким образом, обозначая параметры двойственной сети теми же символами,
но с верхней чертой, имеем μk = μk, νk = νk и νkpkℓ = νplk. Также меняются ме-
(
)
(
)
стами входящие и выходящие потоки: λk = νk 1 - pkℓ и λk = νk 1 - pkℓ .
=1
=1
93
(Следующее рассуждение показывает, что матрица P = (pkℓ) является субстохасти-
ческой. Так как ν = λ + PT ν, то ν PT ν покомпонентно. Поэтому νk
plkν,
=1
т.е.
pkℓ=
plkνk 1.) Если сеть Джексона находится в стационарном состо-
=1
=1
янии, то обращение во времени приводит к стационарной двойственной сети.
В этих обозначениях в силу (3.13) и (3.15), если q(t) ∈ FJ , то п.в.
˙q(t) = ∇H0(θ) - (I - PT )ϕ(J),
где
{
-1
(ρ
- (ρ(J))-1)ν, если ℓ ∈ J,
ϕ(J) =
(3.16)
0
в противном случае.
Кроме того, (3.12) принимает вид
-∇H0(θ) = λ - (I - PT )μ,
(3.17)
где μ = (μ1, . . . , μK )T . (Заметим, что правую часть также можно представить в ви-
де ∇H0(0).) Пусть T > 0. Обозначая q(t) = q(T - t), где 0 t T , получаем,
что п.в.
q(t)=λ- (I - PT )μ + (I - PT )ϕ˙(t),
(3.18)
где
ϕ(t) =
1FJ (q(t))ϕ(J).
(3.19)
J
Так как ϕ˙k(t) = 0, если qk(t) > 0, в силу (3.16), то (3.18) означает, что q(t) получа-
ется косым отражением функции q(T ) + (λ - (I - PT )μ)t, т.е. является жидкостной
траекторией, начинающейся в конечной точке r, длин очередей в сети Джексона
с интенсивностями входных потоков λk, интенсивностями обслуживания μk и матри-
цей переходов P. Покажем обратное: если q - жидкостная траектория двойственной
системы, начинающаяся в конечной точке r, то ее обращение во времени является
оптимальной траекторией. Так как q - решение задачи косого отражения, то имеет
место (3.18), где ϕ(t) - покомпонентно неубывающая абсолютно непрерывная функ-
ция, такая что qk(t)ϕ˙k(t) = 0 п.в. Ввиду (3.17), если q(t) ∈ FJ , то для сужений векто-
ров на J и матриц на J ×J будет выполнено п.в. ϕ˙J (t) = (IJ,J -PTJ,J )-1(-∇H0(θ)J ).
В силу (3.14) и (3.16) имеемϕ˙J(t) = ϕ(J)J, т.е. выполнено (3.19). Таким образом, обра-
щение траектории q проходит через FJ с импульсом
θ(J). Поэтому грани FJ в (3.19)
существенные. Также получаем, что ϕ(J) 0 при ℓ ∈ J и что (3.7) не только необхо-
димо, но и достаточно для существенности FJ , поскольку жидкостная траектория,
начинающаяся в FJ , будет там находиться некоторое время, если выполнено (3.7).
Следовательно, обращение оптимальной траектории с импульсами
θ(J), которая по-
падает из некоторой точки A в некоторую точку B, является жидкостной траекто-
рией для попадания из B в A для двойственной сети, и наоборот.
Так как исходная сеть Джексона предполагается эргодической, то двойствен-
ная сеть тоже эргодична, так что жидкостная траектория двойственной сети, на-
чинающаяся в точке r, попадает в конце концов в начало координат. Более того,
соответствующая траектория состоит из конечного числа отрезков, принадлежа-
щих граням FJ с возрастающими по включению множествами J, кроме, возможно,
94
“одноточечного отрезка”, представляющего собой начальную точку (см., например,
[13, леммы 5.3, 5.4, с. 142, 143]). Поэтому оптимальная траектория из O в r существу-
ет, единственна и состоит из конечного числа отрезков, принадлежащих граням FJ
с убывающими по включению множествами J, кроме, возможно, “одноточечного от-
резка”, представляющего собой конечную точку (см. рис. 9 ниже). Пусть T - время,
за которое жидкостная траектория q(t), начинающаяся в конечной точке r, попа-
дает в начало координат. Положим q(t) = q(T - t) при 0 t T. (Напомним,
что q достигает нижней границы затрат, см. (2.19).) Нами доказана следующая
Теорема 3. Построенная траектория q(t) является единственной опти-
мальной с точностью до времени, проведенного в начале координат. Движение
в существенной грани FJ происходит с импульсом
θ(J). Затраты на достижение
точки r при движении по этой траектории равны L(q(t), q˙(t)) dt = θ · r.
0
Как следствие теоремы 3 получаем, что жидкостная траектория q двойственной
сети, начинающаяся в точке r, достигает начала координат, проходя через последо-
вательность существенных граней, в каждой из которых она проводит положитель-
ное время. Если начальное значение принадлежит несущественной грани, то траек-
тория сразу же уходит из этой грани. В существенной грани FJ движение происхо-
дит в соответствии с уравнениями qk(t) = -∂kH0(θ) - (ρ-1 - (ρ(J))-1)pkℓνk, если
ℓ∈J
k ∈J
q
(t) = 0 п.в., если k ∈ J (см. (3.11), (3.13)). Заметим также, что поскольку
k
q(t) = λ + (PT - I)d(J) при q(t) ∈ FJ , где через d(J) = (d(J)1, . . . , d(J)K)T обозначен
вектор интенсивностей потоков, протекающих через узлы, то в силу (3.18) и (3.19)
имеем d(J) = μ - ϕ(J). В силу (3.16) имеем d(J) = μ, если ℓ ∈ J, и d(J) = (ρ(J))-1ν,
если ℓ ∈ J. Так как 1ρ(J) ρ при условии, что грань FJ существенна, то в этом
(J)
случае ν d
μ. В силу (1.1) и (1.2) отсюда следует, что для двойственной
сети LJ(λ + (PT - I)d(J)) = 0. Как следствие,
L(q(t), q(t)) = 0 п.в.
(3.20)
Условие существенности имеет более явный вид для случая полуоси. Если грань
FJ - это полуось xm, то (3.9) принимает вид
(ρ(J))-1 - 1 = amℓ(ρ-1m - 1), ℓ = m,
(3.21)
а (3.10) (с учетом (2.2)) -
ρ-1 - 1 amℓ(ρ-1m - 1), ℓ = m.
(3.22)
(Разумеется, (3.22) можно получить напрямую из (3.6).) Подстановкой (3.21) в (3.11)
с учетом того, что
amℓpmℓ = 1-1/cmm (как показано в доказательстве теоремы 2),
=1
убеждаемся, что если полуось xm существенна, то
1m
˙q∗m(t) =
μm > 0,
cmm
как и следовало ожидать. Следующее свойство матрицы C доказано в Приложении.
Лемма 7. Имеет место неравенство cmℓcmm.
Из леммы 7, (2.17) и (3.22) следует, что если ρm максимально, то полуось xm
является существенной, т.е. в случае попадания на нее оптимальная траектория
будет находиться там некоторое время.
95
Замечание 1. Из теоремы 2 следует, что θ > 0 покомпонентно, и как следствие,
нижняя граница в (2.19) и (2.20) положительна для всех r тогда и только тогда,
когда рассматриваемая сеть эргодична. Таким образом, для неэргодической сети
Джексона на оптимальность импульсов
θ(J) при движении из O в r рассчитывать
не приходится. С другой стороны, сделанное наблюдение, что обращение уравнений
Гамильтона приводит к жидкостным уравнениям, остается в силе, и оценки (2.19)
и (2.20) могут быть полезны. Например, если θ < 0 покомпонентно, то жидкост-
ные траектории двойственной сети убегают на бесконечность, а затраты на переход
исходной сети из точки r в начало координат равны · r.
§4. Условные законы больших чисел. Обсуждение.
Как отмечено вначале, принцип больших уклонений позволяет получать лога-
рифмические асимптотики вероятностей редких событий и находить наиболее веро-
ятные сценарии, реализующие эти события. Следующие две леммы иллюстрируют
это утверждение. Напомним, что сеть предполагается эргодической.
Лемма 8. Для произвольного δ > 0
(
)
Q(nt)
Q(nT)
lim lim sup P sup
- q(t)
δ|
-r
ε
= 0.
≥
≤
ε→0
n→∞
tT
n
n
Кроме того,
(
)
1
Q(nT)
lim lim sup
ln P
-r
ε
=
≤
ε→0
n→∞ n
n
(
)
1
Q(nT)
= lim
lim inf
ln P
-r
ε
= · r.
≤
ε→0
n→∞ n
n
Доказательство. Для доказательства первого утверждения достаточно до-
казать, что
(
)
1
Q(nt)
Q(nT)
lim sup lim sup
ln P sup
- q(t)
δ|
-r
ε
< 0.
(4.1)
≥
≤
ε→0
n→∞ n
tT
n
n
В силу принципа больших уклонений
(
)
1
Q(nT)
lim inf
ln P
-r
ε
-
inf
I(q).
(4.2)
≤
n→∞ n
n
q: |q(T)-r|ε/2
Продолжим q на интервал времени (T, ∞) по закону больших чисел. Аналогично
(3.20) имеем L(q(t),
q(t))dt = 0. Поэтому I(q) = L(q(t),
˙q(t))dt. Так как
T
0
функция I(q) компактна снизу и q(T) = r, то
lim
inf
I(q) = inf I(q) I(q) =
L(q(t),
˙q(t))dt.
(4.3)
ε→0
q: |q(T)-r|ε/2
q: q(T)=r
0
Аналогично,
(
)
1
Q(nt)
Q(nT)
lim sup lim sup
ln P sup
- q(t)
δ,
-r
ε
≥
≤
ε→0
n→∞ n
tT
n
n
-
inf
I(q).
q: sup |q(t)-q(t)|δ,
tT∗
q(T )=r
96
T
Пусть последний инфимум достигается в точке q. Так как inf
L(q(t),
˙q(t)) dt
q,T: q(T)=r 0
достигается на единственной траектории q и q = q, то I(q) L(q(t),q(t)) dt >
0
> L(q(t),
˙q(t))dt. Таким образом,
0
(
)
1
Q(nt)
Q(nT)
lim sup lim sup
ln P sup
- q(t)
δ,
-r
ε
<
≥
≤
ε→0
n→∞ n
tT
n
n
T
<- L(q(t),
˙q(t))dt.
0
С учетом (4.2) и (4.3) получаем (4.1). Второе утверждение леммы следует, по суще-
ству, из (4.2).
В качестве еще одного применения рассмотрим момент достижения суммарной
}
очередью большого значения: τn = inf t :
Qk(nt) nA . Определим r как точку
k=1
минимума θ · x по всем x = (x1, . . . , xK )T RK+ , таким что
xk = A. “В общем
k=1
положении” такая точка r определяется единственным образом.
Лемма 9. Для всех достаточно больших T
1
lim
ln P(τn T ) = · r
(4.4)
n→∞ n
и
(
)
Q(nt)
lim P sup
- q(t)
δ|τnT
= 1.
(4.5)
n→∞
n
<
tτn
Доказательство. Рассуждения аналогичны тем, которые использовались
при доказательстве леммы 8. Покажем, что для достаточно больших T
inf
I(q) =
inf
I(q) = θ · r.
(4.6)
q: sup
qk(t)>A
q: sup
qk(t)A
tT k=1
tT k=1
Для ε > 0 обозначим через qε,∗ оптимальную траекторию для попадания из начала
координат в точку r(1 + ε), построенную в доказательстве теоремы 3. Предполага-
ется, что она продолжена в соответствии с законом больших чисел после попадания
в r(1 + ε). Поскольку qε,∗ до момента попадания в r(1 + ε) - это обращенная жид-
костная траектория двойственной системы, то существует
T > 0 такое, что все тра-
ектории qε,∗, соответствующие ε ∈ [0, 1], попадают в точку назначения к моменту
T
(см., например, [13, лемма 5.4, с. 143]). Для T
T имеем
θ · r = I(q) =
inf
I(q)
inf
I(q)
q:
qk(t)A для некоторого t>0
q: sup
qk(t)A
k=1
tT k=1
inf
I(q)
inf
I(q) I(qε,∗) = θ · r(1 + ε).
q: sup
qk(t)>A
q: sup
qk(t)A(1+ε)
tT k=1
tT k=1
97
Устремляя ε к нулю, получаем (4.6). Так как в силу принципа больших уклонений
(
)
1
1
Q(nt)
lim sup
ln P(τn T ) = lim sup
ln P sup
A-
inf
I(q),
n→∞ n
n→∞ n
tT
n
q: sup
qk(t)A
(
)
tT k=1
1
1
Q(nt)
lim inf
ln P(τn T ) = lim inf
ln P sup
A-
inf
I(q),
n→∞ n
n→∞ n
tT
n
q: sup
qk(t)>A
tT k=1
то (4.4) вытекает из (4.6).
Для доказательства (4.5) обозначим τ(q) = inf{t : q(t) A}, где q = (q(t), t 0)
D(R+, RK+ ). Так как множество
{
}
K
q ∈ D(R+,RK+) : sup |q(t) - q(t)| δ, sup
qk(t) A
tτ (q)
tT k=1
содержит те свои предельные точки, которые являются непрерывными функциями,
и так как I(q) =, если q разрывна, то
(
)
1
Q(nt)
lim sup
ln P sup
- q(t)
δ, τn T
≥
n→∞ n
tτn
n
-
inf
I(q).
q: sup
|q(t)-q(t)|δ,
tτ(q)
qk(t)A для некоторого t∈[0,T]
k=1
Так как множество, по которому берется инфимум, замкнуто, то эта нижняя грань
достигается некоторой функцией q. Пусть число
T ∈ [0,T] таково, что
qk
T) A.
T
k=1
Поскольку
inf
L(q(t),
˙q(t)) dt достигается в единственной точке (q, T ) =
0
(q,T ):
qk
(T )A
k=1
= (q, T) и q = q, то I(q) L(q(t),q(t)) dt > L(q(t),
˙q(t))dt = θ · r. Поэтому
0
0
(
)
1
Q(nt)
lim sup
ln P sup
- q(t)
δ, τn T
< -θ · r.
≥
n→∞ n
tτn
n
Сопоставляя это неравенство с (4.4), получаем, что для всех достаточно больших T
(
)
1
Q(nt)
lim sup
ln P sup
- q(t)
δ|τnT
< 0,
≥
n→∞ n
tτn
n
что влечет за собой (4.5).
Есть примечательное объяснение тому, что q получается обращением времени
из q. Как и в [14] (см. также [15]), заметим, что
(
)
Q(nt)
Q(nT)
P sup
- q(t)
δ|
-r
ε
=
≥
≤
tT
n
n
(
)
Q(n(T- t))
Q(nT)
= P sup
- q(T - t)
δ|
-r
ε
=
≥
≤
tT
n
n
(
)
Qn(nt)
Qn(0)
= P sup
- q(t)
δ|
-r
ε
,
≥
≤
tT
n
n
98
где Qn(t) = Q(nT - t). Если процесс Q(t) является стационарным, то процесс Qn
также является стационарным и представляет собой процесс длин очередей в обра-
щенной по времени сети Джексона. В частности, его распределение не зависит от n.
Так как q(t) является жидкостным пределом эргодической сети Джексона, то стан-
дартными методами можно показать, что последняя вероятность сходится к нулю
при n → ∞ и ε → 0. Похожие рассуждения можно найти в [16], а также в [9], где
стационарность также играет ключевую роль. (Отметим, что ни одна из этих работ
не опубликована в рецензируемых журналах.)
Так как θ · r =
inf
I(q), то в соответствии с общей теорией (см. [1,2]),
q: q(0)=0, q(T)=r
для некоторого T
а также исходя из второго утверждения леммы 8, можно предположить следующую
асимптотику стационарного распределения Q(t):
(
)
(
)
1
Q(nt)
1
Q(nt)
lim lim sup
ln P
-r
ε
= lim
lim inf
ln P
-r
ε
=
ε→0
<
ε→0
<
n→∞ n
n
n→∞ n
n
= · r.
В данном случае это свойство, очевидно, выполнено, так как стационарное распреде-
ление Q(t) известно явно: P(Q(t) = (i1, . . . , iK )) =
(1 - ρk)ρikk(см.,например,[3]).
k=1
§ 5. Пример: эргодическая сеть из двух узлов
Проиллюстрируем общие результаты на примере эргодической сети из двух уз-
лов. В этом случае анализ удается сделать более наглядным. Имеем
(
)
h1(θ) = e1
(eθ1 - 1)p11 + (eθ2 - 1)p12 + 1
- 1,
(5.1)
(
)
h2(θ) = e2
(eθ1 - 1)p21 + (eθ2 - 1)p22 + 1
- 1,
(5.2)
H1(θ) = (eθ1 - 1)λ1 + (eθ2 - 1)λ2 + h1(θ)+μ1 + h2(θ)μ2,
H2(θ) = (eθ1 - 1)λ1 + (eθ2 - 1)λ2 + h1(θ)μ1 + h2(θ)+μ2,
(5.3)
H0(θ) = (eθ1 - 1)λ1 + (eθ2 - 1)λ2 + h1(θ)μ1 + h2(θ)μ2.
Заметим, что h1(θ) = 0 тогда и только тогда, когда (eθ1 -1)/(eθ2 -1) = p12/(1-p11),
т.е. θ1 и θ2 имеют один и тот же знак, и следовательно, график h1(θ) = 0 ле-
жит в I и III квадрантах. Кроме того, h1(θ) > 0 над графиком и слева от него,
и h1(θ) < 0 под графиком и справа от него. Задавая θ2 как функцию θ1 в первом
квадранте уравнением h1(θ) = 0, получаем, дважды дифференцируя, что d2θ2/dθ21 =
= (1 - p11)/p12eθ12 - ((1 - p11)/p12eθ12 )2. Так как (1 - p11)/p12eθ12 = 1 +
+ (1 - p11 - p12)/p12e2 1, то θ2 является строго вогнутой функцией θ1, если
p11 +p12 < 1, и является линейной функцией θ1, если p11 +p12 = 1. Аналогично, гра-
фик h2(θ) = 0 лежит в I и III квадрантах, h2(θ) < 0 над графиком и слева от него,
h2(θ) > 0 под графиком и справа от него, θ2 является строго выпуклой функцией θ1
на графике h2(θ) = 0, если p22 + p21 < 1, и линейной функцией θ1, если p22 + p21 = 1.
Так как (1 - p11)/p12 p21/(1 - p22), то в I квадранте график h1(θ) = 0 лежит
над графиком h2(θ) = 0, причем строго над ним, если (1 - p11)/p12 > p21/(1 - p22).
В III квадранте график h1(θ) = 0 лежит под графиком h2(θ) = 0, причем строго под
ним, если (1 - p11)/p12 > p21/(1 - p22).
Найдем оптимальное движение из (0, 0) в (1, 0) по прямой. Движение происходит
в соответствии с гамильтонианом H2(θ) при дополнительном условии q2(t) = 0. То-
гда по лемме 1, выбирая g(q) = q22, так что γ(t) = 0, имеем (q1(t), 0) = (q1(t),
˙q2(t))
∈∂H2(θ).Какследствие,0∈∂2H2(θ
˙q1(t) ∈ ∂1H2(θ) (см. [11, предложение 2.3.15,
99
H0(θ) = 0
θ=θ(1)
h2(θ)=0
∇H0(θ(1))
∇H0(0)
Рис. 1. Случай, когда2H0(θ(1)) 0
h2(θ)=0
θ(1)
H0(θ) = 0
∇H0(θ)
θ
h2(θ)<0
h2(θ)>0
∇H0(0)
Рис. 2. Случай, когда2H0(θ(1)) > 0
с. 52]). Кроме того, H2(θ) = 0. Затраты равны 1 · θ1 + 0 · θ2 = θ1. В силу (5.1)-(5.3)
для того, чтобы2H2(θ) 0, необходимо, чтобы h2(θ) 0 (так как2h1(θ) > 0; см.,
например, (3.4)).
Заметим также, что если h2(θ) = 0, то
{(
)
}
eθ1λ1 +1h1(θ)μ1 + α∂1h2(θ)μ2
∂H2(θ) =
, α ∈ [0,1]
eθ2 λ2 +2h1(θ)μ1 + α∂2h2(θ)μ2
Таким образом, если точка
θ такова, что H0(θ) = 0, h2(θ) = 0, т.е.
θ = θ(1),
и 2H0(θ(1)) 0, то эта точка оптимальна. Если h2(θ) > 0, H0(θ) = 0 и2H0(θ) = 0,
то
θ также будет оптимальной. Как можно видеть, эти две возможности исключают
100
p
H0
(θ) = 0
r
θ(p)
θ
θ(1)
h2(θ)<0
h2(
θ)=0
∇H0(θ)
θ
h2(θ)>0
Рис. 3. Предпочтительность движения по вектору r
друг друга. Они иллюстрируются на рис. 1 и 2 соответственно. (Вектор ∇H0(0) изоб-
ражен по той причине, что принадлежность этого вектора III квадранту является
достаточным условием эргодичности сети.)
Рассмотрим оптимальные пути попадания из (0, 0) в r = (r1, r2). Сравним путь
по прямой и путь горизонтально и затем по прямой. Покажем, что в случае, ко-
гда движение сначала происходит горизонтально по некоторому вектору s = (s1, 0)
с импульсом
θ= (θ12), таким что2H0(θ) = 0 и h2(θ) > 0, как на рис. 2, непо-
средственное движение по вектору r не хуже. Рис. 3 иллюстрирует приводимые рас-
суждения. Затраты на движение сначала по вектору s и затем по вектору p = r - s
равны
θ1s1 + θ(p) · p, где через θ(p) обозначена точка на кривой H0(θ) = 0, в кото-
рой внешняя нормаль совпадает с вектором p. Обозначим также через
θ точку на
кривой H0(θ) = 0 с внешней нормалью r. Если r не лежит на оси абсцисс, то
θ=
θ,
поскольку движение с
θ горизонтально. Затраты на движение сразу по вектору r
равны
θ·r =
θ·s+
θ· p. Так как s ортогонален кривой H0(θ) = 0 в точке
θ и
функция H0(θ) является строго выпуклой, то (θ -
θ) · s 0, причем неравенство
является строгим, если r не лежит на оси абсцисс и s = 0. Аналогично, так как p
ортогонален кривой H0(θ) = 0 в точке θ(p), то (θ - θ(p)) · p 0. Таким образом,
θ· r θ · s + θ(p) · p, где неравенство является строгим, если r не лежит на оси
абсцисс, т.е. затраты при движении по негоризонтальному вектору r меньше затрат
при первоначальном движении по s.
Как и выше, пусть θ(1) - точка пересечения кривых H0(θ) = 0 и h2(θ) = 0,
и пусть θ(2) - точка пересечения кривых H0(θ) = 0 и h1(θ) = 0. Как доказано
в теореме 2, прямые θ1 = θ(1)1 и θ2 = θ(2)2 пересекаются в точке θ, которая лежит на
кривой H0(θ) = 0. Приведенный выше анализ показывает, что если2H0(θ(1)) > 0,
то начальное движение по горизонтали не является оптимальным. Более того, как
видно из дальнейшего, в этом случае движение вертикально, и затем пересечение
внутренности квадранта так, чтобы оказаться в нужном месте оси абсцисс, стоит
меньше даже в случае, когда требуется переместиться горизонтально. Аналогично,
начальное вертикальное движение не является оптимальным, если1H0(θ(2)) > 0.
101
H0 (θ)
θ(2)
θ
H0(θ) = 0
h1(θ)=0
θ(1)
h2(θ)=0
λ1 = 0,3,
λ2
= 0,5
∇H0(0)
μ1 = 1,97,
μ2 = 2,23
p11
= 0,23, p12 = 0,08
p21 = 0,3, p22 = 0,13
Рис. 4. Движение внутри квадранта направо и вверх
∇H0(θ)
H0(θ) = 0
C
θ
α
Q
P
CR=QR+QP ctg α
R
1
θ(1)
Рис. 5. Оптимальность движения по нормали в θ
Предположим, что2H0(θ(1)) 0 и1H0(θ(2)) 0 (см. рис. 4). В этом случае
1H0(θ(1)) > 0 и2H0(θ(2)) > 0. Тогда оптимальным горизонтальным движени-
ем является движение с импульсом θ(1), а оптимальным вертикальным - движение
с импульсом θ(2). Затраты на движение сначала по вектору s = (s1, 0) горизон-
тально и затем по вектору p равны θ(1)1s1 + θ(p) · p. Поэтому, как и на рис. 3, если
θ1 θ(1)1, что имеет место, если наклон вектора r больше наклона нормали к кривой
H0(θ) = 0 в точке θ, и соответственно,
θ находится слева от θ, то движение по r
предпочтительней. Предположим, что наклон вектора r меньше наклона нормали
к кривой H0(θ) = 0 в точке θ, т.е.
θ находится справа от θ. Найдем оптималь-
ное горизонтальное смещение s. Нужно минимизировать θ(1)1s1 + θ(p) · p по θ(p) при
условии, что r = p + s и p пропорционален ∇H0(θ(p)). Обозначая θ(p) через θ, а p
через p(θ), имеем θ(1)1s1 +θ ·p(θ) = θ(1)1(r1 -p1(θ))+θ ·p(θ) = θ(1)1r1(1)1p1(θ)+θ ·p(θ),
где κ∇H0(θ) = p(θ) для некоторого κ > 0. Так как p2(θ) = r2, то κ2H0(θ) = r2.
Минимизируем(1)1p1(θ) + θ · p(θ) при ограничениях H0(θ) = 0, κ∇H0(θ) = p(θ),
(
)
κ2H0(θ) = r2. Имеем(1)1p1(θ)+θ·p(θ) =
1H0(θ)/∂2H0(θ)(θ1(1)1)+θ2
r2. Пока-
жем, что1H0(θ)/∂2H0(θ)(θ1 - θ(1)1) + θ2 убывает на дуге [θ, θ]. Предположим, что θ
находится между
θ и θ. Рис. 5 иллюстрирует приводимые рассуждения. Точка P
соответствует переменному импульсу θ. Обозначим через α угол между нормалью к
H0(θ) = 0 в точке P и горизонталью через точку θ. Имеем1H0(θ)/∂2H0(θ) = ctg α.
102
r
r
r
Рис. 6. Оптимальные траектории для параметров рис. 4 в зависимости от конечной
точки
По свойству углов со взаимно перпендикулярными сторонами угол QCP между ка-
сательной к H0(θ) = 0 в точке θ и вертикальной прямой с абсциссой θ(1)1 также
равен α. Поэтому отрезок CQ, соединяющий точку (θ(1)1, θ2) и пересечение каса-
тельной с вертикальной прямой с абсциссой θ(1)1, равен (θ1 - θ(1)1)ctg α. Поэтому
1H0(θ)/∂2H0(θ)(θ1 - θ(1)1) + θ2 - длина вертикального отрезка CR от точки пере-
сечения касательной с вертикальной прямой с абсциссой θ(1)1 до оси абсцисс. По
мере того как точка θ движется по кривой H0(θ) = 0 от точки
θ против часовой
стрелки, длина этого отрезка уменьшается и достигает минимума, когда θ попадает
в точку θ. Если продолжать движение за θ против часовой стрелки, то отрезок
опять начнет увеличиваться. Таким образом, если начать двигаться горизонталь-
но, то оптимальным является движение с импульсом θ(1) до тех пор, пока наклон
прямой, соединяющей движущуюся точку и точку r, не станет равным наклону
внешней нормали в точке θ. После этого нужно двигаться прямолинейно с накло-
ном этой внешней нормали. Поскольку движение по r является частным случаем
начального движения горизонтально с s1 = 0, в этом случае оптимальное движе-
ние горизонтально лучше, чем движение по r. Наконец, если сначала двигаться
вертикально и затем по направлению к точке r, то поскольку
θ2 < θ2, ситуация
будет аналогична рассмотренному выше случаю, когда
θ1 < θ1, т.е. сразу двигать-
ся по прямой выгоднее. Таким образом, оптимальным является движение по оси
абсцисс до того момента, пока прямая, соединяющая движущуюся точку и точ-
ку r, не будет иметь тот же наклон, что и нормаль к H0(θ) = 0 в точке θ. После
этого оптимальным является движение по направлению этой нормали. При этом
s1 = r1 - p1 = r1 - ∂1H0(θ)/∂2H0(θ)r2 = r2(r1/r2 - ∂1H0(θ)/∂2H0(θ)). Затраты
равны θ(1)1s1 + θ · (r - s) = θ · r. Аналогично, если наклон вектора r больше на-
клона нормали в точке θ, то нужно сначала двигаться вертикально, пока наклон
не сравняется с наклоном нормали, а затем идти по нормали в θ. Затраты также
равны θ · r. Эти варианты иллюстрирует рис. 6.
Если2H0(θ(1)) 0 и1H0(θ(2)) > 0, то точка θ находится левее точки θ(2)
(см. рис. 7). Так как оптимальное вертикальное движение будет происходить в со-
ответствии с апексом кривой H0(θ) = 0, то оно будет уступать движению прямо
по направлению r. Геометрические рассуждения, аналогичные использованным вы-
ше, показывают, что в этом случае нужно двигаться горизонтально, пока наклон не
сравняется с наклоном внешней нормали в точке θ, и после этого “возвращаться” по
этой нормали. Если2H0(θ(1)) > 0 и1H0(θ(2)) 0 (см. рис. 8), то нужно двигаться
вертикально и потом “возвращаться”. Рис. 9 иллюстрирует оптимальные траектории
для параметров рис. 8. Ось абсцисс при этом является несущественной, так что опти-
мальная траектория, ведущая в точку на этой оси, проходит по оси ординат. Во всех
103
∇H0(θ)
θ
θ(2)
H0(θ) = 0
h1(θ)=0
h2(θ)=0
θ(1)
λ1 = 0,51, λ2 = 0,07
∇H0(0)
μ1 = 2,6,
μ2 = 4,7
p11 = 0,47, p12 = 0,08
p21 = 0,07, p22 = 0,1
Рис. 7. Движение внутри квадранта налево и вверх
λ1 = 0,12, λ2 = 0,38
μ1 = 2,36, μ2 = 1,04
p11 = 0,21, p12 = 0,11
p21 = 0,45, p22 = 0,16
H0(θ) = 0
θ(1)
θ(2)
θ
∇H0(θ)
∇H0(0)
Рис. 8. Движение внутри квадранта направо и вниз
случаях надо двигаться по одной из осей координат так, чтобы вектор, соединяю-
щий движущуюся точку с точкой назначения, стал коллинеарен нормали в точке θ.
После этого нужно двигаться по прямой к точке назначения. Если система эргодич-
на, то одна из этих комбинаций знаков2H0(θ(1)) и1H0(θ(2)) обязательно имеет
место. Затраты всегда равны θ ·r. Как следствие, если2H0(θ(1)) > 0 (соответствен-
но,1H0(θ(2)) > 0), то первоначальное движение по горизонтали (соответственно, по
вертикали) не является частью оптимального пути, т.е. ось абсцисс (соответственно,
ось ординат) является несущественной. Кроме того, оптимальный маршрут можно
получить, двигаясь по антиградиенту H0 в точке θ до пересечения с одной из осей
координат и затем двигаясь по этой оси в начало координат. Эта ось обязательно
является существенной. Рис. 10 и 11 иллюстрируют варианты оптимального движе-
104
r
r
Рис. 9. Оптимальные траектории при параметрах рис. 8
λ1 = 0,91,
λ2 = 0,6
μ1 = 2,8,
μ2 = 2,84
p11 = 0,13,
p12 = 0,52
p21 = 0,40,
p22 = 0,29
θ(2)
θ
=θ(1)
H0(θ) = 0
∇H0(θ)
∇H0(0)
Рис. 10. Горизонтальное движение внутри квадранта
ния внутри I квадранта параллельно одной из осей координат. (Хотя вектор ∇H0(0)
на рис. 10 не принадлежит III квадранту, выкладки показывают, что сеть тем не
менее эргодична.)
ПРИЛОЖЕНИЕ
Доказательство леммы 1. Если минимум L(x(t), x(t)) dt по T 0 и по абсолют-
0
но непрерывным функциям x(t), таким что x(0) = x0, (T, x(T )) ∈ S и g(x(t)) 0
для всех t T , где S - выпуклое замкнутое подмножество R × Rk, достигается
для времени T и функции x(t), то существуют мера μ на [0, T], μ-измеримая
функция γ(t) и абсолютно непрерывная функция p(t), такие что
1. γ(t) ∈ ∂>g(x(t)) для μ-почти всех t ∈ [0, T], и носитель меры μ содержится
в множестве {t ∈ [0, T] :>g(x(t)) =};
105
∇H
0(θ)
θ =θ(2)
H0(θ) = 0
θ(1)
λ1 = 1,25,
λ2 = 0,65
∇H0(0)
μ1 = 2,47,
μ2 = 3,45
p11 = 0,12,
p12 = 0,38
p21 = 0,16,
p22 = 0,24
Рис. 11. Вертикальное движение внутри квадранта
(
t
)
[
]
− p(t)
2.
∈ ∂H x(t),p(t) + γ(s)μ(ds) п.в. на [0,T];
x(t)
0
3. Существует постоянная h, такая что
(
t
)
H x(t), p(t) + γ(s)μ(ds)
= h на [0,T];
0
−h
4.
−NS(T, x(T)).
p(T)+ γ(t)μ(dt)
0
Несколько более подробно: если множество S имеет вид {T} × S′′ для некоторых
T > 0 и выпуклого замкнутого множества S′′ Rk, то утверждения 1 и 2 вытекают
из [17, теорема 10.2.1 и обсуждение, с. 362-364], а также из “гамильтоновой дуализа-
ции” (см. [17, теорема 7.6.5, с. 266]). Для общего выбора S можно применить прием
сведения задачи с нефиксированным временем к задаче с фиксированным време-
нем, как в [11, доказательство следствия 3.6.1, с. 142] (см. также [17, теорема 8.2.1,
с. 290]). Можно также применить [11, следствие 3.6.1, с. 142], где функция f - это
значение дополнительной переменной, так что ζ - единичный (k + 2)-вектор, у ко-
торого последний элемент равен единице, а все остальные - нулю, откуда следует,
что число λ в [11, условие 4), с. 142] не влияет на значения первых k + 1 компо-
нент в левой части. Используется также утверждение [11, предложение 2.4.4, с. 55],
в соответствии с которым ∂dS(T, x(T)) может быть заменено на NS(T, x(T)).
В условиях леммы 1 имеем S = R+ × S. Поэтому первая компонента всех век-
торов из NS(T, x(T)) равна нулю, например, согласно [11, теорема 2.5.6, с. 67].
Как следствие условия трансверсальности 4 имеем h = 0. Тот факт, что функ-
ция H из (1.3) может использоваться как функция H из [11, следствие 3.6.1, с. 142],
устанавливается рассуждениями, аналогичными использованным при доказатель-
стве теоремы 4.2.2 в [11, с. 156], где условие строгой липшицевости функции H
106
заменено на условие локальной липшицевости функции L. Результат, аналогичный
следствию 3.6.1 в [11, с. 142], содержится также в [17, теорема 10.5.1, с. 383].
Доказательство формулы (1.5). Заметим, что π(u) = sup(uθ - (eθ - 1)), где u 0.
θ∈R
Как следствие, применяя теорему о минимаксе к (1.1), получаем
LJ(y) =
inf
ψJ(a, d, ϱ) =
(a,d,ϱ)RK+ ×RK+ ×SK×K+ :
y=a+(ϱT -I)d
(
(
)
=
inf
sup
θak - (eθ - 1)λk
+
(a,d,ϱ)RK+ ×RK+ ×SK×K+ :
θ
k=1
y=a((ϱT -I)d
)
(
)
+ sup
θdk - (eθ - 1)μk
+ sup
θdk - (eθ - 1)μk
1(μ
k,∞)(dk)+
θ
θ
k∈Jc
k∈J
[
)
(
)
( (K
+ dk sup
θϱkℓ - (eθ - 1)pkℓ
+ sup
θ
1-
ϱkℓ
-
θ
θ
k=1
=1
=1
))])
- (eθ
1)
1-
pkℓ
=
=1
(
∑(
)
=
inf
sup
θkak - (eθk - 1)λk
+
(a,d,ϱ)RK+ ×RK+ ×SK×K+ :
θkkkℓk,
k=1
k,ℓ∈{1,2,...,K}
y=a+(ϱT -I)d
(
)
∑(
)
+
ϑkdk - (eϑk - 1)μk
+
ϑkdk - (eϑk - 1)μk
1(μk,∞)(dk) +
k∈Jc
k∈J
[
∑(
)
∑ )
+ dk
σkℓϱkℓ - (eσkℓ - 1)pkℓ
+τk
1-
ϱkℓ
-
k=1
=1
=1
)])
- (eτ
k - 1)
1-
pkℓ
=
=1
(
= sup
inf
θkak +
ϑkdk +
θkkkℓk,
(a,d,ϱ)RK+ ×RK+ ×SK×K+ :
k=1
k∈Jc
k,ℓ∈{1,2,...,K}
y=a+(ϱT -I)d
)
∑ ( K
+ ϑkdk1(μ
dk
σkℓϱkℓ +
dkτk
1-
ϱkℓ
-
k,∞)(dk)+
k∈J
k=1
=1
k=1
=1
(
)
(eθk - 1)λk - (eϑk - 1)μk - (eϑk - 1)μk1
dk > μk
-
k=1
k∈Jc
k∈J
))
− dk (eσkℓ - 1)pkℓ - dk(eτk - 1)
1-
pkℓ
=
k=1
=1
k=1
=1
(
∑∑
= sup
inf
θkyk -
θϱkℓdk +
θkdk +
θkkkℓk,
(d,ϱ)RK+ ×SK×K+ :
k=1
k=1=1
k=1
k,ℓ∈{1,2,...,K}
y(ϱT -I)d
∑ )
+ ϑkdk + ϑkdk1(μ
k,∞)(dk)+
dk
σkℓϱkℓ +
dkτk
1-
ϱkℓ
-
k∈Jc
k∈J
k=1
=1
k=1
=1
107
-
(eθk - 1)λk -
(eϑk - 1)μk - (eϑk - 1)μk1(μ
k,∞)(dk)-
k=1
k∈Jc
k∈J
))
− dk (eσkℓ - 1)pkℓ - dk(eτk - 1)
1-
pkℓ
k=1
=1
k=1
=1
Найдем инфимум по ϱ. Нужно минимизировать
∑ ( + σkℓ - τk)dkϱkℓ при
k=1=1
условии, что
ϱkℓdk y + d, ϱkℓ 0 и
ϱkℓ 1. В соответствии с методом
k=1
=1
множителей Лагранжа (см., например, [18, теорема 6.2.4, с. 196]) существует неот-
рицательный вектор α = (α1, . . . , αK ), такой что достигается минимум выражения
∑(
)
+ σkℓ - τk + α
dkϱkℓ
k=1=1
(
)
при условии, что ϱkℓ 0 и
ϱkℓ 1. Если min
+ σkℓ - τk + α
0, то нужно
=1
)
взять ϱkm = 1, где (m + σkm - τk + αm) = min(θ + σkℓ - τk + α
и ϱkℓ = 0 при
(
)
= m. Если min
+ σkℓ - τk + α
> 0, то ϱkℓ = 0. Получаем, что минимум равен
(
)
dk min
+ σkℓ - τk + α
0, где использовано обозначение u ∧ 0 = min(u, 0).
k
Максимум по α достигается при α = 0. Это и есть нужное α.
Таким образом, обозначая
)
(
)
Vk = (eσkℓ - 1)pkℓ + (eτk - 1)
1-
pkℓ
+ max
θ - σkℓ
(k),
(П.1)
=1
=1
где используется обозначение u ∨ v = max(u, v), получаем
(
LJ(y) =
sup
inf
θkyk -
Vkdk +
θkkkℓk,
d∈RK
+ k=1
k=1
k,ℓ∈{1,2,...,K}
∑(
)
(
)
+
ϑk1(μ
dk +
θk + ϑk
dk - (eθk - 1)λk -
k,∞)(dk)+θk
k∈J
k∈Jc
k=1
)
(eϑk - 1)μk - (eϑk - 1)μk1(μ
=
k,∞)(dk)
k∈Jc
k∈J
(
∑(
)
= sup
inf
θkyk -
Vkdk +
ϑk1(μ
dk +
k,∞)(dk)+θk
θkkkℓk:
d∈RK
+ k=1
k=1
k∈J
θk+ϑkVk
(
)
+
θk + ϑk
dk - (eθk - 1)λk -
(eϑk - 1)μk -
k∈Jc
k=1
k∈Jc
)
(
-
(eϑk - 1)μk1(μ
= sup
θkyk +
k,∞)(dk)
θkkkℓk:
k∈J
k=1
θk+ϑkVk
)
(
)
+ μk
θk + ϑk - Vk - (eϑk - 1)
0 - (eθk - 1)λk -
(eϑ
k - 1)μk
(П.2)
k∈J
k=1
k∈Jc
108
Поясним, как получается последне(равенство. Если брать и)фимум членов с dk по
dk > μk для k ∈ J, то получится μk
-Vk + θk +ϑk - (eϑk - 1)
. Если брать инфимум
по dk μk, то получится (k(θk - Vk) 0 . Поскольк)ϑk - (eϑk - 1) 0, то минимум
этих выражений равен μk
-Vk + θk + ϑk - (eϑk - 1)
0.
Проминимизируем Vk по σkℓ, τk. В силу (П.1) эта функция выпукла по (σkℓ, τk).
Если pkℓ = 0 для некоторого, то можно положить σkℓ =, что позволяет огра-
ничиться рассмотрением тех, для которых pkℓ > 0. Аналогично можно исключить
из рассмотрения τk, если
pkℓ = 1, полагая τk =. Поэтому минимум правой
=1
части (П.1) существует. В этой точке субдифференциал содержит нулевой вектор.
Обозначим через βk значение максимума в правой части (П.1). Субдифферeнциал
правой части (П.1) по ((σkℓ, ℓ ∈ {1, 2, . . . , K}), τk) равен
(
))
k
(eσkℓ pkℓ, ℓ ∈ {1, 2, . . . , K}), eτ
1-
pkℓ
-
=1
(
)
- co
(1U (), {ℓ ∈ 1, 2, . . . , K}), 1β
k
(k)
,
где co обозначает операцию взятия выпуклой оболочки, а U - множество (возможно,
пустое) тех, для которых θkℓ = βk. Так как в точке минимума субдифференци-
ал содержит нулевой вектор, то U содержит все, такие что pkℓ > 0, и τk =k, если
pkℓ < 1. Поэтому существуют неотрицательные α1,...,αKK+1, сумма которых
=1
)
равна 1, такие что eσkℓ pkℓ - α = 0 для ℓ ∈ U, α = 0 для ℓ ∈ U, eτk 1- pkℓ
-
=1
K+1 = 0 при условии, что τk = k, и αK+1 = 0 в противном случае. Таким об-
)
разом, α = eσkℓ pkℓ для всех ℓ ∈ {1, 2, . . . , K} и αK+1 = eτk 1 - pkℓ . Получаем,
(
)
=1
что eσkℓ pkℓ + eτk 1- pkℓ
= 1. Так как θ - σkℓ = βk, если pkℓ > 0, и τk =k,
=1
=1
)
если 1 - pkℓ > 0, то
ek+θ pkℓ + ek
1- pkℓ
= 1, т.е. eβk =
eθ pkℓ +
=1
=1
=1
=1
)
+1 - pkℓ. Окончательно получаем, что βk = ln
eθ pkℓ + 1 -
pkℓ
, и мини-
=1
=1
=1
)
мум Vk равен (ek+θ - 1)pkℓ + (ek - 1) 1 - pkℓ
+βk =βk.
=1
=1
Таким образом, самое последнее выражение в (П.2) равно
(
(
)
sup
θkyk +
μk
θk + ϑk - βk - (eϑk - 1)
0-
θkk: θk+ϑkβk
k=1
k∈J
)
(eθk - 1)λk - (eϑ
k - 1)μk
(П.3)
k=1
k∈Jc
Если θk - βk 0, где k ∈ J, то выбор ϑk = 0 показывает, что супремум по ϑk
множителя при μk равен нулю. Поэтому (П.3) переписывается в виде
(
(
)
sup
θkyk +
1(-∞,βk)(θk)μk
θk + ϑk - βk - (eϑk - 1)
0-
θkk: θk+ϑkβk
k=1
k∈J
109
)
-
(eθk - 1)λk -
(eϑ
k - 1)μk
k=1
k∈Jc
Так как функция u - (eu - 1) убывает при u 0, то супремум по ϑk для k ∈ J
достигается на границе области ограничений. Соотношение (1.5) следует теперь из
определения hk(θ) в (1.4).
Доказательство леммы 7. Так как C = (I - PT )-1, то
1
cmℓ =
(-1)m+Mℓm,
det(I - PT )
где Mℓm - (ℓ, m)-минор матрицы I -PT . Заметим, что det(I -PT ) > 0. Действитель-
но, det I = 1 и det(I - λPT ) = 0 при λ ∈ [0, 1], поскольку спектральный радиус P
меньше единицы. По непрерывности det(I - PT ) > 0. Таким образом, требуется до-
казать, что (-1)m+Mℓm Mmm. Предположим, что = m+1. Нужно доказать, что
Mmm + Mm+1,m 0. В силу мультилинейности детерминанта Mmm + Mm+1,m явля-
ется детерминантом матрицы
I-P, где
I - единичная ((K -1)×(K -1))-матрица,
а
P - ((K - 1) × (K - 1))-матрица, получающаяся из PT сложением строк m и
m + 1 с последующим вычеркиванием m-го столбца. Так как матрица PT является
субстохастической по столбцам, то матрица
P также является субстохастической по
столбцам. Следовательно, ее спектральный радиус не превосходит единицы. Отсюда
следует, что det
I-
P) 0, т.е. Mm+1,m + Mm,m0. Пусть ℓ > m + 1. С помощью
последовательности транспозиций соседних строк и столбцов передвинем в матрице
I-P строку и столбец в положение строки m+1 и столбца m+1 соответственно,
сохраняя при этом взаимное расположение остальных строк и столбцов. Эта мат-
̃
рица по-прежнему имеет вид
I-
P. В нейM
m+1,m = (-1)ℓ-m-1Mℓm, так как знак
минора меняется только при транспозиции столбцов, иMmm = (-1)2(ℓ-m-1)Mmm.
Так как
Mmm (-1)Mm+1,m, то Mmm (-1)ℓ-m-2Mℓm = (-1)+mMℓm. Случай
ℓ < m рассматривается аналогично.
Автор выражает признательность С.А. Пирогову и А.Н. Рыбко за полезные об-
суждения и рекомендации по улучшению изложения.
СПИСОК ЛИТЕРАТУРЫ
1. Вентцель А.Д., Фрейдлин М.И. Флуктуации в динамических системах под действием
малых случайных возмущений. М.: Наука, 1979.
2. Shwartz A., Weiss A. Large Deviations for Performance Analysis: Queues, Communications,
and Computing. London: Chapman & Hall, 1995.
3. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979.
4. Жакод Ж., Ширяев А.Н. Предельные теоремы для случайных процессов. М.: Физмат-
лит, 1994.
5. Ethier S.N., Kurtz T.G. Markov Processes: Characterization and Convergence. New York:
Wiley, 1986.
6. Puhalskii A.A. The Action Functional for the Jackson Network // Markov Process. Related
Fields. 2007. V. 13. № 1. P. 99-136.
7. Atar R., Dupuis P. Large Deviations and Queueing Networks: Methods for Rate Function
Identification // Stochastic Process. Appl. 1999. V. 84. № 2. P. 255-296.
8. Ignatiouk-Robert I. Large Deviations of Jackson Networks // Ann. Appl. Probab. 2000.
V. 10. № 3. P. 962-1001.
9. Collingwood J. Path Properties of Rare Events. PhD Thesis. Univ. of Ottawa, Canada, 2015.
110
10. Bouchet F., Laurie J., Zaboronski O. Langevin Dynamics, Large Deviations and Instantons
for the Quasi-geostrophic Model and Two-Dimensional Euler Equations // J. Stat. Phys.
2014. V. 156. № 6. P. 1066-1092.
11. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.
12. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
13. Bramson M. Stability of Queueing Networks. Ecole d’Été de Probabilités de Saint-Flour
XXXVI-2006 // Lect. Notes Math. V. 1950. Berlin: Springer, 2008.
14. Anantharam V., Heidelberger R., Tsoukas P. Analysis of Rare Events in Continuous Time
Markov Chains via Time Reversal and Fluid Approximation. IBM Res. Rep. RC 16280.
Yorktown Heights, NY, 1990.
15. Shwartz A., Weiss A. Induced Rare Events: Analysis via Large Deviations and Time Re-
versal // Adv. in Appl. Probab. 1993. V. 25. № 3. P. 667-689.
16. Majewski K., Ramanan K. How Large Queue Lengths Build Up in a Jackson Network.
Preprint, 2008.
17. Vinter R.B. Optimal Control. Boston: Birkhäuser, 2000.
18. Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.: Мир,
1982.
Пухальский Анатолий Анатольевич
Поступила в редакцию
Институт проблем передачи информации
29.08.2018
им. А.А. Харкевича РАН
После доработки
puhalski@iitp.ru
14.01.2019
Принята к публикации
15.01.2019
111