Автоматика и телемеханика, № 7, 2020
© 2020 г. О.В. ЗВЕРЕВ, канд. наук по прикладной математике НИУ ВШЭ
(zv-oleg@yandex.ru)
(Центральный экономико-математический институт РАН, Москва),
В.М. ХАМЕТОВ, д-р физ.-мат. наук (khametovvm@mail.ru)
(Национальный исследовательский университет
“Высшая школа экономики”, Москва;
Московский авиационный институт
(национальный исследовательский университет)),
Е.А. ШЕЛЕМЕХ (letis@mail.ru)
(Центральный экономико-математический институт РАН, Москва)
ОПТИМАЛЬНОЕ ПРАВИЛО ОСТАНОВКИ
ГЕОМЕТРИЧЕСКОГО СЛУЧАЙНОГО БЛУЖДАНИЯ
СО СТЕПЕННОЙ ФУНКЦИЕЙ ВЫИГРЫША1
Решены две задачи об оптимальной остановке геометрического случай-
ного блуждания со степенной функцией выигрыша (с конечным и беско-
нечным горизонтом). Для этих задач установлены явный вид урезанной
цены и правила оптимальной остановки; доказано, что оптимальные пра-
вила остановки являются пороговыми нерандомизированными и описы-
вают соответствующую свободную границу, явный вид которой представ-
лен.
Ключевые слова: геометрическое случайное блуждание, момент останов-
ки, область остановки, область продолжения наблюдений, производящая
функция.
DOI: 10.31857/S000523102007003X
1. Введение
Теория оптимальных правил остановки является одним из разделов тео-
рии оптимального стохастического управления и посвящена одноразовому
выбору марковского момента, максимизирующего ожидаемое значение выиг-
рыша наблюдателя в некоторый конечный случайный момент времени. Про-
блема оптимальной остановки случайных последовательностей возникает во
многих областях науки и техники. Так, в теории и практике приема с об-
ратной связью дискретной информации часто применяются процедуры по-
следовательного обнаружения, сводящиеся к решению задачи об оптималь-
ной остановке [1]. В системах синхронизации [1], как правило, требуется как
можно быстрее обнаружить срыв или сбой в работе; эта проблема с матема-
тической точки зрения сводится к задаче о разладке [2]. Решение последней
состоит в построении оптимального правила остановки. В экономике пробле-
ма оптимальной остановки возникает, например: 1) при решении задач рас-
чета американских опционов, поскольку владелец опциона вправе выбрать
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных
исследований (проект 18-010-00666).
34
момент предъявления контракта к исполнению (обычно выбирается момент,
в который доход владельца максимален) [3], 2) в задачах стимулирования
инвестиционных проектов [4], 3) в последовательном планировании экспери-
ментов [5].
Известно [2, 3, 6], что задача об оптимальной остановке случайной после-
довательности относится к числу труднорешаемых. Общей теории оптималь-
ных правил остановки случайных последовательностей посвящено большое
количество работ. По-видимому впервые теория оптимальных правил оста-
новки была сформулирована в [7], в ней также обосновано применение этой
теории к задачам статистического последовательного анализа. Достаточно
полное изложение актуального состояния теории оптимальных правил оста-
новки можно найти в [3, 8, 9], для случая марковских наблюдаемых после-
довательностей в [2]. Вместе с тем, на настоящий момент известно очень
мало примеров явного аналитического решения задачи оптимальной останов-
ки. Наиболее полный обзор известных примеров можно найти в [8].
В этой статье получены новые примеры точного решения задач об оп-
тимальной остановке, а именно аналитически решены две задачи об оп-
тимальной остановке геометрического случайного блуждания со степенной
функцией выигрыша наблюдателя с конечным и с бесконечным горизонтом.
Степенная функция выигрыша имеет широкое применение в приложениях:
в экономике (стандартная функции полезности с гиперболической абсолют-
ной несклонностью к риску, стандартная функция спроса с постоянной эла-
стичностью), в технике и других областях, где возникает задача о разладке
с распределением Парето наблюдаемой последовательности. Таким образом,
полученные примеры интересны с точки зрения большого количества при-
кладных задач.
Не найдено работ, посвященных задачам оптимальной остановки в данной
постановке. Вместе с тем к задаче этой статьи с бесконечным горизонтом при-
менимы результаты статей [10-12], в которых для случая, когда наблюдается
марковский процесс, функция выигрыша непрерывна и монотонна, доказа-
но, что область продолжения наблюдений отделена от внутренности области
остановки единственной точкой (вид которой не предъявляется). В статье
этот результат не использовался, но он совпадает с полученным здесь; также
приведена формула для этой точки в случае степенной функции выигрыша.
Приведем еще работы, в которых исследовались задачи, наиболее близ-
кие к рассматриваемой в статье. В [13] решена задача об оптимальной оста-
новке случайного одномерного блуждания, когда: 1) независимые одинаково
распределенные случайные величины, порождающие это блуждание, имеют
отрицательное среднее значение, 2) функция выигрыша представляет собой
целую положительную степень стандартного опциона call, 3) горизонт бес-
конечен, 4) оптимальный момент остановки единственный. Доказано, что в
описанной ситуации момент первого пересечения уровня, который совпадает
с наибольшим значением полинома Аппеля, является оптимальным моментом
остановки. В [3] также рассматривалась задача оптимальной остановки с ко-
нечным и бесконечным горизонтом, где наблюдается одномерное случайное
блуждание и функция выигрыша, соответствующая стандартному опциону
call. В случае конечного горизонта предъявлено рекуррентное соотношение,
35
которому удовлетворяют урезанные цены задачи; доказано, что для каждого
момента времени область остановки отделена от области наблюдения одной
точкой, соответствующая последовательность точек монотонно убывает по
времени, но вид точек не найден. Для случая бесконечного горизонта уста-
новлен вид зависимости цены задачи от начального состояния наблюдаемой
последовательности. Таким образом, даже в наиболее близких по постанов-
ке задачах на настоящий момент не удалось получить явных формул для
решения.
Статья имеет следующую структуру. Каждой из задач посвящен отдель-
ный раздел: для задачи с конечным горизонтом раздел 2, а с бесконеч-
ным раздел 3. В разделе 2 сначала приведены необходимые сведения из тео-
рии оптимальных правил остановки с конечным горизонтом (подраздел 2.1),
затем постановка задачи и известные свойства ее решения (подраздел 2.2)
и основные результаты (раздел 2.3) теоремы 1 и 2, в которых установле-
ны явный вид урезанных цен и областей остановки (продолжения) наблю-
дения соответственно. Раздел 3 включает постановку задачи и необходимые
известные результаты теории оптимальных правил остановки с бесконечным
горизонтом (подраздел 3.1) и раздел 3.2, где приведен основной результат
теорема 3, дающая явный вид цены оптимальной остановки и областей оста-
новки (продолжения) наблюдения. Доказательства всех утверждений выне-
сены в Приложения.
2. Задача с конечным горизонтом
2.1. Необходимые сведения из теории оптимальных правил остановки
Подробное изложение приведенных здесь результатов и их доказательства
можно найти в [3].
(
)
Пусть на стохастическом базисе
Ω,F,(Fn)n∈N0 ,P
, где N0 ≜ {0, . . . , N},
N < ∞ горизонт, задана случайная последовательность (Sn,Fn)
. Без
n∈N0
ограничения общности можно считать, что Fn ≜ σ {S0, . . . , Sn}.
Будем использовать следующие обозначения: Eξ математическое ожи-
дание (интеграл Лебега относительно вероятностной меры P) F-измеримой
случайной величины ξ, а E (ξ| Fn) ее условное математическое ожидание
относительно σ-алгебры Fn и меры P, n ∈ N0. Для произвольного множества
A ∈ F определим индикатор
{
1, если ω ∈ A,
1{A}(ω) ≜
0, если ω ∈ A.
Положим, что (fn, Fn)
согласованное семейство случайных вели-
n∈N0
чин, элементы которого fn будем интерпретировать как значения функции
выигрыша в момент времени n ∈ N0. Предполагается, что выполнено сле-
дующее.
Условие (f): Emax |fn| < ∞.
n∈N0
Пусть τ момент остановки относительно фильтрации (Fn)
n∈N0
36
Тогда
(
)
fτ(ω) ≜
fi1{τ=i}(ω)
Sτ (ω) ≜
Si1{τ=i}(ω)
i=0
i=0
Обозначим через TNn , n ∈ N0, множество моментов остановки τ таких, что
n ≤ τ(ω) ≤ N, ω ∈ Ω. Условие (f) гарантирует, что для любого τ ∈ TN0 опре-
делено E |fτ | < ∞. Величина Efτ это ожидаемое значение выигрыша в мо-
мент τ.
Задача оптимальной остановки:
(1)
Efτ → sup
τ ∈TN
0
Величина sup
Efτ есть цена задачи (1). Если существует такой τ0 ∈ TN0 ,
τ ∈TN
0
что sup
Efτ = Efτ0 , то его называют оптимальным моментом остановки в
τ ∈TN
0
задаче (1).
Выполнение условия (f) позволяет ввести последовательность
{
[
(
)]
{
}
vNn = max
fn,E
vNn+1Fn
,
(2)
vN,Fn
:
n
n∈N0
vNn|n=N = fN.
По определению случайные величины vNn являются Fn-измеримыми. Их на-
зывают урезанной ценой оптимальной остановки в момент n или огибающей
Снелла. Известно, что vN0 = sup
Efτ = Efτ0 , где
τ ∈TN
0
{
}
(3)
τ0 = min
n∈N0 :vNn =fn
Таким образом, чтобы решить задачу (1), достаточно найти решение рекур-
рентного уравнения (2). Известно, что в общем случае она является трудно-
решаемой.
Из (2) следует, что
(
)
Fn
vNn ≥ fn, vNn ≥ E vNn+1
,
n∈N0,
почти наверное относительно меры P (д{лее по}ексту P-п.н.) Из условия (f)
и последнего неравенства следует, что
vNn ,F
супермартингал отно-
n n∈N0
сительно фильтрации {Fn}
и вероятностной меры P. Отметим также, что
n∈N0
из рекуррентного соотношения (2) следует, что для любого n ∈ {0, . . . , N - 1}:
{
}
1) на множестве
ω ∈ Ω : fn ≥ E(vNn+1Fn)
имеет место равенство vNn = fn
P -п.н.;
{
}
2) на множестве
ω ∈ Ω : fn < E(vNn+1Fn)
равенство vNn = E(vNn+1|Fn)
P -п.н.
Таким образом, для любого n ∈ {0, . . . , N - 1} величина vNn допускает пред-
ставление P-п.н.
(
)
(4)
vNn = fn1{f
vNn+1Fn
n≥E(vNn+1|Fn)}+E
1{fn<E(vNn+1|Fn)}.
37
2.2. Постановка задачи с конечным горизонтом
и некоторые известные свойства ее решения
Пусть {Sn, Fn}
задана рекуррентным соотношением
n∈N0
{ Sn+1 = Snλρn+1,
(5)
Sn|n=0 = S0 > 0,
где 1 < λ < ∞ параметр, а {ρn}n≥1 последовательность независимых
в совокупности одинаково распределенных случайных величин с задан-
ной функцией распределения Fρ (x). Известно [6], что последовательность
{Sn, Fn}
является однородной марковской и описывает одномерное гео-
n∈N0
метрическое случайное блуждание, причем P-п.н. Sn > 0, n ∈ N0. Описанная
последовательность {Sn}n≥0 является строго марковской [6].
Замечание 1. Условие λ > 1 техническое, оно будет использовано в
доказательствах ниже. Вместе с тем это предположение не ограничивает общ-
ности рассматриваемой постановки: чтобы получить случай 0 < λ < 1, доста-
точно вместо (5) рассмотреть последовательность
{
}
Sn,Fn
:
Sn+1
Snλθn+1,
S0 = S0,
n∈N0
где θn+1 = -ρn+1, n ∈ {0, . . . , N - 1}. В прикладных исследованиях интерес-
ны оба случая.
Будем решать задачу оптимальной остановки для дисконтированной сте-
пенной функции выигрыша:
(6)
fn(x) = βn (Axσ
+ B), x > 0
с параметрами: β ∈ (0, 1]
коэффициент дисконтирования [3], A, B, σ
(σ > 0).
Замечание 2. Задачи оптимальной остановки с функцией выигрыша
вида (6) встречаются в различных прикладных задачах. Так, при A = σ
функция (6) соответствует стандартной функции полезности с гиперболи-
ческой абсолютной несклонностью к риску (HARA) [9]. В задачах микроэко-
номики в случаях, когда эластичность спроса по цене можно считать по-
стоянной, спрос описывается степенной функцией [14]. Задача о разладке
для наблюдаемых величин с распределением Парето также имеет степенную
функцию выигрыша. Поскольку степенные функции применяются для опи-
сания явлений в самых разных областях, имеет смысл рассматривать задачу
оптимальной остановки со степенной функцией наиболее общего вида (6).
Таким образом, рассматривается задача:
(7)
τ (A (Sτ )σ + B) → sup
τ ∈TN
0
Известно [2], что в случае строго марковской наблюдаемой последователь-
ности {Sn, Fn}
и функции выигрыша, зависящей от значения аргумента
n∈N0
38
только в текущий момент времени, урезанные цены vNn являются марков-
скими функциями, т.е. для любого n ∈ N0 существует борелевская функция,
действующая из R+ в R+, которую будем обозначать через vNn (x), такая что
vNn = vNn (x)
= vNn (Sn) P-п.н.
x=Sn
Кроме того, последовательность {vNn (x)}n∈N0 однородна по n, т.е. для любых
x ∈ R+ и k ∈ N0 существует борелевская функция, обозначаемая vk (x), такая
что
(8)
vNn (x) = vN-n0 (x) = βkvk (x)
k=N-n
Для задачи (7) из результатов, приведенных в подразделе 2.1, и сделан-
ных замечаний следует, что для любо{о x ∈} + существует частичная после-
довательность борелевских функций
vk (x)
(где k принимает значения
k∈N0
N,N - 1,... ,0), которая:
1) удовлетворяет рекуррентному соотношению
{
[
]
vk (x) = max
Axσ + B, βEvk+1 (xλρ1 )
,
(9)
vk (x) |k=N = Axσ + B;
(
)
2) v0 (x) |x=S0 = vN0 = sup
τ (ASστ + B) = Eβτ0
ASστ0 + B
, где
τ ∈TN
0
[
]
(10)
τ0 = min k ∈ N0 : vk (Sk) = ASσk + B
есть оптимальный момент остановки в задаче (7);
3) монотонно не возрастает, т.е. для любого x ∈ R+ имеет место неравен-
ство
(11)
vk (x) ≥ vk+1
(x) , k ∈ {0, . . . , N - 1}.
Из (9), в свою очередь, для любых x ∈ R+, k ∈ N0 и β ∈ (0, 1] следуют
неравенства
(12)
vk (x) ≥ Axσ + B, vk (x) ≥ βEvk+1 (xλρ1
).
Аналогично [2], введем области остановки и продолжения наблюдений.
Для любого k ∈ N0 множество Γk ⊆ R+ назовем множеством (областью) оста-
новки, если
{
}
{
}
(13)
Γk ≜ x ∈ R+ : vk(x) = Axσ +B
= x ∈ R+ :Axσ +B ≥ βEvk+1(xλρ1)
Множество Ck ≜ R+k назовем множеством продолжения наблюдений:
{
}
{
}
(14)
Ck = x ∈ R+ : vk(x) > Axσ +B
= x ∈ R+ :Axσ +B < βEvk+1(xλρ1)
39
Из определения семейств областей {Ck}k∈N0 и {Γk}
, а также свойства мо-
k∈N0
{
}
нотонности (для любых x ∈ R+) частичной последовательности
vk (x)
k∈N0
следуют включения
(15)
R+ = ΓN ⊇ ΓN-1 ⊇ ... ⊇ Γk ⊇ ... ⊇ Γ0,
(16)
∅=CN ⊆CN-1 ⊆...⊆Ck ⊆...⊆C0.
В совокупности (9), (13)-(16) дают представление для vk (x), где k ∈ N0,
x∈R+:
{ βEvk+1 (xλρ1), если x ∈ Ck,
(17)
vk (x) =
Axσ + B, если x ∈ Γk.
С учетом (17) имеем при любых k ∈ N0 и x ∈ R+ представление для vk (x):
(18)
vk (x) = (Axσ + B)1{x∈Γ
k} + βEvk+1 (xλρ1) 1{x∈Ck}.
Итак, чтобы найти решение задачи (7), необходимо решить рекуррентное
уравнение (9) и для любого k ∈ N0 построить области Γk и Ck. Это будет
сделано в следующем разделе.
2.3. Решение задачи с конечным горизонтом
Следующие два утверждения основные для этого раздела, они дают
решение задачи (7). В них будут использованы обозначения
(19)
Ak ≜ A(βEλσρ1 )N-k , Bk ≜ βN-k
B,
где k ∈ N0 любое, A > 0, B ∈ R1, а σ ≥ 0. Непосредственно проверяется,
что Ak и Bk удовлетворяют рекуррентным соотношениям
(20)
Ak = Ak+1βEλσρ1 , Ak|k=N = A; Bk = βBk+1, Bk|k=N
= B.
Условие (ϕ):
(21)
0 < Eλσρ1
< ∞, σ ≥ 0.
Теорема 1. Пусть выполнены условия:
1) последовательность {Sk, Fk}
удовлетворяет рекуррентному соот-
k∈N0
ношению (5);
2) условие (ϕ);
3) дисконтированная функция выигрыша имеет вид (6);
4) для любых (k, x) ∈ N0 × R+ урезанная цена vk (x) удовлетворяет ре-
куррентному соотношению (9).
Тогда справедливы следующие утверждения:
а) для любых k ∈ N0 и σ > 0 множества Ck и Γk допускают представле-
ния соответственно
{
}
(22)
Ck =
x ∈ R+ : Akxσ + Bk > Axσ + B
,
{
}
(23)
Γk =
x ∈ R+ : Akxσ + Bk ≤ Axσ + B
40
б) для любых k ∈ N0, x ∈ R+ и σ > 0 решение рекуррентного соотноше-
ния (9) допускает представление
(24)
vk (x) = Axσ + B + max[Akxσ + Bk - Axσ
− B,0] .
Установим теперь вид оптимального момента остановки в задаче (7). Пред-
варительно заметим, что из (13), (22) следует, что для любого k ∈ N0 внут-
ренность Γk, обозначаемая как int Γk, допускает представление
{
}
(25)
int Γk
x ∈ R+ : Akxσ + Bk < Axσ + B
Значит, для любого k ∈ N0 определено множество
{
}
(26)
∂Γk ≜ Γk\int Γk =
x ∈ R+ : Akxσ + Bk = Axσ + B
Если ∂Γk = ∅, то (26) определяет границу, которая для каждого k делит R+
на область остановки Γk и область продолжения наблюдений Ck. Из (26)
также следует, что из разрешимости для любого k ∈ N0 уравнения
Akxσ + Bk = Axσ + B
относительно x (т.е. существование элемента x (k) ∈ R+, обращающего (26)
в тождество) следует ∂Γk = ∅. Частичную последовательность {x (k)}
в
k∈N0
задаче об оптимальной остановке называют свободной границей [3].
Теорема 2. Пусть выполнены условия теоремы 1. Тогда для любого
k ∈ N0 справедливы следующие утверждения:
I. если β = 1,
1) а σ > 0, ϕ (σ) ≤ 1, то Γk = [0, ∞);
2) а σ > 0, ϕ (σ) > 1, то Γk = {0};
II. если β ∈ (0,1) и B = 0,
1) а σ > 0, βϕ (σ) ≤ 1, то Γk = [0, ∞);
2) а σ > 0, βϕ (σ) > 1, то Γk = {0};
III. если β ∈ (0,1) и B < 0,
1) а σ1 > 0 единственный нетривиальный корень уравнения ϕ (σ) = 1
и βϕ(σ) <1, то Γk = [x(k),∞);
2) а σ > 0, βϕ (σ) < 1 и ϕ (σ) = 1, то Γk = [x(k), ∞), где частичная по-
следовательность {x (k)}k∈N0 описывает свободную границу, а ее элементы
для любого k ∈ N0 определяются формулой
(
)1
k
σ
1-β
(27)
x(k) ≡ maxB
,0;
A (βϕ (σ))k - 1
3) а σ > 0, βϕ (σ) ≥ 1, то Γk = {0};
IV. если β ∈ (0,1) и B > 0,
1) а σ > 0, βϕ (σ) ≤ 1, то Γk = [0, ∞);
41
2) а σ > 0, βϕ (σ) > 1, то Γk = [x(k), ∞), где частичная последователь-
ность {x(k)}k∈N0 описывает свободную границу, а ее элементы для любого
k ∈ N0 определяются формулой (27);
V. пусть {Γk}
набор множеств, определенный в пунктах I-IV.
k∈N0
Тогда оптимальный момент остановки τ0 допускает представление τ0 =
= min{k ∈ N0 : Sk ∈ Γk} P-п.н.
Замечание 3. 1. Из доказательства теоремы 2 следует, что в утвержде-
ниях I-IV теоремы 2 элементы частичной последовательности {x (k)}k∈N0
определяются единственным образом.
2. Из утверждения теоремы 2 следует, что значения параметров A и B
функции выигрыша существенно влияют на вид решения задачи (7). Так, при
B = 0 получаются лишь тривиальные решения. Такой результат связан с тем,
что слагаемое B в каждый момент умножается на дисконтирующий множи-
тель. Этот факт следует учитывать при выборе конкретного вида функции
выигрыша в прикладных задачах, например в задачах максимизации ожи-
даемого значения функции полезности, которая, как известно, определяется
с точностью до константы.
Итак, теоремы 1, 2 дают явный вид решения задачи (7): цена задачи допус-
кает представление vN (x) = Axσ + B + max [AN xσ + BN - Axσ - B, 0], а оп-
тимальный момент остановки имеет вид, указанный в п. V теоремы 2.
3. Задача с бесконечным горизонтом
3.1. Постановка задачи с бесконечным горизонтом
и некоторые известные свойства ее решения
Пусть теперь T∞0 множество всех конечных марковских моментов τ.
Предположим, что выполнено условие (ϕ). Тогда задача об оптимальной оста-
новке геометрического случайного блуждания с дисконтированной степенной
функцией выигрыша и бесконечным горизонтом состоит в следующем:
(28)
τ (ASστ + B) → sup
,
τ ∈T
0
где параметрами задачи являются коэффициент дисконтирования β ∈ (0, 1]
и A, B, σ (σ > 0).
Момент остановки τ0 ∈ T∞0 называют оптимальным, если
(
)
sup
τ (ASστ + B) = Eβτ0
ASστ0 + B
τ ∈T
0
Пусть борелевская функция v : R+ → R1, обозначаемая как v (x), опреде-
лена равенством
v (x) = sup
τ (ASστ + B) .
τ ∈T
0
Эту функцию называют ценой оптимальной остановки.
42
Как}было указано в разделе
2, последовательность урезанных цен
{
vk (x)
является монотонной (см. неравенство (11)). Поэтому для любого
k≥1
{
}
x ∈ R+ у последовательности
vk (x)
существует поточечный предел
k≥1
v(x) ≜ lim vk (x) .
k→∞
Известно также [2], что в рекуррентном соотношении (9) в силу теоремы о
монотонной сходимости можно осуществить предельный переход при k → ∞.
Следовательно, для любого x ∈ R+ цена v (x) удовлетворяет нелинейному
уравнению
[
]
(29)
v (x) = max Axσ + B, βEv (xλρ1 ) .
Из (29) следует, что для любого x ∈ R+ имеют место неравенства
(30)
v (x) ≥ Axσ + B,
v (x) ≥ βEv (xλρ1
).
Кроме того, из (29) следует, что приводимые ниже соотношения опреде-
ляют области в R+:
а)
{
}
{
}
(31)
Γ≜
x ∈ R+ : v(x) = Axσ + B
=
x ∈ R+ : Axσ + B ≥ βEv(xλρ1)
,
б)
{
}
{
}
(32)
C ≜
x ∈ R+ : v(x) = βEv(xλρ1)
=
x ∈ R+ : Axσ + B < βEv(xλρ1)
,
которые также называют [2] соответственно областью остановки и областью
продолжения наблюдений. Из (31), (32) следуют равенства
(33)
Γ∪C =R+
,
Γ ∩ C = ∅.
Формулы (29), (31)-(33) дают также представление
{ Axσ + B при x ∈ Γ,
(34)
v (x) =
βEv(xλρ1) при x ∈ C.
В свою очередь, из (33) и (34) следуют равенства для любых x ∈ R+:
v(x) = (Axσ + B)1{x∈Γ} + βEv(xλρ1 ) 1{x∈C} =
(35)
= Axσ + B + [βEv (xλρ1) - Axσ - B] 1{x∈C}.
3.2. Решение задачи с бесконечным горизонтом
Из приведенных выше рассуждений следует, что решение задачи (28) бу-
дет найдено, если установить условия, при которых рекуррентное соотноше-
ние (29) имеет решение. Вид этого решения, а также областей остановки и
продолжения наблюдений для задачи (28) получены в следующем утвержде-
нии.
43
Теорема 3. Предположим, что выполнено условие (ϕ). Пусть σ1 > 0
β
удовлетворяет равенству
σ1
ρ1
(36)
βEλ
β
= 1,
причем
(37)
σ=σ1 .
β
Если выполнено одно из условий:
а)
(38)
σ>σ1
и B > 0,
β
б)
(39)
σ<σ1
и B < 0,
β
то справедливы следующие утверждения.
1. Для любых x ∈ R+ и β ∈ (0, 1] существует решение уравнения (29),
которое имеет вид
(40)
v (x) = Axσ + B + max [Axσ - Axσ
− B,0] ,
где константа A > 0 допускает представление
σ1
(
)
β
1
σ
σ
Aσ-σβ
(41)
A ≜ B
σ-σ1
B σ1
β
β
2. Существует число
(
)1
1
σ
B σβ
(42)
xΓ =
> 0,
Aσ-σ1
β
отделяющее область остановки от внутренности области продолжения
наблюдения:
а) если выполнено условие (38), то
(43)
Γ = [0,xΓ], C = (xΓ
,∞) .
б) если выполнено условие (39), то
(44)
Γ = [xΓ,∞), C = [0,xΓ
).
3. Момент остановки
{
inf {n ≥ 0 : Sn ∈ Γ}
(45)
τ0 =
∞, если Sn ∈ Γ для любого n
является оптимальным в задаче (28).
44
Замечание 4. Выше было отмечено, что значения параметров модели
A и B существенно влияют на вид решения в случае конечного горизонта.
Как следует из утверждения и доказательства теоремы 3, решение задачи в
случае бесконечного горизонта при B = 0 не существует.
4. Заключение
Из утверждений теорем 1-3 следует, что в случае одномерного однород-
ного геометрического случайного блуждания с дисконтированной степенной
функцией выигрыша в задаче об оптимальной остановке:
1) не всегда существуют нетривиальные области остановки и продолжения
наблюдений;
2) соответствующее рекуррентное соотношение (когда горизонт конечен)
или уравнение (когда горизонт бесконечен) допускают явное решение;
3) установлены условия существования и вид решений.
Таким образом, в статье построены новые точно решаемые примеры зада-
чи об оптимальной остановке.
ПРИЛОЖЕНИЕ 1
Далее в доказательствах основных утверждений потребуются условия су-
ществования и свойства производящей функции, соответствующей функции
распределения Fρ1 (x) случайной величины ρ1. Приведем необходимые опре-
деления и утверждения.
Пусть борелевская функция ϕ : R1 → R+ (обозначаемая как ϕ (σ)) опре-
делена равенством
(П.1.1)
ϕ(σ) = Eλσρ1 ,
где 1 < λ < ∞ параметр, σ ∈ R1 переменная величина. Функцию ϕ (σ)
называют производящей функцией моментов случайной величины ρ1 [6]. Обо-
значим:
(
)
{
}
{
}
M+ ≜ sup
x ∈ R1 : Fρ1 (x) < 1
M- ≜ inf
x ∈ R1 : Fρ1 (x) > 0
x∈R1
x∈R1
Величина M+ (M-) это существенная верхняя (нижняя) грань случайной
величины ρ1 [6], а множество вида [M-, M+] ее носитель [6].
Следующее простое утверждение, по-видимому, известно, но, к сожале-
нию, в доступных источниках не было сформулировано и доказано.
Предложение 1. Пусть M- > -∞ и M+ < ∞. Тогда справедливы
утверждения:
1) для любого σ ∈ R1 выполнено (21);
2) для любого σ ∈ R1 существуют и конечны производныеdl
ϕ(σ), где
l
l ∈ N любое, причемd2
ϕ(σ) > 0, т.е. ϕ(σ) строго выпуклая функция;
2
45
3) если m (σ) ≜ddσ ln ϕ (σ), то
m (σ)
(П.1.2)
M+ = lim
,
σ→∞ ln λ
m (σ)
(П.1.3)
M- = lim
σ→-∞ ln λ
Доказательство предложения
1.
По условию предложения 1
M- и M+ конечны, поэтому в доказательстве без ограничения общности
можно полагать ρ1 ≥ c P-п.н., где c > 0 константа.
1. В силу сделанного предположения и определения величины M+ спра-
ведливы неравенства c ≤ ρ1 ≤ M+ < ∞ P-п.н. Отсюда для любого σ ≥ 0 име-
ем P-п.н.
(П.1.4)
0<λ-|σ|c ≤λ-|σ|ρ1 ≤λσρ1 ≤λ|σ|ρ1 ≤λ|σ|M+
< ∞.
Соотношения (П.1.4) дают искомые неравенства 0 < ϕ (σ) < ∞.
2. Пусть l ∈ N. Тогда из (П.1.4) для любого σ ≥ 0 следуют неравенства
P-п.н.
(
)l
(П.1.5)
0 < clλσc ≤ |ρ1|l λσρ1
M+
λ|σ|M+
< ∞.
Отсюда
0 < E|ρ1|l λσρ1 < ∞.
Значит, для любого l ∈ N существует l-я производная производящей функции
моментов
dlϕ
(σ) = (ln λ)ll1λσρ1 ,
l
причем
dlϕ
(П.1.6)
σ)
< ∞.
 dσl (
В частности, для любого σ ≥ 0 имеем
d
(П.1.7)
ϕ(σ) = (ln λ) Eρ1λσρ1 ,
d2ϕ
(П.1.8)
(σ) = (ln λ)221λσρ1
> 0,
2
σρ1
1λ
(П.1.9)
m (σ) = (ln λ)
σρ1
Из (П.1.6)-(П.1.8) следует, что ϕ (σ) строго выпуклая функция.
46
3. Установим равенства (П.1.2)-(П.1.3). Пусть Pσ (A)
вероятностная
мера, определенная с помощью преобразования Эшера (см., например, [3])
распределения вероятностей случайной величины ρ1:
σρ1
(П.1.10)
Pσ (A) ≜ Eλ
1A
(ω),
σρ1
где A ∈ F любое, а σ ≥ 0. Известно, что Pσ эквивалентна P [3]. Тогда из
(П.1.9)-(П.1.10) следует представление
m (σ)
(П.1.11)
=EPσ′ρ1,
ln λ
где EPσ′ρ1 математическое ожидание случайной величины ρ1 относительно
меры Pσ. Из (П.1.11) с учетом ρ1 ≤ M+ < ∞ P-п.н. следует, что для σ ≥ 0
имеет место неравенство
m (σ)
(П.1.12)
= EPσ′ρ1 ≤ M+.
ln λ
Пусть {Mn}n≥1 числовая последовательность такая, что 0 < Mn < M+
и lim
Mn = M+. Тогдаm(σ)lnλ = EPσ′ ρ1 ≥ EPσ′ ρ11[M
n,∞)1)≥Mn,где
n→∞
{ 1, x ∈ [Mn, ∞) ,
1[Mn,∞)(x)≜
0, x ∈ [Mn, ∞) .
Следовательно,
m(σ)
lim
≥Mn → M+.
σ→∞ ln λ
n→∞
Последняя формула в совокупности с (П.1.12) дает требуемое равенство
limm(σ)
=M+.
ln λ
σ→∞
Аналогичным образом устанавливается равенство limm(σ)
= M-. До-
lnλ
σ→-∞
казательство закончено.
Следствие 1. Пусть выполнены условия предложения 1. Тогда произ-
водящая функция моментов ϕ (σ) при σ ≥ 0 обладает следующими свой-
ствами.
1. Если M+ < 0, то функция ϕ(σ) монотонно убывает от значения 1 к
нулю.
2. Если M+ > 0 и Eρ1 < 0, то существуют 0 < σ0 < σ1 < σ 1 < ∞ такие,
β
что:
а) 0 < ϕ (σ0) = min
ϕ(σ) < 1, т.е. σ0 единственный неотрицательный
σ∈R+
корень уравнения
d
ϕ(σ0) = 0;
47
б) ϕ (0) = ϕ (σ1) = 1, где σ1 = 0 единственный нетривиальный корень
уравнения ϕ (σ) = 1, причем
для любого σ ∈ (0, σ1) имеют место неравенства 0 < ϕ (σ) < 1,
для любого σ ≥ σ1 функция ϕ (σ) ≥ 1;
в) для любого β ∈ (0, 1) существует единственный корень σ 1 уравнения
β
ϕ(σ) = , причем
если σ < σ 1, то ϕ(σ) < ,
β
если σ ≥ σ 1, то ϕ(σ) ≥ .
β
3. Если Eρ1 ≥ 0, то для любого β ∈ (0, 1] существует единственный(
)
нетривиальный корень σ1 уравнения ϕ σ1
= , причем при σ ≥ σ1 функ-
β
β
β
ция ϕ (σ) ≥ .
Доказательство следствия 1. Согласно п. 2 предложения 1 (см.
также (П.1.8)) ϕ (σ) строго выпуклая функция. Известно [15], что произ-
водная строго выпуклой функции, в частностиddσ ϕ (σ), является непрерыв-
ной и монотонно возрастающей. Очевидно также, что производныеdϕdσ (0) и
d2ϕ
(0) определены как правые производные в точке нуль и имеют вид
2
d2ϕ
(0) = ln λEρ1,
(0) = (ln λ)221.
2
По определению производящей функции моментов (формула (П.1.1)) пара-
метр ln λ > 1, поэтому знакdϕdσ (0) совпадает со знаком Eρ1. Следовательно,
возможны следующие варианты зависимости ϕ (σ) от σ.
Вариант 1: M+ < 0. Тогда Eρ1 < 0,dϕdσ (0) < 0 иdϕdσ (σ) ↑ 0 при σ → ∞.
Иными словами, при σ ≥ 0 функция ϕ(σ) монотонно убывает от значения 1
(поскольку ϕ (0) = 1) к нулю.
Вариант 2. Пусть M+ > 0, но Eρ1 < 0 (т.е.{(0)<}).Крометого,вэтом
случае lim
(σ) ≥ ln λ lim
1λσρ1 1{O
= ∞, где OM+ (ε)
σ→∞
σ→∞
M+(ε)∩(0,∞)}
ε-окрестность точки M+, ε > 0 любое. Отсюда следует существование чи-
сел σ0, σ1, σ 1 ∈ R+ таких, что:
β
2.1) σ0
это (в силу теоремы Коши) единственный корень уравне-
нияdϕdσ (σ) = 0 (действительно,dϕdσ (0) < 0, lim
(σ) = +∞ иdϕdσ (σ) моно-
σ→∞
тонно возрастает по σ), причем на основании теоремы Ферма 0 < ϕ (σ0) =
= minϕ(σ) < ϕ(0) = 1;
σ∈R1
2.2) σ1 > 0 это единственное нетривиальное решение уравнения ϕ (σ) = 1
(= ϕ (0)), причем если: а) σ ∈ (0, σ1], то ϕ (σ) ≤ 1, б) σ > σ1, то ϕ (σ) > 1;
2.3) σ 1
>0
это корень уравнения ϕ (σ) = , где β ∈ (0, 1), причем σ1 <
β
(
)
< σ1 и если σ > σ1 , то ϕ(σ) > ϕ σ1
β
β
β
48
Вариант 3. Пусть Eρ1 ≥ 0. Тогда
(0) ≥ 0 и, поскольку
(σ) монотонно
возрастает по σ, очевидно, что и ϕ (σ) ≥ 1 монотонна и возрастает по σ, σ ≥ 0.
Поэтому для любого β ∈ (0, 1] существует единственный корень σ 1 уравнения
(
)
β
ϕ σ1
= , причем при σ ≥ σ1
функция ϕ (σ) ≥ .
β
β
Доказательство закончено.
ПРИЛОЖЕНИЕ 2
В этом приложении доказаны теоремы 1 и 2.
При доказательстве теоремы 1 воспользуемся следующим вспомогатель-
ным утверждением о виде решения рекуррентного соотношения (относитель-
но wk : R+ → R+):
{
wk (x) = βEwk+1 (xλρ1 ) ,
(П.2.1)
wk (x)|k=N = Axσ + B.
Лемма 1. Пусть выполнены условия теоремы 1. Семейство {wk(x)}k∈N0
является единственным решением (П.2.1) тогда и только тогда, когда
(П.2.2)
wk (x) = Akxσ + Bk, k ∈ N0,
где {Ak}k∈N0 и {Bk}k∈N0 определены равенствами (19).
Доказательство леммы 1. 1. Необходимость. Докажем, что семей-
ство функций (П.2.2) является решением системы (П.2.1). Доказательство
проведем методом индукции. При k = N из (П.2.1) следует, что wk (x) |k=N =
= Axσ + B, x ∈ R+.
Пусть
wk+1 (x) = Ak+1xσ + Bk+1,
где
Ak+1 = A(βEλσρ1 )N-k-1, Bk+1 = βN-k-1B.
Установим, что wk (x) = Akxσ + Bk. Действительно, из (П.2.1) и предположе-
ния индукции для любых x ∈ R+ следуют равенства
wk (x) = βEwk+1 (xλρ1 ) = βE(Ak+1xσλσρ1 + Bk+1) =
= βAk+1xσσρ1 + βBk+1 = A(βEλσρ1)N-k xσ + βN-kB = Akxσ + Bk.
Таким образом, основной шаг индукции обоснован, а вместе с ним установ-
лена необходимость.
2. Достаточность. Установим, что семейство функций (П.2.2) удовлетво-
ряет (П.2.1). Из (П.2.2) имеем wk+1 (xλρ1 ) ≜ Ak+1xσλσρ1 + Bk+1. От левой
и правой частей последнего равенства возьмем математическое ожидание,
умноженное на β. Учитывая (20), получим
βEwk+1 (xλρ1 ) = βE (Ak+1xσλσρ1 + Bk+1) =
= (βAk+1σρ1 ) xσ + βBk+1 = Akxσ + Bk = wk (x) .
Установили достаточность.
49
Единственность очевидна. Доказательство закончено.
Доказательство теоремы 1. Известно [3], что решение рекуррент-
ного соотношения (9) допускает представление (18). Из (18), в свою очередь,
следует, что для любых k ∈ N0 имеются три взаимоисключающие возможно-
сти: 1) Γk = ∅ (Ck = R+), 2) Ck = ∅ (Γk = R+), 3) Ck = ∅, Γk = ∅, причем
Ck ∪ Γk = R+. Рассмотрим каждую из них.
Возможность 1. Из (9) следует, что в этом случае урезанная цена vk (x)
для любого x ∈ R+ удовлетворяет рекуррентному соотношению
{
vk (x) = βEvk+1 (xλρ1 ),
(П.2.3)
vk (x) |k=N = Axσ + B.
Тогда из утверждения леммы 1 следует, что решение (П.2.3), в силу его един-
ственности, имеет вид
(П.2.4)
vk (x) = Akxσ + Bk,
причем Ak и Bk удовлетворяют рекуррентным соотношениям (20).
Возможность 2. В этом случае из (18) следует, что для любого x ∈ R+
решение (9) имеет вид
(П.2.5)
vk (x) = Axσ
+ B.
Возможность 3. Поскольку по условию Ck = ∅, то из (15) следует, что для
любого 0 ≤ n ≤ k множество Cn = ∅. Поэтому для любого x ∈ Cn урезанная
цена vn (x) удовлетворяет рекуррентному соотношению (П.2.3), решение ко-
торого имеет вид (П.2.4). Следовательно, (18) с учетом (15) для любых n ≤ k
и x ∈ R+ можно переписать в виде
vn (x) = (Axσ + B)1{x∈Γ
n} +(Anxσ + Bn) 1{x∈Cn} =
(П.2.6)
= (Axσ + B) + [Anxσ + Bn - Axσ - B]1{x∈C
n}.
Последнее равенство следует из определения множеств Cn и Γn.
Из (П.2.6) и (12) очевидным образом следует, что для любых x ∈ R+ вы-
полняются соотношения
(П.2.7)
vn (x) - Axσ - B = [Anxσ + Bn - Axσ - B]1{x∈C
≥ 0.
n}
По условию имеем Cn = ∅. Тогда из (П.2.7) следует, что множество Cn (n ≤ k)
допускает представление
{
}
Cn =
x ∈ R+ : vn (x) - Axσ - B
=
{
}
(П.2.8)
=
x ∈ R+ : [Anxσ + Bn - Axσ - B]1{x∈C
=
n} >0
{
}
=
x ∈ R+ : Anxσ + Bn > Axσ + B
,
что и доказывает (22). Поэтому в силу (П.2.8) множество Γn = R+\Cn допус-
кает представление (23).
50
Рассмотрим правую часть равенства (П.2.7). В силу (П.2.8) для любого
x ∈ R+ имеем
[Anxσ + Bn - Axσ - B]1{x∈R+:A
nxσ+Bn>Axσ+B} =
= max{Anxσ + Bn - Axσ - B,0} .
Поэтому из (П.2.5) с учетом (23) и последнего равенства устанавливается
равенство (24). Этим завершается доказательство теоремы 1.
Доказательство теоремы 2. Согласно теореме 1 для любого k ∈ N0
множество остановки Γk имеет вид (23), из которого следует замкнутость
этого множества. Поэтому его внутренность (int Γk) допускает представле-
ние (25). Ясно, что ∂Γk, определяемое (26), это множество граничных то-
чек множества Γk и при любых k ∈ N0 граница ∂Γk = ∅. Поэтому элементы
x (k) ∈ ∂Γk должны удовлетворять уравнению
(П.2.9)
Akxσ + Bk = Axσ
+ B.
Если выполнены условия теоремы 1 и хотя бы одно из условий I-IV теоре-
мы 2, то для каждого из этих случаев очевидно существование единственного
неотрицательного решения x (k) уравнения (П.2.9). Стало быть, ∂Γk одно-
точечное множество (т.е. ∂Γk = {x (k)}). Непосредственной проверкой легко
убедиться в справедливости утверждений I-IV теоремы 2.
ПРИЛОЖЕНИЕ 3
Доказательство утверждений теоремы 3 опирается на следующее вспомо-
гательное утверждение.
Лемма 2. Пусть выполнены условия теоремы 3, где x ∈ R+, а борелев-
ская функция w : R+ → R1 удовлетворяет уравнению (относительно w (x)):
(П.3.1)
w (x) = βEw (xλρ1
).
Тогда для любого x ∈ R+ уравнение (П.3.1) имеет единственное нетри-
виальное решение
σ1
(П.3.2)
w (x) = Ax
β ,
где A > 0 некоторая константа, а σ 1 единственный корень уравнения
β
βϕ(σ) = 1.
Замечание 5. Лемма 2 устанавливает структуру решения уравнения
(П.3.1). Однако, из него не следует, какое значение принимает константа A.
Доказательство леммы 2. Доказательство проведем по индукции.
Рассмотрим рекуррентное соотношение, k ≥ 1
{
wk (x) = βEwk-1 (xλρ1 ) ,
(П.3.3)
σ
1
wk (x) |k=0 = Ax
β ,
где x ∈ R+, а A некоторая положительная константа.
51
Из (П.3.3) следует, что
(
)
σ
1
w1 (x) = βEw0 (xλρ1 ) = βEA (xλρ1)
β
= βAxσσ ϕ σ1
σ
(
)
σ1
Из условия βϕ σ 1
= 1 следует, что w1 (x) = Ax
β . Пусть теперь wk-1(x) =
β
σ1
σ1
=Ax
β . Установим, что из (П.3.3) следует равенство wk(x) = Ax
β . Дей-
ствительно, из (П.3.3) имеем
(
)
σ1
σ
1
σ1
β
wk (x) = βEA (xλρ1 )
= βAx
β ϕ σ1
=Ax
β .
σ
Основной шаг индукции обоснован. Следовательно, для любых k ≥ 1, x ∈ R+
σ1
и β ∈ (0,1] имеем равенство wk (x) = Ax
β . Поэтому
σ1
w (x) ≜ lim wk (x) = Ax
β .
k→∞
Единственность решения уравнения (П.3.1) следует из единственности пре-
дела. Доказательство закончено.
Доказательство теоремы
3. Поскольку уравнение (П.3.1) имеет
единственное решение (П.3.2) для любого x ∈ R+, то оно имеет такое же ре-
шение и для любого x ∈ C ⊆ R+. Стало быть, в силу (35) и утверждения
леммы 2 имеем для любого x ∈ C равенства
σ1
(П.3.4)
v (x) = w (x) = Ax
β .
Поэтому из равенств (34) и (35) в силу (П.3.4) для любого x ∈ R+ следуют
равенства
v (x) = (Axσ + B)1{x∈Γ} + βEv (xλρ1 )1{x∈C} =
(П.3.5)
= (Axσ + B)1{x∈Γ} + v(x)1{x∈C} =
σ
1
= (Axσ + B)1{x∈Γ} + Ax
β 1{x∈C}.
Так как 1{x∈Γ} = 1 - 1{x∈C}, то из (П.3.5) следует, что для любых x ∈ R+
(
)
σ
1
(П.3.6)
v (x) - Axσ - B = Ax
β - Axσ
−B 1{x∈C}
≥ 0.
Последнее неравенство в (П.3.6) следует из неравенств (30). Непосредствен-
ной проверкой легко убедиться в том, что для любого x ∈ R+ в силу (П.3.6)
имеет место равенство
(
)
[
]
σ
1
σ
1
(П.3.7)
Ax
β - Axσ
− B 1{x∈C} = max Ax
β - Axσ
− B,0 .
Из (П.3.6) и (П.3.7) следует (40).
52
Теперь установим представление множеств C и Γ. Действительно, из (40)
и определения множества C имеем
{
}
{
}
σ
1
β
C =
x ∈ R+ : v (x) - Axσ + B > 0
= x∈R+ :Ax
> Axσ + B
Отсюда с учетом определения множества Γ = R+\C получаем
{
}
σ
1
(П.3.8)
Γ= x∈R+ :Ax
β
≤ Axσ + B
Теперь найдем значение константы A. Для этого сначала заметим, что из
неравенства (30) и (П.3.7) следует, что имеет место экстремальная задача
(П.3.9)
(v (x) - Axσ - B) → inf .
x∈R+
Из равенства (П.3.6) вытекает, что задача (П.3.9) эквивалентна следующей
задаче:
[
]
σ
1
(П.3.10)
max Ax
β - Axσ
− B,0 → inf .
x∈R+
Из (П.3.6) и (П.3.7) следует, что
[
]
σ
1
(П.3.11)
inf max Ax
β - Axσ
− B,0
= 0.
x∈R+
Возникает вопрос о том, достигается ли нижняя грань в (П.3.11), т.е. су-
ществует ли такое xΓ > 0, что выполнено равенство
σ1
(П.3.12)
+ B.
AxβΓ=AxΓ
Из теоремы Ферма следует, что для существования такого xΓ > 0 необходимо,
чтобы существовало решение уравнения
(
)
σ
1
d Ax
β - Axσ
− B /dx = 0.
Следовательно,
σ1
-1
(П.3.13)
σ1
= σAxσ-1Γ.
AxβΓ
β
Таким образом, (П.3.12) и (П.3.13) дают систему нелинейных алгебраических
уравнений относительно A и xΓ
σ1
β
 Ax
= AxσΓ + B,
Γ
(П.3.14)
σ1
β
 σ1
Ax
= σAxσΓ.
Γ
β
Тогда в условиях теоремы 3 (т.е. при выполнении (37) и (38) или (39)), как лег-
ко установить, система (П.3.14) имеет единственное решение вида (41), (42).
53
Покажем теперь, что xΓ > 0, определяемое (42), является искомой сво-
бодной границей. Сначала заметим, что множество Γ в силу (П.3.8) можно
представить в виде Γ = ∂Γ ∪ int Γ, где
{
}
σ
1
β
int Γ ≜ x > 0 : Ax
< Axσ + B
внутренность множества Γ, а
{
}
σ1
β
∂Γ = x > 0 : Ax
= Axσ + B
свободная граница, отделяющая множество C от int Γ.
Очевидно, что Γ = ∅, если int Γ = ∅, т.е. если существует хотя бы один
x > 0 такой, что выполняется неравенство
σ1
Ax
β
< Axσ + B,
либо если ∂Γ = ∅, то существует хотя бы одно решение уравнения (относи-
тельно x ∈ R+) (П.3.12). Следовательно, в силу (П.3.9), существует xΓ > 0
такая, что
{
}
σ
1
xΓ = arg x > 0 : Ax
β
= Axσ + B
,
т.е. xΓ является единственной крайней точкой множества Γ. Поэтому Γ до-
пускает представление (44).
Для завершения доказательства осталось заметить, что (45) следует из
определения оптимального момента остановки τ0 и равенства
{
inf
{n ≥ 0, Sn ∈ Γ} ,
τ0 = inf {n ≥ 0 : Sn ∈ Γ} = n
∞, если Sn ∈ Γ для любого n.
Доказательство закончено.
СПИСОК ЛИТЕРАТУРЫ
1. Розов А.К. Оптимальные правила остановки и их применения. СПб.: Политех-
ника, 2009.
2. Ширяев А.Н. Статистический последовательный анализ. М.: Наука, 1976.
3. Ширяев А.Н. Основы стохастической финансовой математики. Т. 2. Теория. М.:
Фазис, 1998.
4. Аркин В.И., Сластников А.Д. Аркина С.В. Стимулирование инвестиционных
проектов с помощью механизма амортизации / Научный доклад № 02/05. Кон-
сорциум экономических исследований и образования. Серия ¾Научные докла-
ды¿. М.: EERC, 2002.
5. Ермаков С.М., Жиглявский А.А. Математическая теория оптимального экспе-
римента. М.: Наука, 1987.
6. Ширяев А.Н. Вероятность
1. М.: МЦНМО, 2004.
7. Wald A. Sequential analysis. N.Y.: John Wiley and Sons, 1947.
54
8. Ferguson T. S. Optimal Stopping and Applications. - unpublished manuscript, 2000,
URL: http://www.math.ucla.edu/ tom/Stopping/Contents.html (дата обращения:
10.07.2014).
9. Фëльмер Г., Шид А. Введение в стохастические финансы. Дискретное время.
М.: МЦНМО, 2008.
10. Jönsson H., Kukush A.G., Silvestrov D.S. Threshold structure of optimal stopping
strategies for american type option. I // Theory Probab. Math. Statist. 2005. No. 71.
P. 93-103.
11. Jönsson H., Kukush A.G., Silvestrov D.S. Threshold structure of optimal stopping
strategies for american type option. II // Theory Probab. Math. Statist. 2006. No. 72.
P. 47-58.
12. Kukush A.G., Silvestrov D.S. Optimal pricing of American type options with discrete
time // Theory Stoch. Proces. 2004. V. 10(26). No. 1-2. P. 72-96.
13. Новиков А.А., Ширяев А.Н. Об одном эффективном случае решения задачи
об оптимальной остановке для случайных блужданий // Теория вероятн. и ее
примен. 2004. Т. 49. Вып. 2. С. 373-382.
14. Силаева М.В., Силаев А.М. Спрос и предложение. Н. Новгород: Нижегород.
филиал ГУ-ВШЭ, 2006.
15. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
Статья представлена к публикации членом редколлегии А.И. Кибзуном.
Поступила в редакцию 11.12.2019
После доработки 16.01.2020
Принята к публикации 30.01.2020
55