Журнал вычислительной математики и математической физики, 2020, T. 60, № 9, стр. 1462-1471
Новый взгляд на некоторые основополагающие результаты в оптимизации
Ю. Г. Евтушенко 1, 2, 3, *, А. А. Третьяков 1, 4, 5, **
1 ВЦ РАН ФИЦ ИУ РАН
119333 Москва, ул. Вавилова, 40, Россия
2 МФТИ
141700 М.o., Долгопрудный, Институтский пер., 9, Россия
3 МАИ
125080 Москва, Волоколамское шоссе, 4, Россия
4 System Res. Inst., Polish Acad. Sciences
01-447 Warsaw, Newelska 6, Poland
5 Siedlce University, Faculty of Sciences
08-110 Siedlce, Poland
* E-mail: yuri-evtushenko@yandex.ru
** E-mail: tret@ap.siedlce.pl
Поступила в редакцию 18.07.2019
После доработки 31.08.2019
Принята к публикации 09.04.2020
Аннотация
В статье для некоторых фундаментальных результатов оптимизации предлагаются новые доказательства, которые носят нетрадиционный характер и позволяют по-новому взглянуть на известные положения. При этом используются конструкции теории $p$-регулярности для обоснования обсуждаемых фактов, а также $2$-фактор-метод для решения вырожденных задач. Библ. 8.
Рассматривается несколько основных результатов теории оптимизации, такие как теорема Лагранжа об условиях оптимальности в задаче с ограничениями равенствами, теорема Куна–Таккера об условиях оптимальности в задаче с ограничениями неравенствами, теорема Люстерника, достаточные условия оптимальности для задачи математического программирования, теорема Фаркаша и теорема о замкнутости конуса – с нетрадиционной точки зрения.
Показано, что во многих случаях доказательство этих центральных для оптимизации результатов можно существенно упростить, не используя идей отделимости, замкнутости конуса, теоремы Фаркаша, выпуклости, предельных переходов или метода штрафных функций, принципа сжимающих отображений или теорему о неявной функции и т.д. и т.п.
1. ЭЛЕМЕНТАРНОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ ЛАГРАНЖА ДЛЯ ЗАДАЧИ С РАВЕНСТВАМИ
Рассматривается задача
при условиях где $F = {{({{f}_{1}}, \ldots ,{{f}_{m}})}^{ \top }}$, $\varphi ,F \in {{C}^{2}}({{\mathbb{R}}^{n}})$, ${{f}_{i}}{\kern 1pt} :\;{{\mathbb{R}}^{n}} \to R$, $i = \overline {1,m} $, и ${{0}_{m}}$ есть вектор-столбец. Обозначим через $x{\kern 1pt} *$ решение задачи (1), (2). Тогда имеет место классическая теорема Лагранжа о необходимых условиях оптимальности [1], [2].Теоpема 1. Пусть $\varphi ,F \in {{C}^{2}}({{\mathbb{R}}^{n}})$ и матрица Якоби
не вырождена. Тогда $\varphi {\text{'}}(x{\kern 1pt} {\text{*}}) \in {\text{Lin}}\{ f_{i}^{'}(x{\kern 1pt} {\text{*}}),i = 1, \ldots ,m\} $.Известные доказательства этой теоремы весьма громоздки и используют такие факты, как теорема о неявной функции [1], предельные переходы [2], [3], теоремa Люстреника [1] и т.д. Мы покажем, как можно в доказательстве избежать этих сложностей и получить основной результат только на основе теоремы Вейерштрасса.
Доказательство. Предположим от противного, что . Тогда $\varphi {\text{'}}(x{\kern 1pt} {\text{*}}) = h + \bar {h}$, где $h \in \operatorname{Ker} F{\kern 1pt} {\text{'}}(x{\kern 1pt} {\text{*}})$, $\bar {h} \in {\text{Lin}}\{ f_{i}^{'}(x{\kern 1pt} {\text{*}}),i = 1, \ldots ,m\} $. Тогда для $\alpha \in (0,\varepsilon )$ и $\xi \in {{\mathbb{R}}^{m}}$, $\left\| \xi \right\| = 1$, ${{\left\| {F(x{\kern 1pt} {\text{*}} - \alpha h + {{\alpha }^{{3/2}}}F{\kern 1pt} {\text{'}}{{{(x{\kern 1pt} {\text{*}})}}^{ \top }}\xi )} \right\|}^{2}} \geqslant c{{\alpha }^{3}}$, и ${{\left\| {F(x{\kern 1pt} {\text{*}} - \alpha h)} \right\|}^{2}} \leqslant c{{\alpha }^{4}}$, где $\varepsilon > 0$ – достаточно малое и $c > 0$ – независимая константа. Это означает, по теореме Вейерштрасса, что существует $\eta (\alpha ){\kern 1pt} :\;{{R}^{1}} \to {{\mathbb{R}}^{m}}$ такое, что
2. НОВОЕ ЭЛЕМЕНТАРНОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ КУНА–ТАККЕРА
Рассматривается задача
при ограничениях Здесь $x \in {{\mathbb{R}}^{n}}$, $\varphi ,{{g}_{i}} \in {{C}^{1}}({{\mathbb{R}}^{n}})$, $i = 1, \ldots ,m$. Основной результат для характеризации решения $x{\text{*}}$ задачи (3), (4) – теорема Куна–Таккера (КТ), которая устанавливает необходимые условия для этой задачи (3), (4).Теоpема 2. Пусть $x{\kern 1pt} {\text{*}}$ – решение задачи (3), (4) и $\varphi ,{{g}_{i}} \in {{C}^{1}}({{\mathbb{R}}^{n}})$, $i = 1, \ldots ,m$.
Тогда найдутся такие неотрицательные множители $\lambda _{0}^{*},\lambda _{1}^{*}, \ldots ,\lambda _{m}^{*}$, что выполнены условия
(5)
$\lambda _{0}^{*}\varphi {\text{'}}(x{\kern 1pt} {\text{*}}) + \sum\limits_{i = 1}^m \,\lambda _{i}^{*}g_{i}^{'}(x{\kern 1pt} {\text{*}}) = {{0}_{n}},\quad \lambda _{0}^{*} + \lambda _{1}^{*} + \ldots + \lambda _{m}^{*} = 1.$Обозначим множество активных ограничений через $I(x{\kern 1pt} {\text{*}}) = \{ i = 1, \ldots ,m\,|\,{{g}_{i}}(x{\kern 1pt} *) = 0\} $. Традиционные доказательства данной теоремы достаточно сложные и используют в своих конструкциях такие результаты, как теорему о неявной функции, теорему о замкнутости конуса, лемму Фаркаша, теоремы об отделимости, предельные теоремы и т.д. Приведем доказательство, которое не использует вышеупомянутые фундаментальные результаты, используя и опираясь только на тривиальную лемму о свойстве проекции.
Лемма 1. Пусть $\mathcal{K}$ – замкнутое выпуклое множество в ${{\mathbb{R}}^{n}}$.
Тогда для проекции $p = {{\Pr }_{\mathcal{K}}}{{0}_{n}}$ нулевого вектора ${{0}_{n}}$ на множество $\mathcal{K}$ имеет место неравенство
для всех $z \in \mathcal{K}$.Доказательство данной леммы тривиально и мы его не приводим. Пусть
Доказательство теоремы КТ. Покажем, что
так как соотношение (7) эквивалентно (5). Действительно, если это не так, т.е. , то поскольку $\varphi {\text{'}}(x{\kern 1pt} {\text{*}}) \in \mathcal{K}$, из леммы 1 следует(8)
$\left\langle {\varphi {\text{'}}(x{\kern 1pt} {\text{*}}), - p} \right\rangle \leqslant - {{\left\| p \right\|}^{2}} < 0$(9)
$\left\langle {g_{i}^{'}(x{\kern 1pt} {\text{*}}), - p} \right\rangle \leqslant - {{\left\| p \right\|}^{2}} < 0.$3. ТЕОРЕМА ФАРКАША И ТЕОРЕМА О ЗАМКНУТОСТИ КОНУСА
Важную роль при построении условий оптимальности и конструировании численных методов играют так называемые теоремы об альтернативах, одна из которых может быть сформулирована в следующем виде.
Теоpема 3 (Фаркаша). Пусть векторы $\eta ,{{\xi }_{i}} \in {{\mathbb{R}}^{n}}$, $i = 1, \ldots ,m$, и для каждого $x \in {{\mathbb{R}}^{n}}$ такого, что $\left\langle {{{\xi }_{i}},x} \right\rangle \geqslant 0$, $i = 1, \ldots ,m$, выполнено неравенство
Назовем это условием Фаркаша.Тогда
Доказательство. Введем в рассмотрение функцию
Замечание 1. Из доказательства явно следует вид множителей Фаркаша $\lambda _{i}^{*}$.
Известные доказательства этой теоремы в большинстве своем полагаются на теоремы отделимости, предельные переходы и, обязательно, на теорему о замкнутости конуса. Однако существующие доказательства теоремы о замкнутости конуса весьма громоздки. Приведем здесь доказательство, которое отличается своей простотой и изяществом. Это доказательство опирается на лемму Фаркаша.
Теоpема 4 (о замкнутости конуса). Множество
Доказательство. Пусть последовательность $\{ {{y}_{i}}\} $, $i = 1,2, \ldots $, такова, что ${{y}_{i}} \in \mathcal{K}$, $i = 1,2, \ldots $, $\left\| {{{y}_{i}}} \right\| \leqslant c$, $i = 1,2, \ldots $, и ${{y}_{i}} \to y$ при $i \to \infty $. Нужно показать, что $y \in \mathcal{K}$. Действительно, $\forall x \in {{\mathbb{R}}^{n}}$ и такого, что $\left\langle {{{a}_{j}},x} \right\rangle \geqslant 0$, $j = 1, \ldots ,m$, следует, что $\left\langle {{{y}_{i}},x} \right\rangle \geqslant 0$, $i = 1,2, \ldots $. Но тогда, переходя к пределу при $i \to \infty $, получаем $\forall x \in {{\mathbb{R}}^{n}}$ и такого, что $\left\langle {{{a}_{j}},x} \right\rangle \geqslant 0$, $j = 1, \ldots ,m$, следует
Таким образом, теорема Фаркаша и о замкнутом конусе эквивалентны, т.е. одна следует из другой. Это новый взгляд на данные основополагающие результаты в оптимизации.
4. ОБ ИЗБЫТОЧНОСТИ УСЛОВИЙ В ТЕОРЕМЕ ФАРКАША
Основные теоремы об условиях оптимальности в задаче с неравенствами получены с использованием теоремы Фаркаша. Однако оказывается, что требование (10): $\forall x \in {{\mathbb{R}}^{n}}$ такого, что $\left\langle {\xi ,x} \right\rangle \geqslant 0$, $i = 1, \ldots ,m$, следует $\left\langle {\eta ,x} \right\rangle \geqslant 0$ избыточно. Достаточно взять некоторый конечный набор элементов ${{z}_{j}}$ и если на нем выполнено (10), а именно $\forall {{z}_{j}}$, $j = 1, \ldots ,k$, из того, что $\left\langle {{{\xi }_{i}},{{z}_{j}}} \right\rangle \geqslant 0$, $i = 1, \ldots ,m$ $ \Rightarrow $ $\left\langle {\eta ,{{z}_{j}}} \right\rangle \geqslant 0$, $j = 1, \ldots ,k$, то $\eta = \sum\nolimits_{i = 1}^m {{{\alpha }_{i}}{{\xi }_{i}}} $, ${{\alpha }_{i}} \geqslant 0$, $i = 1, \ldots ,m$. Например, ${{\xi }_{1}} = {{(0,1)}^{ \top }}$, ${{\xi }_{2}} = {{(1,0)}^{ \top }}$, $\eta = {{(1,1)}^{ \top }}$, ${{z}_{1}} = {{(1,0)}^{ \top }}$, ${{z}_{2}} = {{(0,1)}^{ \top }}$. Очевидно, что $\left\langle {{{\xi }_{i}},{{z}_{j}}} \right\rangle \geqslant 0$, $i = 1,2$ и $\left\langle {\eta ,{{z}_{j}}} \right\rangle \geqslant 0$, $j = 1,2$ $ \Rightarrow $ $ \Rightarrow \eta = {{\alpha }_{1}}{{\xi }_{1}} + {{\alpha }_{2}}{{\xi }_{2}}$, ${{\alpha }_{1}} = 1$, ${{\alpha }_{2}} = 1$.
Набор векторов $\{ {{z}_{j}}\} $ определяется следующим образом. Пусть ${\text{span}}\{ {{\xi }_{i}}\,{\text{|}}\,i = 1, \ldots ,m\} \triangleq {{\mathbb{R}}^{p}}$, $p \leqslant n$, ${{\xi }_{i}} \in {{\mathbb{R}}^{n}}$, $\eta \in {{\mathbb{R}}^{n}}$. Тогда ${{\mathbb{R}}^{n}} = {{\mathbb{R}}^{p}} \oplus {{\mathbb{R}}^{{n - p}}}$ и пусть ${{y}_{1}}, \ldots ,{{y}_{{n - p}}}$ – базис в ${{\mathbb{R}}^{{n - p}}}$. Тогда
1) чтобы $\eta $ принадлежал ${\text{Cone}}\,\{ {{\xi }_{i}}\,{\text{|}}\,i = 1, \ldots ,m\} $ нужно, чтобы $\eta \in {\text{span}}\{ {{\xi }_{i}}\,{\text{|}}\,i = 1, \ldots ,m\} $, а значит, $\left\langle {\eta ,{{y}_{j}}} \right\rangle = 0$, $j = 1, \ldots ,n - p$. Это можно записать как неравенство: из того, что $\left\langle {{{\xi }_{i}}, \pm {{y}_{j}}} \right\rangle \geqslant 0$ $ \Rightarrow $ $ \Rightarrow \left\langle {\eta , \pm {{y}_{j}}} \right\rangle \geqslant 0$ $j = 1, \ldots ,n - p$;
2) имеем $\eta \in {\text{span}}\{ {{\xi }_{i}}\,{\text{|}}\,i = 1, \ldots ,m\} $. Далее в ${{\mathbb{R}}^{p}}$ строим выпуклый конус ${{\mathcal{K}}_{p}} \triangleq \{ z \in {{\mathbb{R}}^{n}} \cap {{\mathbb{R}}^{p}}\,{\text{|}}\,\left\langle {{{\xi }_{i}},z} \right\rangle \geqslant 0,\;i = 1, \ldots ,m\} $ ${{\mathcal{K}}_{p}} \triangleq \{ z \in {{\mathbb{R}}^{n}} \cap {{\mathbb{R}}^{p}}\,{\text{|}}\,\left\langle {{{\xi }_{i}},z} \right\rangle \geqslant 0,\;i = 1, \ldots ,m\} $. Пусть ${{x}_{1}}, \ldots ,{{x}_{r}}$ – его крайние (одномерные) ребра. Очевидно, что их число $r$ конечно, как число вершин $y$ многогранника. Полагаем
Теоpема 5 (обобщенная лемма Фаркаша). Пусть выполнено $\left\langle {{{\xi }_{i}},{{z}_{j}}} \right\rangle \geqslant 0$, $i = 1, \ldots ,m$, $ \Rightarrow $ $\left\langle {\eta ,{{z}_{j}}} \right\rangle \geqslant 0$, $j = 1, \ldots ,k$, где $k$ определено выше. Тогда
Доказательство. Очевидно, что $\eta \in {\text{span}}\{ {{\xi }_{i}}\,{\text{|}}\,i = 1, \ldots ,m\} $. Покажем, что $\eta = \sum\nolimits_{i = 1}^m {{{\alpha }_{i}}{{\xi }_{i}}} $, ${{\alpha }_{i}} \geqslant 0$, $i = 1, \ldots ,m$. Действительно, $\forall x\left\langle {{{\xi }_{i}},x} \right\rangle \geqslant 0$, $i = 1, \ldots ,m$ $ \Rightarrow $ $x \in {{\mathbb{R}}^{n}} \cap {{\mathbb{R}}^{p}}$ $ \Rightarrow $ $x \in {{\mathcal{K}}_{p}}$ и, значит, $x = {{\beta }_{1}}{{x}_{1}} + \ldots + {{\beta }_{r}}{{x}_{r}}$, ${{z}_{1}} = {{x}_{1}}, \ldots ,{{z}_{r}} = {{x}_{r}}$, ${{\beta }_{j}} \geqslant 0$, $j = 1, \ldots ,r$. Но $\left\langle {\eta ,{{x}_{1}}} \right\rangle \geqslant 0, \ldots ,\left\langle {\eta ,{{x}_{r}}} \right\rangle \geqslant 0$ $ \Rightarrow $ $ \Rightarrow \left\langle {\eta ,{{\beta }_{1}}{{x}_{1}} + \ldots + {{\beta }_{r}}{{x}_{r}}} \right\rangle = \left\langle {\eta ,x} \right\rangle \geqslant 0$ $ \Rightarrow $ выполнены условия теоремы Фаркаша и соотношение (11).
5. О СВОДИМОСТИ ЗАДАЧИ ОПТИМИЗАЦИИ С ОГРАНИЧЕНИЯМИ НЕРАВЕНСТВАМИ К ЗАДАЧЕ ОПТИМИЗАЦИИ С РАВЕНСТВАМИ
При решении оптимизационных задач с ограничениями неравенствами типа (3), (4) привлекательным является сведение ограничений неравенств к ограничениям равенствам путем добавления искусственных переменных. Однако, чтобы условие оптимальности для задачи с неравенствами и задачи с равенствами были эквивалентыми, необходимо вводить условие строгой дополняющей нежесткости (УСДН) [4]. В противном случае условия оптимальности будут не эквивалентны, и поэтому такая редукция, как сказано в [2], не представляет интереса. Поясним это. Введем функцию Лагранжа для задачи (3), (4)
Тогда необходимые условия минимума Куна–Таккера выглядят следующим образом:(12)
$L_{x}^{'}(x,\lambda ) = \varphi {\text{'}}(x) + \sum\limits_{i = 1}^m \,{{\lambda }_{i}}g_{i}^{'}(x) = 0$– если в допустимой точке $x{\kern 1pt} {\text{*}}$ $({{g}_{i}}(x{\kern 1pt} {\text{*}}) \leqslant 0,i = 1, \ldots ,m)$ выполнены необходимые условия (12)–(14) при некотором $\lambda {\text{*}}$ и
(15)
$\left\langle {L_{{xx}}^{{''}}(x{\kern 1pt} {\text{*}}\lambda {\text{*}})h,h} \right\rangle > 0,$Существенным недостатком этих условий от достаточных условий оптимальности для задачи с равенствами является то, что точка $x{\kern 1pt} {\text{*}}$ должна быть допустима. Уравнения (12)–(14) не гарантируют этого, в отличие от необходимых условий для задачи с равенствами. Поэтому модифицируем задачу (3), (4) в виде задачи с равенствами путем введения новой искусственной переменной $s = {{({{s}_{1}}, \ldots ,{{s}_{m}})}^{ \top }}$.
(16)
$\begin{array}{*{20}{c}} {min\varphi (x)} \\ {{{g}_{i}}(x) + s_{i}^{2} = 0,\quad i = 1, \ldots ,m.} \end{array}$(18)
${{\lambda }_{1}}\left( {\begin{array}{*{20}{c}} {2{{s}_{1}}} \\ 0 \\ \vdots \\ 0 \end{array}} \right) + \ldots + {{\lambda }_{m}}\left( {\begin{array}{*{20}{c}} 0 \\ 0 \\ \vdots \\ {2{{s}_{m}}} \end{array}} \right) = {{0}_{m}} = 2\lambda s,$(20)
$\bar {L}(x,s,\lambda ) = \varphi (x) + \sum\limits_{i = 1}^m \,{{\lambda }_{i}}({{g}_{i}}(x) + s_{i}^{2}).$(21)
$\left\langle {\bar {L}_{{(x,s)}}^{{''}}(x{\kern 1pt} {\text{*}},\lambda {\text{*}},s{\kern 1pt} {\text{*}})h,h} \right\rangle \geqslant \alpha {{\left\| h \right\|}^{2}},\quad \alpha > 0,$(22)
$\left\langle {L_{{xx}}^{{''}}(x{\kern 1pt} {\text{*}},\lambda {\text{*}}){{h}_{2}},{{h}_{2}}} \right\rangle = 0\quad \left( {L(x,\lambda ) = \varphi (x) + \sum\limits_{i = 1}^m \,{{\lambda }_{i}}{{f}_{i}}(x)} \right)$Теоpема 6 (необходимые и достаточные условия оптимальности специального вида). Пусть $\varphi ,F \in {{C}^{3}}({{\mathbb{R}}^{n}})$ и для любого ${{h}_{2}} \in \operatorname{Ker} F{\kern 1pt} {\text{'}}(x{\kern 1pt} {\text{*}})$ $(\left\| h \right\| = 1)$ такого, что $L{\text{''}}(x{\kern 1pt} {\text{*}}\lambda {\text{*}}){{[{{h}_{2}}]}^{2}} = 0$ или $\left( {L{\text{''}}(x{\text{*}}\lambda {\text{*}}){{h}_{2}} = 0} \right)$ выполняются условия
1)
(23)
$\left\| {F{\kern 1pt} {\text{''}}(x{\kern 1pt} {\text{*}}){{{[{{h}_{2}}]}}^{2}}} \right\| \geqslant \alpha > 0$2) и существуют ${{h}_{1}} \in \mathbb{R}_{2}^{r}$ и $C({{h}_{2}}) \geqslant c > 0$, $\left\| {{{h}_{1}}} \right\| = 1$, удовлетворяющие соотношению
(24)
$F{\kern 1pt} {\text{'}}(x{\kern 1pt} {\text{*}})[{{h}_{1}}] + \frac{1}{2}F{\kern 1pt} {\text{''}}(x{\kern 1pt} {\text{*}}){{[c({{h}_{2}}){{h}_{2}}]}^{2}} = 0.$(26)
$L_{{xx}}^{{''}}(x{\kern 1pt} {\text{*}},\lambda {\text{*}}){{[{{h}_{1}}]}^{2}} \geqslant \beta > 0,$Замечание 2. Элемент ${{h}_{1}}$ может не принадлежать $\operatorname{Ker} F{\kern 1pt} {\text{'}}(x{\text{*}})$.
Доказательство. Необходимость. Покажем, что $\forall t \in (0,\varepsilon )$, $\varepsilon > 0$ достаточно малое, существует $\omega (t)\mathbb{R} \to {{\mathbb{R}}^{n}}$ такое, что дуга
(27)
$\begin{gathered} F(x{\kern 1pt} {\text{*}} + {{c}_{2}}t{{h}_{2}} + {{t}^{2}}{{h}_{1}}) = F(x{\kern 1pt} {\text{*}}) + F{\kern 1pt} {\text{'}}(x{\kern 1pt} {\text{*}})[{{c}_{2}}t{{h}_{2}} + {{t}^{2}}{{h}_{1}}] + \frac{1}{2}F{\kern 1pt} {\text{''}}(x\,{\text{*}}){{[{{c}_{2}}t{{h}_{2}} + {{t}^{2}}{{h}_{1}}]}^{2}} + o({{t}^{2}}) = \\ \, = {{t}^{2}}F'(x{\kern 1pt} {\text{*}}){{h}_{1}} + \frac{1}{2}F{\kern 1pt} {\text{''}}(x{\kern 1pt} {\text{*}}){{[{{c}_{2}}t{{h}_{2}}]}^{2}} + o({{t}^{2}}) = o({{t}^{2}}). \\ \end{gathered} $(28)
${{\Phi }_{t}}(x) = x - \mathop {\left( {F{\kern 1pt} {\text{'}}(x{\kern 1pt} {\text{*}})} \right)}\nolimits^{ - 1} F(x{\kern 1pt} {\text{*}} + {{c}_{2}}t{{h}_{2}} + {{t}^{2}}{{h}_{1}} + x),$Достаточность. Предполагая противное, т.е. что существует последовательность точек $\{ {{x}_{k}}\} \in M(x{\kern 1pt} {\text{*}})$ и ${{x}_{k}} \to x{\kern 1pt} {\text{*}}$ при $k \to \infty $ такая, что $\varphi ({{x}_{k}}) < \varphi (x{\text{*}})$, используя доказательство необходимости и стандартную технику доказательства достаточности условий, приходим к противоречию с соотношением (26).
Пример 1. Рассмотрим задачу (16) в виде
при $F(x) = g(y) + {{s}^{2}} = {{0}_{m}}$. Здесь роль $x$ играет $(y,s)$ (чтобы не было путаницы с последними записями, мы заменили в задаче (3), (4) $x$ на $y$). Если точка $(y{\kern 1pt} {\text{*}},s{\kern 1pt} {\text{*}})$, $s{\kern 1pt} {\text{*}} = 0$ – решение задачи (3), (4), то для ${{h}_{2}} = {{(0,\bar {s})}^{ \top }}$ очевидно существует ${{h}_{1}} = {{(\bar {y},0)}^{ \top }}$ такое, что(32)
$F{\kern 1pt} {\text{'}}(x{\text{*}})[{{h}_{1}}] + \frac{1}{2}F{\kern 1pt} {\text{''}}(x{\text{*}}){{[{{h}_{2}}]}^{2}} = 0 \Leftrightarrow g{\text{'}}(y{\text{*}})\bar {y} + \frac{1}{2}2{{\bar {s}}^{2}} = 0.$Теоpема 7 (об эквивалентности условий оптимальности). Пусть $\varphi ,g \in {{C}^{3}}({{\mathbb{R}}^{n}})$. Тогда условия оптимальности (12), (13), (15) и (26) эквивалентны.
Доказательство. Очевидно нужно проверить только достаточную часть условий оптимальности. Пусть выполнены условия (12)–(15). Тогда, беря $\bar {s} \ne 0$, получаем $\bar {y} = {{\{ g{\text{'}}(y{\kern 1pt} {\text{*}})\} }^{{ - 1}}}( - {{\bar {s}}^{2}})$ из условия (24). При этом $L_{{xx}}^{{''}}(y{\kern 1pt} {\text{*}},s{\kern 1pt} {\text{*}}\lambda {\kern 1pt} {\text{*}}){{[y]}^{2}} \geqslant \beta {{\left\| {\bar {y}} \right\|}^{2}}$, так как выполнено достаточное условие (15). Здесь $\bar {y}$ играет роль ${{h}_{1}}$ в теореме 6 и поэтому имеет место (26), а значит, выполнены достаточные условия теоремы 6. В одну сторону теорема доказана.
Пусть теперь выполнены достаточные условия (26) для задачи (31). Тогда $\forall h$ такого, что $g{\text{'}}(y{\kern 1pt} {\text{*}})h < {{0}_{m}}$ будет $\bar {s} \ne 0$ и, значит, выполнено (26) при ${{h}_{1}} = h$, т.е. $L_{{xx}}^{{''}}(y{\kern 1pt} {\text{*}},0,\lambda {\kern 1pt} {\text{*}}){{[h]}^{2}} \geqslant \beta {{\left\| h \right\|}^{2}}$, а это значит, что $L_{{xx}}^{{''}}(y{\kern 1pt} {\text{*}},\lambda {\kern 1pt} {\text{*}}){{[h]}^{2}} \geqslant \beta {{\left\| h \right\|}^{2}}$ (где $L(y,\lambda )$ играет роль функции $L(x,\lambda ) = \varphi (x) + \sum\nolimits_{i = 1}^m {{{\lambda }_{i}}{{g}_{i}}(x)} $ в задаче (3), (4)), и окончательно выполнены достаточные условия (15) для задачи (3), (4). Теорема доказана.
6. $2$-ФАКТОР-МЕТОД РЕШЕНИЯ ВЫРОЖДЕННЫХ СИСТЕМ НЕЛИНЕЙНЫХ УРАВНЕНИЙ
Для численного решения систем уравнений, в частности возникающих из необходимых условий оптимальности, основной конструкцией для построения различного рода итерационных процессов является метод Ньютона [4]. Однако если для системы нелинейных уравнений
в решении $x{\kern 1pt} {\text{*}}$ матрица $\Phi {\text{'}}(x{\kern 1pt} {\text{*}})$ вырождена, то применение метода Ньютона, итерационная схема которого имеет вид(34)
${{x}_{{k + 1}}} = {{x}_{k}} - \mathop {\left\{ {\Phi {\text{'}}({{x}_{k}})} \right\}}\nolimits^{ - 1} \Phi ({{x}_{k}}),\quad k = 0,1, \ldots ,$(35)
${{x}_{{k + 1}}} = {{x}_{k}} - \mathop {\left\{ {\Phi {\text{'}}({{x}_{k}}) + P\Phi {\text{''}}({{x}_{k}})h} \right\}}\nolimits^{ - 1} \left( {\Phi ({{x}_{k}}) + P\Phi {\text{'}}({{x}_{k}})h} \right),\quad k = 0,1, \ldots ,$Теоpема 8. Пусть $\Phi \in {{C}^{3}}({{\mathbb{R}}^{n}})$ и $\Phi (\, \cdot \,)$ $2$-регулярно в решении $x{\kern 1pt} {\text{*}}$ на векторе $h$. Тогда для ${{x}_{0}} \in {{U}_{\varepsilon }}(x{\kern 1pt} {\text{*}})$ последовательность $\{ {{x}_{k}}\} $, определяемая схемой (35), сходится к решению $x{\kern 1pt} {\text{*}}$, причем справедлива оценка скорости сходимости
(36)
$\left\| {{{x}_{{k + 1}}} - x{\kern 1pt} {\text{*}}} \right\| = c{{\left\| {{{x}_{k}} - x{\kern 1pt} {\text{*}}} \right\|}^{2}},\quad k = 0,1, \ldots ,$Доказательство см., например, в [7]. Покажем, как $2$-фактор-метод можно применять для численного решения задач оптимизации с ограничениями неравенствами при использовании искусственных переменных.
7. ПОНЯТИЕ $2$-РЕГУЛЯРНОСТИ И $2$-ФАКТОР-МЕТОДА НЬЮТОНА ДЛЯ РЕШЕНИЯ ВЫРОЖДЕННОЙ СИСТЕМЫ КУНА–ТАККЕРА
При решении оптимизационных задач с ограничениями типа неравенства путем введения искусственных переменных необходимо вводить условия строго дополняющей нежесткости (УСДН) для того, чтобы система КТ была невырожденной. В противном случае нельзя гарантировать применимость высокоэффективных методов типа Ньютона. В данном разделе мы рассмотрим эффективность указанного подхода с точки зрения применения $2$-фактор-метода для решения системы вырожденных условий оптимальности и докажем, что система КТ $2$-регулярна.
Итак, имеем задачу (3), (4)
при которую заменяем на задачу (16)(37)
$L{\text{'}}(u) = \left( {\begin{array}{*{20}{c}} {{{L}_{x}}(u)} \\ {2\lambda s} \\ {g(x) + {{s}^{2}}} \end{array}} \right),$(38)
$L{\text{''}}(u) = \left[ {\begin{array}{*{20}{c}} {{{L}_{{xx}}}(u)}&{{{0}_{{nm}}}}&{{{{({{g}_{x}}(x))}}^{ \top }}} \\ {{{0}_{{mn}}}}&{2\lambda }&{2s} \\ {{{g}_{x}}(x)}&{2s}&{{{0}_{{mm}}}} \end{array}} \right].$(41)
$\Psi (z) = \left( {\begin{array}{*{20}{c}} {L{\text{'}}(u) = {{0}_{\ell }}} \\ {{{\lambda }^{ \top }} - {{y}^{2}} = {{0}_{m}}} \end{array}} \right) = {{0}_{r}},$(42)
$\Psi {\text{'}}(z) = \left( {\begin{array}{*{20}{c}} {{{L}_{{xx}}}(u)}&{{{0}_{{nm}}}}&{{{{({{g}_{x}}(x))}}^{ \top }}}&{{{0}_{{nm}}}} \\ {{{0}_{{mn}}}}&{2\lambda }&{2s}&{{{0}_{{mm}}}} \\ {{{g}_{x}}(x)}&{2s}&{{{0}_{{mm}}}}&{{{0}_{{mm}}}} \\ {{{0}_{{mn}}}}&{{{I}_{m}}}&{{{0}_{{mm}}}}&{2y} \end{array}} \right).$(43)
${{z}_{{k + 1}}} = {{z}_{k}} - \mathop {\left( {\Psi {\text{'}}({{z}_{k}})} \right)}\nolimits^{ - 1} \Psi ({{z}_{k}}).$Теоpема 9. Пусть $\varphi ,g \in {{C}^{3}}({{\mathbb{R}}^{n}})$, существует удовлетворяющий системе (41) вектор $z{\kern 1pt} {\text{*}}$, в точке $(x{\kern 1pt} {\text{*}},\lambda {\kern 1pt} {\text{*}})$ выполнены достаточные условия оптимальности (15) и УРО. Тогда $2$-фактор-матрица $\Phi {\text{'}}(z{\kern 1pt} {\text{*}})$ невырожденна.
Доказательство. Покажем, что отображение $\Psi (z)$ будет $2$-регулярно в точке $z{\kern 1pt} {\text{*}}$ на векторе ${{h}^{ \top }} = (0_{n}^{ \top },0_{m}^{ \top },e_{0}^{ \top },e_{1}^{ \top })$, где ${{e}_{0}} \in {{\mathbb{R}}^{m}}$ и каждая $i$-я компонента вектора ${{e}_{0}}$ равна единице, если $i \in {{I}_{0}}(x{\kern 1pt} {\text{*}}) = \{ i \in I(x{\kern 1pt} {\text{*}})\,|\,\lambda _{i}^{*} = 0,s_{i}^{*} = 0\} $, и равно нулю в противном случае, а ${{e}_{1}} \in {{\mathbb{R}}^{m}}$ и каждая $i$-я компонента вектора ${{e}_{1}}$ равна единице, если $\lambda _{i}^{*} = 0$, и равна нулю в противном случае. Определим матрицу
(46)
$\Phi {\text{'}}(z{\text{*}}) = \Psi {\text{'}}(z{\kern 1pt} {\text{*}}) + P\Psi {\text{''}}(z{\kern 1pt} {\text{*}})h = \left( {\begin{array}{*{20}{c}} {{{L}_{{xx}}}(z{\kern 1pt} {\text{*}})}&{{{0}_{{nm}}}}&{{{{({{g}_{x}}(x{\kern 1pt} {\text{*}}))}}^{ \top }}}&{{{0}_{{nm}}}} \\ {{{0}_{{mn}}}}&{2\lambda {\text{*}}\; + \;2{{J}_{0}}(x{\text{*}})}&{2s{\kern 1pt} {\text{*}}}&{{{0}_{{mm}}}} \\ {{{{({{g}_{x}}(x{\kern 1pt} {\text{*}}))}}^{ \top }}}&{2s{\kern 1pt} {\text{*}}}&{{{0}_{{mm}}}}&{{{0}_{{mm}}}} \\ {{{0}_{{mn}}}}&{{{I}_{m}}}&{{{0}_{{mm}}}}&{2y{\text{*}}\; + \;2{{J}_{1}}(x{\kern 1pt} {\text{*}})} \end{array}} \right),$Очевидно, что $2$-фактор-метод, примененный к системе (41), имеет вид
(47)
${{z}_{{k + 1}}} = {{z}_{k}} - \mathop {\left( {\Psi {\text{'}}({{z}_{k}}) + P\Psi {\text{''}}({{z}_{k}})h} \right)}\nolimits^{ - 1} \left( {\Psi ({{z}_{k}}) + P\Psi {\text{'}}({{z}_{k}})h} \right),\quad k = 0,1, \ldots .$Теоpема 10. Пусть $\Psi \in {{C}^{3}}({{\mathbb{R}}^{r}})$ и для $h \in {{\mathbb{R}}^{r}}$, $\left\| h \right\| \ne 0$, существует ${{\left( {\Psi {\text{'}}(z{\kern 1pt} {\text{*}}) + P\Psi {\text{''}}(z{\kern 1pt} {\text{*}}h)} \right)}^{{ - 1}}}$. Тогда $2$-фактор-метод (47) сходится к решению $z{\kern 1pt} {\text{*}}$ системы (41) с квадратичной скоростью, т.е.
Доказательство. Следует из того факта, что $2$-фактор-метод (47) есть обычный метод Ньютона, примененный к системе
так как точка $z{\kern 1pt} {\text{*}}$ – решение системы (41), будет одновременно решением системы (48) и для нее выполнены все условия сходимости метода Ньютона с квадратичной скоростью.Список литературы
Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.
Bertsekas D.P. Nonlinear programming. Belmont: Athena scientific, 1999. P. 191–276.
Ашманов С.А., Тимохов А.В. Теория оптимизации в задачах и упражнениях. М.: Физматлит, 1991. 448 с.
Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982. 432 с.
Поляк Б.Т. Введение в оптимизацию. М.: Физматлит, 1983.
Евтушенко Ю.Г., Третьяков А.А. Аппроксимация p-го порядка множества решений нелинейных уравнений // Ж. вычисл. матем. и матем. физ. 2013. Т. 53. № 12. С. 1951.
Белаш К.Н., Третьяков А.А. Методы решения вырожденных задач // Ж. вычисл. матем. и матем. физ. 1988. Т. 28. № 7. С. 1097–1102.
Brezhneva O.A., Tret’yakov A.A. The p-factor-Lagrange methods for degenerate nonlinear programming // Numerical Functional Analysis and Optimization. 2007. V. 28. № 9–10. P. 1051–1086.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики