Журнал вычислительной математики и математической физики, 2020, T. 60, № 3, стр. 534-546
Синтез численных методов аппроксимации множества парето на основе универсальной процедуры
Я. И. Рабинович *
ФИЦ ИУ РАН
119333 Москва, ул. Вавилова, 40, Россия
* E-mail: jacrabin@rambler.ru
Поступила в редакцию 13.06.2019
После доработки 07.10.2019
Принята к публикации 18.11.2019
Аннотация
Для построения численных методов аппроксимации множества Парето используется предложенная в работе [1] универсальная вычислительная процедура. Численные методы разработаны на основе предположений, необходимых для доказательства сходимости универсальной процедуры к множеству Парето. Библ. 4.
ВВЕДЕНИЕ
В работе [1] была развита методология решения задач многокритериальной оптимизации в рамках универсальной вычислительной процедуры, позволяющей использовать существующие численные методы скалярной оптимизации для аппроксимации множества Парето. Без предъявления дополнительных требований к вектору частных критериев эффективности и множеству допустимых решений, универсальная процедура используется в настоящей работе как инструмент разработки численных методов построения множества Парето.
1. ПОСТАНОВКА ЗАДАЧИ
Пусть в $\,s$-мерном евклидовом пространстве ${{\mathbb{R}}^{s}}$ определена $\,m$-мерная непрерывная вектор-функция
образующая вектор частных критериев эффективности, принимающий на непустом компактном множестве допустимых решений (допустимом множестве) положительные значения, $w\left( x \right) > 0$, так что справедливы соотношения(3)
$\begin{gathered} w\left( x \right) \in w\left( X \right) \subset \operatorname{int} \mathbb{R}_{ + }^{m}, \\ w\left( X \right) = \left\{ {u \in {{\mathbb{R}}^{m}}\,\left| {\,u = w\left( x \right),\;x \in X} \right.} \right\},\quad \mathbb{R}_{ + }^{m} = \left\{ {u \in {{\mathbb{R}}^{m}}\,\left| {\,u \geqslant 0} \right.} \right\}, \\ \end{gathered} $(4)
${{\left\{ {{{w}_{k}}\left( x \right)} \right\}}_{{k \in I}}},\;I = \left\{ {k\left| {1 \leqslant k \leqslant m} \right.} \right\}$Определение 1. Векторная оценка $w \in w\left( X \right)$ эффективна (слабо эффективна), если для всякой векторной оценки $u \in w\left( X \right)$ система неравенств $u \geqslant w$ несовместна при условии, что хотя бы одно неравенство строгое (все неравенства строгие).
Векторная оценка $w \in w\left( X \right)$ доминируема или определенно неэффективна, если существует векторная оценка $u \in w\left( X \right)$, $u > w$.
Всякое допустимое решение $x \in X$, доставляющее эффективное (слабо эффективное, доминируемое) значение вектора $w\left( x \right)$, называется эффективным (слабо эффективным, доминируемым) решением.
В согласии с определением 1, эффективная векторная оценка слабо эффективна, достижимая векторная оценка $w \in w\left( X \right)$ либо слабо эффективна, либо доминируема, множества эффективных (${{X}_{e}}$), слабо эффективных (${{X}_{0}}$) и доминируемых (${{X}_{\partial }}$) решений из множества допустимых решений (X) подчиняются соотношениям
(5)
$w\left( {{{X}_{e}}} \right) \subset w\left( {{{X}_{0}}} \right) \subset w\left( X \right),\quad w\left( {{{X}_{0}}} \right) \cap w\left( {{{X}_{\partial }}} \right) = \emptyset ,\quad w\left( X \right) = w\left( {{{X}_{0}}} \right) \cup w\left( {{{X}_{\partial }}} \right),$В качестве решения задачи многокритериальной оптимизации будем рассматривать множество Парето (множество эффективных векторных оценок $w\left( {{{X}_{e}}} \right)$), причем методы аппроксимации множества $w\left( {{{X}_{e}}} \right)$ разрабатываются на базе универсальной вычислительной процедуры [1].
В дальнейшем потребуются следующие определения.
Определение 2. Если $\left\| v \right\|$ – норма вектора $v \in {{\mathbb{R}}^{m}}$, то величина
Определение 3. Величина
Определение 4. Заданная на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$ функция $f$ называется:
вогнутой на $A$, если для любых $x,y \in A$, $\rho \in \left( {0,1} \right)$ выполняется неравенство
квазивогнутой на $A$, если для любых $x,y \in A$, $\rho \in \left( {0,1} \right)$ выполняется неравенство
Дифференцируемая на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$ функция $f$ называется псевдовогнутой на $A$, если для любых $x,y \in A$ неравенство
влечет неравенство $f\left( x \right) \geqslant f\left( y \right)$, где $\nabla f$ – градиент функции $f$, $\left\langle {a,b} \right\rangle $ – скалярное произведение векторов $a,b \in {{\mathbb{R}}^{s}}$.Определение 5. Заданная на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$ функция $f$ называется $\omega $-вогнутой на $A$, если для любых фиксированных $x,y \in A$ при условии $f\left( y \right) \geqslant f\left( x \right)$ можно указать величину $\omega = \omega \left( {x,y} \right) \in \left( {0,1} \right]$ такую, что для любого $\rho \in \left( {0,1} \right)$ выполняется неравенство
Функция $f$ называется выпуклой (квазивыпуклой, псевдовыпуклой, $\omega $-выпуклой) на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$, если функция $ - f$ вогнута (квазивогнута, псевдовогнута, $\omega $-вогнута) на $A$.
В согласии с [2] определения 1–4 являются стандартными. Определение 5 при $\omega \equiv 1$ совпадает с определением вогнутой функции, а в предельном случае $\omega \equiv 0\,$– с определением квазивогнутой функции; каждая вогнутая, псевдовогнутая, $\omega $-вогнутая функция квазивогнута. Отметим, что операции суммирования и взятия минимума (максимума) сохраняет свойство $\omega $-вогнутости (выпуклости) функций. Следующая лемма устанавливает связь меду $\omega $-вогнутыми и псевдовогнутыми функциями.
Лемма 1. 1. Если функция $f$ дифференцируема и $\omega $-вогнута на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$, то она псевдовогнута на $A$.
2. Если функция $f$ псевдовогнута на выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$, то она $\omega $-вогнута на $A$.
Доказательство. 1. Предположим от противного, что для некоторой пары точек $x,y \in A$, $x \ne y$ выполняется соотношение
Тогда для любой точки
справедливо утверждение2. Предположим от противного, что для некоторой пары точек $x,y \in A$, $f\left( y \right) \geqslant f\left( x \right)$ при любом $\omega \in \left( {0,1} \right]$ можно указать точку ${{z}^{\omega }} \in \left[ {x,y} \right]$, удовлетворяющую неравенству
(6)
$\left\| {y - x} \right\|[f({{z}^{\omega }}) - f\left( x \right)] < \omega \left\| {{{z}^{\omega }} - x} \right\|\left[ {f\left( y \right) - f\left( x \right)} \right].$Если выполняется хотя бы одно из равенств
то из неравенства (6) следует утверждениеТем самым с необходимостью из утверждения (1) вытекает утверждение
(7)
$\begin{gathered} f\left( y \right) > f({{z}^{\omega }}) \geqslant f\left( x \right),\quad x \ne y,\quad {{z}^{\omega }} \in \left( {x,y} \right], \\ \frac{{f({{z}^{\omega }}) - f\left( x \right)}}{{\left\| {{{z}^{\omega }} - x} \right\|}} < \omega \frac{{f\left( y \right) - f\left( x \right)}}{{\left\| {y - x} \right\|}}, \\ \end{gathered} $Ввиду компактности отрезка $\left[ {x,y} \right]$ из произвольной сходящейся последовательности величин
Если $z* \ne x$, то переходя в последнем неравенстве следствия к пределу по $\omega = \omega \left( t \right)$, $t \in T$, с учетом последних двух предельных соотношений можно утверждать
Напомним несколько полезных свойств квазивогнутых (и, следовательно, $\omega $-вогнутых) функций.
Лемма 2. 1. Если заданная на непустом выпуклом множестве $A \subset {{\mathbb{R}}^{s}}$ функция $f$ является квазивогнутой на $A$, то каждое из ее множеств Лебега
2. Если функция $f$ непрерывна на непустом компакте $A$, то каждое из множеств Лебега $L\left( {f,\beta } \right)$ либо пусто, либо компактно.
Доказательство. 1. Пусть множество $L\left( {f,\beta } \right) \ne \emptyset $. Тогда для любой пары точек $x,y \in L\left( {f,\beta } \right)$, $x \ne y$ и любой точки $z \in \left( {x,y} \right)$ с учетом определения 4 выполняется:
2. Компактность множеств Лебега функции $f$ непосредственно следует из непрерывности $f$ на компакте $A$. Лемма доказана.
2. УНИВЕРСАЛЬНАЯ ПРОЦЕДУРА
Универсальная вычислительная процедура в работе [1] опирается на ряд неформальных соображений. Для построения множества векторных оценок $w\left( {{{X}_{e}}} \right)$, эффективных по критерию $w\left( x \right)$, недостаточно стремиться к увеличению каждого частного критерия из набора (4), поскольку в этом случае достигаются лишь «рекордные» на допустимом множестве $X$ значения каждого из частных критериев, а не множество эффективных векторных оценок в целом. Необходимо, вообще говоря, добиваться увеличения значений частных критериев в каждом подмножестве критериев из набора (4), с той лишь оговоркой, что добившись улучшения значений критериев для фиксированного подмножества ${{\left\{ {{{w}_{k}}\left( x \right)} \right\}}_{{k \in M}}}$, где $\emptyset \ne M \subset I$, можно не беспокоиться о значениях критериев в любом вложенном подмножестве ${{\left\{ {{{w}_{k}}\left( x \right)} \right\}}_{{k \in K}}}$, $K \subset M$.
Дадим в согласии с [1] строгое описание универсальной процедуры аппроксимации множества эффективных векторных оценок.
На множестве допустимых решений $X \subset {{\mathbb{R}}^{s}}$ строится последовательность множеств $\left\{ {{{X}_{t}}} \right\}_{{t = 1}}^{\infty } \subset X$, где по-прежнему $X$ – непустое компактное множество. Если ${{X}_{1}} \subset X$ – произвольное начальное приближение (например, оно может включать единственное допустимое решение ${{x}^{1}} \in X$, так что ${{X}_{1}} = \left\{ {{{x}_{1}}} \right\}$), и известно множество ${{X}_{t}}$, $t \geqslant 1$, то следующее за ним множество ${{X}_{{t + 1}}}$ подчиняется соотношениям
(8)
${{X}_{{t + 1}}} = \bigcup\limits_{x \in {{X}_{t}}} {{{X}_{{t + 1}}}\left( x \right)} ,\quad {{X}_{{t + 1}}}\left( x \right) = \left\{ x \right\} + \bigcup\limits_{J \in {{\mathcal{M}}_{t}}\left( x \right)} {\left\{ {h\left( {x,J} \right)} \right\}} \subset X,$В согласии с соотношениями (8) всякая опорная точка $x \in {{X}_{t}}$ порождает на следующем t + 1-м уровне непустую векторную сумму множеств ${{X}_{{t + 1}}}\left( x \right)$, причем направление $h\left( {x,J} \right)$ перехода из опорной точки $x \in {{X}_{t}}$ в следующую точку $y = x + h\left( {x,J} \right) \in {{X}_{{t + 1}}}\left( x \right)$, $J \in {{\mathcal{M}}_{t}}\left( x \right)$ удовлетворяет условиям
(9)
$h\left( {x,\emptyset } \right) = 0,\quad h\left( {x,J} \right) \ne 0,\quad \emptyset \ne J \subset I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\},$(10)
$\begin{gathered} y = x + h\left( {x,J} \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right),\quad \emptyset \ne J \subset I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}, \\ {{Y}_{J}}\left( {x,\varepsilon } \right) = \left\{ {y \in {{\mathbb{R}}^{s}}\,\left| {\,\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} \geqslant 1 + \sigma {{\varepsilon }^{2}},\;k \in J} \right.,\;\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} \geqslant 1 - \sigma \varepsilon ,\;k \in I{\backslash }J} \right\}, \\ Y\left( {x,\varepsilon } \right) = \left\{ {y \in {{\mathbb{R}}^{s}}\,\left| {\,\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} \leqslant 1 + \sigma \varepsilon ,\;k \in I} \right.} \right\}, \\ \varepsilon = {{\varepsilon }_{t}}\left( x \right) \in \left( {0,1} \right),\quad \sigma = {{\left[ {2\mathop {{\text{max}}}\limits_{z \in X} \sum\limits_{k \in I} {{{w}_{k}}\left( z \right)} } \right]}^{{ - 1}}}\mathop {{\text{min}}}\limits_{z \in X} \mathop {{\text{min}}}\limits_{k \in I} {{w}_{k}}\left( z \right) \in \left( {0,\frac{1}{2}} \right]. \\ \end{gathered} $Последовательность множеств (8) в каждой опорной точке $x \in {{X}_{t}}$ ветвится, причем степень ее ветвления $\left| {{{\mathcal{M}}_{t}}\left( x \right)} \right|$ определяет множество не вложенных друг в друга подмножеств ${{\mathcal{M}}_{t}}\left( x \right) \subset {{2}^{I}}$, заданное соотношениями
(11)
$\begin{gathered} {{\mathcal{M}}_{t}}\left( x \right) = \left\{ \begin{gathered} {{\mathcal{N}}_{t}}\left( x \right),\quad {\text{если}}\quad {{\mathcal{N}}_{t}}\left( x \right) \ne \emptyset , \hfill \\ \left\{ \emptyset \right\},\quad {\text{если}}\quad {{\mathcal{N}}_{t}}\left( x \right) = \emptyset , \hfill \\ \end{gathered} \right. \\ {{\mathcal{N}}_{t}}\left( x \right) = \left\{ {J \subset I\left| \begin{gathered} X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right) \ne \emptyset , \hfill \\ X \cap {{Y}_{M}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right) = \emptyset ,\quad M \ne J \subset M \subset I \hfill \\ \end{gathered} \right.} \right\}. \\ \end{gathered} $Наибольшая степень ветвления последовательности (8) совпадает с наибольшим числом не вложенных друг в друга подмножеств множества номеров частных критериев эффективности $I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$, так что
Соотношения (10), (11) включают величину $\varepsilon = {{\varepsilon }_{t}}\left( x \right) \in \left( {0,1} \right)$ – параметр возмущения, который в начальной точке ${{x}^{1}}$ и в любых соседних точках ${{x}^{t}} \in {{X}_{t}}$, ${{x}^{{t + 1}}} \in {{X}_{{t + 1}}}({{x}^{t}})$ последовательности (8) таких, что
(12)
${{x}^{{t + 1}}} = {{x}^{t}} + h({{x}^{t}},{{J}_{t}}),\quad {{J}_{t}} \in {{\mathcal{M}}_{t}}\left( x \right),$(13)
$\begin{gathered} {{\varepsilon }_{1}}({{x}^{1}}) = \kappa \in \left( {0,1} \right),\quad {{\varepsilon }_{{t + 1}}}({{x}^{{t + 1}}}) = \left\{ \begin{gathered} \kappa {{\varepsilon }_{t}}({{x}^{t}}),\quad {\text{если}}\quad {{Q}_{t}} = \emptyset , \hfill \\ {{\varepsilon }_{t}}({{x}^{t}}),\quad {\text{если}}\quad {{Q}_{t}} \ne \emptyset , \hfill \\ \end{gathered} \right. \\ {{Q}_{t}} = \bigcap\limits_{q \leqslant t,{{\varepsilon }_{q}}({{x}^{q}}) = {{\varepsilon }_{t}}({{x}^{t}})} {{{J}_{q}}} , \\ \end{gathered} $Замечание 1. Прокомментируем процедуру (8)–(13).
В согласии с соотношениями (9), (10) последовательность (8) определена таким образом, что переход из опорной точки $x \in {{X}_{t}}$ по ненулевому направлению $h\left( {x,J} \right)$, $J \in {{\mathcal{M}}_{t}}\left( x \right)$ в новую опорную точку $y = x + h\left( {x,J} \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)$ обеспечивает следующие результаты:
благодаря включению $y \in {{Y}_{J}}\left( {x,\varepsilon } \right)$ достигается относительное (порядка ${{\varepsilon }^{2}}$) увеличение значений критериев из множества ${{\left\{ {{{w}_{k}}} \right\}}_{{k \in J}}}$ за счет возможного относительного уменьшения (на величину порядка $\varepsilon $) значений остальных критериев ${{\left\{ {{{w}_{k}}} \right\}}_{{k \in I\backslash J}}}$;
включение $y \in Y\left( {x,\varepsilon } \right)$ препятствует слишком резкому росту значений критериев из выделенного множества (18), что является существенным на поздних этапах вычислительной процедуры, не позволяя переходить от одной эффективной векторной оценки к другой и возвращаться обратно, через все множество достижимых векторных оценок;
соотношения (11) позволяют ограничиться теми ненулевыми направлениями $h\left( {x,J} \right)$, $J \in {{\mathcal{M}}_{t}}\left( x \right)$, для которых соответствующие множества улучшаемых на величину порядка ${{\varepsilon }^{2}}$ частных критериев ${{\left\{ {{{w}_{k}}} \right\}}_{{k \in J}}}$ невозможно пополнить, что также существенно на поздних этапах вычислительной процедуры, поскольку препятствует слишком резкому увеличению числа опорных точек $\left| {{{X}_{t}}} \right|$;
соотношения (12), (13) обеспечивают дробление параметра возмущения $\varepsilon $, если невозможно относительное увеличение (на величину порядка ${{\varepsilon }^{2}}$) хотя бы одного из улучшаемых на предыдущих этапах частных критериев. Поскольку непрерывные критерии на компакте $X \subset {{\mathbb{R}}^{s}}$ ограничены, для всякой последовательности решений
В согласии с [1] можно утверждать, что последовательность множеств $\left\{ {w\left( {{{X}_{t}}} \right)} \right\}_{{t = 1}}^{\infty }$, заданная соотношениями (8)–(13), аппроксимирует множество эффективных векторных оценок в следующем смысле.
Теорема 1. Если вектор-функция $w\left( x \right) \in {{\mathbb{R}}^{m}}$ положительно определена, удовлетворяет условию Липшица и $\omega $-вогнута на непустом выпуклом компакте $X$, то отклонение множества эффективных векторных оценок $w\left( {{{X}_{e}}} \right)$ от аппроксимирующего множества $w\left( {{{X}_{t}}} \right)$ и отклонение множества $w\left( {{{X}_{t}}} \right)$ от множества слабо эффективных векторных оценок $w\left( {{{X}_{0}}} \right)$ стремятся к нулю с ростом номера аппроксимаций $t$:
Следствие 1. Если множества эффективных и слабо эффективных векторных оценок совпадают, $w\left( {{{X}_{e}}} \right) = w\left( {{{X}_{0}}} \right)$, то в согласии с определением 2 последовательность аппроксимаций $\left\{ {w\left( {{{X}_{t}}} \right)} \right\}_{{t = 1}}^{\infty }$ сходится к множеству $w\left( {{{X}_{e}}} \right)$ в метрике Хаусдорфа.
3. ПОСТРОЕНИЕ МЕТОДА
Универсальная процедура (8)–(13) не содержит точного рецепта построения аппроксимирующей последовательности $\left\{ {w\left( {{{X}_{t}}} \right)} \right\}_{{t = 1}}^{\infty }$, поскольку для каждого непустого подмножества $J \in {{\mathcal{M}}_{t}}\left( x \right)$ не дает прямого указания, в какую именно “подходящую” опорную точку $y = x + h\left( {x,J} \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)$ следует переходить из исходной опорной точки $x \in {{X}_{t}}$.
Процедура (8)–(13) становится реальной вычислительной процедурой (численным методом), если она дополнена правилом выбора
а) начальной точки ${{x}^{1}} \in X$ (либо множества начальных точек ${{X}_{1}} \subset X$, $\left| {{{X}_{1}}} \right| > 1$, если в работе численного метода предусмотрен мультистарт);
б) каждой последующей опорной точки $y \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)$.
Подчеркнем, что сходимость вычислительной процедуры (8)–(13) сохраняется, если правило выбора меняется от этапа к этапу процедуры.
Нашей целью является правило выбора, не требующее выдвижения дополнительных (по сравнению с формулировкой теоремы 1) предположений о характере вектор-функции $w\left( x \right)$ и множества допустимых решений $X$.
В согласии с утверждением теоремы 1, сходимость численных методов на основе универсальной процедуры обеспечена при старте из любых точек допустимого множества $X\,$. Вместе с тем эффективность численного метода может зависеть от состава начального множества ${{X}_{1}} \subset X$, причем для конкретизации подобного множества приходится учитывать неформальные соображения.
Как было указано в замечании 1, при выборе новой опорной точки не все требования не являются существенными на начальном этапе вычислительной процедуры. Тем самым для формирования начального приближения ${{X}_{1}}$ можно использовать упрощенный вариант процедуры (8)–(13), где вместо требований (10) предъявляются требования
(10а)
$\begin{gathered} y = x + h\left( {x,J} \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right),\quad \emptyset \ne J \subset I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}, \\ {{Y}_{J}}\left( {x,\varepsilon } \right) = \left\{ {y \in {{\mathbb{R}}^{s}}\,\left| {\,\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} \geqslant 1 + \sigma {{\varepsilon }^{2}},\;k \in J} \right.,\;\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} \geqslant 1 - \sigma \varepsilon ,\;k \in I{\backslash }J} \right\}, \\ {{\varepsilon }_{t}}\left( x \right) \in \left( {0,1} \right),\quad \sigma = {{\left[ {2\mathop {{\text{max}}}\limits_{z \in X} \sum\limits_{k \in I} {{{w}_{k}}\left( z \right)} } \right]}^{{ - 1}}}\mathop {{\text{min}}}\limits_{z \in X} \mathop {{\text{min}}}\limits_{k \in I} {{w}_{k}}\left( z \right) \in \left( {0,\frac{1}{2}} \right], \\ \end{gathered} $(11а)
${{\mathcal{M}}_{t}}\left( x \right) = \left\{ {J \subset I\,\left| {\,\emptyset \ne J,\;X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \ne \emptyset } \right.} \right\},$Правило выбора начального приближения.
Чтобы с помощью упрощенной процедуры (8), (9), (10а), (11а), (12), (13) генерировать начальное приближение ${{X}_{1}}$, нужно уметь в соотношениях (10а) указать следующую за опорной точкой $x \in X$ опорную точку $y \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)$. Для этого достаточно отыскать экстремум вспомогательной функции
где ${{\varphi }_{0}}$ – евклидово расстояние между фиксированным опорным решением $x \in X$ и произвольным допустимым решением $z \in X$.В самом деле, в предположениях теоремы 1 вместе с функциями ${{w}_{k}}\left( y \right)$ каждая из функций ${{\left[ {{{w}_{k}}\left( x \right)} \right]}^{{ - 1}}}{{w}_{k}}\left( y \right)$ является положительной, непрерывной и $\omega $-вогнутой по переменным y на выпуклом компакте $X\,$, так что в согласии с леммой 2 заданные соотношениями (10), (10а) множества
(15)
$y = {\text{arg }}\mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)} \left\| {x - z} \right\|$Задача отыскания следующей опорной точки $y$ согласно (15) сводится к задаче выпуклого программирования: отысканию минимума выпуклой квадратичной функции на непустом выпуклом компакте,
Если возможна линейная аппроксимация выпуклого компакта “изнутри”, когда в него вписан непустой выпуклый многогранник $Z \subset X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)$, следующей опорной точкой в соотношениях (10а) может быть выбрана проекция
опорной точки $x \in X$ на выпуклый многогранник $Z$, так что поиск следующей опорной точки сводится к решению задачи квадратичного программирования, которое может быть получено (см. [3]) за конечное число арифметических действий.По упрощенной процедуре через несколько шагов (количество которых определяется спецификой решаемой многокритериальной задачи) будет построено начальное приближение ${{X}_{1}}$. В согласии с соотношениями (10а), (11а) его образ в пространстве критериев ${{\mathbb{R}}^{m}}$ – множество $w\left( {{{X}_{1}}} \right)$ – может представлять собой грубую аппроксимацию множества Парето по всему “фронту”, если упрощенная процедура стартует при достаточно малом $\kappa \in \left( {0,1} \right)$ из доминируемой точки ${{x}^{1}} \in X{\backslash }{{X}_{0}}$, $w({{x}^{1}}) \in \operatorname{int} w\left( X \right)$.
Предположим, что вычислительная процедура (8)–(13) стартовала из конкретной опорной точки начального множества ${{X}_{1}}$. В согласии с соотношениями (10) на каждом шаге процедуры с номером $t \geqslant 1$ необходимо определить следующую за опорной точкой $x \in {{X}_{t}}$ новую опорную точку $y \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)$, где каждое из множеств
(16)
$X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right),\;\emptyset \ne J \subset I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$Таким образом, если допустимое множество $X \subset {{\mathbb{R}}^{s}}$ задано функциональными ограничениями, поиск подходящей опорной точки $y \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)$ может быть сведен к решению системы нелинейных неравенств общего вида.
Другой подход к выбору опорной точки из множества (16) связан с поиском экстремума некоторой вспомогательной функции.
Если выбрана функция (14), то согласно (11) при условии $J \in {{\mathcal{M}}_{t}}\left( x \right)$ пересечение множеств (16) не пусто, проекция
(17)
$y = {\text{arg }}\mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right)} \left\| {x - z} \right\|$Прежде чем перейти к рассмотрению вспомогательных функций, отличных от (14), заметим, что образ множества (16) в пространстве критериев ${{\mathbb{R}}^{m}}$ существенно упрощается, если к заданному в (1) векторному критерию $w \in {{\mathbb{R}}^{m}}$ применить следующее линейное преобразование:
(18)
$u\left( y \right) = \frac{1}{{\sigma \varepsilon \left( {1 - \varepsilon } \right)}}\sum\limits_{k \in J} {\left( {\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} - 1 - \sigma {{\varepsilon }^{2}}} \right){{e}^{k}} + \frac{1}{{2\sigma \varepsilon }}\sum\limits_{k \in I{\backslash }J} {\left( {\frac{{{{w}_{k}}\left( y \right)}}{{{{w}_{k}}\left( x \right)}} - 1 + \sigma \varepsilon } \right){{e}^{k}}} } \in {{\mathbb{R}}^{m}},$В согласии с определениями (10), (18) задающие пересечение (16) множества приобретают вид
(19)
${{Y}_{J}}\left( {x,\varepsilon } \right) = \left\{ {y \in {{\mathbb{R}}^{s}}\,\left| {\,u\left( y \right) \geqslant 0} \right.} \right\},\quad \emptyset \ne J \subset I,\quad Y\left( {x,\varepsilon } \right) = \left\{ {y \in {{\mathbb{R}}^{s}}\,\left| {\,u\left( y \right) \leqslant \sum\limits_{k = 1}^m {{{e}^{k}}} } \right.} \right\}.$Тем самым преобразование (18) переводит заданные соотношениями (10) многогранные множества
(20)
$u\left( {{{Y}_{J}}\left( {x,\varepsilon } \right)} \right) = \mathbb{R}_{ + }^{m},\quad u\left( {Y\left( {x,\varepsilon } \right)} \right) = \left\{ {\sum\limits_{k = 1}^m {{{e}^{k}}} } \right\} - \mathbb{R}_{ + }^{m}$(21)
$\begin{gathered} {{U}_{m}} = u\left( {{{Y}_{J}}\left( {x,\varepsilon } \right)} \right) \cap u\left( {Y\left( {x,\varepsilon } \right)} \right) = \\ = \;\mathbb{R}_{ + }^{m} \cap \left( {\left\{ {\sum\limits_{k = 1}^m {{{e}^{k}}} } \right\} - \mathbb{R}_{ + }^{m}} \right) = \left\{ {u \in {{\mathbb{R}}^{m}}\;\left| {\;0 \leqslant {{u}_{k}} \leqslant 1,\;1 \leqslant k \leqslant m} \right.} \right\}. \\ \end{gathered} $В рамках процедуры (8)–(13) для отыскания последующей опорной точки можно сформулировать следующие правила выбора.
Правило 1. В согласии с определением 3 и соотношениями (18)–(21) выберем в качестве вспомогательной неотрицательную непрерывную функцию
(22)
${{\varphi }_{1}}\left( z \right) = \mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}}\left( z \right),\quad z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right),$Задача вычисления чебышевского расстояния между началом координат и пересечением $u\left( X \right) \cap \mathbb{R}_{ + }^{m}$ сводится к отысканию минимума непрерывной функции (22) на выпуклом компакте,
(23)
$\mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}}\left( z \right)\;\xrightarrow[{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)}]{}\;{\text{min,}}$Теорема 2. Пусть при непустом фиксированном подмножестве $J \subset \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$ в опорной точке $x \in X$ определено преобразование (18), выпуклый компакт $X$, выпуклое замкнутое множество ${{Y}_{J}}\left( {x,\varepsilon } \right)$ и замкнутое множество $Y\left( {x,\varepsilon } \right)$ заданы соотношениями (2), (10), (19), выпуклый компакт (единичный куб) ${{U}_{m}}$ определен в (21).
Если неотрицательная величина
(24)
$\mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)} \mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}}\left( z \right) \leqslant 1,$(25)
$y = {\text{arg }}\mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)} \mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}}\left( z \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right).$В противном случае выполняется строгое неравенство
Доказательство. Поскольку минимум непрерывной функции $\mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}}\left( z \right)$ на выпуклом компакте $X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)$ достигается, решение
Согласно определению куба ${{U}_{m}} \subset \mathbb{R}_{ + }^{m}$ в (21) и расстояния по Чебышёву, для любых векторов $u \in \mathbb{R}_{ + }^{m}$ справедливы соотношения
(26)
$\begin{gathered} \mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}} \leqslant 1,\quad u \in {{U}_{m}}, \\ \mathop {\max }\limits_{1 \leqslant k \leqslant m} {{u}_{k}} > 1,\quad u \in \mathbb{R}_{ + }^{m}{\backslash }{{U}_{m}}, \\ \end{gathered} $Правило 2. Определим вспомогательную функцию
(27)
${{\varphi }_{2}}\left( z \right) = \mathop {\max }\limits_{1 \leqslant k \leqslant m} \left| {{{u}_{k}}\left( z \right) - \frac{1}{2}} \right|,\quad z \in X,$(28)
$\mathop {\max }\limits_{1 \leqslant k \leqslant m} \left| {{{u}_{k}}\left( z \right) - \frac{1}{2}} \right|\;\xrightarrow[{z \in X}]{}\;{\text{min}}{\text{.}}$Сформулируем этот результат в качестве следствия из доказательства теоремы 2.
Следствие 2. Пусть при некотором непустом фиксированном подмножестве $J \subset \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$ в опорной точке $x \in X$ определено преобразование (18), выпуклые компакты $X$, ${{Y}_{J}}\left( {x,\varepsilon } \right)$ и компакт $Y\left( {x,\varepsilon } \right)$ заданы соотношениями (2), (10), выпуклый компакт (единичный куб) ${{U}_{m}}$ определен в (21). Тогда при условии
В противном случае выполняется строгое неравенство
Замечание 2. По сравнению с задачей (23) при решении экстремальной задачи (28) не приходится учитывать $m$ функциональных ограничений, определяющих в согласии с (10) множество ${{Y}_{J}}\left( {x,\varepsilon } \right)$. Вместе с тем минимизируемая функция в (23) несколько проще, чем соответствующая функция в (28).
Следует отметить, что множество достижимых векторных оценок $w\left( X \right)$ – образ выпуклого допустимого множества $X$ – не обязательно является выпуклым, даже если в качестве частных критериев эффективности используются вогнутые функции (см. [4]). Согласно преобразованию (18) множество $u\left( X \right)$ также не выпукло. Вместе с тем всякой векторной оценке $u\left( x \right)$ опорного решения $x \in X$ можно сопоставить подмножество
(29)
$V\left( x \right) = \left\{ {v \in u\left( X \right)\,\left| {\,\left[ {u\left( x \right),v} \right] \subset u\left( X \right)} \right.} \right\},$Лемма 3. Если для некоторого непустого фиксированного подмножества $J \subset I = \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$ пересечение множеств (16) содержит решение
(30)
$y \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right),\quad u\left( y \right) \in V\left( x \right),$(31)
$\begin{gathered} \left[ {u\left( x \right),u\left( y \right)} \right] \cap \bigcup\limits_{k \in J} {{{U}_{{mk}}}} \ne \emptyset , \\ {{U}_{{mk}}} = \left\{ {u \in {{U}_{m}}\,\left| {\,{{u}_{k}} = 0} \right.} \right\},\;1 \leqslant k \leqslant m,\;{{U}_{m}} = \left\{ {u \in {{\mathbb{R}}^{m}}\,\left| {\,0 \leqslant {{u}_{k}} \leqslant 1,\;1 \leqslant k \leqslant m} \right.} \right\}. \\ \end{gathered} $Доказательство. Из определений (18), (29) и условия (30) следует, что векторные оценки $u\left( x \right)$ и $u\left( y \right)$ удовлетворяют соотношениям
Следовательно, можно указать точку отрезка $v \in \left[ {u\left( x \right),u\left( y \right)} \right]$, удовлетворяющую соотношениям
Согласно лемме 3, если пересечение множеств (16) содержит хотя бы одно подходящее решение $y$, образ которого $u\left( y \right)$ “виден” из точки $u\left( x \right)$, то существует подходящее решение ${{y}^{J}}$ из пересечения (16), образ которого $u({{y}^{J}})$ расположен на одной из содержащих 0 граней ${{U}_{{mk}}}$, $k \in J,$ единичного куба ${{U}_{m}}$.
Правило 3. Введем вспомогательную функцию
(32)
${{\varphi }_{J}}\left( z \right) = \mathop {{\text{min}}}\limits_{k \in J} {{u}_{k}}\left( z \right),\quad z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right),\quad \emptyset \ne J \subset I.$Следующая теорема свидетельствует о том, что в условиях леммы 3 в качестве новой опорной точки можно выбрать решение, доставляющее минимум неотрицательной непрерывной $\omega $-вогнутой функции (32) на выпуклом компакте,
(33)
$\mathop {{\text{min}}}\limits_{k \in J} {{u}_{k}}\left( z \right)\;\xrightarrow[{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)}]{}\;{\text{min}}{\text{.}}$Теорема 3. Пусть при непустом фиксированном подмножестве $J \subset \left\{ {k\,\left| {\,1 \leqslant k \leqslant m} \right.} \right\}$ в опорной точке $x \in X$ определено преобразование (18), выпуклый компакт $X$, замкнутое множество $Y\left( {x,\varepsilon } \right)$ и выпуклые замкнутые множества ${{Y}_{J}}\left( {x,\varepsilon } \right)$, ${{U}_{m}}$ заданы соотношениями (2), (10), (19), (21), условие (30) леммы 3 выполнено.
Тогда справедливо утверждение
(34)
${{y}^{J}} = {\text{arg}}\mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)} \mathop {{\text{min}}}\limits_{k \in J} {{u}_{k}}\left( z \right) \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right).$Доказательство. В условиях теоремы выполняется неравенство
(35)
$\begin{gathered} {{y}^{J}} \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right) \cap Y\left( {x,\varepsilon } \right),\quad u({{y}^{J}}) \in u\left( X \right) \cap {{U}_{{mi}}}, \\ i \in J,\quad {{u}_{i}}({{y}^{J}}) = 0 = \mathop {{\text{min}}}\limits_{z \in X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)} \mathop {{\text{min}}}\limits_{k \in J} {{u}_{k}}\left( z \right). \\ \end{gathered} $Следовательно, справедливо утверждение
Замечание 3. Рассмотрим важный частный случай, когда компоненты вектор-функций $w$, $u$ вогнуты. Но тогда функция (32) вогнута, и ее на выпуклом компакте $X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)$ можно аппроксимировать кусочно-линейной функцией
Если возможна линейная аппроксимация выпуклого компакта “изнутри”, когда в него вписан непустой выпуклый многогранник $Z \subset X \cap {{Y}_{J}}\left( {x,\varepsilon } \right)$, то ввиду перестановочности минимумов задача поиска новой опорной точки (33) приближенно сводится к решению конечного числа $Q$ задач линейного программирования:
ВЫВОДЫ
В настоящей работе проанализированы возможности синтеза численных методов аппроксимации множества Парето на основе предложенной в [1] универсальной вычислительной процедуры. Рассматривался наиболее трудный случай, когда к вектору частных критериев эффективности и множеству допустимых решений не предъявляется никаких дополнительных требований (в частности, не требуется дифференцируемости критериальных функций и функциональных ограничений). Предполагается, что множество допустимых решений является выпуклым компактом, а компоненты вектора частных критериев эффективности – непрерывные $\omega $-вогнутые функции, удовлетворяющие условию Липшица. Лемма 1 определяет место $\omega $-вогнутых функций в качестве одного из обобщений понятия вогнутой функции.
Численный метод на основе универсальной процедуры характеризуется:
конкретным правилом выбора начального приближения;
конкретным правилом выбора каждого последующего опорного решения.
Построение начального приближения согласно предложенному правилу сводится к решению нескольких задач проектирования внешней точки на выпуклый компакт (к решению нескольких задач квадратичного программирования в линейном приближении).
В качестве правила перехода от текущего опорного решения к последующему предлагаются следующие 3 варианта.
Согласно правилам 1 и 2 требуется минимизировать расстояние по Чебышёву в пространстве критериев, преобразованных в соответствии с соотношением (18). Для этого в обоих случаях следует отыскать минимум непрерывной функции на выпуклом компакте. Как было указано в замечании 2, по правилу 1 минимизируется несколько более простая функция на более сложном множестве, по правилу 2 – несколько более сложная функция на более простом множестве.
Согласно правилу 3 следует минимизировать $\omega $-вогнутую функцию на выпуклом компакте; если критериальные функции можно считать вогнутыми, в линейном приближении задача минимизации сводится к решению ряда задач линейного программирования.
Сходимость вычислительной процедуры сохраняется, если правило выбора меняется от этапа к этапу процедуры. Следует лишь подчеркнуть, что правило 3 обеспечивает отыскание следующей опорной точки, если выполняются условия леммы 3.
Список литературы
Рабинович Я.И. Универсальная процедура построения множества Парето // Ж. вычисл. матем. и матем. физ. 2017. Т. 57 № 1. С. 28–47.
Базара М., Шетти К. Нелинейное программирование. М.: Мир, 1986.
Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983.
Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Физматлит, 2007.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики