Автоматика и телемеханика, № 11, 2021
© 2021 г. Ю.В. СИДЕЛЬНИКОВ, д-р техн. наук (sidelnikovy@mail.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва;
Московский авиационный институт
(национальный исследовательский университет))
РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ МЕТРИЧЕСКОГО ПОДХОДА
НА ОСНОВЕ ТЕОРИИ СРЕДНИХ И ТЕОРИИ ОШИБОК
Предлагается расширить возможности метрического подхода для ре-
шения специальных задач, например в теории расписаний ослаблени-
ем требований к аксиомам метрики или введением вероятностных мер
близости. Рассматриваются результаты автора на стыке теории сред-
них и такой области исследования, как показатели экспертных оши-
бок, которые аксиоматически заданы. Усилен результат, полученный
акад. А.Н. Колмогоровым при рассмотрении им системы аксиом для вы-
вода аналитической формулы ассоциативной средней.
Ключевые слова: требования к аксиомам метрики, показатели эксперт-
ных оценок, теорема Колмогорова и ее усиление.
DOI: 10.31857/S0005231021110076
1. Введение
Метрики достаточно широко используются в фундаментальных и при-
кладных исследованиях. Например, в теории расписаний, которая является
фундаментальной областью дискретной оптимизации [1].
Обзоры, в рамках которых рассматриваются всевозможные меры бли-
зости, публиковались достаточно давно. Например, обзор мер близости в
пространстве множеств был опубликован Г.В. Раушенбахом в 1982 г. [2].
В настоящее время появляются исследования, где рассматриваются прин-
ципиально новые меры близости (сходства), например вероятностные меры
близости, которые рассмотрены Д.З. Уздиным в монографии [3]. Полагаем,
что метрический подход для решения разнообразных задач может получить
новый импульс при использовании не только мер близости, но и функций,
которые играют роль метрики, однако метриками в классическом понимании
не являются, так как их аксиомы “ослаблены”, а также не дискретных, а ве-
роятностных мер близости. Такие публикации имеются, но их существенно
меньше.
В статье автор рассматривает меру близости как однозначную, неотрица-
тельную действительную функцию ρ (x, y), определенную для любых x и y
на Х и удовлетворяющую трем стандартным условиям (аксиомам) [4, с. 48].
Цель статьи — рассмотреть варианты перспективных направлений в фун-
даментальных и прикладных исследованиях, связанные с использованием ве-
100
роятностного подхода для мер близости и ослаблением требований к аксио-
матике метрик, и получить в их рамках новые результаты.
2. Возможные варианты перспективных направлений
Среди первых трех, по числу аксиом меры близости, вариантов перспек-
тивных направлений рассмотрим лишь те, которые связаны с ослаблением
требований к аксиоматике метрики. Причем если первое и второе лишь обо-
значим, то в третьем направлении попытаемся не только его предложить, но
и получить в его рамках новые результаты.
В качестве первого направления предложим использовать для анализа ин-
формации не только метрики, но и псевдометрики1. В этом случае ослаб-
ляется первая аксиома метрики (рефлексивность) таким образом, что не
требуется выполнение условия: чтобы из E(x, y) = 0 следовало бы x = y
[7, с. 740-741].
Исходим из определения псевдометрического пространства как множе-
ства X, наделенного псевдометрикой E(x, y). При этом любым двум элемен-
там x, y ∈ X ставится в соответствие действительное число E такое, что:
первая аксиома: если x = y, то E(x, y) = 0,
вторая аксиома: неравенство треугольника. Когда для любой тройки
x,y,z ∈ X
E(x, y) ≤ E(x, z) + E(z, y).
Легко показать, что псевдометрика симметрична и положительно полу-
определена, т.е. E(x, y) 0 (см., например, [5, с. 31]).
В качестве второго направления предложим рассмотреть вариант ослаб-
ления аксиомы неравенства треугольника, как, например, в диссертации
Г.В. Иофиной [6]. Эта диссертация направлена на поиск способов измере-
ния расстояний на объектах, задаваемых наборами порядковых призна-
ков. Г.В. Иофина полагает, что “иногда полезно рассматривать функции
на значениях признаков, которые играют роль метрики, однако метрика-
ми в классическом понимании не являются”. Цель этой диссертации — по-
иск и использование оптимальных функций расстояний, удовлетворяющих
всем аксиомам метрик или полуметрик кроме неравенства треугольника.
Г.В. Иофина рассматривает задачу классификации с двумя классами К1
и К2. При этом дано множество объектов {S1,... ,Sm1} из класса К1 и
Sm1+1,... ,Sm1+m2 из класса К2. Каждый объект принадлежит признаково-
му пространству размерности n. Значения признаков принадлежат конечно-
му множеству EN = {0, 1, . . . , N - 1}, на котором задано отношение порядка:
0 1 2 ≤ ··· ≤ N - 1. На каждом признаке задана своя функция расстоя-
ния, которая удовлетворяет всем аксиомам метрики кроме неравенства тре-
1 В более ранних публикациях на русском языке данное понятие именовалось как “ква-
зирасстояние” [5, с. 31]. Встречаются публикации, где данное понятие называется полумет-
рикой [6].
101
угольника, т.е. функция p(x, y) : EN × EN → EM удовлетворяет следующим
условиям:
1. p(x, y) = 0 ⇔ x = y.
2. p(x, y) = p(y, x).
3. Если x ≥ y, то p (x, z) ≥ p (y, z) и p (x, z) ≥ p (x, y) , для любых z ∈ EN ,
z≤y.
Таким образом, Г.В. Иофина использует условие, замещающее неравен-
ство треугольника на более слабое — расстояние между дальними значениями
не меньше, чем между ближними (условие порядка).
При этом требуется, чтобы выбранная мера близости была оптимальна для
различных задач, главным образом для задач распознавания. Кроме того,
Г.В. Иофина обоснованно полагает, что результат работы алгоритмов класси-
фикации и кластеризации сильно зависит от метрик, заданных на объектах.
И, значит, особо важно выбрать правильную функцию близости в задачах
кластеризации [8, 9].
Третье перспективное направление. В данном случае рассматривается ва-
риант, когда допускается асимметричность метрики и при этом ослабляются
тем или иным способом первая и (или) третья аксиомы метрики. В таком
случае можно использовать асимметричные меры, например для числово-
го случая показатель ошибки E1(x, y) = |x - y|/|y|. Обычно все такие меры
называют показателями ошибки. Использование таких асимметричных мер
возможно, когда на множестве можно задать тернарное отношение “между”,
и полезно, когда нужно рассматривать качественно другие ситуации. Напри-
мер, вы пришли за одну минуту до отхода поезда или опоздали на ту же
минуту. Надо ли учитывать асимметричность меры в таких ситуациях? Несо-
мненно, и далее это будет показано.
Четвертое перспективное направление — введение и использование веро-
ятностных и вероятностно-метрических мер близости и их эффективный под-
бор.
3. Обзор существующих современных публикаций
по данной тематике
Рассмотрим сначала публикации, в рамках которых используются асим-
метричные меры близости. Таких работ по сравнению с исследованиями с
использованием обычных метрик гораздо меньше.
Приведем ряд примеров с использованием асимметричных мер. Необхо-
димость учета асимметричности меры возникает, например, при формализа-
ции понятия степени приближения к истине отдельных фрагментов научно-
го знания — теорий, гипотез, научных утверждений и т.п. в рамках решения
проблемы правдоподобности научного знания (логической теории правдопо-
добности). Пример, иллюстрирующий сложности этой задачи, рассмотрен в
монографии основателя этой теории Карла Поппера, которая базируются на
основе аппарата формальной логики. В качестве пояснения К. Поппер рас-
смотрел ситуацию с опозданием на поезд, а для учета степени приближения
102
(меру правдоподобности) к истине использовал показатель ошибки E(x, y) =
= |x - y|, задавая затем риторический вопрос: “Отклонения от истинного вре-
мени в обоих случаях равны, но равная ли мера правдоподобности должна
быть приписана этим утверждениям? На основе только одной интуиции ре-
шить этот вопрос нельзя, и, во всяком случае, во многих практических си-
туациях (например, отправление поезда) ошибка одного существенно менее
значима, чем ошибка другого” [10].
Следующий пример употребления асимметричных мер можно обнаружить
в исследованиях по кластерному анализу, который используется в различных
научных и прикладных областях и также является актуальной темой иссле-
дований. Так, в публикации А.Р. Айдиняна и О.Л. Цветковой предложены
алгоритмы, предназначенные для кластеризации объектов, которые описы-
ваются векторами признаков в пространстве с несоблюдением аксиомы сим-
метрии [11]. “Суть первого из предложенных алгоритмов кластеризации за-
ключается в последовательном формировании кластеров с одновременным
перенесением кластеризованных объектов из ранее созданных кластеров в
текущий кластер в случае, если это уменьшит критерий качества. По сравне-
нию с существующими алгоритмами неиерархической кластеризации такой
подход к формированию кластеров позволяет уменьшить вычислительные
затраты” [11].
По мнению исследователей из ИПУ РАН, “недостатком большинства мер,
основанных на онтологических структурах, является симметричность (экс-
пертные оценки показывают, что мера близости не всегда симметрична). Кро-
ме того, эти меры независимы от контекста и чувствительны к структуре
иерархии” [12].
Среди англоязычных публикаций можно отметить следующие.
В [13] “предлагается асимметричная мера семантической близости. В за-
висимости от направления прохождения ребрам придается разный вес, так
как потомок более подобен родителю, чем родитель — потомку”.
В [14] представлена концепция асимметричной модели сходства и взвешен-
ного вектора частот слов или термов (HFV) и сконструированы две новые
асимметричные меры: HFM и HIPM. В статье [14] показано, что симметрич-
ные меры сходства не всегда могут эффективно работать в рамках общей
проблемы измерения сходства текстов. Будь то информационный поиск, ин-
теллектуальный анализ текстов, извлечение веб-контента, классификация и
кластеризация текстов в коллекции и обнаружении копии документов в смыс-
ле плагиата и т.д. Такого рода направления исследования требуют методов,
способных обрабатывать неструктурированную информацию, поэтому самым
популярным подходом является схема, основанная на частоте повторений то-
го или иного элемента, в случае текстов, слов или сочетаний символов. Для
документов эта схема использует вектор частот слов из словаря, построен-
ного на всех изучаемых документах, тем самым обеспечивается единая раз-
мерность. А стандартными векторными мерами сходства являются функция
косинуса, скалярное произведение и функция пропорций. Но все они симмет-
ричны.
103
Представляют интерес и другие англоязычные исследования, см. напри-
мер, [15-17].
Обзор исследований с использованием асимметричной меры близости по-
казал, что хотя такие работы и существуют, но и в них не учитывается ряд
трудностей их использования. Рассмотрим их в разделе 4.
4. Трудности использования асимметричных мер близости
Первая трудность. Автор статьи не может использовать вышеуказанное
определение псевдометрического пространства, так как из него вытекает
именно симметричность меры. Таким образом, необходимо либо:
I. Ослаблять первую аксиому и (или) аксиому “неравенство треугольника”;
II. Использовать нижеследующие аксиоматики для показателей ошибки.
Пусть XN — множество упорядоченных наборов вещественных чисел. Вве-
дем отношение частичного порядка на XN :
x≥y⇔xi ≥yi,
где
x,y ∈ XN , x = (x1,x2,... ,xN), y = (y1,y2,... ,yN), i = 1,... ,N.
Определение 3.1 [18, с. 170]. Показателем ошибки E называется дей-
ствительная функция E = E(x, y), определенная на декартовом квадрате
XN × XN и удовлетворяющая следующим условиям:
1. E(x, y) = 0 ⇔ x = y;
2. E(x, y) 0;
3. Для каждого фиксированного x ∈ XN функция Ex (y) = E(x, y) строго
монотонно убывает на луче {y ∈ XN : y < x} и монотонно возрастает на
луче {y ∈ XN : y > x};
4. Для каждого фиксированного y ∈ XN функция Ey(x) = E(x, y) строго
монотонно убывает на луче {x ∈ XN : x < y} и строго монотонно возрас-
тает на луче {x ∈ XN : x > y}” [18, с. 170].
Либо “пусть Y — линейно упорядоченное отношением множество,
наделенное порядковой топологией, а X — связное подмножество Y .
Определение 3.4 [18, с. 173]. Показателем ошибки E называется любая
действительная функция E(x,y), определенная на декартовом произведении
X × Y и удовлетворяющая следующим условиям:
1. E(x, y) = 0 ⇔ x = y;
2. E(x, y) 0;
3. Для любого фиксированного x ∈ X функция Ex(y) строго монотонно
убывает на луче {y ∈ Y : y < x} и монотонно возрастает на луче {y ∈ Y :
: y > x};
104
4. Для каждого фиксированного y ∈ Y функция Ey(x) строго монотонно
убывает на луче {x ∈ X : x < y} и строго монотонно возрастает на луче
{x ∈ X : x > y};
5. Функция E(x, y) непрерывна по y.” [18, с. 173].
Заметим, что второе определение показателя ошибки отличается от перво-
го не только областью определения, но и наличием пятого условия, которое
позволяет рассмотреть новый необходимый и достаточный критерий.
Вторая трудность. Необходимо учитывать, что вывод при сопоставитель-
ном анализе, полученный на основе используемой асимметричной меры (по-
казатель ошибки), может зависеть от вида, точнее от класса эквивалентности
использованной меры. Возможно, первый, кто обратил на это внимание, был
Г. Галилей. В его письме к Ноццолино, приведенном в монографии К. Джини,
рассмотрен следующий условный пример [19]: “Пусть перед покупкой лошака
один знаток оценил скотину в 10 скудо (денежная единица того времени в
Италии), второй — в 1 тыс. скудо, а хозяин продал лошака за 100 скудо. Спра-
шивается, какая из оценок точнее? Ноццолино утверждал, что второй знаток
допустил большую ошибку, потому что его оценка отличается от фактической
на 900 скудо, тогда как оценка первого — лишь на 90. На что Галилей возра-
зил, что превышение в оценке второго эксперта равняется приуменьшению в
оценке первого, и, значит, ошибки одинаковы.”
Таким образом, перед отбором меры необходимо обосновать, какую меру
выбрать, а точнее, какой класс эквивалентности таких мер исследователю
подходит. Приведем поясняющий пример. Пусть необходимо выяснить, по-
дойдет ли для верификации прогноза прироста ВВП РФ на 2021 г. следующая
мера (показатель ошибки) E (x, y) = |lnxy |, где x, y ∈ R, x - экспертная оцен-
ка, y - истинное значение. Первый эксперт дал прогнозную оценку X1 = 1%
ожидаемого прироста, второй эксперт дал оценку X2 = 25% ожидаемого при-
роста ВВП по сравнению с 2020 г. Подводя итог 2021 г., экономисты получили
оценку прироста ВВП по сравнению с 2020 г. пять процентов (Y = 5%). Ес-
ли воспользуемся логарифмическим показателем ошибки, то получим, что
ошибки двух прогнозов одинаковы. (|ln 1/5| = |ln 25/5|). По мнению автора,
такой показатель для верификации прогноза прироста ВВП РФ на 2021 г. не
подходит. И в следующий раз не нужно приглашать для оценивания второго
эксперта. Значит, для каждой ситуации надо находить подходящий показа-
тель ошибки. Такой пример является подсказкой для нахождения процедуры
подбора вида показателя ошибки, точнее класса эквивалентности показате-
лей ошибки.
Именно с этим и связана третья трудность: построение тех или иных ва-
риантов процедуры подбора вида показателя ошибки. В монографии автора
предложен один из вариантов процедуры подбора класса эквивалентности
видов показателей ошибки на основе экспертных заключений [18, с. 189]. По-
ясним последнее утверждение. Классы эквивалентности показателей ошибки
вполне естественно вводятся в рамках:
любых двух различных аксиоматических заданий показателей ошибки:
определение 3.1. [18, с. 170] и определение 3.4. [18, с. 173];
105
отношения знаковой эквивалентности (). См. определение 3.3. [18,
с. 171];
утверждения 3.1. “Отношение знаковой эквивалентности () есть отно-
шение эквивалентности” [18, с. 171].
В рамках рассмотренной и вновь создаваемых аналогичных экспертных
процедур возникает необходимость усреднения экспертных оценок. Возника-
ют следующие задачи:
1. Вид используемой средней величины необходимо обосновывать;
2. Кроме того, необходимо уметь рассчитывать найденный вид средних.
Но для этого необходимо, чтобы средние были заданы не аксиоматически, а
в аналитическом виде.
Поясним последнюю задачу. Если основой для отбора вида средней явля-
ется следующая аксиома: “можно заменить некоторую группу значений их
собственным средним, не меняя общего среднего”, то нужно обратить вни-
мание на результат акад. А.Н. Колмогорова [20, 21], которой показал, что
каждый тип среднего M, если он удовлетворяет четырем условиям:
I. M(x1,x2,... ,xn) - непрерывна и монотонна по каждому переменному
(для определенности будем считать, что M - возрастает по каждому пере-
менному);
II. M(x1,x2,... ,xn) - симметрическая функция;
III. Среднее от одинаковых чисел равно их общему значению:
M(x,x,... ,x) = x;
IV. Можно заменить некоторую группу значений их собственным средним,
не меняя общего среднего:
M(x1,x2,... ,xm,y1,y2,... ,yn) = M∗n+m(x,x,... ,x,y1,y2,
,yn),
где x = M(x1, x2, . . . , xm) необходимо имеет вид:
M(x1,x2,... ,xn) = F-1(F(x1) + F(x2) + ··· + F(xn))/n),
где F - непрерывная строго монотонная функция, (xi [a, b] ⊂ R).
Таким образом, имеем возможность рассчитывать значения такой средней
на основе аналитической формулы. Но в рассматриваемом случае, а автор
включает и асимметричные меры, вторая аксиома это запрещает. Таким об-
разом, необходимо получить более общую формулу для любой ассоциативной
средней, но без второй аксиомы.
В исследовании де Финетти показано, что любая ассоциативная средняя
является монотонной [22], таким образом, ему удалось усилить результат
акад. А.Н. Колмогорова.
Задача автора настоящей статьи состояла в ослаблении требования сим-
метричности.
В случае если находим среднюю величину для множества, без учета его
формирования, условие симметричности является вполне естественным, но
106
уже для множества, которое формируется из последовательности, — по-
видимому, нет. Для подтверждения этого заключения рассмотрим такой ши-
роко распространенный способ формирования экспертных групп, как метод
снежного кома [18, с. 159]. В этом случае вполне уместно полагать, что экс-
перт, называя другого эксперта, вряд ли назовет того, у которого уровень
знаний по задаваемому вопросу будет ниже, чем у него самого. Таким обра-
зом, вполне уместно назначать бóльшую весомость числовой оценки после-
дующего эксперта.
Общая постановка задачи: предложить аналитическое выражение для лю-
бой ассоциативной средней, но без условия симметричности, частным случа-
ем которой была бы формула Колмогорова.
Теорема2. Для любой строго монотонной и непрерывной действитель-
нозначной функции F : R0 → R следующее выражение является формулой
для непрерывной ассоциативной средней:
{
}
M(x1,x2,... ,xn) = F-1
qiF(xi)
,
1
где xi ∈ R0 - произвольному ограниченному интервалу действительных чи-
n
сел,
qi = 1, qi 0, qi ∈ R.
1
5. Направления будущих исследований в сфере
расширения возможностей метрического подхода
Предлагается рассмотреть следующий вариант расширения метрического
подхода. Необходимо обратить внимание, что во всех вышеуказанных слу-
чаях областью значения мер близости или функций, которые играют роль
метрики, является положительно определенное подмножество действитель-
ных чисел.
По нашему мнению, желательно расширять трактовку и этого элемента в
аксиоматике меры близости. Для этого рассмотрим объекты, на множестве
которых полезно ввести аналоги мер близости и соответствующее понятие
“близость”. Среди них, например, такие объекты, как меры близости.
Поясним полезность введения мер близости на мерах близости.
Именно для них могут быть полезны различные варианты изменения об-
ласти значения мер близости или функций, которые играют роль метрики.
Предварительно необходимо отметить, что в рамках различных исследо-
ваний их авторы иногда ставят вопрос относительно наиболее подходящих
мер близости на множествах различной природы. Например, Г.В. Иофина в
диссертации требует, чтобы выбранная мера близости была оптимальна для
различных задач, главным образом для задач распознавания [6].
В монографиях Н.Г. Загоруйко и В.Д. Мазурова говорится о выборе пра-
вильной функции близости в задачах кластеризации [8, 9].
2 Данная теорема была впервые доказана в диссертации Ю.В. Сидельникова и анонси-
рована в его автореферате [23].
107
Поиск наиболее подходящих мер близости обусловлен различиями реаль-
ных и виртуальных объектов, в математических моделях которых использу-
ются эти меры близости. Но можно и нужно пойти дальше.
Итак, в дальнейшем исследовании будем исходить из следующего Посту-
лата № 1. В рамках одного и того же реального или виртуального объекта
можно, а в ряде случаев необходимо, использовать различные меры близости
или их расширения как инструмент их анализа.
При этом будем исходить из того, что эти объекты могут иметь неоднород-
ную структуру и требовать для своего изучения различные меры в различных
частях этих же объектов.
Приведем поясняющий пример. Для этого рассмотрим множества, кото-
рые обладают одинаковыми свойствами во всех направлениях — изотропные
и анизотропные, т.е. обладающие различными свойствами в разных направ-
лениях.
Рассмотрим анизотропные множества, которые содержат N не пустых изо-
тропных подмножеств. При этом эти множества могут быть отображением
как реальных, так и виртуальных объектов.
Постулат № 2. Полагаем, что для исследования не только изотропных, но
и анизотропных непустых множеств необходимо на этих множествах ввести
понятия направления.
Это возможно, например, введя линейный или частичный порядок на мно-
жестве элементов этих множеств, а для дальнейших исследований ввести и
меру близости или ее различные расширения на элементах этих множеств.
Но, рассматривая различные меры близости на одном и том же объекте,
необходимо исследовать, как преобразуются эти меры при переходе из одного
изотропного множества в другое в рамках одного и того же объекта. Таким
образом, желательно ввести аналог меры близости на мерах близости — “су-
пермеру близости”.
Введем понятие супермеры близости (P ) на множестве мер бли-
зости E(x, y), и исследуем возможности метрической конструкции
P {E1 (x, y) , E2 (x, y)}, x, y ∈ X, i = 1, 2, . . . , n.
Полагаем, что на множестве мер близости E(x, y) можно ввести как ли-
нейный, так и частичный порядок.
Кроме того, для этого отображения необходимо рассмотреть области опре-
деления и значения однозначного отображения P (E(x, y)), а также ее закон
соответствия. А также нужно ввести понятия “различия” и “совпадения” зна-
чения супермеры на множестве мер близости.
Полагаем, что область определения отображения P (E(x, y)) есть все воз-
можные меры близости или их расширения, например псевдометрика.
На области определения (множество мер близости) можно ввести отноше-
ние линейного или частичного порядка, а также ввести тернарное отношение
“между”.
Это возможно, например, на основе следующего утверждения 3.16: “Пусть
Y — линейно упорядоченное отношением множество, наделенное порядко-
108
вой топологией3, а Х — связное подмножество Y, Ф — непрерывная строго
монотонно возрастающая действительнозначная функция. Тогда функция
{ К1[Ф(x) - Ф(y)], если x > y,
E(x, y) =
К2[Ф(y) - Ф(x)], если y ≥ x,
является показателем ошибки, где x ∈ X; y ∈ Y ; К1, К2 ∈ R+; К1 = К2”
[18, с. 188].
Так как К1 и К2 являются различными действительными числами, то при
фиксированной функции Ф они определяют различные меры близости. А от-
ношение линейного порядка на действительной прямой индуцирует линейный
порядок на множестве мер близости, заданных в утверждении 3.16.
Полагаем, что понятие “совпадения” между мерами близости на множестве
мер близости можно ввести, например, через отношение “тождества” между
функциями E(x, y).
Необходимо обратить внимание, что область значений супермеры являет-
ся множеством преобразований одной меры в другую. В случае дискретно-
го и конечного множества преобразований характеристику этого множества
можно задать минимальным количеством преобразований, необходимых для
перехода одной меры в другую, и таким образом получить положительное
число.
Пояснить понятие “преобразование” одной из мер в другую можно следую-
щим образом. Пусть, например, имеем два показателя ошибок
E(x, y) = |x - y| и E`(x, y) = |lnnx - lnny|.
Рассмотрим, как преобразуется одна из мер близости, выраженной функ-
цией E(x, y), в другую функцию E`(x, y).
Полагаем, что “переход” одной функции в другую в этом конкретном слу-
чае возможен через преобразование lnnx в x. График функции z = lnnx, при
x ≥ 1 приближается к графику функции z = x при стремлении основания
логарифма к бесконечности.
Мера различия между мерами близости на множестве мер близости мо-
жет выражаться и в порядковой шкале, например в баллах. Приведем пояс-
няющий пример такого различия. Рассмотрим двух разных токарей, но их
различие будет только в их разрядах. Один из них будет токарем третьего
разряда, а второй токарь — второго разряда.
Покажем полезность и необходимость такой конструкции. При этом будем
исходить из Постулат № 3.
Само множество, где определены меры близости E(x, y), может быть не
только изотропным, т.е. обладать одинаковыми свойствами во всех направ-
лениях, но и анизотропным, т.е. обладать различными свойствами в разных
направлениях.
3 Порядковой топологией называется наименьшая система подмножеств множества Y ,
замкнyтая относительно объединения и конечного пересечения и содержащая все открытые
лyчи [24].
109
Так, например, в реальном космическом пространстве вблизи массивных
тел для расчетов используется метрика Минковского, а вдали от массивных
тел можно использовать метрику Эвклида.
По нашему мнению, необходимо исследовать свойства такой метрической
конструкции, где введена супермера близости P на множестве мер близости
E(x, y).
6. Заключение
В статье рассмотрены три варианта расширения метрического подхода
для решения специальных задач, например в теории расписаний, связанные
с ослаблением требований к аксиоматике метрики. Кроме того, предложено
поддержать вариант расширения метрического подхода на основе вероятност-
ных мер близости и вероятностно-метрических мер близости, рассмотренных
Д.З. Уздиным в монографии [3].
Указано на перспективность выбора функций близости для разнообраз-
ных типов задач. Так, Г.В. Иофина в исследовании требует, чтобы выбранная
мера близости была оптимальна для различных задач, главным образом для
задач распознавания [6]. Н.Г. Загоруйко и В.Д. Мазуров пишут о выборе пра-
вильной функции близости в задачах кластеризации [8, 9]. Но как выбирать
оптимальную или правильную меру близости? Этот вопрос пока не решен в
полной мере. Хотя для асимметричных числовых мер близости удалось по-
строить такую процедуру подбора вида показателя ошибки [18, с. 189].
Кратко описаны результаты Ю.В. Сидельникова, связывающие наиболее
известные аналитические средние с характеристиками классов эквивалент-
ности числовых показателей ошибки в рамках двух различных аксиоматиче-
ских заданий показателей ошибки.
Усилен результат, полученный А.Н. Колмогоровым, при рассмотрении им
системы аксиом для вывода аналитической формулы ассоциативной средней.
В статье получена формула для ассоциативной средней, но уже без условия
ее симметричности.
Предложено новое направление будущих исследований в сфере расшире-
ния возможностей метрического подхода, связанное с расширением метриче-
ского подхода. Введено понятие супермеры близости и рассмотрен случай,
когда областью определения супермеры близости являются меры близости
или функции, которые играют роль метрики. Показана полезность данной
конструкции.
ПРИЛОЖЕНИЕ
Доказательство теоремы.
Во-первых, докажем, что M(x1, x2, . . . , xn) является средним по Коши,
т.е. min xi ≤ M(x1, x2, . . . , xn) max xi.
110
Действительно, пусть F — строго монотонно возрастающая функция, то-
гда
qiF(min xi)
qiF(xi)
qiF(maxxi),
i=1
i=1
i=1
F (min xi)
qiF(xi) ≤ F(max xi).
i=1
Аналогично можно показать и для F - строго монотонно убывающей функ-
ции.
Теперь докажем, что средняя, выраженная в виде M(x1, x2, . . . , xn) =
n
=F-1{
qiF(xi)}, является ассоциативной, т.е.
1
M(x1,x2,... ,xm,xm+1,... ,xn) = M∗n(x,x,... ,x,xm+1,... ,xn),
где x = M∗m(x1, x2, . . . , xm) для любого m < n.
Формула для среднего при m < n, образуется следующим образом:
{
(
)
}
x = M∗m(x1,x2,...,xm) = F-1
qi/
qj F(xi)
,
1
1
т.е. сохраняя прежние коэффициенты, заново нормируем их, чтобы сохранить
условие
(
)
q∗i =
qi/
qj
=1
1
1
1
{
}
M∗m(x,x,xm+1,... ,xn) = F-1
qiF(x) +
qiF(xi)
=
1
m+1
{
[
(
(
)
)]
}
=F-1
qiF F-1
qi/
qj F(xi)
+ qiF(xi)
=
1
1
1
m+1
{
[
(
)
]
}
=F-1
qi
qi/
qj F(xi)
+ qiF(xi)
=
1
1
1
m+1
{
}
=F-1
qiF(xi) +
qiF(xi)
= M(x1,x2,... ,xn).
1
m+1
Теорема доказана.
111
СПИСОК ЛИТЕРАТУРЫ
1.
Lazarev A.A., Lemtyuzhnikova D.V., Werner F. A Metric Approach for Scheduling
Problems with Minimizing the Maximum Penalty // Appl. Math. Modell. Oxford,
Great Britain, Elsevier. 2021. No. 89. P. 1163-1176.
2.
Раушенбах Г.В. Меры близости в пространстве множеств / Алгоритмы анали-
за данных социально-экономических исследований ЭИ и ОПП СО АН СССР.
Новосибирск: 1982. С. 29-44.
3.
Уздин Д.З. Новые меры близости, функции состояний и решающие правила в
теории распознавания состояний (статистической классификации). 2-е изд., доп.
и испр. М.: МАКС Пресс, 2016.
4.
Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального
анализа. М.: Наука, 1968.
5.
Коллатц Л. Функциональный анализ и вычислительная математика / Пер. с
немецкого И.Г. Нидеккера, под ред. А.Д. Горбунова. М.: Изд-во Мир, 1964.
6.
Иофина Г.В. Выбор оптимальных метрик в задачах распознавания с порядко-
выми признаками. Дисс. на соискание уч. степ. канд. физ.-мат. наук: М.: 2010.
7.
Математическая энциклопедия. М.: Сов. энциклопедия. Т. 4. Ок-Сло. 1984.
8.
Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск:
Изд. Ин-та математики СО РАН, 1999.
9.
Мазуров В.Д. Метод комитетов в задачах оптимизации и классификации. М.:
Наука, 1990.
10.
Popper K.R. Conjectures and Refutations. The Growth of Scientific Knowledge.
Ch. 10, section 3. London: Routledge and Kegan Paul; N.Y.: Basic Books Inc., 1963.
11.
Айдинян А.Р., Цветкова О.Л. Алгоритмы кластерного анализа задач с асим-
метричной мерой близости // Сиб. журн. вычисл. матем. 2018. № 2. С. 127-138.
12.
Крюков К.В., Панкова Л.А., Пронина В.А., Шипилина Л.Б. Меры семантиче-
ской близости в онтологиях // Проблемы управления. 2010. № 5. С. 2-14.
13.
Bulskov H., Knappe R., Andreasen T. On Measuring Similarity for Conceptual
Querying / T. Andreasen, A. Motro, H. Christiansen, H.L. Larsen (Eds.). Flexible
Query Answering Systems. Lecture Notes in Artificial Intelligence. Berlin: Springer,
2002. V. 2522. P. 100-111.
14.
Jun-Peng Bao, Jun-Yi Shen, Xiao-Dong Liu, Hai-Yan Liu. Quick Asymmetric
Text Similarity Measures // Proc. Second Int. Conf. on Machine Learning and
Cybernetics. Wan, 2-5 November 2003. V. 1. P. 374-379.
15.
Hubert L.J. Min and Max Hierarchical Clustering Using Asymmetric Similarity
Measures // Psychometrika. 1973. No. 38. P. 63-72.
16.
Faith D.P. Asymmetric Binary Similarity Measures // Oecologia. 1983. V. 57. No. 3.
P. 287-290.
17.
Chen H.H., Giles C.L. ASCOS++ An Asymmetric Similarity Measure for Weighted
Networks to Address the Problem of SimRank // ACM Trans. Knowledge Discovery
from Data (TKDD). 2015. V. 10. No. 2. P. 1-26.
18.
Сидельников Ю.В. Системный анализ технологии экспертного прогнозирования.
М.: Изд-во МАИ-ПРИНТ, 2007.
19.
Джини К. Средние величины. М.: Статистика, 1970.
20.
Kolmogorov A.N. Sur la Notion de Moyenne. Atti Accad. Naz. Lincei Rend. Cl. Sci.
Fis. Mat. Natur. (6) 12 (1930). P. 388-391.
112
21. Колмогоров А.Н. Об определении среднего / Математика и механика. Избранн.
тр. Отв. ред. С.М. Никольский, сост. В.М. Тихомиров. М.: Наука, 1985. Т. 1.
С. 136-138.
22. Finetti B. de. Sul Concetto di Media // Giornale dell Instituto Ital. degli Attuari,
1931. Anno 11. No. 3. P. 365-396.
23. Сидельников Ю.В. Автореферат на соиск. уч. степ. д-ра техн. наук “Технология
экспертного прогнозирования”. 2002, ОКОРОИ ИМЭМО РАН.
24. Пфанцагель И. Теория измерений. М.: Мир, 1976.
Статья представлена к публикации членом редколлегии А.А. Лазаревым.
Поступила в редакцию 10.02.2021
После доработки 23.06.2021
Принята к публикации 30.06.2021
113