Автоматика и телемеханика, № 4, 2022
Оптимизация, системный анализ
и исследование операций
© 2022 г. В.Б. МЕЛЕХИН, д-р техн. наук (pashka1602@rambler.ru)
(Дагестанский государственный технический университет, Махачкала),
М.В. ХАЧУМОВ, канд. физ.- мат. наук (khmike@inbox.ru)
(Институт программных систем им. А.К. Айламазяна РАН, с. Веськово;
Федеральный исследовательский центр
“Информатика и управление” РАН, Москва;
Российский университет дружбы народов, Москва)
ПРИНЦИП ПОСТРОЕНИЯ ПРОЦЕДУР ПЛАНИРОВАНИЯ
ПОВЕДЕНИЯ АВТОНОМНЫХ ИНТЕЛЛЕКТУАЛЬНЫХ РОБОТОВ
НА ОСНОВЕ ПОЛИПЕРЕМЕННЫХ УСЛОВНО-ЗАВИСИМЫХ
ПРЕДИКАТОВ1
Предложен принцип построения процедур планирования целенаправ-
ленного поведения различных по назначению автономных интеллекту-
альных мобильных роботов в недоопределенных нестабильных условиях
функционирования. Для построения модели представления знаний раз-
работаны типовые ее конструкции в виде импликативных решающих пра-
вил, сформированных на основе различных по содержанию полиперемен-
ных условно-зависимых предикатов. Определена структура различных
по назначению предикатов данного типа, которые могут содержать как
полипеременные в виде активных нечетких семантических сетей, так и
связанные определенными условиями проблемной среды отдельные пере-
менные сорта “объекты” и “события”. Показано, что применение активных
нечетких семантических сетей позволяет описывать различные ситуации
и подситуации проблемной среды безотносительно к конкретной предмет-
ной области, а также определять в общем виде отношения, которые могут
наблюдаться интеллектуальным роботом в процессе планирования пове-
дения в проблемной среде между ее объектами и происходящими в ней
событиями. Разработаны инструменты обработки знаний на различных
этапах вывода решений, позволяющие строить эффективные процеду-
ры планирования поведения, обеспечивающие автономным интеллекту-
альным мобильным роботам возможность выполнять сложные задания,
сформулированные в виде обобщенного описания целевой ситуации про-
блемной среды. Найдены верхние граничные оценки сложности процедур
планирования целенаправленного поведения автономным интеллектуаль-
ным мобильным роботом, построенных по предложенному принципу орга-
низации инструментальных средств обработки знаний и вывода решений.
Ключевые слова: автономный интеллектуальный робот, проблемная сре-
да, модель представления знаний, планирование поведения, полиперемен-
ные условно-зависимые предикаты, импликативные решающие правила.
DOI: 10.31857/S0005231022040080, EDN: AAZOAD
1 Исследование выполнено за счет гранта Российского научного фонда № 21-71-10056,
https://rscf.ru/project/21-71-10056/
140
1. Введение
Актуальность решения различных проблем, связанных с созданием эф-
фективных интеллектуальных решателей задач для автономных интеллек-
туальных мобильных роботов (АИМР), обусловлена следующими основными
обстоятельствами, которые сложились в настоящее время в области разра-
ботки интеллектуальных систем различного назначения.
1. Низкими функциональными возможностями интеллектуальных реша-
телей задач, создаваемых на основе формализации мыслительных актов
наглядно-действенного мышления [1], т.е. мышления, организованного по
принципу условной и безусловной рефлекторной деятельности высокоразви-
тых живых систем, позволяющей организовать самообучение и рефлекторное
поведение АИМР в априори неописанных условиях проблемной среды [2].
К таким АИМР следует отнести, например, автономных мобильных робо-
тов, в основу планирования поведения которых закладываются различные
роевые [3] и генетические алгоритмы [4], позволяющие роботу организовать
относительно несложные формы целесообразной деятельности на основе об-
работки воспринимаемой в проблемной среде информации после предвари-
тельного обучения и самообучения. Следует отметить, что интеллектуаль-
ный решатель задач в этом случае, как правило, строится на базе нейронных
сетей [5], реализация которых в виде специализированных вычислительных
систем имеет высокие аппаратурные затраты при обеспечении АИМР отно-
сительно низкими интеллектуальными возможностями. При моделировании
же процессов вывода решений на основе таких сетей на универсальных ЭВМ
теряется основное преимущество сетевого интеллекта в сравнении с алгорит-
мическим интеллектом, связанное с возможностью принятия решений в ре-
альном времени.
2. Экспоненциальной сложностью вывода решения практических задач
и необходимостью формирования достаточно подробной модели закономер-
ностей целенаправленного преобразования различных ситуаций проблемной
среды [6]. Такие интеллектуальные решатели задач строятся на основе логи-
ческих моделей представления и обработки знаний с использованием логики
предикатов первого порядка [7]. Однако высокая сложность вывода решений
существенным образом препятствует применению классических моделей ло-
гического подхода для создания интеллектуальных решателей задач АИМР
различного назначения из-за того, что их бортовые ЭВМ, как правило, имеют
ограниченные вычислительные ресурсы.
Что же касается интеллектуальных решателей задач, организованных в
рамках логического подхода, имеющих линейную сложность вывода, напри-
мер, созданных на основе миварных технологий [8], то для принятия реше-
ний в таких системах требуется подробная, как правило, громоздкая модель
закономерностей преобразования различных ситуаций проблемной среды в
конкретной предметной области. Однако построение подробной модели за-
кономерностей реальной априори неопределенной проблемной среды, позво-
ляющей организовать на ее основе эффективную целенаправленную деятель-
ность АИМР, на практике не представляется возможным, так как заранее
141
неизвестно, с какими условиями столкнется робот в процессе функциониро-
вания в такой среде [6, 9]. Следовательно, АИМР должны обладать способ-
ностью адаптации к условиям неопределенности и на этой основе выполнять
сформулированные им сложные задания.
Таким образом, возникает необходимость в разработке модели представ-
ления и обработки знаний, которая, с одной стороны, позволяет компактным
образом в общем виде описать закономерности целенаправленного преобра-
зования различных ситуаций априори неописанной проблемной среды без-
относительно к конкретной предметной области и на этой основе наделить
АИМР способностью адаптироваться к различным условиям функциониро-
вания. С другой стороны, модель представления знаний должна обеспечи-
вать возможность вывода решений сложных задач в процессе планирования
АИМР целенаправленного поведения с приемлемой для его бортовой ЭВМ
сложностью.
В настоящей статье предлагается формализация мыслительных актов и
процедур вывода решений, обеспечивающая возможность организации пла-
нирования поведения в априори неописанных нестабильных условиях функ-
ционирования на основе модели представления знаний в виде набора типо-
вых конструкций, позволяющих АИМР автоматически строить сложные про-
граммы целенаправленной деятельности. В рассматриваемом случае типовые
конструкции различного назначения модели представления знаний АИМР
строятся на основе полипеременных условно-зависимых предикатов (ПУЗП),
отличающихся от известных условно-зависимых предикатов, содержащих в
структуре только условно-зависимые предметные переменные [6], наличием
различного сорта условно-зависимых переменных. В общем случае ПУЗП мо-
гут включать переменные следующих сортов: полипеременные; объектные
переменные; переменные события происходящего в проблемной среде и пе-
ременные сорта “отношения” между объектами, событиями и интеллектуаль-
ным роботом, которые должны наблюдаться в проблемной среде для успеш-
ной отработки АИМР действий, связанных с достижением заданной цели
поведения. Это позволяет сформировать типовые конструкции модели пред-
ставления знаний, обладающие высокими функциональными возможностями
и наделяющие АИМР способностью адаптироваться к априори неописанным
условиям функционирования.
Следует также отметить, что предложенные типовые конструкции моде-
ли представления знаний на основе ПУЗП, в отличие от ранее описанных,
аналогичных им по назначению конструкций [10, 11], позволяют организо-
вать целенаправленное поведение АИМР в нестабильных условиях проблем-
ной среды.
2. Постановка задачи и принятые определения
Рассмотрим АИМР, который оснащен манипулятором, обладает техни-
ческим зрением и способен отрабатывать множество различных действий
B = {bi1}, i1 = 1,n1. Проблемную среду можно охарактеризовать множе-
142
ством находящихся в ней объектов O = {oi2 (Xi2 , o∗i2 )}, i2 = 1, n2, и происхо-
дящими независимо от АИМР событиями Y = {yi3 (Yi3 )}, i3 = 1, n3, которые
могут негативным образом отразиться на отработке роботом определенных
действий bi1 ∈ B в процессе целенаправленного поведения. Здесь Xi2 — мно-
жество признаков (характеристик), позволяющих АИМР идентифицировать
oi2(Xi2 ,o∗i2 ) ∈ O объекты проблемной среды; o — описание текущего состоя-i
2
ния i2 объекта проблемной среды; Yi3 — множество характеристик, опреде-
ляющих yi3 (Yi3 ) событие, происходящее в проблемной среде.
Обобщенное описание допустимых ситуаций и подситуаций проблемной
среды в модели представления знаний АИМР осуществляется безотноситель-
но к конкретной предметной области с помощью активных нечетких семан-
тических сетей S = {S∗h1 }, h1 = 1, m1, [12]. В общем случае активная нечет-
кая семантическая сеть S∗h1 ∈ S представляет собой помеченный граф Gh1 =
= (Vh1 , Eh2 ), где Vh1 = {vh2 }, h2 = 1, m2, Eh1 = {eh3 }, h3 = 1, m3, — соответ-
ственно множество вершин и ребер. Семантическая сеть S называется ак-h
1
тивной, потому что в ней вершины vh2 ∈ Vh1 определяются слотами (пере-
{
(
)}
{
(
)}
менными) двух видов: X =
x∗i4
X∗i
,x∗∗i
, i4 = 1,n4, и Y =
y∗i5
Y
,
4
4
i5
i5 = 1,n5, которые в процессе вывода решений означиваются соответственно
конкретными объектами и событиями проблемной среды, удовлетворяющи-
ми их требованиям. Например, в процессе вывода решений допускается заме-
(
)
на слота x∗i4
X∗i
,x∗∗i
∈ X, которым помечена активная вершина vh2 ∈ Vh1,
4
4
(
)
произвольным объектом проблемной среды oi2
Xi2 ,o
∈ O, если для этого
(
)
i2
объекта выполняется условие
X∗i
⊆Xi2
4
Ребра eh3 ∈ Eh1 в активной нечеткой семантической сети S помечаютсяh
1
переменными сорта “отношения”, которые определяются следующими трой-(
)
(
)
— подынтервал допустимых чис-
ками < ti6j,tj
+1
, Ti6j>.Здесьtj6 ,tj
+1
ленных значений r∗i6 отношения ri6 ∈ R, которые должны наблюдаться в про-
блемной среде между ее объектами, событиями и АИМР для результативной
отработки роботом определенных действий bi1 ∈ B, например подынтервал
расстояний, при которых АИМР способен захватить объекты, расположенные
в проблемной среде, можно определить на основе разрешающей способности
его манипулятора; Ti6j—термодноименнойсотношениемri6∈Rлингви-
стичес
(
)
на ее количественной шкале, например терм “расположен
чений ti6j,tj
+1
очень близко” [13]; R = {ri6 }, i6 = 1, n6, — множество различного вида отно-
шений, которые могут выполняться в проблемной среде между объектами,
событиями и АИМР.
Следует отметить, что необходимый для вывода решений фрагмент на-
блюдаемой в проблемной среде ситуации в процессе планирования поведе-
ния формируется в виде семантической сети Sh4 ∈ S, S = {Sh4 }, h = 1, m4,
на основе данных, поступающих из системы технического зрения АИМР
и активной нечеткой семантической сети S∗∗, определяющей заданную ро-h
1
боту цель поведения. Для этого в сети S∗∗ выполняется замена слотовh
1
143
(
)
(
)
x∗i4
X∗i
,x∗∗i
∈X и y∗i5
Y
∈ Y соответственно на удовлетворяющие их
4
4
(
i5
)
требованиям объекты oi2
Xi2 ,o∗i2
∈ O и события yi3(Yi3) ∈ Y , наблюдаемые
в текущих условиях проблемной среды. В свою очередь ребра в формируе-
мой семантической сети Sh4 помечаются количественными оценками r от-i
6
ношений ri6 ∈ R, которые выполняются в текущих условиях проблемной сре-
ды между объектами, событиями и АИМР, определяющими инцидентные им
вершины. В результате этого активная нечеткая семантическая сеть S∗∗ ста-h
1
новится пассивной и соответствует конкретной текущей подситуации про-
блемной среды.
Таким образом, необходимые для вывода решений фрагменты Sh4 ∈ S до-
пустимых ситуаций проблемной среды определяются помеченными графа-
ми Gh4 = (Vh4 , Ei4 ), где Vh4 = {vh5 }, h5 = 1, m5, — множество вершин, опре-
(
)
деляемых находящимися в проблемной среде объектами oi2
Xi2 ,o
∈O и
i2
происходящими в ней событиями yi3 (Yi3 ) ∈ Y в соответствии с пометками
структурно эквивалентных им вершин в сети S∗∗, из которой строится семан-h
1
тическая сеть Sh4 ; Ei4 = {eh6 }, h6 = 1, m6, — множество ребер, помеченных
количественными значениями r∗i6 отношений ri6 ∈ R, выполняющимися в про-
блемной среде между объектами, событиями и АИМР, которыми помечены
инцидентные им вершины в семантической сети Sh4 .
Типовые элементы представления знаний АИМР строятся на основе раз-
личных по содержанию ПУЗП.
Определение 1. В общем случае, например под трехместным ПУЗП,
(
(
)
(
))
понимается выражение P
S∗h1,x∗i4
X∗i
,x∗∗i
,y∗i5
Y
, которое становится
4
4
i5
истинным высказыванием после подстановки в него вместо условно-зависи-
(
)
(
)
мых переменных S∗h1, x∗i4
X∗i
,x∗∗i
,y∗i5
Y
их значений, соответственно из
4
4
i5
множеств S, O и Y при условии, что они удовлетворяют соответствую-
щим этим переменным требованиям. Здесь P — предикатный символ, опре-
деляющий смысловое содержание ПУЗП; S
— полипеременная, область
h1
определения которой S представляет собой множество допустимых под-
ситуаций проблемной среды, сформированных с учетом находящихся в ней
объектов, событий и АИМР, а также количественных значений отноше-
(
)
ний, которые выполняются между ними в проблемной среде; x∗i4
X∗i
,x∗∗
4
i4
предметная переменная, областью определения которой O является мно-
(
)
жество находящихся в проблемной среде объектов; y∗i5
Y
— переменная
i5
сорта “события”, область определения которой Y представляет собой мно-
жество событий, происходящих в проблемной среде.
Таким образом, все переменные, входящие в структуру ПУЗП, фактиче-
ски являются связанными допустимыми условиями их означивания, а сами
формулы могут быть только выполнимыми в определенных условиях про-
блемной среды. При этом высказывания, получаемые в результате подста-
новки вместо условно-зависимых переменных соответствующих им констант
в виде конкретных объектов и событий, которые наблюдаются АИМР в теку-
щих условиях функционирования, являются истинными тогда и только тогда,
когда выполняются следующие условия:
144
(
)
— все слоты x∗i4
X∗i
,x∗∗i
∈ X в сети S и отдельные предметные пере-h
(
)
4
4
1
менные x∗i4
X∗i
,x∗∗
, входящие в структуру ПУЗП, удается пометить нахо-
4
i4
дящимися в проблемной среде объектами;
(
)
— все слоты y∗i5
Y∗i
∈ Y в подситуации Sh4 и отдельные переменные
(
)
5
y∗i5
Y
в структуре ПУЗП являются помеченными происходящими в про-
i5
блемной среде событиями yi3 (Yi3 ) ∈ Y , удовлетворяющими их требованиям,
т.е. при выполнении следующих условий Y∗i
⊆Yi3;
5
— фрагмент Sh4 текущей ситуации проблемной среды являет-
ся нечетко равным сети S , определяющей полипеременную ПУЗПh
(
(
)
(
))
1
P
S∗h1 ,x∗i4
X∗i
,x∗∗i
,y∗i5
Y
4
4
i5
Определение 2. Семантическая сеть Sh4 является нечетко равной
активной нечеткой семантической сети S , если для них выполняютсяh
1
следующие условия:
а) для каждой вершины vh2 ∈ Vh1 сети S , определяемой слотомh
(
)
1
x∗i4
X∗i
,x∗∗i
, существует структурно эквивалентная ей вершина vh5 ∈ Vh4
4
4
(
)
в сети Sh4, помеченная объектом проблемной среды oi2
Xi2 ,o
∈ O, для ко-
i2
торого выполняется условие X∗i
⊆Xi2;
4
б) для каждой вершины vh2 ∈ Vh1 сети S∗h1 , определяемой слотом y∗i5 (Y),i
5
существует структурно эквивалентная ей вершина vh5 ∈ Vh4 в сети Sh4,
помеченная событием проблемной среды yi3 (Yi3 ) ∈ Y , для которого выполня-
ется условие Y∗i
⊆Yi3;
5
в) для каждого ребра vh2 ∈ Vh1 сети S , определяемого тройкойh
(
)
1
< ti6j,tj
+1
, Ti6j>,существуетструктурноэквивалентноеемуребро
eh6 ∈ Ei4 в сети Sh4, помеченное количественным значением r одноимен-i
6
ного с пометкой вершины vh2 отношения ri6 ∈ R, которое попадает в ин-(
)
тервал численных значений ti6j,tj
+1
Следует отметить, что если сравниваются между собой активные нечет-
кие семантические сети, то для их нечеткого равенства, помимо выполнения
условий пп. а и б определения 2, требуется выполнение условия равенства
пометок всех пар структурно эквивалентных в них ребер.
Пусть модель представления знаний АИМР в соответствии с его функцио-
нальным назначением состоит из набора типовых конструкций, сформиро-
ванных на основе ПУЗП, которые имеют следующую структуру, содержание
и условия их применения.
1. Импликативные решающие правила первого типа
(
(
))
Pj1
S1(j1), x∗i
X∗i
,x∗∗i
→ <b1i
,b2i
,...,bdi
>, j1 = 1,m7,
4
4
4
1
1
1
и
Pj2(S1(j2), x1(X1,x∗∗1),... ,x∗k(X∗k,x∗∗k))
<b1i
,b2i
,...,bdi
> j2 = 1,m8,
1
1
1
сформированные соответственно на основе двухместных и k-местных ПУЗП,
которые обеспечивают деятельность АИМР, связанную с целенаправленной
145
отработкой действий bi1 ∈ B над отдельными объектами проблемной среды
(
)
oi2
Xi2 ,o∗i2
∈ O для их перевода из текущего состояния o в требуемое со-i
2
стояние x∗∗.i
4
(
В общем случае, например, импликативное решающее правило Pj1
S1(j1),
(
))
x∗i4
X∗i
,x∗∗i
→ < b1i1,b2i1,...,bd >, построенное на основе двухместногоi
4
4
1
(
(
))
ПУЗП, имеет следующее содержание “Если ПУЗП Pj1
S1(j1),x∗i4
X∗i
,x∗∗
4
i4
является выполнимым в текущих условиях проблемной среды, то для пере-
вода объекта oi2 (Xi2 , o∗i2 ) из текущего состояния o∗i2 в заданное состояние x∗∗,i
4
определяемое целью поведения S∗∗, следует отработать кортеж действийh
1
<b1i1,b2i1,...,bdi
∈Bj1 >”. Здесь S1(j1) — полипеременная, представляющая
1
собой активную нечеткую семантическую сеть, определяющую условия, ко-
торые должны выполняться в проблемной среде для успешной отработки
АИМР кортежа действий < b1i1 , b2i1 , . . . , bdi
∈Bj1 > над объектом проблемной
(
)
1
среды oi2
Xi2 ,o
, который удовлетворяет требованиям предметной пере-
i2
(
)
менной x∗i4
X∗i
,x∗∗
4
i4
2. Импликативные решающие правила второго типа Pj3 (S1(j3), S2(j3))
→<b1i1,b2i1,...,bd >, построенные на основе двухместных ПУЗП видаi
1
Pj3(S1(j3),S2(j3)), j3 = 1,m8, имеющих следующее содержание “Преобразо-
вать нечеткую семантическую сеть S1(j3) в нечеткую семантическую сеть
S2(j3)”. В общем случае данные импликативные решающие правила означа-
ют следующее: “Если в проблемной среде наблюдается подситуация, опре-
деляемая семантической сетью нечетко равной сети S1(j3), а семантическая
сеть, определяющая заданную АИМР целевую подситуацию среды, нечет-
ко равна сети S2(j3), то для преобразования текущей ситуации проблемной
среды в заданную целевую ситуацию следует отработать кортеж действий
< b1i1,b2i1,...,bd >”.i
1
3. Импликативные решающие правила третьего типа
(
(
))
Pj4
S1(j4), y∗i
Y∗i
→<b1i
,b2i
,...,bdi
>, j4 = 1,m9,
5
5
1
1
1
и
(
(
))
(
)
Pj5
S1(j5), y1∗i
Y1∗i
,...,yk∗
Yk∗
→<b1i
,b2i
,...,bdi
>, j5 = 1,m10,
5
3
i5
i3
1
1
1
(
(
))
строящиеся соответственно на основе двухместных Pj3
S1(j4),y∗i5
Y
и
i5
(
(
)
(
))
многоместных ПУЗП Pj5
S1(j5),y1∗i
Y1∗i
,...,yk∗i
Yk∗
. Данные импли-
5
3
5
i3
кативные решающие правила позволяют АИМР выявлять кортежи дей-
ствий
< b1i1,b2i1,...,bd >, отработка которых обеспечивает соответственноi
1
устранение негативного влияния на его дальнейшее поведение отдельных
yi3(Yi3 ) ∈ Y и взаимосвязанных между собой в проблемной среде событий
(
)
(
)
y1i3
Y1i
,...,yki
Yk
∈ Y , удовлетворяющих требованиям переменных сорта
3
3
i3
(
)
“события” y∗i2
Y
, т.е. когда для наблюдаемых в проблемной среде событий
i2
выполняется условие Y∗i
⊆ Yi3. Здесь S1(j4) и S1(j5) — полипеременные, опре-
2
деляющие условия, при выполнении которых в проблемной среде отработка
АИМР кортежа действий < b1i1 , b2i1 , . . . , bd > является результативной.i
1
146
В общем случае в модели представления знаний АИМР целесообразно так-
же иметь импликативные решающие правила третьего типа, в которых по-
сылка представлена в виде различного сочетания, например, следующих пар
ПУЗП:
(
(
))
(
(
))
<Pj4
S1(j4), y∗i
Y∗i
, Pj1
S1(j1), x∗i
X∗i
,x
>
5
5
4
4
i4
и
(
(
))
<Pj4
S1(j4), y∗i
Y∗i
, Pj2(S1(j2), S2(j2)) >,
5
5
позволяющих по их первой проекции установить наличие в проблемной сре-
де событий yi3 (Yi3 ) ∈ Y , удовлетворяющих требованиям условно-зависимых
(
)
переменных y∗i5
Y
, которые препятствуют отработке действий, определяе-
i5
мых на основе импликативных решающих правил первого и второго типа:
(
(
))
Pj1
S1(j1), x∗i
X∗i
, x∗i
→<b1i
,b2i
,...,bdi
>
4
4
4
1
1
1
и
Pj2 (S1(j2), S2(j2)) → < b1i
,b2i
,...,bdi
>.
1
1
1
Следовательно, комбинированные импликативные решающие правила
имеют, например, следующую структуру:
(
(
))
<Pj4
S1(j4),y∗i
Y∗i
, Pj2 (S1(j2),S2(j2)) > →
5
5
(1)
→<< b1,1i,b,2,1i,...,bd,1i
>, < b1,2i,b2,2i,...,bd,2 >> .i
1
1
1
1
1
1
Согласно решающему правилу (1) АИМР cначала отрабатывает кортеж дей-
ствий <b1,1i,b,2,1i,...,bd,1>, позволяющих устранить влияние на его даль-i
1
1
1
нейшее поведение событий проблемной среды, удовлетворяющих требова-
(
)
ниям переменной y∗i5
Y
. Затем роботом отрабатывается кортеж действий
i5
<b1,2i,b2,2i,...,bd,2 >, позволяющих выполнить преобразование текущей под-i
1
1
1
ситуации проблемной среды нечетко равной сети S1(j2) в подситуацию, опи-
сываемую сетью нечетко равной сети S2(j2).
Следует отметить, что если в проблемной среде отсутствуют со-
(
)
бытия, удовлетворяющие требованиям переменной y∗i5
Y
, то ПУЗП
i5
(
(
))
Pj4
S1(j4), y∗i5
Y
является невыполнимым, и в этом случае блокируется
i5
отработка первого кортежа действий, а АИМР выполняет только действия
второго кортежа.
Таким образом, имея модель представления знаний, состоящую из выше-
описанных конструкций, для организации интеллектуального решателя за-
дач АИМР возникает необходимость в разработке принципа построения про-
цедур планирования целенаправленного поведения в различных недоопреде-
ленных условиях функционирования, позволяющих роботу выполнять пре-
образование различных исходных ситуаций проблемной среды в заданные
целевые ситуации.
147
3. Принцип построения процедур планирования поведения АИМР
В общем случае принцип построения процедур автоматического плани-
рования целенаправленного поведения АИМР на основе типовых элементов
представления знаний, построенных на базе различных ПУЗП, состоит из
следующих друг за другом этапов.
1. Этап, позволяющий проверить возможность достижения полученной це-
ли поведения S∗∗ в текущих условиях проблемной среды. Инструментальныеh
1
средства данного этапа планирования поведения АИМР представляют собой
методику решения следующей типовой задачи “Построить фрагмент целе-
вой подситуации S , определяющий участок проблемной среды, на которомh
4
предстоит действовать АИМР для достижения заданной цели”. Для решения
(
)
данной задачи осуществляется пометка слотов x∗i4
X∗i
,x∗∗
∈X в активной
4
i4
нечеткой семантической сети S∗∗ находящимися в проблемной среде объек-h
(
)
1
тами oi2
Xi2 ,o∗i2
∈O, для которых выполняется условие X∗i
⊆ Xi2. При этом
(
)
4
после проведения пометки слотов x∗i4
X∗i
,x∗∗i
∈X в сети S∗∗ объектами про-h
4
4
1
блемной среды в полученном в результате этого фрагменте описания ее целе-
вой подситуации S сохраняются обозначенные в этих слотах необходимыеh
4
для достижения заданной цели состояния x∗∗ объектов, т.е. соответствующиеi
4
(
)
вершины в сети S∗h4 определяются пометками oi2
Xi2 ,x∗∗
i4
(
)
Затем проверяется условие “все слоты x∗i4
X∗i
,x∗∗
∈ X в активной нечет-
4
i4
кой семантической сети S∗∗ в процессе построения из нее семантической се-h
1
ти S являются помеченными находящимися в проблемной среде объектамиh
(
4
)
oi2
Xi2 ,o∗∗
∈ O”. Если данное условие выполняется, то в интеллектуальном
i2
решателе задач АИМР осуществляется построение фрагмента текущей под-
ситуации проблемной среды Sh4 . В противном случае принимается решение
о том, что полученная цель поведения не может быть достигнута в текущих
условиях проблемной среды из-за отсутствия в ней необходимых для этого
объектов.
2. Этап построения инструментов формирования описания текущей подси-
туации проблемной среды Sh4 , которые реализуются путем выполнения сле-
дующих изменений пометок вершин и ребер в сети S :h
4
— замены пометок ребер на количественные значения r отношенийi
6
ri6 ∈R, наблюдаемые в текущих условиях проблемной среды между объекта-
ми, событиями и АИМР, которыми определяются инцидентные им вершины;
— замены требуемых состояний x∗∗ объектов проблемной среды, которымиi
4
помечены соответствующие вершины в сети S , на текущие в проблемнойh
4
среде их состояния o∗∗;i
2
(
)
— замены пометок вершин, определяемых слотами y∗i5
Y
∈ Y , на удо-
i5
влетворяющие их требования события, происходящие в проблемной среде.
3. Этап приведения целевой подситуации проблемной среды, определяемой
сетью S , к удобной для вывода решений форме. Для этого строятся инстру-h
4
ментальные средства, позволяющие выполнить решение следующей типовой
задачи “Установить все различия между значениями одноименных отноше-
148
ний, которыми помечены структурно эквивалентные ребра в семантических
сетях Sh4 и S ”. Чтобы выявить наличие таких различий, для пометок всехh
4
пар структурно эквивалентных ребер в сетях Sh4 и S проверяется условиеh
4
) — количественное значение и интервал
+1
+1
численных значений отношения ri6 ∈ R, которыми соответственно помечены
структурно эквивалентные ребра в сетях Sh4 и S . Если данное условие вы-h
4
полняется для определенной пары структурно эквивалентных ребер в сетях
Sh4 и S , то принимается решение о том, что между значениями соответст-h
4
вующего им отношения в исходной и целевой подситуациях проблемной среды
различие отсутствует.
Затем в сетях Sh4 и S удаляются пометки всех структурно эквивалент-h
4
ных ребер, для которых выполняется условие “r∗i6 (ti6j,tj6+1)”,ипринимается
решение о том, что для достижения заданной цели S∗∗ требуется определитьh
1
последовательность действий bi1 ∈ B, отработка которой позволит выполнить
преобразование исходной подситуации проблемной среды, определяемой се-
тью Sh4 , в ее целевую подситуацию, описанную сетью S .h
4
4. Этап определения автономно решаемых подзадач, который сводится к
разбиению уточненной целевой подситуации проблемной среды, определяе-
мой сетью S , на не связанные между собой ее подсети. Для этого из семан-h
4
тических сетей Sh4 и S удаляются все непомеченные ребра. Затем формиру-h
4
ется множество пар структурно эквивалентных между собой семантических
подсетей < Sh4 (j7) ⊂ Sh4 , S∗h4 (j7) ⊂ S∗h4 >, j7 = 1, m11.
Следует отметить, что если после удаления непомеченных ребер из семан-
тических сетей Sh4 и S в результате получаются только их частичные сетиh
4
S-h
иS∗-h, то вывод решения полученной таким образом задачи < S-h
⊂Sh4,
4
4
4
S∗-h
⊂ S > выполняется на основе данных частей в целом, т.е. без их после-h
4
4
дующего разбиения.
5. Этап выбора для каждой полученной подзадачи
< Sh4(j7) ⊂ Sh4,
S∗h4(j7) ⊂ S
> комбинированного импликативного решающего правила:
h4
(
(
))
<Pj4
S1(j4), y∗i
Y∗i
, Pj2(S1(j2), S2(j2)) > →
5
5
→<b1,1i,b,2,1i,...,bd,1i
>, < b1,2i,b2,2i,...,bd,2 >,i
1
1
1
1
1
1
для которого подсети Sh4 (j7) и S∗h4 (j7) соответственно являются нечетко рав-
ными полипеременным S1(j2) и S2(j2).
В этом случае отработка АИМР первого кортежа действий, входящего
в структуру найденного таким образом импликативного решающего прави-
ла, позволяет устранить влияние события yi3 (Yi3 ) ∈ Y при его наличии в
проблемной среде, т.е. когда в среде наблюдается событие, удовлетворяю-
щее условию Y∗i
⊆ Yi3. Затем АИМР отрабатывает действия второго корте-
5
жа < b1,2i,b2,2i,...,bd,2 >, что позволяет осуществить преобразование текущейi
1
1
1
подситуации проблемной среды в ее целевую подситуацию.
При отсутствии в модели представления знаний импликативного решаю-
щего правила, удовлетворяющего описанным выше требованиям, в интеллек-
149
туальном решателе задач включаются процедуры планирования поведения,
позволяющие сформировать необходимую для достижения заданной подце-
ли последовательность импликативных решающих правил. Автоматический
синтез такой последовательности комбинированных импликативных решаю-
щих правил третьего типа осуществляется следующим образом. На первом
шаге планирования определяется импликативное решающее правило, постро-
енное на основе ПУЗП Pj2 (S1(j2), S2(j2)), у которого полипеременная S2(j2)
является нечетко равной сети S∗h4 (j7). Затем на следующем шаге планирова-
ния определяется импликативное решающее правило, сформированное на ос-
нове ПУЗП Pj2,2(S1,2(j2), S2,2(j2)), у которого полипеременная S2,2(j2) являет-
ся нечетко равной полипеременной S1(j2), входящей в структуру решающего
правила, найденного на предыдущем шаге планирования поведения. Данный
процесс построения цепочки взаимосвязанных между собой импликативных
решающих правил продолжается до тех пор, пока не будет найдено решаю-
щее правило k, полипеременная S1,k(j2) которого является нечетко равной
сети Sh4 (j7), определяющей исходную подситуацию проблемной среды. По-
сле этого принимается решение о том, что план поведения АИМР, обеспе-
чивающий решение j7 подзадачи, является сформированным и т.д., пока не
будет получено решение всех сформулированных подзадач < Sh4 (j7) ⊂ Sh4 ,
S∗h4(j7) ⊂ S
>.
h4
Следует отметить, что если в модели представления знаний АИМР от-
сутствует импликативное решающее правило, у которого полипеременная
S1,1(j2) нечетко равна сети S∗h4(j7), определяющей целевую подситуацию про-
блемной среды, но имеется совокупность решающих правил, полипеременные
которых представляют собой разбиение этой сети на подсети, то решение
рассматриваемой подзадачи < Sh4 (j7) ⊂ Sh4 , S∗h4 (j7) ⊂ S
> сводится к по-
h4
строению соответствующего ей дерева вывода в пространстве состояний [8].
Каждая ветвь такого дерева представляет собой подплан поведения АИМР,
состоящий из цепочек импликативных решающих правил, определяющих по-
следовательность действий, отработка которых в заданном порядке обеспе-
чивает достижение одной из подцелей, на которые разбивается целевая под-
ситуация проблемной среды, определяемая сетью S∗h4 (j7).
6. Этап определения подзадач, связанных с манипулированием объектами
проблемной среды oi2 (Xi2 , o∗i2 ) с целью их перевода из текущего состояния o∗i2
в требуемое согласно заданной цели состояние x∗∗2. В этом случае если для
решения одной из текущих подзадач < Sh4 (j7) ⊂ Sh4 , S∗h4 (j7) ⊂ S
> в модели
h4
представления знаний отсутствует импликативное решающее правило:
(
(
))
(
(
))
<Pj4
S1(j4), y∗i
Y∗i
, Pj1
S1(j1), x∗i
X∗i
,x∗i
>→
5
5
4
4
4
(2)
→ << b1,1i,b,2,1i,...,bd,1i
>, < b1,2i,b2,2i,...,bd,2 >>,i
1
1
1
1
1
1
отработка действий которого позволяет перевести заданный объект в тре-
буемое состояние, то планирование поведения АИМР сводится к формиро-
ванию упорядоченной последовательности таких правил. Данная последова-
тельность решающих правил строится таким образом, чтобы состояние задан-
ного объекта x∗∗i
, определяемое ее первым ПУЗП, совпадало с его исходным
4,1
150
состоянием o∗i2 в проблемной среде, а состояние x∗∗i
, входящее в структу-
4,k
ру последнего решающего правила строящейся цепочки, соответствовало бы
его целевому состоянию, т.е. в этом случае строится цепочка импликативных
решающих правил, позволяющая определить такую последовательность дей-
ствий, отработка которых позволяет осуществить перевод рассматриваемого
объекта проблемной среды в требуемое состояние путем его перехода через
ряд допустимых промежуточных состояний.
7. Этап совмещения процедур планирования поведения, связанных с
преобразованием подситуаций проблемной среды, определяемых подсетя-
ми Sh4 (j7) в подситуации, описываемые подсетями S∗h4 (j7), с процедурами
планирования поведения, обеспечивающими перевод одноименных в этих
подситуациях объектов в состояния, определяемые заданной целью поведе-
ния S∗∗. Такое совмещение различных по назначению процедур планирова-h
1
ния поведения осуществляется следующим образом. Пусть в процессе пре-
образования подситуации, описанной подсетью Sh4 (j7), в подситуацию, пред-
ставленную подсетью S∗h4 (j7), требуется выполнить определенные действия
над некоторым объектом проблемной среды и, кроме того, необходимо еще
перевести этот объект из исходного состояния o∗i2 в заданное состояние x∗∗.i
4
В этом случае АИМР сначала отрабатывает действия над рассматривае-
мым объектом, связанные с устранением определенного различия между ис-
ходной и целевой подситуациями проблемной среды, а затем переводит дан-
ный объект в требуемое состояние. После этого аналогичным образом про-
должается совмещенная отработка действий различных по назначению сфор-
мированных подпланов поведения и над другими объектами проблемной сре-
ды, входящими в структуру подситуаций, определяемых подсетями Sh4 (j7)
и S∗h4(j7).
Введем понятие функциональной сложности β1 процедур планирования
поведения АИМР, построенных по выше описанному принципу, связанных
с преобразованием исходной подситуации проблемной среды, описанной се-
тью Sh4 , в целевую подситуацию, представленную сетью S , путем устра-h
4
нения имеющихся между ними различий по значениям одноименных отно-
шений. Полагаем, что функциональная сложность β1 определяется общим
количеством элементарных операций сравнения, выполняемых при сопостав-
лении между собой сетей Sh4 и S в процессе вывода решения задачи, связан-h
4
ной с определением последовательности действий, отработка которых АИМР
позволяет выполнить достижение заданной цели в текущих условиях функ-
ционирования. Для оценки сложности β1 докажем утверждение 1.
Утверждение 1. Верхняя граничная оценка сложности β1 удовлетво-
m11
mj7
ряет неравенству: β1
m1n2(j7), где m11 — количество под-
j7=1
j8=1
задач, на которое разбивается задача преобразования исходной подситуа-
ции проблемной среды в ее целевую подситуацию, которые соответственно
определяются семантическими сетями Sh4 и S∗h4; mj7 — количество ша-
гов планирования поведения АИМР, выполняемых в процессе поиска реше-
ния j7 подзадачи < Sh4 (j7) ⊂ Sh4,S∗h4 (j7) ⊂ S∗h4 >; m1 — количество импли-
кативных решающих правил (1), хранящихся в модели представления зна-
151
ний АИМР; n(j7) — количество вершин в сравниваемых между собой семан-
тических сетях в процессе решения j7 подзадачи.
Доказательство. 1. На каждом шаге планирования поведения в худ-
шем случае необходимые для решения текущей подзадачи < Sh4 (j7) ⊂ Sh4 ,
S∗h4(j7) ⊂ S
> импликативные решающие правила могут быть выбраны
h4
в последнюю очередь. Следовательно, количество сравнений между собой
нечетких семантических сетей в процессе поиска решения каждой подзадачи
< Sh4(j7) ⊂ Sh4,S∗h4(j7) ⊂ S
> не может превышать величины, равной m.
h4
2. В процессе поиска каждого результативного импликативного решающе-
го правила между собой сравниваются семантические сети, которые пред-
ставляют собой помеченные графы. Следовательно, количество сравнений
пометок структурно эквивалентных вершин и ребер в процессе определения
нечеткого равенства семантических сетей не может превышать величины,
равной n2(j7). Это обусловлено тем, что при сравнении между собой семанти-
ческих сетей практически решается задача определения изоморфизма поме-
ченных графов с точностью до равенства пометок структурно эквивалентных
в них вершин и ребер.
3. Из пп. 1 и 2 проводимого доказательства с очевидностью следует спра-
ведливость утверждения 1.
Определим верхнюю граничную оценку функциональной сложности β2
процедур планирования поведения, позволяющих АИМР осуществить пере-
вод объектов проблемной среды oi2 (Xi2 , o∗i2 ) ∈ O из их текущих состояний o∗i2
в состояния x∗∗2, обозначенные в ее целевой подситуации, определяемой се-
тью S .h
4
Утверждение 2. Верхняя граничная оценка функциональной сложно-
m11
mj7
сти β2 удовлетворяет неравенству: β2
m2n2(j7), где m2
j7=1
j8=1
количество импликативных решающих правил (2), хранящихся в модели
представления знаний АИМР.
Доказательство справедливости утверждения 2 проводится анало-
гично доказательству утверждения 1.
Резюмируя вышеизложенное, необходимо отметить, что предложенная мо-
дель представления и обработки знаний может быть использована для по-
строения решателей задач интеллектуальных систем различного назначения,
функционирующих в окружающих средах с различной степенью априорной
неопределенности, для развития интеллектуальной системы автоматическо-
го проектирования сложных технологических маршрутов в машинострое-
нии [14].
4. Заключение
1. Построенная модель представления и обработки знаний позволяет син-
тезировать интеллектуальный решатель задач и организовать на этой осно-
ве вывод решения различных по сложности задач в процессе автоматиче-
ского планирования целенаправленного поведения АИМР с приемлемой для
152
его бортовой вычислительной системы сложностью. Об этом свидетельству-
ют найденные верхние граничные оценки процедур планирования поведения
АИМР, построенные по предложенному принципу организации вывода реше-
ний.
2. Разработанные на основе ПУЗП типовые элементы представления зна-
ний позволяют описывать сложные закономерности целенаправленного пре-
образования различных ситуаций и подситуаций проблемной среды безотно-
сительно к конкретной предметной области. Это наделяет АИМР способно-
стью адаптироваться к различным, априори неописанным условиям функ-
ционирования путем конкретизации заданных в общем виде различных по
назначению типовых конструкций модели представления знаний и выпол-
нять на этой основе различные по сложности задания в реальной проблемной
среде.
3. Предложенные инструменты обработки знаний на различных этапах
планирования целенаправленной деятельности позволяют АИМР определять
действия, связанные с преобразованием различных текущих подситуаций
проблемной среды в подситуации, определяющие достижение заданной це-
ли поведения.
4. Дальнейшее развитие проведенного исследования сводится к разработке
принципа построения процедур планирования целенаправленной деятельно-
сти при процедурной форме представления цели, заданной в виде взаимосвя-
занных между собой ключевых подзадач поведения. Наличие таких процедур
планирования поведения в сочетании с процедурами, разработанными в на-
стоящей статье, позволяет существенным образом повысить функциональные
возможности АИМР за счет расширения класса задач, которые он становит-
ся способным решать в различных условиях проблемной среды. Например,
осуществлять поиск заданных объектов в проблемной среде при неизвестных
координатах их местоположения в процессе выполнения различного вида спа-
сательных работ и т.д.
СПИСОК ЛИТЕРАТУРЫ
1. Мелехин В.Б., Хачумов М.В. Формы мышления автономных интеллектуальных
агентов: особенности и проблемы их организации // Морские интеллектуальные
технологии. 2020. № 4. Т. 1. С. 223-229.
2. Мелехин В.Б., Хачумов М.В. Инструментальные средства управления целесооб-
разным поведением самоорганизующихся автономных интеллектуальных аген-
тов // Мехатроника, автоматизация, управление. 2021. Т. 22. № 4. С. 171-180.
3. Карпов В.Э., Карпова И.П., Кулинич А.А. Социальные сообщества роботов. М.:
ЛЕНАНД, 2019.
4. Земских Л.В., Смирнов Е.К., Жданов А.А., Бабакова В.В. Применение гене-
тических алгоритмов для оптимизации адаптивных систем управления мобиль-
ного робота на параллельном вычислительном комплексе // Тр. Института си-
стемного программирования РАН. 2004. Т. 7. С. 79-104.
5. Кудирин А.А., Николенко С.И. Глубокое обучение. Погружение в мир нейрон-
ных сетей. СПб.: Питер, 2018.
153
6.
Melekhin V.B. Model of Representation and Acquisition of New Knowledge by
an Autonomous Intelligent Robot Based on the Logic of Conditionally Dependent
Predicates // J. Comput. Syst. Sci. Int. 2019. No. 58 (5). P. 747-765.
7.
Плесневич Г.С. Логические модели / Искусственный интеллект. В 3-х кн. Кн. 2.
Методы и модели: Справочник. Под ред. Д.А. Поспелова. М.: Радио и связь,
1990. С. 14-28.
8.
Варламов О.О., Аладдин Д.В. О применении миварных сетей для интеллек-
туального планирования поведения роботов в пространстве состояний // Изв.
Кабардино-Балкарского научного центра РАН. 2018. № 6-2 (86). С. 75-82.
9.
Каляев А.В., Чернухин Ю.В., Носков В.Н., Каляев И.А. Однородные управ-
ляющие структуры адаптивных роботов. М.: Наука, 1990.
10.
Мелехин В.Б., Хачумов М.В. Планирование поведения интеллектуального бес-
пилотного летательного аппарата в недоопределенной проблемной среде. Ч. 1.
Структура и применение фрейм-микропрограмм поведения // Искусственный
интеллект и принятие решений. 2018. № 2. С. 73-83.
11.
Мелехин В.Б., Хачумов М.В. Планирование поведения интеллектуального бес-
пилотного летательного аппарата в недоопределенной проблемной среде. Ч. 2.
Структура и применение фреймов действий // Искусственный интеллект и при-
нятие решений. 2018. № 3. С. 46-56.
12.
Мелехин В.Б., Хачумов М.В. Нечеткие семантические сети как адаптивная мо-
дель представления знаний автономных интеллектуальных систем // Искус-
ственный интеллект и принятие решений. 2020. № 3. С. 61-72.
13.
Флегонтов А.В., Вилков В.Б., Черных А.К. Моделирование задач принятия
решений при нечетких исходных данных. СПб.: Лань, 2020.
14.
Мелехин В.Б., Хачумов В.М. Интеллектуальная система автоматического про-
ектирования технологических маршрутов обработки деталей в машинострое-
нии // Автоматизация в промышленности. 2018. № 9. С. 13-20.
Статья представлена к публикации членом редколлегии Д.А. Пальчуновым.
Поступила в редакцию 03.10.2021
После доработки 15.12.2021
Принята к публикации 30.12.2021
154