Автоматика и телемеханика, № 4, 2022

Оптимизация, системный анализ

и исследование операций

(Дагестанский государственный технический университет, Махачкала),

М.В. ХАЧУМОВ, канд. физ.- мат. наук (khmike@inbox.ru)

(Институт программных систем им. А.К. Айламазяна РАН, с. Веськово;

Федеральный исследовательский центр

“Информатика и управление” РАН, Москва;

Российский университет дружбы народов, Москва)

ПРИНЦИП ПОСТРОЕНИЯ ПРОЦЕДУР ПЛАНИРОВАНИЯ

ПОВЕДЕНИЯ АВТОНОМНЫХ ИНТЕЛЛЕКТУАЛЬНЫХ РОБОТОВ

НА ОСНОВЕ ПОЛИПЕРЕМЕННЫХ УСЛОВНО-ЗАВИСИМЫХ

ПРЕДИКАТОВ¹

Предложен принцип построения процедур планирования целенаправ-

ленного поведения различных по назначению автономных интеллекту-

альных мобильных роботов в недоопределенных нестабильных условиях

функционирования. Для построения модели представления знаний раз-

работаны типовые ее конструкции в виде импликативных решающих пра-

вил, сформированных на основе различных по содержанию полиперемен-

ных условно-зависимых предикатов. Определена структура различных

по назначению предикатов данного типа, которые могут содержать как

полипеременные в виде активных нечетких семантических сетей, так и

связанные определенными условиями проблемной среды отдельные пере-

менные сорта “объекты” и “события”. Показано, что применение активных

нечетких семантических сетей позволяет описывать различные ситуации

и подситуации проблемной среды безотносительно к конкретной предмет-

ной области, а также определять в общем виде отношения, которые могут

наблюдаться интеллектуальным роботом в процессе планирования пове-

дения в проблемной среде между ее объектами и происходящими в ней

событиями. Разработаны инструменты обработки знаний на различных

этапах вывода решений, позволяющие строить эффективные процеду-

ры планирования поведения, обеспечивающие автономным интеллекту-

альным мобильным роботам возможность выполнять сложные задания,

сформулированные в виде обобщенного описания целевой ситуации про-

блемной среды. Найдены верхние граничные оценки сложности процедур

планирования целенаправленного поведения автономным интеллектуаль-

ным мобильным роботом, построенных по предложенному принципу орга-

низации инструментальных средств обработки знаний и вывода решений.

Ключевые слова: автономный интеллектуальный робот, проблемная сре-

да, модель представления знаний, планирование поведения, полиперемен-

ные условно-зависимые предикаты, импликативные решающие правила.

DOI: 10.31857/S0005231022040080, EDN: AAZOAD

¹ Исследование выполнено за счет гранта Российского научного фонда № 21-71-10056,

https://rscf.ru/project/21-71-10056/

140

1. Введение

Актуальность решения различных проблем, связанных с созданием эф-

фективных интеллектуальных решателей задач для автономных интеллек-

туальных мобильных роботов (АИМР), обусловлена следующими основными

обстоятельствами, которые сложились в настоящее время в области разра-

ботки интеллектуальных систем различного назначения.

1. Низкими функциональными возможностями интеллектуальных реша-

телей задач, создаваемых на основе формализации мыслительных актов

наглядно-действенного мышления [1], т.е. мышления, организованного по

принципу условной и безусловной рефлекторной деятельности высокоразви-

тых живых систем, позволяющей организовать самообучение и рефлекторное

поведение АИМР в априори неописанных условиях проблемной среды [2].

К таким АИМР следует отнести, например, автономных мобильных робо-

тов, в основу планирования поведения которых закладываются различные

роевые [3] и генетические алгоритмы [4], позволяющие роботу организовать

относительно несложные формы целесообразной деятельности на основе об-

работки воспринимаемой в проблемной среде информации после предвари-

тельного обучения и самообучения. Следует отметить, что интеллектуаль-

ный решатель задач в этом случае, как правило, строится на базе нейронных

сетей [5], реализация которых в виде специализированных вычислительных

систем имеет высокие аппаратурные затраты при обеспечении АИМР отно-

сительно низкими интеллектуальными возможностями. При моделировании

же процессов вывода решений на основе таких сетей на универсальных ЭВМ

теряется основное преимущество сетевого интеллекта в сравнении с алгорит-

мическим интеллектом, связанное с возможностью принятия решений в ре-

альном времени.

2. Экспоненциальной сложностью вывода решения практических задач

и необходимостью формирования достаточно подробной модели закономер-

ностей целенаправленного преобразования различных ситуаций проблемной

среды [6]. Такие интеллектуальные решатели задач строятся на основе логи-

ческих моделей представления и обработки знаний с использованием логики

предикатов первого порядка [7]. Однако высокая сложность вывода решений

существенным образом препятствует применению классических моделей ло-

гического подхода для создания интеллектуальных решателей задач АИМР

различного назначения из-за того, что их бортовые ЭВМ, как правило, имеют

ограниченные вычислительные ресурсы.

Что же касается интеллектуальных решателей задач, организованных в

рамках логического подхода, имеющих линейную сложность вывода, напри-

мер, созданных на основе миварных технологий [8], то для принятия реше-

ний в таких системах требуется подробная, как правило, громоздкая модель

закономерностей преобразования различных ситуаций проблемной среды в

конкретной предметной области. Однако построение подробной модели за-

кономерностей реальной априори неопределенной проблемной среды, позво-

ляющей организовать на ее основе эффективную целенаправленную деятель-

ность АИМР, на практике не представляется возможным, так как заранее

141

неизвестно, с какими условиями столкнется робот в процессе функциониро-

вания в такой среде [6, 9]. Следовательно, АИМР должны обладать способ-

ностью адаптации к условиям неопределенности и на этой основе выполнять

сформулированные им сложные задания.

Таким образом, возникает необходимость в разработке модели представ-

ления и обработки знаний, которая, с одной стороны, позволяет компактным

образом в общем виде описать закономерности целенаправленного преобра-

зования различных ситуаций априори неописанной проблемной среды без-

относительно к конкретной предметной области и на этой основе наделить

АИМР способностью адаптироваться к различным условиям функциониро-

вания. С другой стороны, модель представления знаний должна обеспечи-

вать возможность вывода решений сложных задач в процессе планирования

АИМР целенаправленного поведения с приемлемой для его бортовой ЭВМ

сложностью.

В настоящей статье предлагается формализация мыслительных актов и

процедур вывода решений, обеспечивающая возможность организации пла-

нирования поведения в априори неописанных нестабильных условиях функ-

ционирования на основе модели представления знаний в виде набора типо-

вых конструкций, позволяющих АИМР автоматически строить сложные про-

граммы целенаправленной деятельности. В рассматриваемом случае типовые

конструкции различного назначения модели представления знаний АИМР

строятся на основе полипеременных условно-зависимых предикатов (ПУЗП),

отличающихся от известных условно-зависимых предикатов, содержащих в

структуре только условно-зависимые предметные переменные [6], наличием

различного сорта условно-зависимых переменных. В общем случае ПУЗП мо-

гут включать переменные следующих сортов: полипеременные; объектные

переменные; переменные события происходящего в проблемной среде и пе-

ременные сорта “отношения” между объектами, событиями и интеллектуаль-

ным роботом, которые должны наблюдаться в проблемной среде для успеш-

ной отработки АИМР действий, связанных с достижением заданной цели

поведения. Это позволяет сформировать типовые конструкции модели пред-

ставления знаний, обладающие высокими функциональными возможностями

и наделяющие АИМР способностью адаптироваться к априори неописанным

условиям функционирования.

Следует также отметить, что предложенные типовые конструкции моде-

ли представления знаний на основе ПУЗП, в отличие от ранее описанных,

аналогичных им по назначению конструкций [10, 11], позволяют организо-

вать целенаправленное поведение АИМР в нестабильных условиях проблем-

ной среды.

2. Постановка задачи и принятые определения

Рассмотрим АИМР, который оснащен манипулятором, обладает техни-

ческим зрением и способен отрабатывать множество различных действий

B = {bi1}, i₁ = 1,n₁. Проблемную среду можно охарактеризовать множе-

142

ством находящихся в ней объектов O = {oi2 (Xi2 , o∗i2 )}, i₂ = 1, n₂, и происхо-

дящими независимо от АИМР событиями Y = {yi3 (Yi3 )}, i₃ = 1, n₃, которые

могут негативным образом отразиться на отработке роботом определенных

действий bi1 ∈ B в процессе целенаправленного поведения. Здесь Xi2 — мно-

жество признаков (характеристик), позволяющих АИМР идентифицировать

oi2(Xi2 ,o∗i2 ) ∈ O объекты проблемной среды; o^∗ — описание текущего состоя-_i

ния i₂ объекта проблемной среды; Yi3 — множество характеристик, опреде-

ляющих yi3 (Yi3 ) событие, происходящее в проблемной среде.

Обобщенное описание допустимых ситуаций и подситуаций проблемной

среды в модели представления знаний АИМР осуществляется безотноситель-

но к конкретной предметной области с помощью активных нечетких семан-

тических сетей S^∗ = {S∗h1 }, h₁ = 1, m₁, [12]. В общем случае активная нечет-

кая семантическая сеть S∗h1 ∈ S^∗ представляет собой помеченный граф Gh1 =

= (Vh1 , Eh2 ), где Vh1 = {vh2 }, h₂ = 1, m₂, Eh1 = {eh3 }, h₃ = 1, m₃, — соответ-

ственно множество вершин и ребер. Семантическая сеть S^∗ называется ак-_h

тивной, потому что в ней вершины vh2 ∈ Vh1 определяются слотами (пере-

{

(

)}

{

(

)}

менными) двух видов: X^∗ =

x∗i4

X^∗i

,x^∗∗i

, i₄ = 1,n₄, и Y ^∗ =

y∗i5

Y∗

i₅

i₅ = 1,n₅, которые в процессе вывода решений означиваются соответственно

конкретными объектами и событиями проблемной среды, удовлетворяющи-

ми их требованиям. Например, в процессе вывода решений допускается заме-

(

)

на слота x∗i4

X^∗i

,x^∗∗i

∈ X^∗, которым помечена активная вершина vh2 ∈ Vh1,

(

)

произвольным объектом проблемной среды oi2

Xi2 ,o^∗

∈ O, если для этого

(

)

i₂

объекта выполняется условие

X^∗i

⊆Xi2

Ребра eh3 ∈ Eh1 в активной нечеткой семантической сети S^∗ помечаются_h

переменными сорта “отношения”, которые определяются следующими трой-₍

)

(

)

— подынтервал допустимых чис-

ками < ti6j^,tj

, Ti6j>.Здесьtj6 ,tj

ленных значений r∗i6 отношения ri6 ∈ R, которые должны наблюдаться в про-

блемной среде между ее объектами, событиями и АИМР для результативной

отработки роботом определенных действий bi1 ∈ B, например подынтервал

расстояний, при которых АИМР способен захватить объекты, расположенные

в проблемной среде, можно определить на основе разрешающей способности

его манипулятора; Ti6j—термодноименнойсотношениемri6∈Rлингви-

стичес

(

)

на ее количественной шкале, например терм “расположен

чений ti6j^,tj

очень близко” [13]; R = {ri6 }, i₆ = 1, n₆, — множество различного вида отно-

шений, которые могут выполняться в проблемной среде между объектами,

событиями и АИМР.

Следует отметить, что необходимый для вывода решений фрагмент на-

блюдаемой в проблемной среде ситуации в процессе планирования поведе-

ния формируется в виде семантической сети Sh4 ∈ S, S = {Sh4 }, h = 1, m₄,

на основе данных, поступающих из системы технического зрения АИМР

и активной нечеткой семантической сети S^∗∗, определяющей заданную ро-_h

боту цель поведения. Для этого в сети S^∗∗ выполняется замена слотов_h

143

(

)

(

)

x∗i4

X^∗i

,x^∗∗i

∈X^∗ и y∗i5

Y∗

∈ Y ^∗ соответственно на удовлетворяющие их

(

i₅

)

требованиям объекты oi2

Xi2 ,o∗i2

∈ O и события yi3(Yi3) ∈ Y , наблюдаемые

в текущих условиях проблемной среды. В свою очередь ребра в формируе-

мой семантической сети Sh4 помечаются количественными оценками r^∗ от-_i

ношений ri6 ∈ R, которые выполняются в текущих условиях проблемной сре-

ды между объектами, событиями и АИМР, определяющими инцидентные им

вершины. В результате этого активная нечеткая семантическая сеть S^∗∗ ста-_h

новится пассивной и соответствует конкретной текущей подситуации про-

блемной среды.

Таким образом, необходимые для вывода решений фрагменты Sh4 ∈ S до-

пустимых ситуаций проблемной среды определяются помеченными графа-

ми Gh4 = (Vh4 , Ei4 ), где Vh4 = {vh5 }, h₅ = 1, m₅, — множество вершин, опре-

(

)

деляемых находящимися в проблемной среде объектами oi2

Xi2 ,o^∗

∈O и

i₂

происходящими в ней событиями yi3 (Yi3 ) ∈ Y в соответствии с пометками

структурно эквивалентных им вершин в сети S^∗∗, из которой строится семан-_h

тическая сеть Sh4 ; Ei4 = {eh6 }, h₆ = 1, m₆, — множество ребер, помеченных

количественными значениями r∗i6 отношений ri6 ∈ R, выполняющимися в про-

блемной среде между объектами, событиями и АИМР, которыми помечены

инцидентные им вершины в семантической сети Sh4 .

Типовые элементы представления знаний АИМР строятся на основе раз-

личных по содержанию ПУЗП.

Определение 1. В общем случае, например под трехместным ПУЗП,

(

)

(

))

понимается выражение P

S∗h1,x∗i4

X^∗i

,x^∗∗i

,y∗i5

Y∗

, которое становится

i₅

истинным высказыванием после подстановки в него вместо условно-зависи-

(

)

(

)

мых переменных S∗h1, x∗i4

X^∗i

,x^∗∗i

,y∗i5

Y∗

их значений, соответственно из

i₅

множеств S, O и Y при условии, что они удовлетворяют соответствую-

щим этим переменным требованиям. Здесь P — предикатный символ, опре-

деляющий смысловое содержание ПУЗП; S^∗

— полипеременная, область

h₁

определения которой S представляет собой множество допустимых под-

ситуаций проблемной среды, сформированных с учетом находящихся в ней

объектов, событий и АИМР, а также количественных значений отноше-

(

)

ний, которые выполняются между ними в проблемной среде; x∗i4

X^∗i

,x^∗∗

—

i₄

предметная переменная, областью определения которой O является мно-

(

)

жество находящихся в проблемной среде объектов; y∗i5

Y∗

— переменная

i₅

сорта “события”, область определения которой Y представляет собой мно-

жество событий, происходящих в проблемной среде.

Таким образом, все переменные, входящие в структуру ПУЗП, фактиче-

ски являются связанными допустимыми условиями их означивания, а сами

формулы могут быть только выполнимыми в определенных условиях про-

блемной среды. При этом высказывания, получаемые в результате подста-

новки вместо условно-зависимых переменных соответствующих им констант

в виде конкретных объектов и событий, которые наблюдаются АИМР в теку-

щих условиях функционирования, являются истинными тогда и только тогда,

когда выполняются следующие условия:

144

(

)

— все слоты x∗i4

X^∗i

,x^∗∗i

∈ X^∗ в сети S^∗ и отдельные предметные пере-_h

(

)

менные x∗i4

X^∗i

,x^∗∗

, входящие в структуру ПУЗП, удается пометить нахо-

i₄

дящимися в проблемной среде объектами;

(

)

— все слоты y∗i5

Y∗i

∈ Y ^∗ в подситуации Sh4 и отдельные переменные

(

)

y∗i5

Y∗

в структуре ПУЗП являются помеченными происходящими в про-

i₅

блемной среде событиями yi3 (Yi3 ) ∈ Y , удовлетворяющими их требованиям,

т.е. при выполнении следующих условий Y^∗i

⊆Yi3;

— фрагмент Sh4 текущей ситуации проблемной среды являет-

ся нечетко равным сети S^∗ , определяющей полипеременную ПУЗП_h

(

)

(

))

S∗h1 ,x∗i4

X^∗i

,x^∗∗i

,y∗i5

Y∗

i₅

Определение 2. Семантическая сеть Sh4 является нечетко равной

активной нечеткой семантической сети S^∗ , если для них выполняются_h

следующие условия:

а) для каждой вершины vh2 ∈ Vh1 сети S^∗ , определяемой слотом_h

(

)

x∗i4

X^∗i

,x^∗∗i

, существует структурно эквивалентная ей вершина vh5 ∈ Vh4

(

)

в сети Sh4, помеченная объектом проблемной среды oi2

Xi2 ,o^∗

∈ O, для ко-

i₂

торого выполняется условие X^∗i

⊆Xi2;

б) для каждой вершины vh2 ∈ Vh1 сети S∗h1 , определяемой слотом y∗i5 (Y^∗),_i

существует структурно эквивалентная ей вершина vh5 ∈ Vh4 в сети Sh4,

помеченная событием проблемной среды yi3 (Yi3 ) ∈ Y , для которого выполня-

ется условие Y^∗i

⊆Yi3;

в) для каждого ребра vh2 ∈ Vh1 сети S^∗ , определяемого тройкой_h

(

)

< ti6j^,tj

, Ti6j>,существуетструктурноэквивалентноеемуребро

eh6 ∈ Ei4 в сети Sh4, помеченное количественным значением r^∗ одноимен-_i

ного с пометкой вершины vh2 отношения ri6 ∈ R, которое попадает в ин-₍

)

тервал численных значений ti6j^,tj

Следует отметить, что если сравниваются между собой активные нечет-

кие семантические сети, то для их нечеткого равенства, помимо выполнения

условий пп. а и б определения 2, требуется выполнение условия равенства

пометок всех пар структурно эквивалентных в них ребер.

Пусть модель представления знаний АИМР в соответствии с его функцио-

нальным назначением состоит из набора типовых конструкций, сформиро-

ванных на основе ПУЗП, которые имеют следующую структуру, содержание

и условия их применения.

1. Импликативные решающие правила первого типа

(

))

Pj1

S∗1(j₁), x^∗i

X^∗i

,x^∗∗i

→ <b1i

,b2i

,...,b^di

>, j₁ = 1,m₇,

Pj2(S∗1(j₂), x∗1(X∗1,x∗∗1),... ,x^∗k(X^∗k,x^∗∗k)) →

<b1i

,b2i

,...,b^di

> j₂ = 1,m₈,

сформированные соответственно на основе двухместных и k-местных ПУЗП,

которые обеспечивают деятельность АИМР, связанную с целенаправленной

145

отработкой действий bi1 ∈ B над отдельными объектами проблемной среды

(

)

oi2

Xi2 ,o∗i2

∈ O для их перевода из текущего состояния o^∗ в требуемое со-_i

стояние x^∗∗._i

(

В общем случае, например, импликативное решающее правило Pj1

S∗1(j₁),

(

))

x∗i4

X^∗i

,x^∗∗i

→ < b1i1,b2i1,...,b^d >, построенное на основе двухместного_i

(

))

ПУЗП, имеет следующее содержание “Если ПУЗП Pj1

S∗1(j₁),x∗i4

X^∗i

,x^∗∗

i₄

является выполнимым в текущих условиях проблемной среды, то для пере-

вода объекта oi2 (Xi2 , o∗i2 ) из текущего состояния o∗i2 в заданное состояние x^∗∗,_i

определяемое целью поведения S^∗∗, следует отработать кортеж действий_h

<b1i1,b2i1,...,b^di

∈Bj1 >”. Здесь S∗1(j₁) — полипеременная, представляющая

собой активную нечеткую семантическую сеть, определяющую условия, ко-

торые должны выполняться в проблемной среде для успешной отработки

АИМР кортежа действий < b1i1 , b2i1 , . . . , b^di

∈Bj1 > над объектом проблемной

(

)

среды oi2

Xi2 ,o^∗

, который удовлетворяет требованиям предметной пере-

i₂

(

)

менной x∗i4

X^∗i

,x^∗∗

i₄

2. Импликативные решающие правила второго типа Pj3 (S∗1(j₃), S∗2(j₃)) →

→<b1i1,b2i1,...,b^d >, построенные на основе двухместных ПУЗП вида_i

Pj3(S∗1(j₃),S∗2(j₃)), j₃ = 1,m₈, имеющих следующее содержание “Преобразо-

вать нечеткую семантическую сеть S∗1(j₃) в нечеткую семантическую сеть

S∗2(j₃)”. В общем случае данные импликативные решающие правила означа-

ют следующее: “Если в проблемной среде наблюдается подситуация, опре-

деляемая семантической сетью нечетко равной сети S∗1(j₃), а семантическая

сеть, определяющая заданную АИМР целевую подситуацию среды, нечет-

ко равна сети S∗2(j₃), то для преобразования текущей ситуации проблемной

среды в заданную целевую ситуацию следует отработать кортеж действий

< b1i1,b2i1,...,b^d >”._i

3. Импликативные решающие правила третьего типа

(

))

Pj4

S∗1(j₄), y^∗i

Y∗i

→<b1i

,b2i

,...,b^di

>, j₄ = 1,m₉,

(

))

(

)

Pj5

S∗1(j₅), y1∗i

Y1∗i

,...,y^k∗

Yk∗

→<b1i

,b2i

,...,b^di

>, j₅ = 1,m₁₀,

i₅

i₃

(

))

строящиеся соответственно на основе двухместных Pj3

S∗1(j₄),y∗i5

Y∗

i₅

(

)

(

))

многоместных ПУЗП Pj5

S∗1(j₅),y1∗i

Y1∗i

,...,y^k∗i

Yk∗

. Данные импли-

i₃

кативные решающие правила позволяют АИМР выявлять кортежи дей-

ствий

< b1i1,b2i1,...,b^d >, отработка которых обеспечивает соответственно_i

устранение негативного влияния на его дальнейшее поведение отдельных

yi3(Yi3 ) ∈ Y и взаимосвязанных между собой в проблемной среде событий

(

)

(

)

y1i3

Y1i

,...,y^ki

∈ Y , удовлетворяющих требованиям переменных сорта

i₃

(

)

“события” y∗i2

Y∗

, т.е. когда для наблюдаемых в проблемной среде событий

i₂

выполняется условие Y^∗i

⊆ Yi3. Здесь S∗1(j₄) и S∗1(j₅) — полипеременные, опре-

деляющие условия, при выполнении которых в проблемной среде отработка

АИМР кортежа действий < b1i1 , b2i1 , . . . , b^d > является результативной._i

146

В общем случае в модели представления знаний АИМР целесообразно так-

же иметь импликативные решающие правила третьего типа, в которых по-

сылка представлена в виде различного сочетания, например, следующих пар

ПУЗП:

(

))

(

))

<Pj4

S∗1(j₄), y^∗i

Y∗i

, Pj1

S∗1(j₁), x^∗i

X^∗i

,x^∗

i₄

(

))

<Pj4

S∗1(j₄), y^∗i

Y∗i

, Pj2(S∗1(j₂), S∗2(j₂)) >,

позволяющих по их первой проекции установить наличие в проблемной сре-

де событий yi3 (Yi3 ) ∈ Y , удовлетворяющих требованиям условно-зависимых

(

)

переменных y∗i5

Y∗

, которые препятствуют отработке действий, определяе-

i₅

мых на основе импликативных решающих правил первого и второго типа:

(

))

Pj1

S∗1(j₁), x^∗i

X^∗i

, x^∗i

→<b1i

,b2i

,...,b^di

Pj2 (S∗1(j₂), S∗2(j₂)) → < b1i

,b2i

,...,b^di

Следовательно, комбинированные импликативные решающие правила

имеют, например, следующую структуру:

(

))

<Pj4

S∗1(j₄),y^∗i

Y∗i

, Pj2 (S∗1(j₂),S∗2(j₂)) > →

(1)

→<< b1,1i,b,2,1i,...,bd,1i

>, < b1,2i,b2,2i,...,bd,2 >> .i

Согласно решающему правилу (1) АИМР cначала отрабатывает кортеж дей-

ствий <b1,1i,b,2,1i,...,bd,1>, позволяющих устранить влияние на его даль-i

нейшее поведение событий проблемной среды, удовлетворяющих требова-

(

)

ниям переменной y∗i5

Y∗

. Затем роботом отрабатывается кортеж действий

i₅

<b1,2i,b2,2i,...,bd,2 >, позволяющих выполнить преобразование текущей под-i

ситуации проблемной среды нечетко равной сети S∗1(j₂) в подситуацию, опи-

сываемую сетью нечетко равной сети S∗2(j₂).

Следует отметить, что если в проблемной среде отсутствуют со-

(

)

бытия, удовлетворяющие требованиям переменной y∗i5

Y∗

, то ПУЗП

i₅

(

))

Pj4

S∗1(j₄), y∗i5

Y∗

является невыполнимым, и в этом случае блокируется

i₅

отработка первого кортежа действий, а АИМР выполняет только действия

второго кортежа.

Таким образом, имея модель представления знаний, состоящую из выше-

описанных конструкций, для организации интеллектуального решателя за-

дач АИМР возникает необходимость в разработке принципа построения про-

цедур планирования целенаправленного поведения в различных недоопреде-

ленных условиях функционирования, позволяющих роботу выполнять пре-

образование различных исходных ситуаций проблемной среды в заданные

целевые ситуации.

147

3. Принцип построения процедур планирования поведения АИМР

В общем случае принцип построения процедур автоматического плани-

рования целенаправленного поведения АИМР на основе типовых элементов

представления знаний, построенных на базе различных ПУЗП, состоит из

следующих друг за другом этапов.

1. Этап, позволяющий проверить возможность достижения полученной це-

ли поведения S^∗∗ в текущих условиях проблемной среды. Инструментальные_h

средства данного этапа планирования поведения АИМР представляют собой

методику решения следующей типовой задачи “Построить фрагмент целе-

вой подситуации S^∗ , определяющий участок проблемной среды, на котором_h

предстоит действовать АИМР для достижения заданной цели”. Для решения

(

)

данной задачи осуществляется пометка слотов x∗i4

X^∗i

,x^∗∗

∈X^∗ в активной

i₄

нечеткой семантической сети S^∗∗ находящимися в проблемной среде объек-_h

(

)

тами oi2

Xi2 ,o∗i2

∈O, для которых выполняется условие X^∗i

⊆ Xi2. При этом

(

)

после проведения пометки слотов x∗i4

X^∗i

,x^∗∗i

∈X^∗ в сети S^∗∗ объектами про-_h

блемной среды в полученном в результате этого фрагменте описания ее целе-

вой подситуации S^∗ сохраняются обозначенные в этих слотах необходимые_h

для достижения заданной цели состояния x^∗∗ объектов, т.е. соответствующие_i

(

)

вершины в сети S∗h4 определяются пометками oi2

Xi2 ,x^∗∗

i₄

(

)

Затем проверяется условие “все слоты x∗i4

X^∗i

,x^∗∗

∈ X^∗ в активной нечет-

i₄

кой семантической сети S^∗∗ в процессе построения из нее семантической се-_h

ти S^∗ являются помеченными находящимися в проблемной среде объектами_h

(

)

oi2

Xi2 ,o^∗∗

∈ O”. Если данное условие выполняется, то в интеллектуальном

i₂

решателе задач АИМР осуществляется построение фрагмента текущей под-

ситуации проблемной среды Sh4 . В противном случае принимается решение

о том, что полученная цель поведения не может быть достигнута в текущих

условиях проблемной среды из-за отсутствия в ней необходимых для этого

объектов.

2. Этап построения инструментов формирования описания текущей подси-

туации проблемной среды Sh4 , которые реализуются путем выполнения сле-

дующих изменений пометок вершин и ребер в сети S^∗ :_h

— замены пометок ребер на количественные значения r^∗ отношений_i

ri6 ∈R, наблюдаемые в текущих условиях проблемной среды между объекта-

ми, событиями и АИМР, которыми определяются инцидентные им вершины;

— замены требуемых состояний x^∗∗ объектов проблемной среды, которыми_i

помечены соответствующие вершины в сети S^∗ , на текущие в проблемной_h

среде их состояния o^∗∗;_i

(

)

— замены пометок вершин, определяемых слотами y∗i5

Y∗

∈ Y ^∗, на удо-

i₅

влетворяющие их требования события, происходящие в проблемной среде.

3. Этап приведения целевой подситуации проблемной среды, определяемой

сетью S^∗ , к удобной для вывода решений форме. Для этого строятся инстру-_h

ментальные средства, позволяющие выполнить решение следующей типовой

задачи “Установить все различия между значениями одноименных отноше-

148

ний, которыми помечены структурно эквивалентные ребра в семантических

сетях Sh4 и S^∗ ”. Чтобы выявить наличие таких различий, для пометок всех_h

пар структурно эквивалентных ребер в сетях Sh4 и S^∗ проверяется условие_h

) — количественное значение и интервал

численных значений отношения ri6 ∈ R, которыми соответственно помечены

структурно эквивалентные ребра в сетях Sh4 и S^∗ . Если данное условие вы-_h

полняется для определенной пары структурно эквивалентных ребер в сетях

Sh4 и S^∗ , то принимается решение о том, что между значениями соответст-_h

вующего им отношения в исходной и целевой подситуациях проблемной среды

различие отсутствует.

Затем в сетях Sh4 и S^∗ удаляются пометки всех структурно эквивалент-_h

ных ребер, для которых выполняется условие “r∗i6 ∈ (ti6j,tj6+1^{)”,ипринимается}

решение о том, что для достижения заданной цели S^∗∗ требуется определить_h

последовательность действий bi1 ∈ B, отработка которой позволит выполнить

преобразование исходной подситуации проблемной среды, определяемой се-

тью Sh4 , в ее целевую подситуацию, описанную сетью S^∗ ._h

4. Этап определения автономно решаемых подзадач, который сводится к

разбиению уточненной целевой подситуации проблемной среды, определяе-

мой сетью S^∗ , на не связанные между собой ее подсети. Для этого из семан-_h

тических сетей Sh4 и S^∗ удаляются все непомеченные ребра. Затем формиру-_h

ется множество пар структурно эквивалентных между собой семантических

подсетей < Sh4 (j₇) ⊂ Sh4 , S∗h4 (j₇) ⊂ S∗h4 >, j₇ = 1, m₁₁.

Следует отметить, что если после удаления непомеченных ребер из семан-

тических сетей Sh4 и S^∗ в результате получаются только их частичные сети_h

S^-h

иS^∗-h, то вывод решения полученной таким образом задачи < S-h

⊂Sh4,

S^∗-h

⊂ S^∗ > выполняется на основе данных частей в целом, т.е. без их после-_h

дующего разбиения.

5. Этап выбора для каждой полученной подзадачи

< Sh4(j₇) ⊂ Sh4,

S∗h4(j₇) ⊂ S^∗

> комбинированного импликативного решающего правила:

h₄

(

))

<Pj4

S∗1(j₄), y^∗i

Y∗i

, Pj2(S∗1(j₂), S∗2(j₂)) > →

→<b1,1i,b,2,1i,...,bd,1i

>, < b1,2i,b2,2i,...,bd,2 >,i

для которого подсети Sh4 (j₇) и S∗h4 (j₇) соответственно являются нечетко рав-

ными полипеременным S∗1(j₂) и S∗2(j₂).

В этом случае отработка АИМР первого кортежа действий, входящего

в структуру найденного таким образом импликативного решающего прави-

ла, позволяет устранить влияние события yi3 (Yi3 ) ∈ Y при его наличии в

проблемной среде, т.е. когда в среде наблюдается событие, удовлетворяю-

щее условию Y^∗i

⊆ Yi3. Затем АИМР отрабатывает действия второго корте-

жа < b1,2i,b2,2i,...,bd,2 >, что позволяет осуществить преобразование текущейi

подситуации проблемной среды в ее целевую подситуацию.

При отсутствии в модели представления знаний импликативного решаю-

щего правила, удовлетворяющего описанным выше требованиям, в интеллек-

149

туальном решателе задач включаются процедуры планирования поведения,

позволяющие сформировать необходимую для достижения заданной подце-

ли последовательность импликативных решающих правил. Автоматический

синтез такой последовательности комбинированных импликативных решаю-

щих правил третьего типа осуществляется следующим образом. На первом

шаге планирования определяется импликативное решающее правило, постро-

енное на основе ПУЗП Pj2 (S∗1(j₂), S∗2(j₂)), у которого полипеременная S∗2(j₂)

является нечетко равной сети S∗h4 (j₇). Затем на следующем шаге планирова-

ния определяется импликативное решающее правило, сформированное на ос-

нове ПУЗП Pj2,2(S1,2(j2), S2,2(j2)), у которого полипеременная S2,2(j2) являет-

ся нечетко равной полипеременной S∗1(j₂), входящей в структуру решающего

правила, найденного на предыдущем шаге планирования поведения. Данный

процесс построения цепочки взаимосвязанных между собой импликативных

решающих правил продолжается до тех пор, пока не будет найдено решаю-

щее правило k, полипеременная S∗1,k(j₂) которого является нечетко равной

сети Sh4 (j₇), определяющей исходную подситуацию проблемной среды. По-

сле этого принимается решение о том, что план поведения АИМР, обеспе-

чивающий решение j₇ подзадачи, является сформированным и т.д., пока не

будет получено решение всех сформулированных подзадач < Sh4 (j₇) ⊂ Sh4 ,

S∗h4(j₇) ⊂ S^∗

h₄

Следует отметить, что если в модели представления знаний АИМР от-

сутствует импликативное решающее правило, у которого полипеременная

S∗1,1(j₂) нечетко равна сети S∗h4(j₇), определяющей целевую подситуацию про-

блемной среды, но имеется совокупность решающих правил, полипеременные

которых представляют собой разбиение этой сети на подсети, то решение

рассматриваемой подзадачи < Sh4 (j₇) ⊂ Sh4 , S∗h4 (j₇) ⊂ S^∗

> сводится к по-

h₄

строению соответствующего ей дерева вывода в пространстве состояний [8].

Каждая ветвь такого дерева представляет собой подплан поведения АИМР,

состоящий из цепочек импликативных решающих правил, определяющих по-

следовательность действий, отработка которых в заданном порядке обеспе-

чивает достижение одной из подцелей, на которые разбивается целевая под-

ситуация проблемной среды, определяемая сетью S∗h4 (j₇).

6. Этап определения подзадач, связанных с манипулированием объектами

проблемной среды oi2 (Xi2 , o∗i2 ) с целью их перевода из текущего состояния o∗i2

в требуемое согласно заданной цели состояние x∗∗2. В этом случае если для

решения одной из текущих подзадач < Sh4 (j₇) ⊂ Sh4 , S∗h4 (j₇) ⊂ S^∗

> в модели

h₄

представления знаний отсутствует импликативное решающее правило:

(

))

(

))

<Pj4

S∗1(j₄), y^∗i

Y∗i

, Pj1

S∗1(j₁), x^∗i

X^∗i

,x^∗i

>→

(2)

→ << b1,1i,b,2,1i,...,bd,1i

>, < b1,2i,b2,2i,...,bd,2 >>,i

отработка действий которого позволяет перевести заданный объект в тре-

буемое состояние, то планирование поведения АИМР сводится к формиро-

ванию упорядоченной последовательности таких правил. Данная последова-

тельность решающих правил строится таким образом, чтобы состояние задан-

ного объекта x^∗∗i

, определяемое ее первым ПУЗП, совпадало с его исходным

4,1

150

состоянием o∗i2 в проблемной среде, а состояние x^∗∗i

, входящее в структу-

4,k

ру последнего решающего правила строящейся цепочки, соответствовало бы

его целевому состоянию, т.е. в этом случае строится цепочка импликативных

решающих правил, позволяющая определить такую последовательность дей-

ствий, отработка которых позволяет осуществить перевод рассматриваемого

объекта проблемной среды в требуемое состояние путем его перехода через

ряд допустимых промежуточных состояний.

7. Этап совмещения процедур планирования поведения, связанных с

преобразованием подситуаций проблемной среды, определяемых подсетя-

ми Sh4 (j₇) в подситуации, описываемые подсетями S∗h4 (j₇), с процедурами

планирования поведения, обеспечивающими перевод одноименных в этих

подситуациях объектов в состояния, определяемые заданной целью поведе-

ния S^∗∗. Такое совмещение различных по назначению процедур планирова-_h

ния поведения осуществляется следующим образом. Пусть в процессе пре-

образования подситуации, описанной подсетью Sh4 (j₇), в подситуацию, пред-

ставленную подсетью S∗h4 (j₇), требуется выполнить определенные действия

над некоторым объектом проблемной среды и, кроме того, необходимо еще

перевести этот объект из исходного состояния o∗i2 в заданное состояние x^∗∗._i

В этом случае АИМР сначала отрабатывает действия над рассматривае-

мым объектом, связанные с устранением определенного различия между ис-

ходной и целевой подситуациями проблемной среды, а затем переводит дан-

ный объект в требуемое состояние. После этого аналогичным образом про-

должается совмещенная отработка действий различных по назначению сфор-

мированных подпланов поведения и над другими объектами проблемной сре-

ды, входящими в структуру подситуаций, определяемых подсетями Sh4 (j₇)

и S∗h4(j₇).

Введем понятие функциональной сложности β₁ процедур планирования

поведения АИМР, построенных по выше описанному принципу, связанных

с преобразованием исходной подситуации проблемной среды, описанной се-

тью Sh4 , в целевую подситуацию, представленную сетью S^∗ , путем устра-_h

нения имеющихся между ними различий по значениям одноименных отно-

шений. Полагаем, что функциональная сложность β₁ определяется общим

количеством элементарных операций сравнения, выполняемых при сопостав-

лении между собой сетей Sh4 и S^∗ в процессе вывода решения задачи, связан-_h

ной с определением последовательности действий, отработка которых АИМР

позволяет выполнить достижение заданной цели в текущих условиях функ-

ционирования. Для оценки сложности β₁ докажем утверждение 1.

Утверждение 1. Верхняя граничная оценка сложности β₁ удовлетво-

∑m11

∑mj7

ряет неравенству: β₁ ≤

m∗1n²(j₇), где m₁₁ — количество под-

j₇=1

j₈=1

задач, на которое разбивается задача преобразования исходной подситуа-

ции проблемной среды в ее целевую подситуацию, которые соответственно

определяются семантическими сетями Sh4 и S∗h4; mj7 — количество ша-

гов планирования поведения АИМР, выполняемых в процессе поиска реше-

ния j₇ подзадачи < Sh4 (j₇) ⊂ Sh4,S∗h4 (j₇) ⊂ S∗h4 >; m∗1 — количество импли-

кативных решающих правил (1), хранящихся в модели представления зна-

151

ний АИМР; n(j₇) — количество вершин в сравниваемых между собой семан-

тических сетях в процессе решения j₇ подзадачи.

Доказательство. 1. На каждом шаге планирования поведения в худ-

шем случае необходимые для решения текущей подзадачи < Sh4 (j₇) ⊂ Sh4 ,

S∗h4(j₇) ⊂ S^∗

> импликативные решающие правила могут быть выбраны

h₄

в последнюю очередь. Следовательно, количество сравнений между собой

нечетких семантических сетей в процессе поиска решения каждой подзадачи

< Sh4(j₇) ⊂ Sh4,S∗h4(j₇) ⊂ S^∗

> не может превышать величины, равной m^∗.

h₄

2. В процессе поиска каждого результативного импликативного решающе-

го правила между собой сравниваются семантические сети, которые пред-

ставляют собой помеченные графы. Следовательно, количество сравнений

пометок структурно эквивалентных вершин и ребер в процессе определения

нечеткого равенства семантических сетей не может превышать величины,

равной n²(j₇). Это обусловлено тем, что при сравнении между собой семанти-

ческих сетей практически решается задача определения изоморфизма поме-

ченных графов с точностью до равенства пометок структурно эквивалентных

в них вершин и ребер.

3. Из пп. 1 и 2 проводимого доказательства с очевидностью следует спра-

ведливость утверждения 1.

Определим верхнюю граничную оценку функциональной сложности β₂

процедур планирования поведения, позволяющих АИМР осуществить пере-

вод объектов проблемной среды oi2 (Xi2 , o∗i2 ) ∈ O из их текущих состояний o∗i2

в состояния x∗∗2, обозначенные в ее целевой подситуации, определяемой се-

тью S^∗ ._h

Утверждение 2. Верхняя граничная оценка функциональной сложно-

∑m11

∑mj7

сти β₂ удовлетворяет неравенству: β₂ ≤

m∗2n²(j₇), где m∗2 —

j₇=1

j₈=1

количество импликативных решающих правил (2), хранящихся в модели

представления знаний АИМР.

Доказательство справедливости утверждения 2 проводится анало-

гично доказательству утверждения 1.

Резюмируя вышеизложенное, необходимо отметить, что предложенная мо-

дель представления и обработки знаний может быть использована для по-

строения решателей задач интеллектуальных систем различного назначения,

функционирующих в окружающих средах с различной степенью априорной

неопределенности, для развития интеллектуальной системы автоматическо-

го проектирования сложных технологических маршрутов в машинострое-

нии [14].

4. Заключение

1. Построенная модель представления и обработки знаний позволяет син-

тезировать интеллектуальный решатель задач и организовать на этой осно-

ве вывод решения различных по сложности задач в процессе автоматиче-

ского планирования целенаправленного поведения АИМР с приемлемой для

152

его бортовой вычислительной системы сложностью. Об этом свидетельству-

ют найденные верхние граничные оценки процедур планирования поведения

АИМР, построенные по предложенному принципу организации вывода реше-

ний.

2. Разработанные на основе ПУЗП типовые элементы представления зна-

ний позволяют описывать сложные закономерности целенаправленного пре-

образования различных ситуаций и подситуаций проблемной среды безотно-

сительно к конкретной предметной области. Это наделяет АИМР способно-

стью адаптироваться к различным, априори неописанным условиям функ-

ционирования путем конкретизации заданных в общем виде различных по

назначению типовых конструкций модели представления знаний и выпол-

нять на этой основе различные по сложности задания в реальной проблемной

среде.

3. Предложенные инструменты обработки знаний на различных этапах

планирования целенаправленной деятельности позволяют АИМР определять

действия, связанные с преобразованием различных текущих подситуаций

проблемной среды в подситуации, определяющие достижение заданной це-

ли поведения.

4. Дальнейшее развитие проведенного исследования сводится к разработке

принципа построения процедур планирования целенаправленной деятельно-

сти при процедурной форме представления цели, заданной в виде взаимосвя-

занных между собой ключевых подзадач поведения. Наличие таких процедур

планирования поведения в сочетании с процедурами, разработанными в на-

стоящей статье, позволяет существенным образом повысить функциональные

возможности АИМР за счет расширения класса задач, которые он становит-

ся способным решать в различных условиях проблемной среды. Например,

осуществлять поиск заданных объектов в проблемной среде при неизвестных

координатах их местоположения в процессе выполнения различного вида спа-

сательных работ и т.д.

СПИСОК ЛИТЕРАТУРЫ

1. Мелехин В.Б., Хачумов М.В. Формы мышления автономных интеллектуальных

агентов: особенности и проблемы их организации // Морские интеллектуальные

технологии. 2020. № 4. Т. 1. С. 223-229.

2. Мелехин В.Б., Хачумов М.В. Инструментальные средства управления целесооб-

разным поведением самоорганизующихся автономных интеллектуальных аген-

тов // Мехатроника, автоматизация, управление. 2021. Т. 22. № 4. С. 171-180.

3. Карпов В.Э., Карпова И.П., Кулинич А.А. Социальные сообщества роботов. М.:

ЛЕНАНД, 2019.

4. Земских Л.В., Смирнов Е.К., Жданов А.А., Бабакова В.В. Применение гене-

тических алгоритмов для оптимизации адаптивных систем управления мобиль-

ного робота на параллельном вычислительном комплексе // Тр. Института си-

стемного программирования РАН. 2004. Т. 7. С. 79-104.

5. Кудирин А.А., Николенко С.И. Глубокое обучение. Погружение в мир нейрон-

ных сетей. СПб.: Питер, 2018.

153

Melekhin V.B. Model of Representation and Acquisition of New Knowledge by

an Autonomous Intelligent Robot Based on the Logic of Conditionally Dependent

Predicates // J. Comput. Syst. Sci. Int. 2019. No. 58 (5). P. 747-765.

Плесневич Г.С. Логические модели / Искусственный интеллект. В 3-х кн. Кн. 2.

Методы и модели: Справочник. Под ред. Д.А. Поспелова. М.: Радио и связь,

1990. С. 14-28.

Варламов О.О., Аладдин Д.В. О применении миварных сетей для интеллек-

туального планирования поведения роботов в пространстве состояний // Изв.

Кабардино-Балкарского научного центра РАН. 2018. № 6-2 (86). С. 75-82.

Каляев А.В., Чернухин Ю.В., Носков В.Н., Каляев И.А. Однородные управ-

ляющие структуры адаптивных роботов. М.: Наука, 1990.

10.

Мелехин В.Б., Хачумов М.В. Планирование поведения интеллектуального бес-

пилотного летательного аппарата в недоопределенной проблемной среде. Ч. 1.

Структура и применение фрейм-микропрограмм поведения // Искусственный

интеллект и принятие решений. 2018. № 2. С. 73-83.

11.

Мелехин В.Б., Хачумов М.В. Планирование поведения интеллектуального бес-

пилотного летательного аппарата в недоопределенной проблемной среде. Ч. 2.

Структура и применение фреймов действий // Искусственный интеллект и при-

нятие решений. 2018. № 3. С. 46-56.

12.

Мелехин В.Б., Хачумов М.В. Нечеткие семантические сети как адаптивная мо-

дель представления знаний автономных интеллектуальных систем // Искус-

ственный интеллект и принятие решений. 2020. № 3. С. 61-72.

13.

Флегонтов А.В., Вилков В.Б., Черных А.К. Моделирование задач принятия

решений при нечетких исходных данных. СПб.: Лань, 2020.

14.

Мелехин В.Б., Хачумов В.М. Интеллектуальная система автоматического про-

ектирования технологических маршрутов обработки деталей в машинострое-

нии // Автоматизация в промышленности. 2018. № 9. С. 13-20.

Статья представлена к публикации членом редколлегии Д.А. Пальчуновым.

Поступила в редакцию 03.10.2021

После доработки 15.12.2021

Принята к публикации 30.12.2021

154