Автоматика и телемеханика, № 12, 2023

Оптимизация, системный анализ

и исследование операций

(Дагестанский государственный технический университет, Махачкала),

М.В. ХАЧУМОВ, канд. физ.-мат. наук (khmike@inbox.ru)

(Институт программных систем им. А.К. Айламазяна РАН,

г. Переславль-Залесский;

Федеральный исследовательский центр

“Информатика и управление” РАН, Москва;

Российский университет дружбы народов, Москва)

ПЛАНИРОВАНИЕ МНОГОЭТАПНОЙ ДЕЯТЕЛЬНОСТИ

ИНТЕЛЛЕКТУАЛЬНЫМ РОБОТОМ

В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ¹

Показана актуальность создания интеллектуальных роботов различно-

го назначения, способных эффективным образом решать сложные мно-

гоэтапные задачи целенаправленной деятельности в априори неописан-

ных проблемных средах. Предложены оригинальные по содержанию эле-

менты продукционной модели представления знаний безотносительно к

конкретной предметной области. Построенная таким образом модель

представления знаний позволяет интеллектуальным роботам автомати-

чески планировать целенаправленную деятельность в условиях неопре-

деленности, опираясь на обобщенное описание возможных закономерно-

стей проблемной среды. Разработаны процедуры автоматического син-

теза графа “видимости”, определяющего формальным образом воспри-

нимаемый интеллектуальным роботом участок проблемной среды. Это,

в свою очередь, позволяет роботу автоматически формировать локально-

оптимальный маршрут целенаправленного перемещения в априори неопи-

санных условиях функционирования. Синтезированы процедуры автома-

тического планирования интеллектуальным роботом целенаправленной

деятельности, связанной с преобразованием текущей ситуации проблем-

ной среды в заданную целевую ситуацию в условиях неопределенности.

Ключевые слова: интеллектуальный робот, многоэтапное поведение, про-

блемная среда, элементы модели представления знаний, акты поведения,

граф “видимости”, планирование целенаправленной деятельности.

DOI: 10.31857/S0005231023120127, EDN: NGVHRW

1. Введение

Создание интеллектуальных роботов (ИР) различного назначения, спо-

собных решать сложные многоэтапные задачи в условиях неопределенности,

сводящиеся к необходимости перехода с одного участка проблемной среды

¹ Работа выполнена при финансовой поддержке Российского научного фонда (грант

№ 21-71-10056), https://rscf.ru/project/21-71-10056.

146

(ПС) на другие ее участки с целью перевода текущей ситуации в требуемое

целевое состояние, является одной из актуальных и сложных проблем искус-

ственного интеллекта.

В общем случае многоэтапная целенаправленная деятельность ИР скла-

дывается из ряда этапов, взаимосвязанных между собой достижением общей

заданной роботу цели. Каждый такой этап может быть связан с характерным

для него видом целенаправленной деятельности ИР. Достижение же теку-

щей подцели поведения на отдельном его этапе является предпосылкой для

перехода робота на следующий этап целенаправленной деятельности и т.д.

до выполнения ИР полученного задания. Иначе говоря, многоэтапная дея-

тельность ИР на каждом участке ПС, как правило, состоит из следующих

двух фаз. В первой фазе целенаправленной деятельности ИР автоматиче-

ски строит и отрабатывает маршрут перемещения из исходного к целевому

местоположению на заданном участке ПС. Во второй фазе ИР планирует

и отрабатывает упорядоченную последовательность действий, позволяющих

выполнить преобразование исходной ситуации на текущем участке проблем-

ной среды в заданную целевую ситуацию.

К одной из попыток решения данной сложной проблемы следует отне-

сти когнитивные инструменты планирования ИР полифазной деятельности,

предложенные в [1]. Однако модель представления знаний, на которую опи-

раются в процессе вывода решений данные когнитивные инструменты, не

позволяет в полной мере учитывать сложившиеся в ПС условия функциони-

рования, влияющие на текущие функциональные возможности ИР. Другими

словами, используемая в данном случае модель представления и обработки

знаний не позволяет наделить ИР способностью на альтернативной основе ав-

томатически формировать наиболее эффективный по принятой “стоимости”

план многоэтапной деятельности, учитывающий сложившиеся в ПС условия

функционирования. Например, при наличии грязи после дождя, препятст-

вующей эффективному перемещению ИР в ПС. Это, в свою очередь, при-

водит к необходимости корректировки сформированного плана целенаправ-

ленной деятельности во время его реализации с учетом наблюдаемых в ПС

неучтенных в процессе планирования особенностей. Либо ИР вынужден реа-

лизовать не совсем эффективный по принятой “стоимости” план целенаправ-

ленной деятельности.

Что же касается использования в рассматриваемом случае известных ал-

горитмических моделей представления и обработки знаний [2], позволяю-

щих организовать планирование целенаправленной деятельности ИР, напри-

мер [3-7], то такие модели фактически не предусматривают возможности ре-

шения интеллектуальным роботом сложных многоэтапных задач в условиях

неопределенности. Помимо этого, алгоритмический подход к созданию ин-

теллектуальных решателей задач имеет существенный недостаток, препятст-

вующий построению ИР, которые способны целенаправленно функциониро-

вать в условиях неопределенности. Этот недостаток заключается в том, что

применение алгоритмических методов вывода решений требует разработки

147

подробной модели представления знаний, ориентированной на выполнение

ИР конкретных заданий в текущих условиях функционирования. Формули-

руемая ИР цель поведения в этом случае достигается путем планирования и

отработки действий, обеспечивающих целенаправленное изменение значений

отношений пространства состояний между различными объектами проблем-

ной среды в пределах разрешающей способности подсистемы его техническо-

го зрения. Иначе говоря, известные методы планирования целенаправленной

деятельности ИР, базирующиеся на аксиоматическом подходе вывода реше-

ний с применением логики предикатов первого порядка и ее различных мо-

дификаций, не позволяют решать многоэтапные задачи в условиях неопре-

деленности [8]. Это связано с тем, что они требуют подробного формального

описания закономерностей ПС и применения в худшем случае сложных про-

цедур вывода решений методом перебора с экспоненциальной сложностью [9].

В свою очередь, для сетевого подхода к созданию интеллектуальных ре-

шателей задач ИР, связанного с использованием нейронных сетей для пред-

ставления и обработки знаний [10, 11], характерны те же основные недостат-

ки, что и для алгоритмического подхода. Данное обстоятельство обусловлено

следующими двумя особенностями организации современного сетевого интел-

лекта. Во-первых, с моделированием на ЭВМ процессов вывода решений на

нейронных сетях. Такое моделирование нейросетевых технологий фактиче-

ски сводит процессы планирования целенаправленной деятельности ИР на

основе решателя задач, организованного по принципу сетевого интеллекта,

к процессам, свойственным алгоритмическому интеллекту. Во-вторых, ней-

ронные сети в рассматриваемом случае, как правило, должны отражать по-

дробное формальное описание закономерностей текущих условий функцио-

нирования ИР. Это, в свою очередь, не позволяет роботу решать задачи в

условиях неопределенности и требует предварительного обучения нейронных

сетей [12].

Кроме того, на практике построить подробную модель закономерностей

реальной сложной ПС не представляется возможным [13], особенно если речь

идет о труднодоступных и агрессивных для человека средах, в которых в

основном и предстоит функционировать ИР.

Таким образом, отмеченные выше обстоятельства приводят к объектив-

ной необходимости разработки элементов процедурной модели представления

знаний безотносительно к конкретной предметной области, позволяющих ИР

адаптироваться к различным априори неописанным условиям функциониро-

вания [14]. Кроме того, такие элементы представления знаний должны обес-

печивать ИР возможность планирования целенаправленной деятельности с

учетом влияния текущих условий ПС на функциональные возможности ро-

бота.

Следует также отметить, что для планирования целенаправленных пере-

мещений ИР в априори неописанной проблемной среде в настоящее время

широко используются SLAM методы [15, 16]. На основе данных методов вна-

чале строится формальное описание карты местности в виде помеченного гра-

148

фа, которая затем используется для маршрутизации перемещений ИР в ПС.

С этой целью применяется один из методов поиска оптимального пути на

графах [17]. Однако учитывая, что в процессе многоэтапной деятельности

задача маршрутизации движения ИР решается в реальном времени, приме-

нение в рассматриваем случае SLAM методов является нецелесообразным.

В этой связи в работе предлагается оригинальный эвристический метод фор-

мирования модели воспринимаемого участка среды в виде графа “видимо-

сти”. Автоматическое построение такого графа позволяет ИР параллельно

с его синтезом сформировать локально-оптимальный маршрут движения к

целевому местоположению. Кроме того, предложенный метод маршрутиза-

ции движения ИР в отличие от SLAM методов, а также известных методов

построения графов “видимости” [18, 19], не требует выполнения трудоемких

вычислений.

Помимо метода планирования перемещений ИР в условиях неопределен-

ности в настоящей статье предлагаются также различные элементы модели

представления и обработки знаний безотносительно к конкретной предмет-

ной области. Использование такого вида элементов представления знаний

позволяет ИР организовать модельный подход к организации вывода реше-

ний в процессе автоматического планирования многоэтапной целенаправлен-

ной деятельности в априори неописанных и нестабильных условиях ПС. При

этом предлагаемая в статье модель представления и обработки знаний позво-

ляет ИР организовать планирование многоэтапной деятельности в условиях

неопределенности с приемлемой для бортовой ЭВМ полиномиальной слож-

ностью.

2. Постановка задачи

Рассмотрим ИР как мобильную систему, оснащенную манипулятором, ко-

торая ориентирована на решение определенного класса задач. Как правило,

такая система состоит из сенсорной, решающей и моторной подсистем [4].

Сенсорная подсистема ИР включает модуль технического зрения и ряд дат-

чиков, связанных с управлением навигацией робота в ПС, а также обеспече-

нием данными, необходимыми для проведения анализа условий и результатов

отработки различных действий. Решающая подсистема ИР состоит из базы

знаний, в которой хранится модель их представления, и интеллектуально-

го решателя задач, предназначенного для планирования многоэтапной дея-

тельности, связанной с выполнением сформулированного интеллектуальному

роботу задания. Моторная подсистема служит для отработки различных дей-

ствий в процессе перемещения ИР в ПС и манипулирования находящимися

в среде объектами в процессе целенаправленного преобразования текущей

ситуации в целевую ситуацию проблемной среды.

Таким образом, ИР можно охарактеризовать множеством отрабатывае-

мых элементарных действий B = {bi1 }, i₁ = 1, n₁, например, поднять объ-

ект, подойти, захватить объект и т.д.; множествами объектов O = {o₂(Xi2 )},

i₂ = 1,n₂ и событий D = {di3 (Yi3 )}, i₃ = 1,n₃, соответственно находящихся и

происходящих в ПС, которые интеллектуальный робот способен распознать,

149

планируя целенаправленную деятельность. Здесь Xi2 и Yi3 - множества ха-

рактеристик, соответственно определяющих объекты и события ПС. В общем

же случае функциональные возможности ИР определяются заданной моде-

лью представленных в общем виде знаний и процедурами автоматического

планирования целенаправленной деятельности в различных условиях априо-

ри неописанной ПС.

В свою очередь, нестабильную ПС в общем случае можно охарактеризо-

вать

— множеством находящихся в среде объектов oi2 (Xi2 ) ∈ O;

— происходящими независимо от деятельности ИР событиями di3 (Yi3 ) ∈ D,

спонтанное проявление которых в проблемной среде может препятствовать

результативной отработке интеллектуальным роботом элементарных дей-

ствий bi1 ∈ B;

— различным видом семантических отношений [20] R = {ri4 }, i₄ = 1, n₄,

которые выполняются в ПС между объектами, событиями и находящимся в

среде ИР.

В целом же ПС определяется сложившейся в ней текущей ситуацией

S = {Si5}, i₅ = 1,n₅, содержание которой зависит от состояния находящих-

ся в ней объектов oi2 (Xi2 ) ∈ O и происходящих di3 (Yi3 ) ∈ D, а также видом

и значениями выполняющихся в среде отношений ri4 ∈ R между объектами,

событиями и ИР.

Задание к выполнению ИР получает в декларативно-процедурной фор-

ме представления в виде упорядоченной последовательности сложных дей-

ствий Bj1 , j₁ = 1, m₁ [21] и условий, которые должны выполняться в ПС для

их результативной отработки. В общем случае целевое задание имеет следую-

щую структуру и содержание:

< SИ1 &B1j

→ SЦ1 &B2j

→ SЦ2 ,... ,SЦk-1&B^kj

→ SЦk >,

где, например, S^И1 и S^Ц1 - описание в обобщенном виде соответственно ис-

ходных условий и условий, отражающих достижение подцели соответствую-

щего этапа целенаправленной деятельности. Таким образом, в рассматри-

ваемом случае целевая ситуация предыдущего этапа поведения, например,

S^Ц1 определяет исходную ситуацию S^И2 для следующего этапа целенаправ-

ленной деятельности ИР.

Сложные действия Bj1 состоят из кортежей элементарных действий

bi1 ∈ B и фактически отражают содержание соответствующего им этапа це-

ленаправленной деятельности ИР. Например, полученное ИР задание может

иметь следующее содержание: “найти на заданном участке ПС определен-

ного вида объекты, перевести их в необходимое состояние или перенести в

заданное местоположение”. При этом, если результативность определенных

действий bi1 ∈ B зависит от текущего состояния ПС, то их отработка сопро-

вождается проверкой определенного условия. По ее результатам либо дей-

ствие непосредственно выполняется ИР, либо выбирается по ссылке другой

150

элемент модели представления знаний, позволяющий ИР отработать данное

действие с учетом сложившихся в ПС условий. Например, действие подойти

к объекту может быть непосредственно отработано по прямой линии движе-

ния только при отсутствии препятствий на пути перемещения ИР к этому

объекту. В случае же наличия в ПС таких препятствий для отработки дан-

ного действия ИР требуется предварительно сформировать план движения

к заданному объекту по проходимым между препятствиями участкам среды.

Такой подход к построению типовых элементов модели представления знаний

позволяет существенным образом

— снизить сложность процесса вывода решений за счет автоматического

перехода по ссылкам от одного к другому типовому элементу представления

знаний;

— сократить их количество за счет возможности использования одного и

того же элемента для решения одной и той же по назначению подзадачи в

различных условиях ПС.

Требуется, опираясь на вышеизложенное описание ИР, проблемной среды

и заданной роботу цели, разработать такие типовые элементы модели пред-

ставления знаний, которые позволяют автоматически строить планы много-

этапной деятельности в сложных априори неописанных условиях ПС. В об-

щем случае такой план целенаправленной деятельности ИР представляет со-

бой дерево вывода решений в пространстве состояний [8].

Следует отметить, что решение подзадач, связанных с распознаванием

различных образов ПС в процессе планирования ИР целенаправленной дея-

тельности, является самостоятельной проблемой, требующей отдельного об-

суждения, и в настоящей статье по причине ее ограниченного объема не рас-

сматривается.

3. Типовые элементы модели представления знаний ИР

В общем случае модель представления знаний состоит из декларативных

и процедурных элементов, позволяющих ИР планировать многоэтапную дея-

тельность в условиях неопределенности. Декларативные элементы модели

представления знаний предназначены для формального описания допусти-

мых ситуаций (состояний) ПС Si5 ∈ S, а также их отдельных фрагментов

ΔSj2i₅ ⊂ Si5 , j2 = 1, m2. Данные фрагменты ситуаций ПС служат для построе-

ния различных элементов процедурной модели представления знаний ИР.

Здесь m₂ - множество допустимых фрагментов (частей), на которые допус-

кается разбиение текущих ситуаций ПС Si5 ∈ S.

Следует отметить, что минимальный допустимый фрагмент текущей си-

туации ПС может состоять из двух объектов или одного объекта среды и ИР,

а также отношений, которые выполняются между ними в проблемной среде.

Процедурные знания представляют собой набор элементов, определяющих

безотносительно к конкретной предметной области решение различного ви-

да типовых подзадач целенаправленной деятельности, т.е. “кирпичиков”, на

основе которых ИР планирует свое поведение.

151

Формальное представление различных ситуаций ПС и их фрагментов за-

висит от роли, которую они выполняют в процессе вывода решений. Так,

для обобщенного представления различных аналогичных друг другу ситуа-

ций Si5 ∈ S и их фрагментов ΔSj2i₅ ⊂ Si5 , предназначенных для построения

типовых элементов модели представления процедурных знаний ИР безотно-

сительно к конкретной предметной области, используются активные нечет-

кие семантические сети [22]. Для описания же текущих ситуаций ПС служат

классические семантические сети [8].

В общем случае активные нечеткие семантические сети, служащие для

обобщенного описания различных ситуаций Si5 ∈ S и их отдельных частей

ΔSi5 ⊂ Si5 , представляют собой нечетко помеченный граф G_a = (v₀,V_a,E_a).

Здесь v₀ - базовая вершина сети, определяемая ИР, V_a, E_a - соответственно

множества активных вершин и ребер. Активные вершины vi6 ∈ V_a, V_a = {vi6 },

i₆ = 1,n₆ согласно их назначению представляются слотами O^∗ = {o∗i7 (X^∗ )},_i

i₇ = 1,n₇ и D^∗ = {d∗i8 (Y^∗i)}, i8 = 1, n8, которые в текущих условиях ПС по-

мечаются соответственно находящимися в среде объектами oi2 (Xi2 ) ∈ O и

происходящими в ней событиями di3 (Yi3 ) ∈ D. Активные вершины vi6 ∈ V_a

в нечеткой семантической сети G_a, определяемые слотами o∗i7 (X^∗ ) ∈ O^∗ и_i

d∗i8 (Y^∗i) ∈ D∗, могут быть помечены конкретными объектами oi2(Xi2) и собы-

тиями di3 (Yi3 ) ПС, если они удовлетворяют следующим условиям X^∗i

⊆Xi2

иY^∗i

⊆Yi3.

Активные ребра ei9 ∈ E_a, E_a = {ei9 }, i₉ = 1, n₉ могут быть неориен-

тированными и ориентированными. Неориентированные ребра e⁰

∈E⁰¹

;

(

в сети G⁰ помечаются следующими тройками T^∗j

(ri4 ) , r∗j3 , r^∗

, где

j₃+1

T^∗j

(ri4 ) — j₃ терм лингвистической переменной (в общем случае j₃ = 1, 5 [23])

с названием, совпадающим с наименованием соответствующего отношения

ri4(Xi4 ) ∈ R, выполняющегося в ПС между двумя объектами или объектом

и ИР; (r∗j3 , r∗j3+1) — соответственно нижняя и верхняя границы подынтервала

численных значений терма T^∗j

(ri4 ) на шкале количественных оценок соответ-

ствующей лингвистической переменной.

Ориентированные ребра ei9 ∈ E_a помечаются следующими тройками

< Fi9,(t1j2,t2j2) >, где Fi9 - множество характеристик, описывающих влияние

событий di3 (Yi3 ) ∈ D, определяемых активной вершиной d∗i8 (Y^∗) ∈ D^∗, на со-_i

стояние ПС при их появлении; (t1j2 , t² ) - интервал времени t, в течение кото-_j

рого может проявиться результат влияния событий di3 (Yi3 ) ∈ D на текущую

деятельность ИР. Кроме того, события di3 (Yi3 ) ∈ D могут также влиять на со-

стояние объекта ПС oi2 (Xi2 ) ∈ O, удовлетворяющего требованиям активной

вершины o∗i7 (X^∗ ) ∈ O^∗, в которую это ребро входит._i

Текущие ситуации ПС Si5 ∈ S в модели представления знаний АР описы-

ваются семантическими сетями, представляющими собой помеченный граф

,Ei5 ), который формируется в сенсорной подсистеме интел-_i

Gi⁵i₁₀ =(v0^,

i₁₀

лектуального робота на основе информации, поступающей из проблемной

среды. Здесь v₀ - ключевая помеченная ИР вершина, относительно кото-

152

рой формируется семантическая сеть. Остальные же вершины Vi5i₁₀ =^{vi11},

i₁₁ = 1,n₁₁ графа Gi5 в соответствии с их назначением определяются нахо-_i

дящимися в ПС объектами oi2 (Xi2 ) ∈ O и происходящими в ней событиями

di3 (Yi3 ) ∈ D. Ребра Ei5i₁₀ =^{ei12},i12=1,n12всетиGi50 могутбытьтакже1

ориентированными и неориентированными. Неориентированные ребра в се-

ти Gi5i₁₀ помечаютсяколичественнымиоценкамиri4отношенийri4(Xi4)∈R,

которые выполняются в ПС между ИР и находящимися в ней объектами.

Ориентированные же ребра ei12 ∈ Ei5 , определяющие характер влияния про-_i

исходящих в среде событий на находящиеся в ней объекты и текущую дея-

тельность ИР, помечаются так же, как и в активных нечетких семантических

сетях тройками < Fi9 , (t1j2 , t² ) >._j

Содержание и структура типовых элементов процедурной модели пред-

ставления знаний определяются функциональным назначением ИР. В общем

случае такие элементы представления знаний с учетом их функционального

назначения могут быть следующих видов.

1. Импликативные решающие правила, позволяющие ИР выявлять необ-

ходимые для достижения заданной подцели процедуры автоматического по-

строения маршрута целенаправленного перемещения в ПС

(1)

Fj₄ :

(j₄)&Bj1 (j₄) → SЦi(j4), j4

= 1, 3,

i₅

где Fj4 - идентификатор, определяющий назначение решаемой на основе

j₄ правила подзадачи, например, “маршрутизация движения в ПС с препят-

ствиями”; SИi(j4) - исходная ситуация участка ПС, на котором ИР находится

в текущий момент времени; SЦi(j4) - ситуация, определяющая участок проб-

лемной среды, на который ИР требуется перейти для достижения заданной

подцели текущего этапа поведения; Bj1 (j₄) - метод планирования маршрута

движения, связанного с переходом ИР в текущее целевое местоположение.

2. Элементы представления знаний, характеризующие требуемые исход-

ные условия и результаты отработки ИР элементарных действий bi1 ∈ B

(2)

(j₅)&bi1 (j₅) → ΔSРi

(j₅) , j₅ = 1,m₄,

Fj₅ : Δ

i₁

где Fj5 - идентификатор подзадачи, решение которой обеспечивает ИР полу-

чение локального результата ΔSРi(j5); ΔSИi(j5)&bi1 (j5) → ΔSРi(j5) - элемен-

тарный акт поведения ИР, показывающий, что если в текущей ситуации ПС

Si5 ∈ S выполняется условие ΔSИi(j5) ⊂ Si5 , то для получения в среде локаль-

ного результата ΔSРi(j5) роботу следует отработать действие bi1 (j5); m5 - под-

множество допустимых фрагментов ΔSИi(j5) ⊂ Si5 , определяющих различные

локальные условия, которые могут возникнуть в текущей ситуации ПС.

Таким образом, импликативные решающие правила (2) позволяют ИР

устанавливать различные действия bi1 (j₅) ∈ B, которые после их отработки

в ПС приводят к получению результата ΔSРi(j5) в соответствии со сложив-

шимися в проблемной среде локальными условиями ΔSИi(j4).

153

При этом множество элементов представления знаний (2) целесообразно

разбить на классы эквивалентности по идентичности получаемого на их ос-

нове результата ΔSРi(j5). Каждый такой класс определяется либо идентифи-

катором Fj5 , либо локальным результатом ΔSРi(j5), который ИР требуется

получить для достижения текущей подцели поведения. Следовательно, если

ИР в текущий момент времени необходимо обеспечить локальный результат

ΔSРi(j5) в текущей ситуации ПС Si5 ∈ S, то по соответствующему ему со-

держанию в модели представления знаний в первую очередь определяется

обеспечивающий этот результат класс элементов модели представления зна-

ний (2). Затем в выбранном классе устанавливается типовой элемент пред-

ставления знаний, у которого фрагменты ΔSИi(j5) и ΔSРi(j5) являются нечет-

ко вложенными соответственно в текущую и целевую ситуации проблемной

среды. Например, таким образом группируются в один класс эквивалентно-

сти все действия, связанные с изменением местоположения различных объек-

тов в ПС. Так, одни объекты из-за их габаритных размеров и веса ИР может

поднять и перенести, вторые только перекатить, а третьи — перетащить и т.п.

3. Описание в модели представления знаний ИР условий и результатов

выполнения сложных действий Bj1 определяется следующими актами пове-

дения:

[

(

)

Fj₆ :

(j₆)&Bj1 S1,Иi

(j₆) &b1i

→ ΔS1,Рi

(j₆) ≈ ΔS2,Иi

(j₆) &b²

→

i₅

i₁

(3)

]

→ΔS2,Рi(j6) ≈, . . . , ≈ΔSk,Иi(j6)&bki

→ ΔSk,Рi(j6)

⇒SЦi(j6) , j6 = 1, m6.

Импликативные решающие правила (3) означают следующее. Если теку-

щее состояние ПС определяется ситуацией Si5 ∈ S, в которую нечетко вло-

жено обобщенное описание SИi(j6) аналогичных друг другу допустимых под-

ситуаций проблемной среды, то для ее преобразования в целевую ситуа-

цию, определяющуюся обобщенным описанием SЦi(j6), ИР требуется выпол-

нить сложное действие Bj1 , состоящее из кортежа элементарных действий

<b1i1,b2i1,...,b^k

>. Здесь ≈ — знак нечеткого равенства сравниваемых меж-

i₁

ду собой семантических сетей.

4. Для планирования многоэтапной деятельности в ПС, в которой спонтан-

но возникают события di3 (Yi3 ) ∈ D, негативно влияющие (препятствующие

эффективной результативной отработке роботом определенных действий) на

целенаправленную деятельность ИР, для построения подплана поведения,

связанного со снижением и устранением такого влияния, используются сле-

дующие два вида импликативных решающих правил.

Первый вид данных импликативных решающих правил имеет следующую

структуру и содержание:

(4)

Fj₇ : < Δ

i₅

(j₇), d^∗i

(Y^∗i

) > &bi1(j₇) →Δd∗i8(Y ^∗i)j5 , j7 = 1,m7,

где элементарный акт поведения ΔSИi(j7)&bi1 (j7) →Δd∗i8 (Y∗) означает, чтоi

если в текущую ситуацию ПС Si5 ∈ S нечетко вложен фрагмент ΔSИi(j7), то

154

при появлении в проблемной среде события di3 (Yi3 ) ∈ D, удовлетворяюще-

го требованиям слота d∗i8 (Y^∗) ∈ D^∗, отработка ИР элементарного действия_i

bi1(j₇) позволяет снизить Δd∗i8(Y^∗i)j5 его негативное влияние на дальнейшую

целенаправленную деятельность робота.

Второй вид таких правил вывода имеет следующее представление:

(5)

Fj₈ :<

i₅

(j₈), SРi(j8), d∗i

(Y^∗i

) > &Bj1(j₈) →d∗i8(Y ^∗i), j8 = 1,m8,

где импликативные решающие правила (5) означают следующее. Если теку-

щая ситуация ПС Si5 является нечетко равной обобщенному описанию SИi(j8)

аналогичных друг другу ситуаций проблемной среды, а заданная ИР цель по-

ведения представлена семантической сетью SРi(j8), то при появлении в среде

событий di3 (Yi3 ) ∈ D, удовлетворяющих требованиям слота d∗i8 (Y^∗) ∈ D^∗, вы-_i

полнение роботом сложного действия Bj1 (j₈) позволяет устранить d∗i8 (Y^∗)_i

негативное влияние этого события на дальнейшую целенаправленную дея-

тельность.

Например, при наличии в ПС тумана, ИР для избегания столкновения с

различными находящимися в среде объектами, используя правило (4), опре-

деляет, что ему в этом случае требуется снизить скорость своего передвиже-

ния и т.п.

Следует отметить, что множества решающих правил (3)-(5) по характер-

ному для них общему признаку (например, назначению), как и правила (2),

разбиваются на соответствующие им классы эквивалентности. Это позволяет

ИР эффективным образом определять результативные решающие правила на

каждом этапе планирования целенаправленной деятельности в соответствии

с текущими условиями ПС и заданной подцелью поведения.

4. Методы планирования многоэтапной деятельности ИР

Как уже отмечалось выше, на каждом этапе целенаправленной деятель-

ности ИР в ПС с препятствиями, как правило, требуется автоматическое по-

строение маршрута перемещения для перехода с одного участка проблемной

среды на другой ее участок. В процессе решения данной подзадачи на осно-

ве типовых элементов представления знаний (1) ИР может столкнуться со

следующими тремя случаями:

— целевое местоположение находится в зоне прямой видимости сенсорной

подсистемы робота, а на пути движения к нему имеются препятствия;

— интеллектуальному роботу известны только координаты своего целевого

местоположения в ПС с препятствиями;

— требуется найти заданные объекты в априори неописанной ПС с пре-

пятствиями.

В первом случае для построения маршрута движения к целевому место-

положению в среде с препятствиями, габаритные размеры и координаты ме-

стоположения которых в ПС априори роботу не известны, используется ме-

155

Построение ИР графа “видимости” для выбора эффективного марш-

рута движения к целевому местоположению: (p₁-p₆) - препятствия;

(ОНП₁-ОНП₃) - основные направления перемещения; (М₁-М₄) -

альтернативные маршруты движения к целевому местоположению.

тод 1. На основе метода 1 и данных, поступающих из сенсорной подси-

стемы ИР, в его интеллектуальном решателе задач строится граф “видимо-

сти” G_B = (V_B, E_B). Здесь V_B = {vi13 }, i₁₃ = 1, n₁₃ - множество вершин, со-

ответствующих проходимым между препятствиями зонам ПС; E_B = {ei14 },

i₁₄ = 1,n₁₄ - множество ребер, определяющих связь между смежными про-

ходимыми зонами ПС, которые определяются “затратами”, связанными с пе-

реходом ИР от одной такой зоны к смежной с ней в проблемной среде зоне.

Параллельно построению данного графа выбирается также и направление

перемещения ИР на каждом шаге целенаправленного движения.

В общем случае метод 1 автоматического построения графа “видимости”

GB = (VB, EB) и локально-оптимального маршрута целенаправленного дви-

жения ИР к воспринимаемому целевому местоположению (при отсутствии

формального описания карты местности) можно представить следующим об-

разом:

1. Принять в качестве исходной вершины v0i13 (0) ∈ V_B или истока графа

“видимости”, имеющего нулевую условную стоимость, исходное местополо-

жение ИР (см. рисунок).

2. Определить первое основное направление перемещения к цели (ОНП₁),

представляющее собой прямую или кратчайшее расстояние между исходным

и целевым местоположением ИР.

3. Выбрать расположенные по разные стороны от ОНП₁ две отстоящие

от него на минимальном расстоянии проходимые между препятствиями зо-

ны, которые будут определять вершины v1i13 (c1i13 ) и v2i13 (c²

) строящегося гра-

i₁₃

фа G_B , смежные с вершиной v₀(0) и имеющие соответственно условные сто-

имости c1i13 и c²

i₁₃

156

Определить для каждой принятой таким образом вершины

v1i13 (c1i13 ),v2i13 (c2i13 )∈ V_B их условные стоимости c1i13 и c²

, равные стоимости

i₁₃

инцидентных им ребер ei14 ∈ E_B и зависящие

— от расстояния, которое необходимо преодолеть ИР для перехода от те-

кущего местоположения за пределы соответствующей вершине проходимой

зоны ПС;

— от вида грунта на поверхности, по которому интеллектуальному роботу

предстоит движение к каждой проходимой зоне с учетом конструктивных

особенностей хода моторной системы.

5. Построить для каждой из выявленных на текущем шаге формирования

графа “видимости” вершин v1i13 (c1i13 ), v2i13 (c2i13 ) ∈ V_B исходящие из них основ-

ные направления перемещения ИР к целевому местоположению (например,

на приведенном рисунке - это ОНП₂ и ОНП₃).

6. Выбрать относительно каждого построенного ОНП₂ и ОНП₃ по две

отстоящие от них по разные стороны на минимальном расстоянии прохо-

димые зоны ПС, которые определяют следующие вершины v^ki

(cki13 ) ∈ V_B,

k = 1,4 строящегося графа “видимости” G_B, смежные с присоединенными

к нему на предыдущем шаге вершинами. Определить стоимость c^k вер-_i

шин v^ki

(cki13 ) ∈ V_B, складывающуюся из стоимости смежных с ними вершин

строящегося графа “видимости” и стоимости инцидентных им ребер ei14 ∈ E_B.

7. Продолжить дальнейшее построение графа “видимости” G_B = (V_B, E_B)

по описанному в пп. 1-6 принципу. В этом случае построение графа “види-

мости” происходит до тех пор, пока к каждой входящей в его структуру вер-

шине, найденной на предыдущем шаге его построения, не будет присоединена

вершина, соответствующая проходимой зоне ПС, между которой и заданным

целевым местоположением ИР отсутствуют препятствия.

Определить “стоимость” каждой выявленной таким образом вершины, ко-

торая складывается из “стоимости” смежной с ней вершины и “стоимости”,

зависящей от сложности перемещения ИР по отрезку прямой, связывающему

соответствующую этой вершине проходимую зону и текущее целевое место-

положение робота.

8. Присоединить к каждой вершине строящегося графа “видимости”, удо-

влетворяющей условиям п. 7, вершину - сток v_ц ∈ E_B, соответствующую це-

левому местоположению ИР.

Построенный таким способом граф “видимости” G_B = (V_B, E_B) позволя-

ет ИР определить локально-оптимальный маршрут Lj9 (v_и, v_ц), j₉ = 1, m₉ с

∑m10

минимальной “стоимостью” Cj9 =

j₁₀=1

ej9i₁₄ (ci914 ,j10) → min. Здесь vи и vц -

вершины графа G_B, соответственно определяющие исходное и целевое место-

положение интеллектуального робота; ej9i₁₄ (ci914 , j10) - ребра графа GB, входя-

щие в j₉ маршрут движения ИР к целевому местоположению; cj9

- “стои-

i₁₄

мость” j₉ ребра ej9i₁₄ ∈ Lj8 (vи, vц).

Следует отметить, что построенный на основе метода 1 граф “видимости”

(см. рисунок) параллельно сопровождается формированием ИР в условиях

157

неопределенности локально-оптимального маршрута движения M₂ к задан-

ному целевому местоположению.

Для второго случая, когда заданы только координаты целевого местопо-

ложения, и оно расположено за пределами зоны прямой видимости ИР, для

планирования перемещения используется метод 2, имеющий следующее со-

держание:

1. На первом шаге планирования поведения определяется стратегическое

направление движения ИР к целевому местоположению, которым является

прямая, связывающая его исходное и целевое местоположения в ПС.

2. На втором шаге на стратегическом направлении движения выбирается

наиболее удаленная точка, попадающая в зону прямой видимости и играющая

роль подцели на текущем шаге планирования перемещения ИР.

3. На третьем шаге, используя приведенные выше инструменты плани-

рования поведения при расположении целевого местоположения в зоне пря-

мой видимости, ИР строит относительно выбранной точки, расположенной

на стратегическом направлении движения, подграф “видимости”. Это позво-

ляет ИР определить эффективный маршрут движения к данной точке, т.е.

маршрут, имеющий минимальную “стоимость” в пределах видимого роботу

участка ПС.

4. На четвертом шаге выбирается новая точка, расположенная на страте-

гическом направлении движения, относительно которой строится следующий

соответствующий ей подграф “видимости” и т.д., пока ИР не достигнет за-

данного целевого местоположения.

В случае, когда ИР требуется найти в априори неописанной ПС заданные

объекты, для планирования целесообразного поведения на заданном участке

местности эффективно могут быть использованы алгоритмы самообучения,

предложенные в [24].

Что же касается планирования целенаправленной деятельности ИР, свя-

занной с манипулированием на каждом этапе деятельности находящимися в

ПС объектами, то следует отметить, что основной операцией, которая выпол-

няется в процессе вывода решений в этом случае, является операция срав-

нения между собой различных семантических сетей. В общем случае данная

операция может быть связана

1. С необходимостью сравнения между собой семантической сети, соответ-

ствующей текущей ситуации ПС Si5 ∈ S, и активной нечеткой семантической

сети S_a на предмет их нечеткого равенства в процессе выбора сложного дей-

ствия Bj1 , результативного с точки зрения достижения заданной подцели в

текущих условиях среды.

Определение 1. Сравниваемые между собой семантические сети

Ga = (v0, Va, Ea) и Gi510 = (v0,

i₁₀

,Ei5 ) нечетко равны, если они удовлетво-_i

ряют следующим условиям [25]:

— данные семантические сети имеют одинаковое количество вершин и

ребер;

158

— для каждой вершины vi7 ∈ V_a, помеченной в сети G_a слотом o∗i7 (X^∗ )_i

или слотом d∗i8 (Y^∗), имеется структурно эквивалентная ей вершина_i

vi11 ∈ Vi5i₁₀ ,помеченнаявсетиGi510 соответственнообъектомoi2(Xi2)или

происходящим в проблемной среде событием di3 (Yi3 ) ∈ D, для которых спра-

ведливы следующие условия X^∗i

⊆Xi2 иY^∗i

⊆ Yi3. В этом случае принимает-

ся решение, что пометки структурно эквивалентных вершин в сетях G_a

и Gi5

являются нечетко равными между собой ввиду того, что они опре-

i₁₀

деляются одними и теми же признаками, характерными для аналогичных

друг другу объектов и событий ПС;

— для каждого неориентированного ребра ei9 ∈ E_a, помеченного в сети G_a

тройкой < T^∗j

(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему

неориентированное ребро ei12 ∈ Ei5i₁₀ ,помеченноезначениемri одноименно-4

го с этой тройкой отношения ri4 ∈ R, для которого выполняется условие

r∗i4 ∈ (r∗j3,r∗j3+1)илипометкисравниваемыхмеждусобойребернечеткорав-

ны между собой, так как определяются одним и тем же термом T^∗j

(ri4 );

— для каждого ориентированного ребра ei9 ∈ E_a, помеченного в сети G_a

тройкой < T^∗j

(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему

одинаково с ним помеченное ориентированное ребро ei12 ∈ Ei5 ._i

В противном случае, если хотя бы одно из перечисленных выше условий не

выполняется, то сравниваемые между собой семантические сети не являются

нечетко равными.

2. С определением нечеткого вложения фрагментов ΔS_a = (ΔV_a, ΔE_a),

,Ei5 ),_i

имеющих нечеткое описание, в текущую ситуацию ПС Gi5i₁₀ =(v0^,

i₁₀

например, в процессе построения целенаправленной последовательности эле-

ментарных действий bi1 ∈ B.

Определение 2. Нечетко заданный фрагмент ΔS = (ΔV_a,ΔE_a) обоб-

щенного описания аналогичных друг другу ситуаций ПС Si5 ∈ S яв-

ляется( нечетко в)оженным в текущую ситуацию проблемной среды

, если его матрица смежности M(ΔS_a) является ча-

Gi⁵i₁₀

= v₀, V i5i₁₀, Ei510

стью матрицы смежности M(Gi5i₁₀)сетиGi50 принечеткомравенствепо-1

меток структурно эквивалентных в этих сетях вершин и ребер.

Необходимо отметить, что столбцы и строки в матрицах смежности, участ-

вующих в определении нечеткого вложения одной семантической сети в дру-

гую, определяются пометками соответствующих им вершин. В свою очередь,

элементы в данных матрицах представлены нечеткими значениями пометок

ребер инцидентных вершинам, определяющим их соответствующие столбцы

и строки.

В общем случае планирование многоэтапной деятельности ИР опирается

на сформулированное роботу задание и имеющиеся у него типовые элемен-

ты модели представления знаний. Пусть на j₁₁ этапе планирования в моде-

ли представления знаний имеется согласованная между собой и с получен-

ным заданием пара импликативных решающих правил <(1),(3)>. Допустим,

что для данных элементов соответственно выполняются следующие условия:

159

фрагмент ситуации SИi

(j₄) типового элемента (1) является нечетко вложен-

ным в исходную на j₁₁ шаге деятельности ситуацию ПС S^И (см. определе-_j

ние 2); SЦi(j4) ≈ SИi(j6) и фрагмент ситуации SЦi

(j₆) типового элемента (4)

является нечетко вложенным в целевую ситуацию среды S^Ц . Тогда задача_i

планирования целенаправленной деятельности на данном этапе решается ИР

на основе метода 3 путем построения упорядоченной цепочки, состоящей из

таких пар. При этом типовой элемент (1) при наличии на пути движения

ИР препятствий по заданной ссылке встраивается в структуру типового эле-

мента представления знаний (4) вместо элементарного действия “подойти к

объекту”.

Следует отметить, учитывая, что ИР априори неизвестны условия ПС, в

которых ему предстоит действовать на каждом следующем этапе, робот вна-

чале отрабатывает подплан действий, полученный на текущем этапе функци-

онирования. Затем ИР переходит к планированию дальнейшей целенаправ-

ленной деятельности следующего этапа поведения.

В противном случае, когда ИР для выполнения подзадания текущего этапа

поведения требуется решить несколько подзадач, планирование целенаправ-

ленной деятельности на этом этапе сводится к автоматическому построению

дерева вывода решений на основе импликативных решающих правил (1)-(5)

с использованием метода 4. Данный метод планирования имеет следующее

описание.

1. На первом шаге построения дерева вывода решений соответствующего,

например, текущему j₁₁ этапу деятельности, его корневая вершина v₀(j₁₁) по-

мечается целевой ситуацией S^Ц . Затем в модели представления знаний опре-_j

деляется первый акт поведения (3), у которого содержание ситуации S1,Цi(j6)

совпадает с содержанием целевой ситуации S^Ц ._j

При этом может возникнуть одно из условий: ситуация S1,Цi(j6) является

нечетко равной (см. определение 1), или нечетко вложенной (см. определе-

ние 2) в целевую ситуацию S^Ц . В первом случае осуществляется переход_j

на следующий шаг построения дерева вывода решений (п. 2), в противном

случае выполняется переход к п. 3.

2. На данном шаге построения дерева вывода решений проверяется усло-

вие: является или нет исходная ситуация S1,Иi(j6) выбранного элемента пред-

ставления знаний нечетко вложенной в текущую ситуацию ПС Si5 ∈ S. Если

данное условие выполняется, то план поведения, связанный с преобразова-

нием текущей ситуации ПС Si5 в ее целевую ситуацию S^Ц , является постро-_j

енным. Таким образом, для достижения заданной подцели на текущем этапе

деятельности ИР выполняет выбранное сложное действие B¹ . В противном_j

случае построение плана целенаправленной деятельности продолжается сле-

дующим образом.

На текущем k, k = 2, . . . , n шаге построения дерева вывода решений опре-

деляется результативный акт поведения (3), у которого ситуация Sk,Цi(j6)

160

является либо нечетко равной исходной ситуации Sk-1,Иi(j6) акта поведения

выбранного на предыдущем шаге ее роста, либо нечетко вложена в эту си-

туацию.

В случае, когда Sk,Цi

(j₆) ≈ Sk-1,Иi

(j₆), проверяется условие: является или

нет исходная ситуация Sk,Иi(j6) последнего выбранного акта поведения нечет-

ко вложенной в текущую ситуацию ПС Si5 ∈ S. Если данное условие является

справедливым, то принимается решение о том, что план целенаправленно-

го поведения сформирован. Таким образом, для достижения заданной под-

цели S^Ц ИР требуется выполнить построенный кортеж сложных действий_j

<B^k,... ,B2j1,B¹

j₁

В случае же, когда условие Sk,Цi

(j₆) ≈ Sk-1,Иi

(j₆) не выполняется, построе-

ние основной ветви дерева вывода решений продолжается по вышеописанно-

му принципу до тех пор, пока к нему не будет присоединен акт поведения z,

у которого исходная ситуация Sz,Иi(j6) является нечетко вложенной в теку-

щую ситуацию ПС Si5 ∈ S.

Если же ситуация Sk,Цi(j6) оказывается нечетко вложенной в ситуацию

Sk-1,Иi(j6), то это сигнализирует решающей подсистеме ИР о том, что тре-

буется разветвление строящегося дерева вывода решений и осуществляется

переход к п. 3.

3. На данном шаге определяются подцели поведения ИР для образующих-

ся ветвей строящегося дерева вывода решений путем выполнения следующих

операций над нечеткими семантическими сетями. Для определения подцели

поведения и продолжения роста основной ветви дерева вывода или его ствола,

например на k + 1 шаге планирования из исходной ситуации Sk-1,Иi(j6) акта

поведения, выявленного на k - 1 шаге, вырезается подграф структурно эк-

вивалентный семантической сети Sk,Цi(j6), соответствующей акту поведения,

выбранному на k шаге построения дерева вывода решений. Затем выполняет-

ся переход к п.2, на котором продолжается построение ствола дерева вывода

решений на основе полученной таким образом подцели поведения.

В оставшейся же части ΔSk-1,Иi

(j₆) ⊂ Sk-1,Иi

(j₆) разбиваемой семантиче-

ской сети к ее разрезанным ребрам присоединяются вершины, которые были

им инцидентны в исходной семантической сети Sk-1,Иi(j5). В результате опре-

деляется фрагмент активной нечеткой семантической сети, определяющий

подцель поведения ИР ΔSk+1,Цi(j6) для боковой ветви строящегося дерева

вывода решений. Затем выполняется переход к п. 4.

4. На данном шаге для дальнейшего роста боковой ветви дерева выво-

да решений в модели представления знаний определяется акт поведения,

у которого для целевой подситуации SЦi(j6) выполняется условие SЦi(j5) ≈

≈ΔSk+1,Цi(j5). Если найден такой акт поведения, то для дальнейшего ро-

ста боковой ветви выполняется переход к п. 2. Если же выполняется усло-

вие SЦi

(j₅) ⊂ ΔSk+1,Цi

(j₅), то рост боковой ветви дерева вывода решений осу-

ществляется по описанному в пп. 3, 4 принципу.

161

В случае же, когда такой акт поведения не найден, то дальнейший рост

боковой ветви дерева вывода решений осуществляется по тому же принципу,

что и на основе формального описания условий и результатов выполнения

сложных действий Bj1 , но только с использованием элементарных актов по-

ведения (2).

Таким образом, построенное описанным выше способом дерево вывода ре-

шений определяет план целенаправленной деятельности ИР, состоящий из

входящих в него различных актов поведения, связанных между собой усло-

виями нечеткого равенства или нечеткого вхождения соответствующих им

фрагментов нечетких семантических сетей. Отработка ИР данного плана це-

ленаправленной деятельности начинается с выполнения последнего сложно-

го действия, присоединенного к стволу дерева вывода решений. При этом

подпланы целенаправленной деятельности, соответствующие боковым вет-

вям построенного дерева, отрабатываются в порядке возникновения условий,

сигнализирующих о необходимости их построения, начиная с последнего при-

соединенного к ним сложного действия.

Примеры планирования целенаправленной деятельности ИР на основе

предложенных типовых элементов представления знаний с использованием

методов 3, 4 приводятся в Приложении П.1.

При самопроизвольном появлении в ПС событий di5 (Yi5 ) ∈ D, препятст-

вующих эффективной отработке действий сформированного на текущем эта-

пе плана поведения, ИР приостанавливает свою текущую целенаправленную

деятельность и переключается к построению и отработке подплана, связан-

ного с устранением негативного влияния этих событий на его дальнейшую

деятельность. Данный подплан поведения автоматически формируется таким

же способом, как и основной план целенаправленной деятельности. Только

в этом случае процесс построения дерева вывода решений на первом шаге

осуществляется на основе импликативных решающих правил (4) и (5). После

устранения негативного влияния возникшего в ПС события di5 (Yi5 ) ∈ D, ИР

продолжает свою многоэтапную целенаправленную деятельность. Для этого

он, в зависимости от сложившейся в ПС ситуации Si5 ∈ S, использует либо

ранее разработанный план целенаправленной деятельности, либо переплани-

рует свою дальнейшую деятельность с учетом произошедших в проблемной

среде изменений.

Предложение 1. Функциональная сложность β метода 4 планирова-

ния целенаправленной деятельности на каждом ее этапе зависит от ко-

личества операций сравнения пометок вершин и ребер в сопоставляемых

между собой семантических сетях и определяется следующими граничны-

ми оценками:

∑

3δ

n²

≤ β ≤ 3δλ

n²

j₁₂

j₁₂=1

где δ, λ - соответственно общее количество выполненных шагов вывода ре-

шений и импликативных решающих правил, хранящихся в модели представ-

162

ления знаний, связанных с решаемой ИР задачей на текущем этапе дея-

тельности; nj12 - количество вершин у максимальной по размерам семан-

тической сети, участвующей в процессе вывода решений на j₁₂ шаге плани-

рования.

Доказательство сформулированного предложения приводится в Приложе-

нии П.2.

Таким образом, наиболее трудоемкий метод 4 планирования многоэтап-

ной деятельности ИР имеет полиномиальную сложность второго поряд-

ка. Это позволяет ориентировочно определить производительность бортовой

ЭВМ, необходимой для его реализации с учетом функционального назначе-

ния создаваемого интеллектуального робота.

5. Заключение

1. Предложенные элементы модели представления знаний позволяют ИР

адаптироваться к априори неописанным проблемным средам путем конкрети-

зации в процессе вывода решений имеющихся в их структуре слотов с учетом

текущей ситуации ПС. Это, в свою очередь, обеспечивает ИР возможность

на основе разработанных процедур вывода решений автоматически генери-

ровать планы целенаправленной многоэтапной деятельности в нестабильных

априори неописанных условиях функционирования.

2. Разработанные типовые элементы представления знаний позволяют су-

щественным образом сузить пространство поиска решаемых ИР задач за счет

выбора на каждом шаге планирования целенаправленной деятельности не од-

ного, а сразу нескольких результативных действий. Кроме того, определение

таких результативных действий осуществляется не путем перебора, а на осно-

ве целенаправленного выбора с учетом условий ПС, в которых ИР предстоит

решать стоящую перед ним подзадачу на каждом этапе целенаправленной

деятельности.

3. Важная особенность предложенных элементов представления знаний и

методов вывода решений заключается в возможности их использования для

вывода решений на семантических сетях, позволяющих наиболее выразитель-

но и компактно выполнить формальное описание текущих условий функци-

онирования ИР в различных по сложности ПС.

4. К основному недостатку предложенного подхода к построению интел-

лектуального решателя задач, позволяющего ИР планировать целенаправ-

ленную деятельность в априори неописанных нестабильных проблемных сре-

дах, следует отнести громоздкость задаваемой роботу цели. В этой связи воз-

никает необходимость в дальнейшем развитии проведенного исследования,

связанного с построением типовых элементов представления знаний, позво-

ляющих формулировать ИР цель поведения в виде одной общей задачи. За-

тем выполнять разбиение этой задачи на подзадачи, решение которых обес-

печивает достижение полученных подцелей в сложившихся в ПС условиях

на различных этапах функционирования.

163

ПРИЛОЖЕНИЕ

П.1. Примеры решения ИР гипотетических задач

Задача 1. Допустим, что робот получил следующее задание. Находясь

на одном из участков ПС с препятствиями, роботу требуется перейти на

другой ближайший к нему участок этой среды, на котором необходимо пе-

ренести объект o₁(X₁) и поставить на объект o₂(X₂). Затем попасть на

следующий участок ПС, на котором следует заменить объект o₃(X₃) (на-

пример, разряженную батарею питания), находящийся в закрытой дверцей

нише объекта o₄(X₄) (например, электронного прибора) на объект o₅(X₅)

(заряженную батарею питания).

Пусть в ПС выполняются следующие условия. В исходном состоянии ИР

наблюдает объект o₁(X₁), а на пути движения к этому объекту имеются

препятствия. Между объектами o₁(X₁) и o₂(X₂) препятствия отсутствуют.

Из местоположения объекта o₂(X₂) ИР становится видимым объект o₄(X₄),

а между данными объектами в ПС имеются непреодолимые для робота пре-

пятствия. Объект o₅(X₅) находится в специальном для этого “кармане 1” ИР.

Следует отметить, что сформулированное ИР задание состоит из следую-

щих двух этапов. На первом этапе ИР требуется перейти в ПС с препятст-

виями к местоположению объекта o₁(X₁). После этого захватить этот объект

и перенести его к местоположению объекта o₂(X₂). Затем поставить объ-

ект o₁(X₁) на поверхность объекта o₂(X₂).

На втором этапе ИР необходимо перейти в ПС с препятствиями к местопо-

ложению объекта o₄(X₄). После этого заменить объект o₃(X₃), находящийся

в специальной для этого нише внутри объекта o₄(X₄), на объект o₅(X₅).

Таким образом, ИР для выполнения сформулированного ему задания тре-

буется использовать типовые элементы модели представления знаний, обес-

печивающие решение следующих подзадач.

1. Построить маршрут перемещения ИР в ПС с препятствиями, при усло-

вии воспринимаемого в среде целевого местоположения (типовой элемент

представления процедурных знаний для решения данной подзадачи опреде-

ляется методом 1 ).

2. Отработать сложное действие B₁ (поставить объект o∗1(X∗1) на

объект o∗2(X∗2)) при условии, что данные объекты расположены в зоне пря-

мой видимости за пределами рабочей зоны манипулятора ИР. Здесь харак-

теристики X∗1 слота o∗1(X∗1) показывают, что первый, находящийся в ПС объ-

ект o₁(X₁), для эффективной отработки действий данного элемента модели

представления знаний должен имеет определенные габаритные размеры и

вес, позволяющие ИР захватить поднять и перенести этот объект. В свою

очередь, характеристики X∗2 слота o∗2(X∗2) показывают, что для того, чтобы

ИР мог поставить объект o₁(X₁) на объект o₂(X₂), последний должен иметь

плоскую поверхность.

Сложное действие B₁ данного элемента представления знаний состоит

из кортежа следующих элементарных действий: <подойти к объекту o∗1(X∗1)

164

(при наличии в ПС препятствий отработать данное действие, используя ме-

тод 1); захватить объект o∗1(X∗1); поднять объект o∗1(X∗1); перейти к объекту

o∗2(X∗2) (при наличии в ПС препятствий отработать данное действие, исполь-

зуя метод 1 ); поставить объект o∗1(X∗1) на поверхность объекта o∗2(X∗2) >.

3. Выполнить сложное действие B₂ [провести замену объекта o∗3(X∗3), на-

ходящегося в нише с дверцей объекта o∗4(X∗4), на объект o∗5(X∗5)]. В данном

элементе представления знаний характеристики X∗1 слота o∗1(X∗1) показыва-

ют, что имеющийся у ИР объект o₅(X₅) для эффективной отработки действий

данного элемента модели представления знаний должен удовлетворять сле-

дующему условию X∗5 ⊆ X₅. В свою очередь, для выполнения сложного дей-

ствия B₂ для объектов o₃(X₃) и o₄(X₄) соответственно должны выполняться

следующие условия X∗3 ⊆ X₃ и X∗4 ⊆ X₄.

При этом сложное действие B₂ состоит из следующего кортежа элементар-

ных действий: <подойти к объекту o∗4(X∗4) [при наличии в ПС препятствий

для отработки действия использовать метод 1 ]; открыть дверцу ниши объ-

екта o∗4(X∗4), в которой расположен объект; отключить объект o∗3(X∗3) от се-

ти питания; вынуть объект o∗3(X∗3) из ниши объекта o∗4(X∗4); опустить объект

o∗3(X∗3) на поверхность земли; достать из “кармана 1” объект o∗5(X∗5); вставить

объект o∗5(X∗5) в нишу объекта o∗4(X∗4); подключить объект o∗5(X∗5) к сети пи-

тания, закрыть крышку ниши объекта o∗4(X∗4); поднять с земли объект o∗3(X∗3)

и поместить его в “карман 2”>.

Таким образом, используя метод 3 и сформулированное задание, ИР при-

ступает к планированию целенаправленной деятельности, связанной с выпол-

нением первого этапа функционирования. Пусть на первом шаге такого пла-

нирования на основе метода 3 робот устанавливает, что для объектов o₁(X₁),

o₂(X₂) и типового элемента представления знаний “поставить объект o∗1(X∗1)

на объект o∗2(X∗2)” соответственно выполняются следующие условия X∗1 ⊆ X₁

и X∗2 ⊆ X₂. Отсюда для решения подзадачи первого этапа целенаправленной

деятельности, ИР использует типовой элемент представления знаний, связан-

ный с выполнением сложного действия B₁. Таким образом, подплан первого

этапа будет определяться кортежем элементарных действий этого сложного

действия, в котором слоты o∗1(X∗1) и o∗2(X∗2) помечены соответственно нахо-

дящимися в ПС объектами o₁(X₁) и o₂(X₂).

При этом, учитывая, что на пути движения робота к объекту o₁(X₁) в сре-

де имеются препятствия, отработка первого действия полученного подплана

поведения выполняется с привлечением по ссылке метода 1. В итоге под-

план первого этапа целенаправленной деятельности состоит из двух типовых

элементов процедурной модели представления знаний ИР.

Кроме того, исходя из того, что ИР априори неизвестны условия ПС, в

которых предстоит выполнять второй этап целенаправленной деятельности,

робот непосредственно реализует подплан поведения первого этапа. В ре-

зультате этого ИР переходит на новый участок ПС, на котором, согласно

текущим условиям функционирования, объект o₄(X₄) ему становится види-

мым. Это позволяет ИР на втором этапе планирования целенаправленной

165

деятельности, для достижения соответствующей ему подцели, выбрать эле-

мент представления знаний, соответствующий сложному действию B₂.

Пусть для объектов ПС o₃(X₃), o₄(X₄) и o₅(X₅), а также данного элемен-

та представления знаний, соответственно выполняются следующие условия

X∗3 ⊆ X₃, X∗4 ⊆ X₄ и X∗5 ⊆ X₅. В этом случае, согласно методу 3, подплан це-

ленаправленной деятельности ИР второго этапа будет состоять из кортежа

элементарных действий сложного действия B₂, в котором слоты помечены

удовлетворяющими их требованиям объектами ПС. При этом первое дей-

ствие этого кортежа выполняется с привлечением выбранного по его ссылке

метода 1.

В итоге выполнение сформулированного ИР задания сводится к отработке

следующего кортежа сложных действий 〈B₁, B₂〉, в которых первые элемен-

тарные действия “подойти к заданному объекту” реализуются с привлечением

метода 1.

Задача 2. Рассмотрим случай, когда ИР на одном из этапов требует-

ся решить несколько взаимосвязанных между собой подзадач. Например,

“снять объект o₅(X₅), расположенный на объекте o₆(X₆)” и “заменить объ-

ект o₇(X₇), находящийся в закрытой дверцей нише объекта o₈(X₈), на объ-

ект o₅(X₅)”.

В этом случае для планирования целенаправленной деятельности ИР ис-

пользует метод 4. При этом сформированный подплан целенаправленной

деятельности ИР будет состоять из следующего кортежа типовых элемен-

тов модели представления знаний <сложное действие B₃, сложное действие

B₂>. Здесь третье сложное действие определяется следующим типовом эле-

ментом B₃ (снять объект o∗5(X∗5), расположенный на объекте o∗6(X∗6)). При

этом, если на пути движения ИР к объекту o₆(X₆) и пути перехода от место-

положения объекта o₆(X₆) к местоположению в ПС объекта o₈(X₈) имеются

препятствия, то первые элементарные действия сложных действий B₃ и B₂

отрабатываются роботом с привлечением для этого метода 1.

П.2. Доказательство сформулированного утверждения

Доказательство предложения

1. Справедливость сформулиро-

ванного предложения вытекает из следующих соображений.

1. На каждом j₁₂ шаге вывода решений сравниваются между собой семан-

тические сети, представляющие собой помеченные графы. Следовательно,

количество сравнений между собой пометок имеющихся в них структурно

эквивалентных вершин и ребер не может превышать величины, равной n²

j₁₂

2. Каждый шаг вывода решений в процессе построения плана целенаправ-

ленного поведения на текущем этапе деятельности сводится к выбору путем

направленного перебора акта поведения, удовлетворяющего следующим усло-

виям: SИi(j4) ≈ SИj

,SЦi(j4) ≈ SИi(j6) и SЦi(j6) ≈ SЦ .j

Таким образом, количество сравнений пометок в сопоставляемых между

собой семантических сетях, в лучшем случае, когда результативный акт по-

166

ведения выбирается в первую очередь (что вполне вероятно), может быть не

менее трех. Следовательно, в течение δ шагов синтеза дерева вывода реше-

ний, исходя из п. 1 проводимого доказательства, количество таких сравнений

∑_δ

не может быть менее величины, равной 3δ

n²

j₁₂=1

j₁₂

В худшем же случае, когда необходимое импликативное решающее прави-

ло определяется в последнюю очередь, количество сравнений пометок в со-

поставляемых между собой семантических сетях на каждом j₁₂ шаге вывода

решений выполняется не более λ раз. Следовательно, количество сравнений

между собой пометок структурно эквивалентных вершин и ребер в сопостав-

ляемых семантических сетях на протяжении всего процесса построения дере-

ва вывода решений, состоящего из δ шагов, не может превышать величины,

∑_δ

равной 3δλ

n²

j₁₂=1

j₁₂

3. Из пп. 1-2 проводимого доказательства с очевидностью следует спра-

ведливость сформулированного предложения.

СПИСОК ЛИТЕРАТУРЫ

Melekhin V.B., Khachumov M.V. Planning polyphasic behavior of autonomous

intelligent mobile systems in uncertain environments // Inform. Control. Syst. 2021.

V. 113. No. 4. P. 28-36.

Амосов Н.М. Алгоритмы разума. Киев: Наукова думка, 1979.

Kelly A. Mobile Robotics: Mathematics, Models, and Methods. Cambridge: Cam-

bridge University Press, 2013.

Давыдов О.И., Платонов А.К. Роботы и искусственный интеллект. Технокра-

тический подход // Препринт ИПМ им. М.В. Келдыша. 2017. № 112. 24 с.

Гаазе-Рапопорт М.Г., Поспелов Д.А. От амебы к роботу. Модели поведения.

4 изд., стереотип. М.: URSS, 2019.

Kober J., Peters J. Learning Motor Skills: From Algorithms to Robot Experiments.

Cham: Springer, 2014.

Абасов И.Б., Игнатьев В.В., Орехов В.В. Дизайн автономного мобильного ро-

бототехнического комплекса // Междунар. науч.-исслед. журн. 2019. № 1-1.

С. 3340-3351.

Russell S., Norvig P. Artificial Intelligence: A Modern Approach. 4 ed. Pearson,

2020.

Вагин В.Н. Дедуктивный вывод на знаниях / Искусственный интеллект. В 3-х

кн. Кн. 2. Методы и модели. Справочник: под ред. Д.А. Поспелова. М.: Радио

и связь, 1990. С. 89-105.

10.

Абросимов В.К. Нейронная пространственно-временная модель движения объ-

ектов управления //Нейрокомпьютеры. Разработка, применение. 2014. № 3.

С. 26-35.

11.

Бодин О.Н., Безбородова О.Е., Спиркин А.Н., Шерстнев В.В. Бионические си-

стемы управления робототехническими комплексами. Пенза: ПГУ, 2022.

12.

Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволю-

ционной кибернетики. М.: Ленанд, 2019.

13.

Каляев А.В., Чернухин Ю.В., Носков В.Н., Каляев И.А. Однородные управ-

ляющие структуры адаптивных роботов. М.: Наука, 1990.

167

14.

Мелехин В.Б., Хачумов М.В. Планирование поведения автономных интеллек-

туальных систем в условиях неопределенности: под ред. проф. М.В. Хачумова.

СПб.: Политехника, 2022.

15.

Павловский В.Е., Павловский В.В. Технологии SLAM для подвижных роботов:

состояние и перспективы // Мехатроника, автоматизация, управление. 2016.

Т. 1. № 6. С. 384-394.

16.

Labbe M., Michaud F. RTAB-Map as an open-source lidar and visual simultaneous

localization and mapping library for large-scale and long-term online operation //

Field Robotics. 2019. No. 35. P. 416-446.

17.

Носков В.П., Рубцов И.В. Ключевые вопросы создания интеллектуальных мо-

бильных роботов // Инженер. журн.: наука и инновации. 2013. Вып. 3. С. 1-11.

18.

Заева К.А., Семенов А.Б. Метод маршрутизации с препятствиями на основе

параллельных вычислений // Вестник ТвГУ. Прикладная математика. 2016.

Вып. 3. С. 85-95.

19.

Tomas L.P., Michael A.W. An algorithm for planning collision-free paths among

polyhedral obstacles // Commun. ACM. 1979. Vol. 22. No. 10. P. 560-570.

20.

Поспелов Д.А. Ситуационное управление: теория и практика. 2-е изд., стереотип.

М.: URSS, 2022.

21.

Мелехин В.Б., Хачумов М.В. Элементы понятийного мышления в планировании

поведения автономных интеллектуальных агентов // Мехатроника, автоматиза-

ция, управление. 2021. Т. 22. № 8. С. 411-419.

22.

Melekhin V.B., Khachumov M.V. Fuzzy semantic networks as an adaptive model

of knowledge representation of autonomous intelligent systems // Sci. Tech. Inf.

Process. 2021. Vol. 48. No. 5. P. 1-8.

23.

Заде Л. Понятие лингвистической переменной и его применение для принятия

приближенных решений: пер. с англ. М.: Мир, 1976.

24.

Мелехин В.Б., Хачумов М.В. Процедуры самообучения автономных интеллек-

туальных мобильных систем в нестабильных априори неописанных проблемных

средах // Мехатроника, автоматизация, управление. 2022. Т. 23. № 7. С. 356-366.

25.

Мелехин В.Б., Хачумов М.В. Принцип построения процедур планирования

поведения автономных интеллектуальных роботов на основе полипеременных

условно-зависимых предикатов // АиТ. 2022. № 4. С. 140-154.

Статья представлена к публикации членом редколлегии О.П. Кузнецовым.

Поступила в редакцию 20.07.2022

После доработки 09.06.2023

Принята к публикации 30.09.2023

168