Автоматика и телемеханика, № 12, 2023
Оптимизация, системный анализ
и исследование операций
© 2023 г. В.Б. МЕЛЕХИН, д-р техн. наук (pashka1602@rambler.ru)
(Дагестанский государственный технический университет, Махачкала),
М.В. ХАЧУМОВ, канд. физ.-мат. наук (khmike@inbox.ru)
(Институт программных систем им. А.К. Айламазяна РАН,
г. Переславль-Залесский;
Федеральный исследовательский центр
“Информатика и управление” РАН, Москва;
Российский университет дружбы народов, Москва)
ПЛАНИРОВАНИЕ МНОГОЭТАПНОЙ ДЕЯТЕЛЬНОСТИ
ИНТЕЛЛЕКТУАЛЬНЫМ РОБОТОМ
В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ1
Показана актуальность создания интеллектуальных роботов различно-
го назначения, способных эффективным образом решать сложные мно-
гоэтапные задачи целенаправленной деятельности в априори неописан-
ных проблемных средах. Предложены оригинальные по содержанию эле-
менты продукционной модели представления знаний безотносительно к
конкретной предметной области. Построенная таким образом модель
представления знаний позволяет интеллектуальным роботам автомати-
чески планировать целенаправленную деятельность в условиях неопре-
деленности, опираясь на обобщенное описание возможных закономерно-
стей проблемной среды. Разработаны процедуры автоматического син-
теза графа “видимости”, определяющего формальным образом воспри-
нимаемый интеллектуальным роботом участок проблемной среды. Это,
в свою очередь, позволяет роботу автоматически формировать локально-
оптимальный маршрут целенаправленного перемещения в априори неопи-
санных условиях функционирования. Синтезированы процедуры автома-
тического планирования интеллектуальным роботом целенаправленной
деятельности, связанной с преобразованием текущей ситуации проблем-
ной среды в заданную целевую ситуацию в условиях неопределенности.
Ключевые слова: интеллектуальный робот, многоэтапное поведение, про-
блемная среда, элементы модели представления знаний, акты поведения,
граф “видимости”, планирование целенаправленной деятельности.
DOI: 10.31857/S0005231023120127, EDN: NGVHRW
1. Введение
Создание интеллектуальных роботов (ИР) различного назначения, спо-
собных решать сложные многоэтапные задачи в условиях неопределенности,
сводящиеся к необходимости перехода с одного участка проблемной среды
1 Работа выполнена при финансовой поддержке Российского научного фонда (грант
№ 21-71-10056), https://rscf.ru/project/21-71-10056.
146
(ПС) на другие ее участки с целью перевода текущей ситуации в требуемое
целевое состояние, является одной из актуальных и сложных проблем искус-
ственного интеллекта.
В общем случае многоэтапная целенаправленная деятельность ИР скла-
дывается из ряда этапов, взаимосвязанных между собой достижением общей
заданной роботу цели. Каждый такой этап может быть связан с характерным
для него видом целенаправленной деятельности ИР. Достижение же теку-
щей подцели поведения на отдельном его этапе является предпосылкой для
перехода робота на следующий этап целенаправленной деятельности и т.д.
до выполнения ИР полученного задания. Иначе говоря, многоэтапная дея-
тельность ИР на каждом участке ПС, как правило, состоит из следующих
двух фаз. В первой фазе целенаправленной деятельности ИР автоматиче-
ски строит и отрабатывает маршрут перемещения из исходного к целевому
местоположению на заданном участке ПС. Во второй фазе ИР планирует
и отрабатывает упорядоченную последовательность действий, позволяющих
выполнить преобразование исходной ситуации на текущем участке проблем-
ной среды в заданную целевую ситуацию.
К одной из попыток решения данной сложной проблемы следует отне-
сти когнитивные инструменты планирования ИР полифазной деятельности,
предложенные в [1]. Однако модель представления знаний, на которую опи-
раются в процессе вывода решений данные когнитивные инструменты, не
позволяет в полной мере учитывать сложившиеся в ПС условия функциони-
рования, влияющие на текущие функциональные возможности ИР. Другими
словами, используемая в данном случае модель представления и обработки
знаний не позволяет наделить ИР способностью на альтернативной основе ав-
томатически формировать наиболее эффективный по принятой “стоимости”
план многоэтапной деятельности, учитывающий сложившиеся в ПС условия
функционирования. Например, при наличии грязи после дождя, препятст-
вующей эффективному перемещению ИР в ПС. Это, в свою очередь, при-
водит к необходимости корректировки сформированного плана целенаправ-
ленной деятельности во время его реализации с учетом наблюдаемых в ПС
неучтенных в процессе планирования особенностей. Либо ИР вынужден реа-
лизовать не совсем эффективный по принятой “стоимости” план целенаправ-
ленной деятельности.
Что же касается использования в рассматриваемом случае известных ал-
горитмических моделей представления и обработки знаний [2], позволяю-
щих организовать планирование целенаправленной деятельности ИР, напри-
мер [3-7], то такие модели фактически не предусматривают возможности ре-
шения интеллектуальным роботом сложных многоэтапных задач в условиях
неопределенности. Помимо этого, алгоритмический подход к созданию ин-
теллектуальных решателей задач имеет существенный недостаток, препятст-
вующий построению ИР, которые способны целенаправленно функциониро-
вать в условиях неопределенности. Этот недостаток заключается в том, что
применение алгоритмических методов вывода решений требует разработки
147
подробной модели представления знаний, ориентированной на выполнение
ИР конкретных заданий в текущих условиях функционирования. Формули-
руемая ИР цель поведения в этом случае достигается путем планирования и
отработки действий, обеспечивающих целенаправленное изменение значений
отношений пространства состояний между различными объектами проблем-
ной среды в пределах разрешающей способности подсистемы его техническо-
го зрения. Иначе говоря, известные методы планирования целенаправленной
деятельности ИР, базирующиеся на аксиоматическом подходе вывода реше-
ний с применением логики предикатов первого порядка и ее различных мо-
дификаций, не позволяют решать многоэтапные задачи в условиях неопре-
деленности [8]. Это связано с тем, что они требуют подробного формального
описания закономерностей ПС и применения в худшем случае сложных про-
цедур вывода решений методом перебора с экспоненциальной сложностью [9].
В свою очередь, для сетевого подхода к созданию интеллектуальных ре-
шателей задач ИР, связанного с использованием нейронных сетей для пред-
ставления и обработки знаний [10, 11], характерны те же основные недостат-
ки, что и для алгоритмического подхода. Данное обстоятельство обусловлено
следующими двумя особенностями организации современного сетевого интел-
лекта. Во-первых, с моделированием на ЭВМ процессов вывода решений на
нейронных сетях. Такое моделирование нейросетевых технологий фактиче-
ски сводит процессы планирования целенаправленной деятельности ИР на
основе решателя задач, организованного по принципу сетевого интеллекта,
к процессам, свойственным алгоритмическому интеллекту. Во-вторых, ней-
ронные сети в рассматриваемом случае, как правило, должны отражать по-
дробное формальное описание закономерностей текущих условий функцио-
нирования ИР. Это, в свою очередь, не позволяет роботу решать задачи в
условиях неопределенности и требует предварительного обучения нейронных
сетей [12].
Кроме того, на практике построить подробную модель закономерностей
реальной сложной ПС не представляется возможным [13], особенно если речь
идет о труднодоступных и агрессивных для человека средах, в которых в
основном и предстоит функционировать ИР.
Таким образом, отмеченные выше обстоятельства приводят к объектив-
ной необходимости разработки элементов процедурной модели представления
знаний безотносительно к конкретной предметной области, позволяющих ИР
адаптироваться к различным априори неописанным условиям функциониро-
вания [14]. Кроме того, такие элементы представления знаний должны обес-
печивать ИР возможность планирования целенаправленной деятельности с
учетом влияния текущих условий ПС на функциональные возможности ро-
бота.
Следует также отметить, что для планирования целенаправленных пере-
мещений ИР в априори неописанной проблемной среде в настоящее время
широко используются SLAM методы [15, 16]. На основе данных методов вна-
чале строится формальное описание карты местности в виде помеченного гра-
148
фа, которая затем используется для маршрутизации перемещений ИР в ПС.
С этой целью применяется один из методов поиска оптимального пути на
графах [17]. Однако учитывая, что в процессе многоэтапной деятельности
задача маршрутизации движения ИР решается в реальном времени, приме-
нение в рассматриваем случае SLAM методов является нецелесообразным.
В этой связи в работе предлагается оригинальный эвристический метод фор-
мирования модели воспринимаемого участка среды в виде графа “видимо-
сти”. Автоматическое построение такого графа позволяет ИР параллельно
с его синтезом сформировать локально-оптимальный маршрут движения к
целевому местоположению. Кроме того, предложенный метод маршрутиза-
ции движения ИР в отличие от SLAM методов, а также известных методов
построения графов “видимости” [18, 19], не требует выполнения трудоемких
вычислений.
Помимо метода планирования перемещений ИР в условиях неопределен-
ности в настоящей статье предлагаются также различные элементы модели
представления и обработки знаний безотносительно к конкретной предмет-
ной области. Использование такого вида элементов представления знаний
позволяет ИР организовать модельный подход к организации вывода реше-
ний в процессе автоматического планирования многоэтапной целенаправлен-
ной деятельности в априори неописанных и нестабильных условиях ПС. При
этом предлагаемая в статье модель представления и обработки знаний позво-
ляет ИР организовать планирование многоэтапной деятельности в условиях
неопределенности с приемлемой для бортовой ЭВМ полиномиальной слож-
ностью.
2. Постановка задачи
Рассмотрим ИР как мобильную систему, оснащенную манипулятором, ко-
торая ориентирована на решение определенного класса задач. Как правило,
такая система состоит из сенсорной, решающей и моторной подсистем [4].
Сенсорная подсистема ИР включает модуль технического зрения и ряд дат-
чиков, связанных с управлением навигацией робота в ПС, а также обеспече-
нием данными, необходимыми для проведения анализа условий и результатов
отработки различных действий. Решающая подсистема ИР состоит из базы
знаний, в которой хранится модель их представления, и интеллектуально-
го решателя задач, предназначенного для планирования многоэтапной дея-
тельности, связанной с выполнением сформулированного интеллектуальному
роботу задания. Моторная подсистема служит для отработки различных дей-
ствий в процессе перемещения ИР в ПС и манипулирования находящимися
в среде объектами в процессе целенаправленного преобразования текущей
ситуации в целевую ситуацию проблемной среды.
Таким образом, ИР можно охарактеризовать множеством отрабатывае-
мых элементарных действий B = {bi1 }, i1 = 1, n1, например, поднять объ-
ект, подойти, захватить объект и т.д.; множествами объектов O = {o2(Xi2 )},
i2 = 1,n2 и событий D = {di3 (Yi3 )}, i3 = 1,n3, соответственно находящихся и
происходящих в ПС, которые интеллектуальный робот способен распознать,
149
планируя целенаправленную деятельность. Здесь Xi2 и Yi3 - множества ха-
рактеристик, соответственно определяющих объекты и события ПС. В общем
же случае функциональные возможности ИР определяются заданной моде-
лью представленных в общем виде знаний и процедурами автоматического
планирования целенаправленной деятельности в различных условиях априо-
ри неописанной ПС.
В свою очередь, нестабильную ПС в общем случае можно охарактеризо-
вать
— множеством находящихся в среде объектов oi2 (Xi2 ) ∈ O;
— происходящими независимо от деятельности ИР событиями di3 (Yi3 ) ∈ D,
спонтанное проявление которых в проблемной среде может препятствовать
результативной отработке интеллектуальным роботом элементарных дей-
ствий bi1 ∈ B;
— различным видом семантических отношений [20] R = {ri4 }, i4 = 1, n4,
которые выполняются в ПС между объектами, событиями и находящимся в
среде ИР.
В целом же ПС определяется сложившейся в ней текущей ситуацией
S = {Si5}, i5 = 1,n5, содержание которой зависит от состояния находящих-
ся в ней объектов oi2 (Xi2 ) ∈ O и происходящих di3 (Yi3 ) ∈ D, а также видом
и значениями выполняющихся в среде отношений ri4 ∈ R между объектами,
событиями и ИР.
Задание к выполнению ИР получает в декларативно-процедурной фор-
ме представления в виде упорядоченной последовательности сложных дей-
ствий Bj1 , j1 = 1, m1 [21] и условий, которые должны выполняться в ПС для
их результативной отработки. В общем случае целевое задание имеет следую-
щую структуру и содержание:
< SИ1 &B1j
→ SЦ1 &B2j
→ SЦ2 ,... ,SЦk-1&Bkj
→ SЦk >,
1
1
1
где, например, SИ1 и SЦ1 - описание в обобщенном виде соответственно ис-
ходных условий и условий, отражающих достижение подцели соответствую-
щего этапа целенаправленной деятельности. Таким образом, в рассматри-
ваемом случае целевая ситуация предыдущего этапа поведения, например,
SЦ1 определяет исходную ситуацию SИ2 для следующего этапа целенаправ-
ленной деятельности ИР.
Сложные действия Bj1 состоят из кортежей элементарных действий
bi1 ∈ B и фактически отражают содержание соответствующего им этапа це-
ленаправленной деятельности ИР. Например, полученное ИР задание может
иметь следующее содержание: “найти на заданном участке ПС определен-
ного вида объекты, перевести их в необходимое состояние или перенести в
заданное местоположение”. При этом, если результативность определенных
действий bi1 ∈ B зависит от текущего состояния ПС, то их отработка сопро-
вождается проверкой определенного условия. По ее результатам либо дей-
ствие непосредственно выполняется ИР, либо выбирается по ссылке другой
150
элемент модели представления знаний, позволяющий ИР отработать данное
действие с учетом сложившихся в ПС условий. Например, действие подойти
к объекту может быть непосредственно отработано по прямой линии движе-
ния только при отсутствии препятствий на пути перемещения ИР к этому
объекту. В случае же наличия в ПС таких препятствий для отработки дан-
ного действия ИР требуется предварительно сформировать план движения
к заданному объекту по проходимым между препятствиями участкам среды.
Такой подход к построению типовых элементов модели представления знаний
позволяет существенным образом
— снизить сложность процесса вывода решений за счет автоматического
перехода по ссылкам от одного к другому типовому элементу представления
знаний;
— сократить их количество за счет возможности использования одного и
того же элемента для решения одной и той же по назначению подзадачи в
различных условиях ПС.
Требуется, опираясь на вышеизложенное описание ИР, проблемной среды
и заданной роботу цели, разработать такие типовые элементы модели пред-
ставления знаний, которые позволяют автоматически строить планы много-
этапной деятельности в сложных априори неописанных условиях ПС. В об-
щем случае такой план целенаправленной деятельности ИР представляет со-
бой дерево вывода решений в пространстве состояний [8].
Следует отметить, что решение подзадач, связанных с распознаванием
различных образов ПС в процессе планирования ИР целенаправленной дея-
тельности, является самостоятельной проблемой, требующей отдельного об-
суждения, и в настоящей статье по причине ее ограниченного объема не рас-
сматривается.
3. Типовые элементы модели представления знаний ИР
В общем случае модель представления знаний состоит из декларативных
и процедурных элементов, позволяющих ИР планировать многоэтапную дея-
тельность в условиях неопределенности. Декларативные элементы модели
представления знаний предназначены для формального описания допусти-
мых ситуаций (состояний) ПС Si5 ∈ S, а также их отдельных фрагментов
ΔSj2i5 ⊂ Si5 , j2 = 1, m2. Данные фрагменты ситуаций ПС служат для построе-
ния различных элементов процедурной модели представления знаний ИР.
Здесь m2 - множество допустимых фрагментов (частей), на которые допус-
кается разбиение текущих ситуаций ПС Si5 ∈ S.
Следует отметить, что минимальный допустимый фрагмент текущей си-
туации ПС может состоять из двух объектов или одного объекта среды и ИР,
а также отношений, которые выполняются между ними в проблемной среде.
Процедурные знания представляют собой набор элементов, определяющих
безотносительно к конкретной предметной области решение различного ви-
да типовых подзадач целенаправленной деятельности, т.е. “кирпичиков”, на
основе которых ИР планирует свое поведение.
151
Формальное представление различных ситуаций ПС и их фрагментов за-
висит от роли, которую они выполняют в процессе вывода решений. Так,
для обобщенного представления различных аналогичных друг другу ситуа-
ций Si5 ∈ S и их фрагментов ΔSj2i5 ⊂ Si5 , предназначенных для построения
типовых элементов модели представления процедурных знаний ИР безотно-
сительно к конкретной предметной области, используются активные нечет-
кие семантические сети [22]. Для описания же текущих ситуаций ПС служат
классические семантические сети [8].
В общем случае активные нечеткие семантические сети, служащие для
обобщенного описания различных ситуаций Si5 ∈ S и их отдельных частей
ΔSi5 ⊂ Si5 , представляют собой нечетко помеченный граф Ga = (v0,Va,Ea).
Здесь v0 - базовая вершина сети, определяемая ИР, Va, Ea - соответственно
множества активных вершин и ребер. Активные вершины vi6 ∈ Va, Va = {vi6 },
i6 = 1,n6 согласно их назначению представляются слотами O = {o∗i7 (X )},i
7
i7 = 1,n7 и D = {d∗i8 (Y∗i)}, i8 = 1, n8, которые в текущих условиях ПС по-
8
мечаются соответственно находящимися в среде объектами oi2 (Xi2 ) ∈ O и
происходящими в ней событиями di3 (Yi3 ) ∈ D. Активные вершины vi6 ∈ Va
в нечеткой семантической сети Ga, определяемые слотами o∗i7 (X ) ∈ O иi
7
d∗i8 (Y∗i) ∈ D, могут быть помечены конкретными объектами oi2(Xi2) и собы-
8
тиями di3 (Yi3 ) ПС, если они удовлетворяют следующим условиям X∗i
⊆Xi2
7
иY∗i
⊆Yi3.
8
Активные ребра ei9 ∈ Ea, Ea = {ei9 }, i9 = 1, n9 могут быть неориен-
тированными и ориентированными. Неориентированные ребра e0
∈E01
;
(
)<
в сети G0 помечаются следующими тройками T∗j
(ri4 ) , r∗j3 , r
, где
3
j3+1
T∗j
(ri4 ) — j3 терм лингвистической переменной (в общем случае j3 = 1, 5 [23])
3
с названием, совпадающим с наименованием соответствующего отношения
ri4(Xi4 ) ∈ R, выполняющегося в ПС между двумя объектами или объектом
и ИР; (r∗j3 , r∗j3+1) — соответственно нижняя и верхняя границы подынтервала
численных значений терма T∗j
(ri4 ) на шкале количественных оценок соответ-
3
ствующей лингвистической переменной.
Ориентированные ребра ei9 ∈ Ea помечаются следующими тройками
< Fi9,(t1j2,t2j2) >, где Fi9 - множество характеристик, описывающих влияние
событий di3 (Yi3 ) ∈ D, определяемых активной вершиной d∗i8 (Y) ∈ D, на со-i
8
стояние ПС при их появлении; (t1j2 , t2 ) - интервал времени t, в течение кото-j
2
рого может проявиться результат влияния событий di3 (Yi3 ) ∈ D на текущую
деятельность ИР. Кроме того, события di3 (Yi3 ) ∈ D могут также влиять на со-
стояние объекта ПС oi2 (Xi2 ) ∈ O, удовлетворяющего требованиям активной
вершины o∗i7 (X ) ∈ O, в которую это ребро входит.i
7
Текущие ситуации ПС Si5 ∈ S в модели представления знаний АР описы-
ваются семантическими сетями, представляющими собой помеченный граф
,Ei5 ), который формируется в сенсорной подсистеме интел-i
Gi5i10 =(v0,
i10
10
лектуального робота на основе информации, поступающей из проблемной
среды. Здесь v0 - ключевая помеченная ИР вершина, относительно кото-
152
рой формируется семантическая сеть. Остальные же вершины Vi5i10 ={vi11},
i11 = 1,n11 графа Gi5 в соответствии с их назначением определяются нахо-i
10
дящимися в ПС объектами oi2 (Xi2 ) ∈ O и происходящими в ней событиями
di3 (Yi3 ) ∈ D. Ребра Ei5i10 ={ei12},i12=1,n12всетиGi50 могутбытьтакже1
ориентированными и неориентированными. Неориентированные ребра в се-
ти Gi5i10 помечаютсяколичественнымиоценкамиri4отношенийri4(Xi4)∈R,
которые выполняются в ПС между ИР и находящимися в ней объектами.
Ориентированные же ребра ei12 ∈ Ei5 , определяющие характер влияния про-i
10
исходящих в среде событий на находящиеся в ней объекты и текущую дея-
тельность ИР, помечаются так же, как и в активных нечетких семантических
сетях тройками < Fi9 , (t1j2 , t2 ) >.j
2
Содержание и структура типовых элементов процедурной модели пред-
ставления знаний определяются функциональным назначением ИР. В общем
случае такие элементы представления знаний с учетом их функционального
назначения могут быть следующих видов.
1. Импликативные решающие правила, позволяющие ИР выявлять необ-
ходимые для достижения заданной подцели процедуры автоматического по-
строения маршрута целенаправленного перемещения в ПС
(1)
Fj4 :
(j4)&Bj1 (j4) → SЦi(j4), j4
= 1, 3,
i5
5
где Fj4 - идентификатор, определяющий назначение решаемой на основе
j4 правила подзадачи, например, “маршрутизация движения в ПС с препят-
ствиями”; SИi(j4) - исходная ситуация участка ПС, на котором ИР находится
5
в текущий момент времени; SЦi(j4) - ситуация, определяющая участок проб-
5
лемной среды, на который ИР требуется перейти для достижения заданной
подцели текущего этапа поведения; Bj1 (j4) - метод планирования маршрута
движения, связанного с переходом ИР в текущее целевое местоположение.
2. Элементы представления знаний, характеризующие требуемые исход-
ные условия и результаты отработки ИР элементарных действий bi1 ∈ B
(2)
(j5)&bi1 (j5) ΔSРi
(j5) , j5 = 1,m4,
Fj5 : Δ
i1
1
где Fj5 - идентификатор подзадачи, решение которой обеспечивает ИР полу-
чение локального результата ΔSРi(j5); ΔSИi(j5)&bi1 (j5) ΔSРi(j5) - элемен-
1
1
1
тарный акт поведения ИР, показывающий, что если в текущей ситуации ПС
Si5 ∈ S выполняется условие ΔSИi(j5) ⊂ Si5 , то для получения в среде локаль-
1
ного результата ΔSРi(j5) роботу следует отработать действие bi1 (j5); m5 - под-
1
множество допустимых фрагментов ΔSИi(j5) ⊂ Si5 , определяющих различные
1
локальные условия, которые могут возникнуть в текущей ситуации ПС.
Таким образом, импликативные решающие правила (2) позволяют ИР
устанавливать различные действия bi1 (j5) ∈ B, которые после их отработки
в ПС приводят к получению результата ΔSРi(j5) в соответствии со сложив-
1
шимися в проблемной среде локальными условиями ΔSИi(j4).
1
153
При этом множество элементов представления знаний (2) целесообразно
разбить на классы эквивалентности по идентичности получаемого на их ос-
нове результата ΔSРi(j5). Каждый такой класс определяется либо идентифи-
1
катором Fj5 , либо локальным результатом ΔSРi(j5), который ИР требуется
1
получить для достижения текущей подцели поведения. Следовательно, если
ИР в текущий момент времени необходимо обеспечить локальный результат
ΔSРi(j5) в текущей ситуации ПС Si5 ∈ S, то по соответствующему ему со-
1
держанию в модели представления знаний в первую очередь определяется
обеспечивающий этот результат класс элементов модели представления зна-
ний (2). Затем в выбранном классе устанавливается типовой элемент пред-
ставления знаний, у которого фрагменты ΔSИi(j5) и ΔSРi(j5) являются нечет-
1
1
ко вложенными соответственно в текущую и целевую ситуации проблемной
среды. Например, таким образом группируются в один класс эквивалентно-
сти все действия, связанные с изменением местоположения различных объек-
тов в ПС. Так, одни объекты из-за их габаритных размеров и веса ИР может
поднять и перенести, вторые только перекатить, а третьи — перетащить и т.п.
3. Описание в модели представления знаний ИР условий и результатов
выполнения сложных действий Bj1 определяется следующими актами пове-
дения:
[
(
)
Fj6 :
(j6)&Bj1 S1,Иi
(j6) &b1i
ΔS1,Рi
(j6) ΔS2,Иi
(j6) &b2
i5
1
1
1
1
i1
(3)
]
ΔS2,Рi(j6) ≈, . . . , ≈ΔSk,Иi(j6)&bki
ΔSk,Рi(j6)
⇒SЦi(j6) , j6 = 1, m6.
1
1
1
1
5
Импликативные решающие правила (3) означают следующее. Если теку-
щее состояние ПС определяется ситуацией Si5 ∈ S, в которую нечетко вло-
жено обобщенное описание SИi(j6) аналогичных друг другу допустимых под-
5
ситуаций проблемной среды, то для ее преобразования в целевую ситуа-
цию, определяющуюся обобщенным описанием SЦi(j6), ИР требуется выпол-
5
нить сложное действие Bj1 , состоящее из кортежа элементарных действий
<b1i1,b2i1,...,bk
>. Здесь — знак нечеткого равенства сравниваемых меж-
i1
ду собой семантических сетей.
4. Для планирования многоэтапной деятельности в ПС, в которой спонтан-
но возникают события di3 (Yi3 ) ∈ D, негативно влияющие (препятствующие
эффективной результативной отработке роботом определенных действий) на
целенаправленную деятельность ИР, для построения подплана поведения,
связанного со снижением и устранением такого влияния, используются сле-
дующие два вида импликативных решающих правил.
Первый вид данных импликативных решающих правил имеет следующую
структуру и содержание:
(4)
Fj7 : < Δ
i5
(j7), d∗i
(Y∗i
) > &bi1(j7) Δd∗i8(Y ∗i)j5 , j7 = 1,m7,
8
8
8
где элементарный акт поведения ΔSИi(j7)&bi1 (j7)Δd∗i8 (Y) означает, чтоi
5
8
если в текущую ситуацию ПС Si5 ∈ S нечетко вложен фрагмент ΔSИi(j7), то
5
154
при появлении в проблемной среде события di3 (Yi3 ) ∈ D, удовлетворяюще-
го требованиям слота d∗i8 (Y) ∈ D, отработка ИР элементарного действияi
8
bi1(j7) позволяет снизить Δd∗i8(Y∗i)j5 его негативное влияние на дальнейшую
8
целенаправленную деятельность робота.
Второй вид таких правил вывода имеет следующее представление:
(5)
Fj8 :<
i5
(j8), SРi(j8), d∗i
(Y∗i
) > &Bj1(j8) →d∗i8(Y ∗i), j8 = 1,m8,
5
8
8
8
где импликативные решающие правила (5) означают следующее. Если теку-
щая ситуация ПС Si5 является нечетко равной обобщенному описанию SИi(j8)
5
аналогичных друг другу ситуаций проблемной среды, а заданная ИР цель по-
ведения представлена семантической сетью SРi(j8), то при появлении в среде
5
событий di3 (Yi3 ) ∈ D, удовлетворяющих требованиям слота d∗i8 (Y) ∈ D, вы-i
8
полнение роботом сложного действия Bj1 (j8) позволяет устранить d∗i8 (Y)i
8
негативное влияние этого события на дальнейшую целенаправленную дея-
тельность.
Например, при наличии в ПС тумана, ИР для избегания столкновения с
различными находящимися в среде объектами, используя правило (4), опре-
деляет, что ему в этом случае требуется снизить скорость своего передвиже-
ния и т.п.
Следует отметить, что множества решающих правил (3)-(5) по характер-
ному для них общему признаку (например, назначению), как и правила (2),
разбиваются на соответствующие им классы эквивалентности. Это позволяет
ИР эффективным образом определять результативные решающие правила на
каждом этапе планирования целенаправленной деятельности в соответствии
с текущими условиями ПС и заданной подцелью поведения.
4. Методы планирования многоэтапной деятельности ИР
Как уже отмечалось выше, на каждом этапе целенаправленной деятель-
ности ИР в ПС с препятствиями, как правило, требуется автоматическое по-
строение маршрута перемещения для перехода с одного участка проблемной
среды на другой ее участок. В процессе решения данной подзадачи на осно-
ве типовых элементов представления знаний (1) ИР может столкнуться со
следующими тремя случаями:
— целевое местоположение находится в зоне прямой видимости сенсорной
подсистемы робота, а на пути движения к нему имеются препятствия;
— интеллектуальному роботу известны только координаты своего целевого
местоположения в ПС с препятствиями;
— требуется найти заданные объекты в априори неописанной ПС с пре-
пятствиями.
В первом случае для построения маршрута движения к целевому место-
положению в среде с препятствиями, габаритные размеры и координаты ме-
стоположения которых в ПС априори роботу не известны, используется ме-
155
Построение ИР графа “видимости” для выбора эффективного марш-
рута движения к целевому местоположению: (p1-p6) - препятствия;
(ОНП1-ОНП3) - основные направления перемещения; (М14) -
альтернативные маршруты движения к целевому местоположению.
тод 1. На основе метода 1 и данных, поступающих из сенсорной подси-
стемы ИР, в его интеллектуальном решателе задач строится граф “видимо-
сти” GB = (VB, EB). Здесь VB = {vi13 }, i13 = 1, n13 - множество вершин, со-
ответствующих проходимым между препятствиями зонам ПС; EB = {ei14 },
i14 = 1,n14 - множество ребер, определяющих связь между смежными про-
ходимыми зонами ПС, которые определяются “затратами”, связанными с пе-
реходом ИР от одной такой зоны к смежной с ней в проблемной среде зоне.
Параллельно построению данного графа выбирается также и направление
перемещения ИР на каждом шаге целенаправленного движения.
В общем случае метод 1 автоматического построения графа “видимости”
GB = (VB, EB) и локально-оптимального маршрута целенаправленного дви-
жения ИР к воспринимаемому целевому местоположению (при отсутствии
формального описания карты местности) можно представить следующим об-
разом:
1. Принять в качестве исходной вершины v0i13 (0) ∈ VB или истока графа
“видимости”, имеющего нулевую условную стоимость, исходное местополо-
жение ИР (см. рисунок).
2. Определить первое основное направление перемещения к цели (ОНП1),
представляющее собой прямую или кратчайшее расстояние между исходным
и целевым местоположением ИР.
3. Выбрать расположенные по разные стороны от ОНП1 две отстоящие
от него на минимальном расстоянии проходимые между препятствиями зо-
ны, которые будут определять вершины v1i13 (c1i13 ) и v2i13 (c2
) строящегося гра-
i13
фа GB , смежные с вершиной v0(0) и имеющие соответственно условные сто-
имости c1i13 и c2
i13
156
4.
Определить для каждой принятой таким образом вершины
v1i13 (c1i13 ),v2i13 (c2i13 )∈ VB их условные стоимости c1i13 и c2
, равные стоимости
i13
инцидентных им ребер ei14 ∈ EB и зависящие
— от расстояния, которое необходимо преодолеть ИР для перехода от те-
кущего местоположения за пределы соответствующей вершине проходимой
зоны ПС;
— от вида грунта на поверхности, по которому интеллектуальному роботу
предстоит движение к каждой проходимой зоне с учетом конструктивных
особенностей хода моторной системы.
5. Построить для каждой из выявленных на текущем шаге формирования
графа “видимости” вершин v1i13 (c1i13 ), v2i13 (c2i13 ) ∈ VB исходящие из них основ-
ные направления перемещения ИР к целевому местоположению (например,
на приведенном рисунке - это ОНП2 и ОНП3).
6. Выбрать относительно каждого построенного ОНП2 и ОНП3 по две
отстоящие от них по разные стороны на минимальном расстоянии прохо-
димые зоны ПС, которые определяют следующие вершины vki
(cki13 ) ∈ VB,
13
k = 1,4 строящегося графа “видимости” GB, смежные с присоединенными
к нему на предыдущем шаге вершинами. Определить стоимость ck вер-i
8
шин vki
(cki13 ) ∈ VB, складывающуюся из стоимости смежных с ними вершин
13
строящегося графа “видимости” и стоимости инцидентных им ребер ei14 ∈ EB.
7. Продолжить дальнейшее построение графа “видимости” GB = (VB, EB)
по описанному в пп. 1-6 принципу. В этом случае построение графа “види-
мости” происходит до тех пор, пока к каждой входящей в его структуру вер-
шине, найденной на предыдущем шаге его построения, не будет присоединена
вершина, соответствующая проходимой зоне ПС, между которой и заданным
целевым местоположением ИР отсутствуют препятствия.
Определить “стоимость” каждой выявленной таким образом вершины, ко-
торая складывается из “стоимости” смежной с ней вершины и “стоимости”,
зависящей от сложности перемещения ИР по отрезку прямой, связывающему
соответствующую этой вершине проходимую зону и текущее целевое место-
положение робота.
8. Присоединить к каждой вершине строящегося графа “видимости”, удо-
влетворяющей условиям п. 7, вершину - сток vц ∈ EB, соответствующую це-
левому местоположению ИР.
Построенный таким способом граф “видимости” GB = (VB, EB) позволя-
ет ИР определить локально-оптимальный маршрут Lj9 (vи, vц), j9 = 1, m9 с
m10
минимальной “стоимостью” Cj9 =
j10=1
ej9i14 (ci914 ,j10) min. Здесь vи и vц -
вершины графа GB, соответственно определяющие исходное и целевое место-
положение интеллектуального робота; ej9i14 (ci914 , j10) - ребра графа GB, входя-
щие в j9 маршрут движения ИР к целевому местоположению; cj9
- “стои-
i14
мость” j9 ребра ej9i14 ∈ Lj8 (vи, vц).
Следует отметить, что построенный на основе метода 1 граф “видимости”
(см. рисунок) параллельно сопровождается формированием ИР в условиях
157
неопределенности локально-оптимального маршрута движения M2 к задан-
ному целевому местоположению.
Для второго случая, когда заданы только координаты целевого местопо-
ложения, и оно расположено за пределами зоны прямой видимости ИР, для
планирования перемещения используется метод 2, имеющий следующее со-
держание:
1. На первом шаге планирования поведения определяется стратегическое
направление движения ИР к целевому местоположению, которым является
прямая, связывающая его исходное и целевое местоположения в ПС.
2. На втором шаге на стратегическом направлении движения выбирается
наиболее удаленная точка, попадающая в зону прямой видимости и играющая
роль подцели на текущем шаге планирования перемещения ИР.
3. На третьем шаге, используя приведенные выше инструменты плани-
рования поведения при расположении целевого местоположения в зоне пря-
мой видимости, ИР строит относительно выбранной точки, расположенной
на стратегическом направлении движения, подграф “видимости”. Это позво-
ляет ИР определить эффективный маршрут движения к данной точке, т.е.
маршрут, имеющий минимальную “стоимость” в пределах видимого роботу
участка ПС.
4. На четвертом шаге выбирается новая точка, расположенная на страте-
гическом направлении движения, относительно которой строится следующий
соответствующий ей подграф “видимости” и т.д., пока ИР не достигнет за-
данного целевого местоположения.
В случае, когда ИР требуется найти в априори неописанной ПС заданные
объекты, для планирования целесообразного поведения на заданном участке
местности эффективно могут быть использованы алгоритмы самообучения,
предложенные в [24].
Что же касается планирования целенаправленной деятельности ИР, свя-
занной с манипулированием на каждом этапе деятельности находящимися в
ПС объектами, то следует отметить, что основной операцией, которая выпол-
няется в процессе вывода решений в этом случае, является операция срав-
нения между собой различных семантических сетей. В общем случае данная
операция может быть связана
1. С необходимостью сравнения между собой семантической сети, соответ-
ствующей текущей ситуации ПС Si5 ∈ S, и активной нечеткой семантической
сети Sa на предмет их нечеткого равенства в процессе выбора сложного дей-
ствия Bj1 , результативного с точки зрения достижения заданной подцели в
текущих условиях среды.
Определение 1. Сравниваемые между собой семантические сети
Ga = (v0, Va, Ea) и Gi510 = (v0,
i10
,Ei5 ) нечетко равны, если они удовлетво-i
10
ряют следующим условиям [25]:
— данные семантические сети имеют одинаковое количество вершин и
ребер;
158
— для каждой вершины vi7 ∈ Va, помеченной в сети Ga слотом o∗i7 (X )i
7
или слотом d∗i8 (Y), имеется структурно эквивалентная ей вершинаi
8
vi11 ∈ Vi5i10 ,помеченнаявсетиGi510 соответственнообъектомoi2(Xi2)или
происходящим в проблемной среде событием di3 (Yi3 ) ∈ D, для которых спра-
ведливы следующие условия X∗i
⊆Xi2 иY∗i
⊆ Yi3. В этом случае принимает-
7
8
ся решение, что пометки структурно эквивалентных вершин в сетях Ga
и Gi5
являются нечетко равными между собой ввиду того, что они опре-
i10
деляются одними и теми же признаками, характерными для аналогичных
друг другу объектов и событий ПС;
— для каждого неориентированного ребра ei9 ∈ Ea, помеченного в сети Ga
тройкой < T∗j
3
(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему
неориентированное ребро ei12 ∈ Ei5i10 ,помеченноезначениемri одноименно-4
го с этой тройкой отношения ri4 ∈ R, для которого выполняется условие
r∗i4 (r∗j3,r∗j3+1)илипометкисравниваемыхмеждусобойребернечеткорав-
ны между собой, так как определяются одним и тем же термом T∗j
(ri4 );
3
— для каждого ориентированного ребра ei9 ∈ Ea, помеченного в сети Ga
тройкой < T∗j
3
(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему
одинаково с ним помеченное ориентированное ребро ei12 ∈ Ei5 .i
10
В противном случае, если хотя бы одно из перечисленных выше условий не
выполняется, то сравниваемые между собой семантические сети не являются
нечетко равными.
2. С определением нечеткого вложения фрагментов ΔSa = (ΔVa, ΔEa),
,Ei5 ),i
имеющих нечеткое описание, в текущую ситуацию ПС Gi5i10 =(v0,
i10
10
например, в процессе построения целенаправленной последовательности эле-
ментарных действий bi1 ∈ B.
Определение 2. Нечетко заданный фрагмент ΔS = (ΔVa,ΔEa) обоб-
щенного описания аналогичных друг другу ситуаций ПС Si5 ∈ S яв-
ляется( нечетко в)оженным в текущую ситуацию проблемной среды
, если его матрица смежности MSa) является ча-
Gi5i10
= v0, V i5i10, Ei510
стью матрицы смежности M(Gi5i10)сетиGi50 принечеткомравенствепо-1
меток структурно эквивалентных в этих сетях вершин и ребер.
Необходимо отметить, что столбцы и строки в матрицах смежности, участ-
вующих в определении нечеткого вложения одной семантической сети в дру-
гую, определяются пометками соответствующих им вершин. В свою очередь,
элементы в данных матрицах представлены нечеткими значениями пометок
ребер инцидентных вершинам, определяющим их соответствующие столбцы
и строки.
В общем случае планирование многоэтапной деятельности ИР опирается
на сформулированное роботу задание и имеющиеся у него типовые элемен-
ты модели представления знаний. Пусть на j11 этапе планирования в моде-
ли представления знаний имеется согласованная между собой и с получен-
ным заданием пара импликативных решающих правил <(1),(3)>. Допустим,
что для данных элементов соответственно выполняются следующие условия:
159
фрагмент ситуации SИi
(j4) типового элемента (1) является нечетко вложен-
5
ным в исходную на j11 шаге деятельности ситуацию ПС SИ (см. определе-j
11
ние 2); SЦi(j4) ≈ SИi(j6) и фрагмент ситуации SЦi
(j6) типового элемента (4)
5
5
5
является нечетко вложенным в целевую ситуацию среды SЦ . Тогда задачаi
11
планирования целенаправленной деятельности на данном этапе решается ИР
на основе метода 3 путем построения упорядоченной цепочки, состоящей из
таких пар. При этом типовой элемент (1) при наличии на пути движения
ИР препятствий по заданной ссылке встраивается в структуру типового эле-
мента представления знаний (4) вместо элементарного действия “подойти к
объекту”.
Следует отметить, учитывая, что ИР априори неизвестны условия ПС, в
которых ему предстоит действовать на каждом следующем этапе, робот вна-
чале отрабатывает подплан действий, полученный на текущем этапе функци-
онирования. Затем ИР переходит к планированию дальнейшей целенаправ-
ленной деятельности следующего этапа поведения.
В противном случае, когда ИР для выполнения подзадания текущего этапа
поведения требуется решить несколько подзадач, планирование целенаправ-
ленной деятельности на этом этапе сводится к автоматическому построению
дерева вывода решений на основе импликативных решающих правил (1)-(5)
с использованием метода 4. Данный метод планирования имеет следующее
описание.
1. На первом шаге построения дерева вывода решений соответствующего,
например, текущему j11 этапу деятельности, его корневая вершина v0(j11) по-
мечается целевой ситуацией SЦ . Затем в модели представления знаний опре-j
11
деляется первый акт поведения (3), у которого содержание ситуации S1,Цi(j6)
5
совпадает с содержанием целевой ситуации SЦ .j
11
При этом может возникнуть одно из условий: ситуация S1,Цi(j6) является
5
нечетко равной (см. определение 1), или нечетко вложенной (см. определе-
ние 2) в целевую ситуацию SЦ . В первом случае осуществляется переходj
11
на следующий шаг построения дерева вывода решений (п. 2), в противном
случае выполняется переход к п. 3.
2. На данном шаге построения дерева вывода решений проверяется усло-
вие: является или нет исходная ситуация S1,Иi(j6) выбранного элемента пред-
5
ставления знаний нечетко вложенной в текущую ситуацию ПС Si5 ∈ S. Если
данное условие выполняется, то план поведения, связанный с преобразова-
нием текущей ситуации ПС Si5 в ее целевую ситуацию SЦ , является постро-j
11
енным. Таким образом, для достижения заданной подцели на текущем этапе
деятельности ИР выполняет выбранное сложное действие B1 . В противномj
1
случае построение плана целенаправленной деятельности продолжается сле-
дующим образом.
На текущем k, k = 2, . . . , n шаге построения дерева вывода решений опре-
деляется результативный акт поведения (3), у которого ситуация Sk,Цi(j6)
5
160
является либо нечетко равной исходной ситуации Sk-1,Иi(j6) акта поведения
5
выбранного на предыдущем шаге ее роста, либо нечетко вложена в эту си-
туацию.
В случае, когда Sk,Цi
(j6) ≈ Sk-1,Иi
(j6), проверяется условие: является или
5
5
нет исходная ситуация Sk,Иi(j6) последнего выбранного акта поведения нечет-
5
ко вложенной в текущую ситуацию ПС Si5 ∈ S. Если данное условие является
справедливым, то принимается решение о том, что план целенаправленно-
го поведения сформирован. Таким образом, для достижения заданной под-
цели SЦ ИР требуется выполнить построенный кортеж сложных действийj
10
<Bk,... ,B2j1,B1
>.
j1
В случае же, когда условие Sk,Цi
(j6) ≈ Sk-1,Иi
(j6) не выполняется, построе-
5
5
ние основной ветви дерева вывода решений продолжается по вышеописанно-
му принципу до тех пор, пока к нему не будет присоединен акт поведения z,
у которого исходная ситуация Sz,Иi(j6) является нечетко вложенной в теку-
5
щую ситуацию ПС Si5 ∈ S.
Если же ситуация Sk,Цi(j6) оказывается нечетко вложенной в ситуацию
5
Sk-1,Иi(j6), то это сигнализирует решающей подсистеме ИР о том, что тре-
5
буется разветвление строящегося дерева вывода решений и осуществляется
переход к п. 3.
3. На данном шаге определяются подцели поведения ИР для образующих-
ся ветвей строящегося дерева вывода решений путем выполнения следующих
операций над нечеткими семантическими сетями. Для определения подцели
поведения и продолжения роста основной ветви дерева вывода или его ствола,
например на k + 1 шаге планирования из исходной ситуации Sk-1,Иi(j6) акта
5
поведения, выявленного на k - 1 шаге, вырезается подграф структурно эк-
вивалентный семантической сети Sk,Цi(j6), соответствующей акту поведения,
5
выбранному на k шаге построения дерева вывода решений. Затем выполняет-
ся переход к п.2, на котором продолжается построение ствола дерева вывода
решений на основе полученной таким образом подцели поведения.
В оставшейся же части ΔSk-1,Иi
(j6) ⊂ Sk-1,Иi
(j6) разбиваемой семантиче-
5
5
ской сети к ее разрезанным ребрам присоединяются вершины, которые были
им инцидентны в исходной семантической сети Sk-1,Иi(j5). В результате опре-
5
деляется фрагмент активной нечеткой семантической сети, определяющий
подцель поведения ИР ΔSk+1,Цi(j6) для боковой ветви строящегося дерева
5
вывода решений. Затем выполняется переход к п. 4.
4. На данном шаге для дальнейшего роста боковой ветви дерева выво-
да решений в модели представления знаний определяется акт поведения,
у которого для целевой подситуации SЦi(j6) выполняется условие SЦi(j5)
5
5
ΔSk+1,Цi(j5). Если найден такой акт поведения, то для дальнейшего ро-
5
ста боковой ветви выполняется переход к п. 2. Если же выполняется усло-
вие SЦi
(j5) ΔSk+1,Цi
(j5), то рост боковой ветви дерева вывода решений осу-
5
5
ществляется по описанному в пп. 3, 4 принципу.
161
В случае же, когда такой акт поведения не найден, то дальнейший рост
боковой ветви дерева вывода решений осуществляется по тому же принципу,
что и на основе формального описания условий и результатов выполнения
сложных действий Bj1 , но только с использованием элементарных актов по-
ведения (2).
Таким образом, построенное описанным выше способом дерево вывода ре-
шений определяет план целенаправленной деятельности ИР, состоящий из
входящих в него различных актов поведения, связанных между собой усло-
виями нечеткого равенства или нечеткого вхождения соответствующих им
фрагментов нечетких семантических сетей. Отработка ИР данного плана це-
ленаправленной деятельности начинается с выполнения последнего сложно-
го действия, присоединенного к стволу дерева вывода решений. При этом
подпланы целенаправленной деятельности, соответствующие боковым вет-
вям построенного дерева, отрабатываются в порядке возникновения условий,
сигнализирующих о необходимости их построения, начиная с последнего при-
соединенного к ним сложного действия.
Примеры планирования целенаправленной деятельности ИР на основе
предложенных типовых элементов представления знаний с использованием
методов 3, 4 приводятся в Приложении П.1.
При самопроизвольном появлении в ПС событий di5 (Yi5 ) ∈ D, препятст-
вующих эффективной отработке действий сформированного на текущем эта-
пе плана поведения, ИР приостанавливает свою текущую целенаправленную
деятельность и переключается к построению и отработке подплана, связан-
ного с устранением негативного влияния этих событий на его дальнейшую
деятельность. Данный подплан поведения автоматически формируется таким
же способом, как и основной план целенаправленной деятельности. Только
в этом случае процесс построения дерева вывода решений на первом шаге
осуществляется на основе импликативных решающих правил (4) и (5). После
устранения негативного влияния возникшего в ПС события di5 (Yi5 ) ∈ D, ИР
продолжает свою многоэтапную целенаправленную деятельность. Для этого
он, в зависимости от сложившейся в ПС ситуации Si5 ∈ S, использует либо
ранее разработанный план целенаправленной деятельности, либо переплани-
рует свою дальнейшую деятельность с учетом произошедших в проблемной
среде изменений.
Предложение 1. Функциональная сложность β метода 4 планирова-
ния целенаправленной деятельности на каждом ее этапе зависит от ко-
личества операций сравнения пометок вершин и ребер в сопоставляемых
между собой семантических сетях и определяется следующими граничны-
ми оценками:
3δ
n2
β 3δλ
n2
,
j12
j12
j12=1
j12=1
где δ, λ - соответственно общее количество выполненных шагов вывода ре-
шений и импликативных решающих правил, хранящихся в модели представ-
162
ления знаний, связанных с решаемой ИР задачей на текущем этапе дея-
тельности; nj12 - количество вершин у максимальной по размерам семан-
тической сети, участвующей в процессе вывода решений на j12 шаге плани-
рования.
Доказательство сформулированного предложения приводится в Приложе-
нии П.2.
Таким образом, наиболее трудоемкий метод 4 планирования многоэтап-
ной деятельности ИР имеет полиномиальную сложность второго поряд-
ка. Это позволяет ориентировочно определить производительность бортовой
ЭВМ, необходимой для его реализации с учетом функционального назначе-
ния создаваемого интеллектуального робота.
5. Заключение
1. Предложенные элементы модели представления знаний позволяют ИР
адаптироваться к априори неописанным проблемным средам путем конкрети-
зации в процессе вывода решений имеющихся в их структуре слотов с учетом
текущей ситуации ПС. Это, в свою очередь, обеспечивает ИР возможность
на основе разработанных процедур вывода решений автоматически генери-
ровать планы целенаправленной многоэтапной деятельности в нестабильных
априори неописанных условиях функционирования.
2. Разработанные типовые элементы представления знаний позволяют су-
щественным образом сузить пространство поиска решаемых ИР задач за счет
выбора на каждом шаге планирования целенаправленной деятельности не од-
ного, а сразу нескольких результативных действий. Кроме того, определение
таких результативных действий осуществляется не путем перебора, а на осно-
ве целенаправленного выбора с учетом условий ПС, в которых ИР предстоит
решать стоящую перед ним подзадачу на каждом этапе целенаправленной
деятельности.
3. Важная особенность предложенных элементов представления знаний и
методов вывода решений заключается в возможности их использования для
вывода решений на семантических сетях, позволяющих наиболее выразитель-
но и компактно выполнить формальное описание текущих условий функци-
онирования ИР в различных по сложности ПС.
4. К основному недостатку предложенного подхода к построению интел-
лектуального решателя задач, позволяющего ИР планировать целенаправ-
ленную деятельность в априори неописанных нестабильных проблемных сре-
дах, следует отнести громоздкость задаваемой роботу цели. В этой связи воз-
никает необходимость в дальнейшем развитии проведенного исследования,
связанного с построением типовых элементов представления знаний, позво-
ляющих формулировать ИР цель поведения в виде одной общей задачи. За-
тем выполнять разбиение этой задачи на подзадачи, решение которых обес-
печивает достижение полученных подцелей в сложившихся в ПС условиях
на различных этапах функционирования.
163
ПРИЛОЖЕНИЕ
П.1. Примеры решения ИР гипотетических задач
Задача 1. Допустим, что робот получил следующее задание. Находясь
на одном из участков ПС с препятствиями, роботу требуется перейти на
другой ближайший к нему участок этой среды, на котором необходимо пе-
ренести объект o1(X1) и поставить на объект o2(X2). Затем попасть на
следующий участок ПС, на котором следует заменить объект o3(X3) (на-
пример, разряженную батарею питания), находящийся в закрытой дверцей
нише объекта o4(X4) (например, электронного прибора) на объект o5(X5)
(заряженную батарею питания).
Пусть в ПС выполняются следующие условия. В исходном состоянии ИР
наблюдает объект o1(X1), а на пути движения к этому объекту имеются
препятствия. Между объектами o1(X1) и o2(X2) препятствия отсутствуют.
Из местоположения объекта o2(X2) ИР становится видимым объект o4(X4),
а между данными объектами в ПС имеются непреодолимые для робота пре-
пятствия. Объект o5(X5) находится в специальном для этого “кармане 1” ИР.
Следует отметить, что сформулированное ИР задание состоит из следую-
щих двух этапов. На первом этапе ИР требуется перейти в ПС с препятст-
виями к местоположению объекта o1(X1). После этого захватить этот объект
и перенести его к местоположению объекта o2(X2). Затем поставить объ-
ект o1(X1) на поверхность объекта o2(X2).
На втором этапе ИР необходимо перейти в ПС с препятствиями к местопо-
ложению объекта o4(X4). После этого заменить объект o3(X3), находящийся
в специальной для этого нише внутри объекта o4(X4), на объект o5(X5).
Таким образом, ИР для выполнения сформулированного ему задания тре-
буется использовать типовые элементы модели представления знаний, обес-
печивающие решение следующих подзадач.
1. Построить маршрут перемещения ИР в ПС с препятствиями, при усло-
вии воспринимаемого в среде целевого местоположения (типовой элемент
представления процедурных знаний для решения данной подзадачи опреде-
ляется методом 1 ).
2. Отработать сложное действие B1 (поставить объект o1(X1) на
объект o2(X2)) при условии, что данные объекты расположены в зоне пря-
мой видимости за пределами рабочей зоны манипулятора ИР. Здесь харак-
теристики X1 слота o1(X1) показывают, что первый, находящийся в ПС объ-
ект o1(X1), для эффективной отработки действий данного элемента модели
представления знаний должен имеет определенные габаритные размеры и
вес, позволяющие ИР захватить поднять и перенести этот объект. В свою
очередь, характеристики X2 слота o2(X2) показывают, что для того, чтобы
ИР мог поставить объект o1(X1) на объект o2(X2), последний должен иметь
плоскую поверхность.
Сложное действие B1 данного элемента представления знаний состоит
из кортежа следующих элементарных действий: <подойти к объекту o1(X1)
164
(при наличии в ПС препятствий отработать данное действие, используя ме-
тод 1); захватить объект o1(X1); поднять объект o1(X1); перейти к объекту
o2(X2) (при наличии в ПС препятствий отработать данное действие, исполь-
зуя метод 1 ); поставить объект o1(X1) на поверхность объекта o2(X2) >.
3. Выполнить сложное действие B2 [провести замену объекта o3(X3), на-
ходящегося в нише с дверцей объекта o4(X4), на объект o5(X5)]. В данном
элементе представления знаний характеристики X1 слота o1(X1) показыва-
ют, что имеющийся у ИР объект o5(X5) для эффективной отработки действий
данного элемента модели представления знаний должен удовлетворять сле-
дующему условию X5 ⊆ X5. В свою очередь, для выполнения сложного дей-
ствия B2 для объектов o3(X3) и o4(X4) соответственно должны выполняться
следующие условия X3 ⊆ X3 и X4 ⊆ X4.
При этом сложное действие B2 состоит из следующего кортежа элементар-
ных действий: <подойти к объекту o4(X4) [при наличии в ПС препятствий
для отработки действия использовать метод 1 ]; открыть дверцу ниши объ-
екта o4(X4), в которой расположен объект; отключить объект o3(X3) от се-
ти питания; вынуть объект o3(X3) из ниши объекта o4(X4); опустить объект
o3(X3) на поверхность земли; достать из “кармана 1” объект o5(X5); вставить
объект o5(X5) в нишу объекта o4(X4); подключить объект o5(X5) к сети пи-
тания, закрыть крышку ниши объекта o4(X4); поднять с земли объект o3(X3)
и поместить его в “карман 2”>.
Таким образом, используя метод 3 и сформулированное задание, ИР при-
ступает к планированию целенаправленной деятельности, связанной с выпол-
нением первого этапа функционирования. Пусть на первом шаге такого пла-
нирования на основе метода 3 робот устанавливает, что для объектов o1(X1),
o2(X2) и типового элемента представления знаний “поставить объект o1(X1)
на объект o2(X2)” соответственно выполняются следующие условия X1 ⊆ X1
и X2 ⊆ X2. Отсюда для решения подзадачи первого этапа целенаправленной
деятельности, ИР использует типовой элемент представления знаний, связан-
ный с выполнением сложного действия B1. Таким образом, подплан первого
этапа будет определяться кортежем элементарных действий этого сложного
действия, в котором слоты o1(X1) и o2(X2) помечены соответственно нахо-
дящимися в ПС объектами o1(X1) и o2(X2).
При этом, учитывая, что на пути движения робота к объекту o1(X1) в сре-
де имеются препятствия, отработка первого действия полученного подплана
поведения выполняется с привлечением по ссылке метода 1. В итоге под-
план первого этапа целенаправленной деятельности состоит из двух типовых
элементов процедурной модели представления знаний ИР.
Кроме того, исходя из того, что ИР априори неизвестны условия ПС, в
которых предстоит выполнять второй этап целенаправленной деятельности,
робот непосредственно реализует подплан поведения первого этапа. В ре-
зультате этого ИР переходит на новый участок ПС, на котором, согласно
текущим условиям функционирования, объект o4(X4) ему становится види-
мым. Это позволяет ИР на втором этапе планирования целенаправленной
165
деятельности, для достижения соответствующей ему подцели, выбрать эле-
мент представления знаний, соответствующий сложному действию B2.
Пусть для объектов ПС o3(X3), o4(X4) и o5(X5), а также данного элемен-
та представления знаний, соответственно выполняются следующие условия
X3 ⊆ X3, X4 ⊆ X4 и X5 ⊆ X5. В этом случае, согласно методу 3, подплан це-
ленаправленной деятельности ИР второго этапа будет состоять из кортежа
элементарных действий сложного действия B2, в котором слоты помечены
удовлетворяющими их требованиям объектами ПС. При этом первое дей-
ствие этого кортежа выполняется с привлечением выбранного по его ссылке
метода 1.
В итоге выполнение сформулированного ИР задания сводится к отработке
следующего кортежа сложных действий 〈B1, B2〉, в которых первые элемен-
тарные действия “подойти к заданному объекту” реализуются с привлечением
метода 1.
Задача 2. Рассмотрим случай, когда ИР на одном из этапов требует-
ся решить несколько взаимосвязанных между собой подзадач. Например,
“снять объект o5(X5), расположенный на объекте o6(X6)” и “заменить объ-
ект o7(X7), находящийся в закрытой дверцей нише объекта o8(X8), на объ-
ект o5(X5)”.
В этом случае для планирования целенаправленной деятельности ИР ис-
пользует метод 4. При этом сформированный подплан целенаправленной
деятельности ИР будет состоять из следующего кортежа типовых элемен-
тов модели представления знаний <сложное действие B3, сложное действие
B2>. Здесь третье сложное действие определяется следующим типовом эле-
ментом B3 (снять объект o5(X5), расположенный на объекте o6(X6)). При
этом, если на пути движения ИР к объекту o6(X6) и пути перехода от место-
положения объекта o6(X6) к местоположению в ПС объекта o8(X8) имеются
препятствия, то первые элементарные действия сложных действий B3 и B2
отрабатываются роботом с привлечением для этого метода 1.
П.2. Доказательство сформулированного утверждения
Доказательство предложения
1. Справедливость сформулиро-
ванного предложения вытекает из следующих соображений.
1. На каждом j12 шаге вывода решений сравниваются между собой семан-
тические сети, представляющие собой помеченные графы. Следовательно,
количество сравнений между собой пометок имеющихся в них структурно
эквивалентных вершин и ребер не может превышать величины, равной n2
j12
2. Каждый шаг вывода решений в процессе построения плана целенаправ-
ленного поведения на текущем этапе деятельности сводится к выбору путем
направленного перебора акта поведения, удовлетворяющего следующим усло-
виям: SИi(j4) ≈ SИj
,SЦi(j4) ≈ SИi(j6) и SЦi(j6) ≈ SЦ .j
5
11
5
5
5
11
Таким образом, количество сравнений пометок в сопоставляемых между
собой семантических сетях, в лучшем случае, когда результативный акт по-
166
ведения выбирается в первую очередь (что вполне вероятно), может быть не
менее трех. Следовательно, в течение δ шагов синтеза дерева вывода реше-
ний, исходя из п. 1 проводимого доказательства, количество таких сравнений
δ
не может быть менее величины, равной 3δ
n2
j12=1
j12
В худшем же случае, когда необходимое импликативное решающее прави-
ло определяется в последнюю очередь, количество сравнений пометок в со-
поставляемых между собой семантических сетях на каждом j12 шаге вывода
решений выполняется не более λ раз. Следовательно, количество сравнений
между собой пометок структурно эквивалентных вершин и ребер в сопостав-
ляемых семантических сетях на протяжении всего процесса построения дере-
ва вывода решений, состоящего из δ шагов, не может превышать величины,
δ
равной 3δλ
n2
j12=1
j12
3. Из пп. 1-2 проводимого доказательства с очевидностью следует спра-
ведливость сформулированного предложения.
СПИСОК ЛИТЕРАТУРЫ
1.
Melekhin V.B., Khachumov M.V. Planning polyphasic behavior of autonomous
intelligent mobile systems in uncertain environments // Inform. Control. Syst. 2021.
V. 113. No. 4. P. 28-36.
2.
Амосов Н.М. Алгоритмы разума. Киев: Наукова думка, 1979.
3.
Kelly A. Mobile Robotics: Mathematics, Models, and Methods. Cambridge: Cam-
bridge University Press, 2013.
4.
Давыдов О.И., Платонов А.К. Роботы и искусственный интеллект. Технокра-
тический подход // Препринт ИПМ им. М.В. Келдыша. 2017. № 112. 24 с.
5.
Гаазе-Рапопорт М.Г., Поспелов Д.А. От амебы к роботу. Модели поведения.
4 изд., стереотип. М.: URSS, 2019.
6.
Kober J., Peters J. Learning Motor Skills: From Algorithms to Robot Experiments.
Cham: Springer, 2014.
7.
Абасов И.Б., Игнатьев В.В., Орехов В.В. Дизайн автономного мобильного ро-
бототехнического комплекса // Междунар. науч.-исслед. журн. 2019. № 1-1.
С. 3340-3351.
8.
Russell S., Norvig P. Artificial Intelligence: A Modern Approach. 4 ed. Pearson,
2020.
9.
Вагин В.Н. Дедуктивный вывод на знаниях / Искусственный интеллект. В 3-х
кн. Кн. 2. Методы и модели. Справочник: под ред. Д.А. Поспелова. М.: Радио
и связь, 1990. С. 89-105.
10.
Абросимов В.К. Нейронная пространственно-временная модель движения объ-
ектов управления //Нейрокомпьютеры. Разработка, применение. 2014. № 3.
С. 26-35.
11.
Бодин О.Н., Безбородова О.Е., Спиркин А.Н., Шерстнев В.В. Бионические си-
стемы управления робототехническими комплексами. Пенза: ПГУ, 2022.
12.
Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволю-
ционной кибернетики. М.: Ленанд, 2019.
13.
Каляев А.В., Чернухин Ю.В., Носков В.Н., Каляев И.А. Однородные управ-
ляющие структуры адаптивных роботов. М.: Наука, 1990.
167
14.
Мелехин В.Б., Хачумов М.В. Планирование поведения автономных интеллек-
туальных систем в условиях неопределенности: под ред. проф. М.В. Хачумова.
СПб.: Политехника, 2022.
15.
Павловский В.Е., Павловский В.В. Технологии SLAM для подвижных роботов:
состояние и перспективы // Мехатроника, автоматизация, управление. 2016.
Т. 1. № 6. С. 384-394.
16.
Labbe M., Michaud F. RTAB-Map as an open-source lidar and visual simultaneous
localization and mapping library for large-scale and long-term online operation //
Field Robotics. 2019. No. 35. P. 416-446.
17.
Носков В.П., Рубцов И.В. Ключевые вопросы создания интеллектуальных мо-
бильных роботов // Инженер. журн.: наука и инновации. 2013. Вып. 3. С. 1-11.
18.
Заева К.А., Семенов А.Б. Метод маршрутизации с препятствиями на основе
параллельных вычислений // Вестник ТвГУ. Прикладная математика. 2016.
Вып. 3. С. 85-95.
19.
Tomas L.P., Michael A.W. An algorithm for planning collision-free paths among
polyhedral obstacles // Commun. ACM. 1979. Vol. 22. No. 10. P. 560-570.
20.
Поспелов Д.А. Ситуационное управление: теория и практика. 2-е изд., стереотип.
М.: URSS, 2022.
21.
Мелехин В.Б., Хачумов М.В. Элементы понятийного мышления в планировании
поведения автономных интеллектуальных агентов // Мехатроника, автоматиза-
ция, управление. 2021. Т. 22. № 8. С. 411-419.
22.
Melekhin V.B., Khachumov M.V. Fuzzy semantic networks as an adaptive model
of knowledge representation of autonomous intelligent systems // Sci. Tech. Inf.
Process. 2021. Vol. 48. No. 5. P. 1-8.
23.
Заде Л. Понятие лингвистической переменной и его применение для принятия
приближенных решений: пер. с англ. М.: Мир, 1976.
24.
Мелехин В.Б., Хачумов М.В. Процедуры самообучения автономных интеллек-
туальных мобильных систем в нестабильных априори неописанных проблемных
средах // Мехатроника, автоматизация, управление. 2022. Т. 23. № 7. С. 356-366.
25.
Мелехин В.Б., Хачумов М.В. Принцип построения процедур планирования
поведения автономных интеллектуальных роботов на основе полипеременных
условно-зависимых предикатов // АиТ. 2022. № 4. С. 140-154.
Статья представлена к публикации членом редколлегии О.П. Кузнецовым.
Поступила в редакцию 20.07.2022
После доработки 09.06.2023
Принята к публикации 30.09.2023
168