Автоматика и телемеханика, № 12, 2023
Оптимизация, системный анализ
и исследование операций
© 2023 г. В.Б. МЕЛЕХИН, д-р техн. наук (pashka1602@rambler.ru)
(Дагестанский государственный технический университет, Махачкала),
М.В. ХАЧУМОВ, канд. физ.-мат. наук (khmike@inbox.ru)
(Институт программных систем им. А.К. Айламазяна РАН,
г. Переславль-Залесский;
Федеральный исследовательский центр
“Информатика и управление” РАН, Москва;
Российский университет дружбы народов, Москва)
ПЛАНИРОВАНИЕ МНОГОЭТАПНОЙ ДЕЯТЕЛЬНОСТИ
ИНТЕЛЛЕКТУАЛЬНЫМ РОБОТОМ
В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ1
Показана актуальность создания интеллектуальных роботов различно-
го назначения, способных эффективным образом решать сложные мно-
гоэтапные задачи целенаправленной деятельности в априори неописан-
ных проблемных средах. Предложены оригинальные по содержанию эле-
менты продукционной модели представления знаний безотносительно к
конкретной предметной области. Построенная таким образом модель
представления знаний позволяет интеллектуальным роботам автомати-
чески планировать целенаправленную деятельность в условиях неопре-
деленности, опираясь на обобщенное описание возможных закономерно-
стей проблемной среды. Разработаны процедуры автоматического син-
теза графа “видимости”, определяющего формальным образом воспри-
нимаемый интеллектуальным роботом участок проблемной среды. Это,
в свою очередь, позволяет роботу автоматически формировать локально-
оптимальный маршрут целенаправленного перемещения в априори неопи-
санных условиях функционирования. Синтезированы процедуры автома-
тического планирования интеллектуальным роботом целенаправленной
деятельности, связанной с преобразованием текущей ситуации проблем-
ной среды в заданную целевую ситуацию в условиях неопределенности.
Ключевые слова: интеллектуальный робот, многоэтапное поведение, про-
блемная среда, элементы модели представления знаний, акты поведения,
граф “видимости”, планирование целенаправленной деятельности.
DOI: 10.31857/S0005231023120127, EDN: NGVHRW
1. Введение
Создание интеллектуальных роботов (ИР) различного назначения, спо-
собных решать сложные многоэтапные задачи в условиях неопределенности,
сводящиеся к необходимости перехода с одного участка проблемной среды
1 Работа выполнена при финансовой поддержке Российского научного фонда (грант
146
(ПС) на другие ее участки с целью перевода текущей ситуации в требуемое
целевое состояние, является одной из актуальных и сложных проблем искус-
ственного интеллекта.
В общем случае многоэтапная целенаправленная деятельность ИР скла-
дывается из ряда этапов, взаимосвязанных между собой достижением общей
заданной роботу цели. Каждый такой этап может быть связан с характерным
для него видом целенаправленной деятельности ИР. Достижение же теку-
щей подцели поведения на отдельном его этапе является предпосылкой для
перехода робота на следующий этап целенаправленной деятельности и т.д.
до выполнения ИР полученного задания. Иначе говоря, многоэтапная дея-
тельность ИР на каждом участке ПС, как правило, состоит из следующих
двух фаз. В первой фазе целенаправленной деятельности ИР автоматиче-
ски строит и отрабатывает маршрут перемещения из исходного к целевому
местоположению на заданном участке ПС. Во второй фазе ИР планирует
и отрабатывает упорядоченную последовательность действий, позволяющих
выполнить преобразование исходной ситуации на текущем участке проблем-
ной среды в заданную целевую ситуацию.
К одной из попыток решения данной сложной проблемы следует отне-
сти когнитивные инструменты планирования ИР полифазной деятельности,
предложенные в [1]. Однако модель представления знаний, на которую опи-
раются в процессе вывода решений данные когнитивные инструменты, не
позволяет в полной мере учитывать сложившиеся в ПС условия функциони-
рования, влияющие на текущие функциональные возможности ИР. Другими
словами, используемая в данном случае модель представления и обработки
знаний не позволяет наделить ИР способностью на альтернативной основе ав-
томатически формировать наиболее эффективный по принятой “стоимости”
план многоэтапной деятельности, учитывающий сложившиеся в ПС условия
функционирования. Например, при наличии грязи после дождя, препятст-
вующей эффективному перемещению ИР в ПС. Это, в свою очередь, при-
водит к необходимости корректировки сформированного плана целенаправ-
ленной деятельности во время его реализации с учетом наблюдаемых в ПС
неучтенных в процессе планирования особенностей. Либо ИР вынужден реа-
лизовать не совсем эффективный по принятой “стоимости” план целенаправ-
ленной деятельности.
Что же касается использования в рассматриваемом случае известных ал-
горитмических моделей представления и обработки знаний [2], позволяю-
щих организовать планирование целенаправленной деятельности ИР, напри-
мер [3-7], то такие модели фактически не предусматривают возможности ре-
шения интеллектуальным роботом сложных многоэтапных задач в условиях
неопределенности. Помимо этого, алгоритмический подход к созданию ин-
теллектуальных решателей задач имеет существенный недостаток, препятст-
вующий построению ИР, которые способны целенаправленно функциониро-
вать в условиях неопределенности. Этот недостаток заключается в том, что
применение алгоритмических методов вывода решений требует разработки
147
подробной модели представления знаний, ориентированной на выполнение
ИР конкретных заданий в текущих условиях функционирования. Формули-
руемая ИР цель поведения в этом случае достигается путем планирования и
отработки действий, обеспечивающих целенаправленное изменение значений
отношений пространства состояний между различными объектами проблем-
ной среды в пределах разрешающей способности подсистемы его техническо-
го зрения. Иначе говоря, известные методы планирования целенаправленной
деятельности ИР, базирующиеся на аксиоматическом подходе вывода реше-
ний с применением логики предикатов первого порядка и ее различных мо-
дификаций, не позволяют решать многоэтапные задачи в условиях неопре-
деленности [8]. Это связано с тем, что они требуют подробного формального
описания закономерностей ПС и применения в худшем случае сложных про-
цедур вывода решений методом перебора с экспоненциальной сложностью [9].
В свою очередь, для сетевого подхода к созданию интеллектуальных ре-
шателей задач ИР, связанного с использованием нейронных сетей для пред-
ставления и обработки знаний [10, 11], характерны те же основные недостат-
ки, что и для алгоритмического подхода. Данное обстоятельство обусловлено
следующими двумя особенностями организации современного сетевого интел-
лекта. Во-первых, с моделированием на ЭВМ процессов вывода решений на
нейронных сетях. Такое моделирование нейросетевых технологий фактиче-
ски сводит процессы планирования целенаправленной деятельности ИР на
основе решателя задач, организованного по принципу сетевого интеллекта,
к процессам, свойственным алгоритмическому интеллекту. Во-вторых, ней-
ронные сети в рассматриваемом случае, как правило, должны отражать по-
дробное формальное описание закономерностей текущих условий функцио-
нирования ИР. Это, в свою очередь, не позволяет роботу решать задачи в
условиях неопределенности и требует предварительного обучения нейронных
сетей [12].
Кроме того, на практике построить подробную модель закономерностей
реальной сложной ПС не представляется возможным [13], особенно если речь
идет о труднодоступных и агрессивных для человека средах, в которых в
основном и предстоит функционировать ИР.
Таким образом, отмеченные выше обстоятельства приводят к объектив-
ной необходимости разработки элементов процедурной модели представления
знаний безотносительно к конкретной предметной области, позволяющих ИР
адаптироваться к различным априори неописанным условиям функциониро-
вания [14]. Кроме того, такие элементы представления знаний должны обес-
печивать ИР возможность планирования целенаправленной деятельности с
учетом влияния текущих условий ПС на функциональные возможности ро-
бота.
Следует также отметить, что для планирования целенаправленных пере-
мещений ИР в априори неописанной проблемной среде в настоящее время
широко используются SLAM методы [15, 16]. На основе данных методов вна-
чале строится формальное описание карты местности в виде помеченного гра-
148
фа, которая затем используется для маршрутизации перемещений ИР в ПС.
С этой целью применяется один из методов поиска оптимального пути на
графах [17]. Однако учитывая, что в процессе многоэтапной деятельности
задача маршрутизации движения ИР решается в реальном времени, приме-
нение в рассматриваем случае SLAM методов является нецелесообразным.
В этой связи в работе предлагается оригинальный эвристический метод фор-
мирования модели воспринимаемого участка среды в виде графа “видимо-
сти”. Автоматическое построение такого графа позволяет ИР параллельно
с его синтезом сформировать локально-оптимальный маршрут движения к
целевому местоположению. Кроме того, предложенный метод маршрутиза-
ции движения ИР в отличие от SLAM методов, а также известных методов
построения графов “видимости” [18, 19], не требует выполнения трудоемких
вычислений.
Помимо метода планирования перемещений ИР в условиях неопределен-
ности в настоящей статье предлагаются также различные элементы модели
представления и обработки знаний безотносительно к конкретной предмет-
ной области. Использование такого вида элементов представления знаний
позволяет ИР организовать модельный подход к организации вывода реше-
ний в процессе автоматического планирования многоэтапной целенаправлен-
ной деятельности в априори неописанных и нестабильных условиях ПС. При
этом предлагаемая в статье модель представления и обработки знаний позво-
ляет ИР организовать планирование многоэтапной деятельности в условиях
неопределенности с приемлемой для бортовой ЭВМ полиномиальной слож-
ностью.
2. Постановка задачи
Рассмотрим ИР как мобильную систему, оснащенную манипулятором, ко-
торая ориентирована на решение определенного класса задач. Как правило,
такая система состоит из сенсорной, решающей и моторной подсистем [4].
Сенсорная подсистема ИР включает модуль технического зрения и ряд дат-
чиков, связанных с управлением навигацией робота в ПС, а также обеспече-
нием данными, необходимыми для проведения анализа условий и результатов
отработки различных действий. Решающая подсистема ИР состоит из базы
знаний, в которой хранится модель их представления, и интеллектуально-
го решателя задач, предназначенного для планирования многоэтапной дея-
тельности, связанной с выполнением сформулированного интеллектуальному
роботу задания. Моторная подсистема служит для отработки различных дей-
ствий в процессе перемещения ИР в ПС и манипулирования находящимися
в среде объектами в процессе целенаправленного преобразования текущей
ситуации в целевую ситуацию проблемной среды.
Таким образом, ИР можно охарактеризовать множеством отрабатывае-
мых элементарных действий B = {bi1 }, i1 = 1, n1, например, поднять объ-
ект, подойти, захватить объект и т.д.; множествами объектов O = {o2(Xi2 )},
i2 = 1,n2 и событий D = {di3 (Yi3 )}, i3 = 1,n3, соответственно находящихся и
происходящих в ПС, которые интеллектуальный робот способен распознать,
149
планируя целенаправленную деятельность. Здесь Xi2 и Yi3 - множества ха-
рактеристик, соответственно определяющих объекты и события ПС. В общем
же случае функциональные возможности ИР определяются заданной моде-
лью представленных в общем виде знаний и процедурами автоматического
планирования целенаправленной деятельности в различных условиях априо-
ри неописанной ПС.
В свою очередь, нестабильную ПС в общем случае можно охарактеризо-
вать
— множеством находящихся в среде объектов oi2 (Xi2 ) ∈ O;
— происходящими независимо от деятельности ИР событиями di3 (Yi3 ) ∈ D,
спонтанное проявление которых в проблемной среде может препятствовать
результативной отработке интеллектуальным роботом элементарных дей-
ствий bi1 ∈ B;
— различным видом семантических отношений [20] R = {ri4 }, i4 = 1, n4,
которые выполняются в ПС между объектами, событиями и находящимся в
среде ИР.
В целом же ПС определяется сложившейся в ней текущей ситуацией
S = {Si5}, i5 = 1,n5, содержание которой зависит от состояния находящих-
ся в ней объектов oi2 (Xi2 ) ∈ O и происходящих di3 (Yi3 ) ∈ D, а также видом
и значениями выполняющихся в среде отношений ri4 ∈ R между объектами,
событиями и ИР.
Задание к выполнению ИР получает в декларативно-процедурной фор-
ме представления в виде упорядоченной последовательности сложных дей-
ствий Bj1 , j1 = 1, m1 [21] и условий, которые должны выполняться в ПС для
их результативной отработки. В общем случае целевое задание имеет следую-
щую структуру и содержание:
< SИ1 &B1j
→ SЦ1 &B2j
→ SЦ2 ,... ,SЦk-1&Bkj
→ SЦk >,
1
1
1
где, например, SИ1 и SЦ1 - описание в обобщенном виде соответственно ис-
ходных условий и условий, отражающих достижение подцели соответствую-
щего этапа целенаправленной деятельности. Таким образом, в рассматри-
ваемом случае целевая ситуация предыдущего этапа поведения, например,
SЦ1 определяет исходную ситуацию SИ2 для следующего этапа целенаправ-
ленной деятельности ИР.
Сложные действия Bj1 состоят из кортежей элементарных действий
bi1 ∈ B и фактически отражают содержание соответствующего им этапа це-
ленаправленной деятельности ИР. Например, полученное ИР задание может
иметь следующее содержание: “найти на заданном участке ПС определен-
ного вида объекты, перевести их в необходимое состояние или перенести в
заданное местоположение”. При этом, если результативность определенных
действий bi1 ∈ B зависит от текущего состояния ПС, то их отработка сопро-
вождается проверкой определенного условия. По ее результатам либо дей-
ствие непосредственно выполняется ИР, либо выбирается по ссылке другой
150
элемент модели представления знаний, позволяющий ИР отработать данное
действие с учетом сложившихся в ПС условий. Например, действие подойти
к объекту может быть непосредственно отработано по прямой линии движе-
ния только при отсутствии препятствий на пути перемещения ИР к этому
объекту. В случае же наличия в ПС таких препятствий для отработки дан-
ного действия ИР требуется предварительно сформировать план движения
к заданному объекту по проходимым между препятствиями участкам среды.
Такой подход к построению типовых элементов модели представления знаний
позволяет существенным образом
— снизить сложность процесса вывода решений за счет автоматического
перехода по ссылкам от одного к другому типовому элементу представления
знаний;
— сократить их количество за счет возможности использования одного и
того же элемента для решения одной и той же по назначению подзадачи в
различных условиях ПС.
Требуется, опираясь на вышеизложенное описание ИР, проблемной среды
и заданной роботу цели, разработать такие типовые элементы модели пред-
ставления знаний, которые позволяют автоматически строить планы много-
этапной деятельности в сложных априори неописанных условиях ПС. В об-
щем случае такой план целенаправленной деятельности ИР представляет со-
бой дерево вывода решений в пространстве состояний [8].
Следует отметить, что решение подзадач, связанных с распознаванием
различных образов ПС в процессе планирования ИР целенаправленной дея-
тельности, является самостоятельной проблемой, требующей отдельного об-
суждения, и в настоящей статье по причине ее ограниченного объема не рас-
сматривается.
3. Типовые элементы модели представления знаний ИР
В общем случае модель представления знаний состоит из декларативных
и процедурных элементов, позволяющих ИР планировать многоэтапную дея-
тельность в условиях неопределенности. Декларативные элементы модели
представления знаний предназначены для формального описания допусти-
мых ситуаций (состояний) ПС Si5 ∈ S, а также их отдельных фрагментов
ΔSj2i5 ⊂ Si5 , j2 = 1, m2. Данные фрагменты ситуаций ПС служат для построе-
ния различных элементов процедурной модели представления знаний ИР.
Здесь m2 - множество допустимых фрагментов (частей), на которые допус-
кается разбиение текущих ситуаций ПС Si5 ∈ S.
Следует отметить, что минимальный допустимый фрагмент текущей си-
туации ПС может состоять из двух объектов или одного объекта среды и ИР,
а также отношений, которые выполняются между ними в проблемной среде.
Процедурные знания представляют собой набор элементов, определяющих
безотносительно к конкретной предметной области решение различного ви-
да типовых подзадач целенаправленной деятельности, т.е. “кирпичиков”, на
основе которых ИР планирует свое поведение.
151
Формальное представление различных ситуаций ПС и их фрагментов за-
висит от роли, которую они выполняют в процессе вывода решений. Так,
для обобщенного представления различных аналогичных друг другу ситуа-
ций Si5 ∈ S и их фрагментов ΔSj2i5 ⊂ Si5 , предназначенных для построения
типовых элементов модели представления процедурных знаний ИР безотно-
сительно к конкретной предметной области, используются активные нечет-
кие семантические сети [22]. Для описания же текущих ситуаций ПС служат
классические семантические сети [8].
В общем случае активные нечеткие семантические сети, служащие для
обобщенного описания различных ситуаций Si5 ∈ S и их отдельных частей
ΔSi5 ⊂ Si5 , представляют собой нечетко помеченный граф Ga = (v0,Va,Ea).
Здесь v0 - базовая вершина сети, определяемая ИР, Va, Ea - соответственно
множества активных вершин и ребер. Активные вершины vi6 ∈ Va, Va = {vi6 },
i6 = 1,n6 согласно их назначению представляются слотами O∗ = {o∗i7 (X∗ )},i
7
i7 = 1,n7 и D∗ = {d∗i8 (Y∗i)}, i8 = 1, n8, которые в текущих условиях ПС по-
8
мечаются соответственно находящимися в среде объектами oi2 (Xi2 ) ∈ O и
происходящими в ней событиями di3 (Yi3 ) ∈ D. Активные вершины vi6 ∈ Va
в нечеткой семантической сети Ga, определяемые слотами o∗i7 (X∗ ) ∈ O∗ иi
7
d∗i8 (Y∗i) ∈ D∗, могут быть помечены конкретными объектами oi2(Xi2) и собы-
8
тиями di3 (Yi3 ) ПС, если они удовлетворяют следующим условиям X∗i
⊆Xi2
7
иY∗i
⊆Yi3.
8
Активные ребра ei9 ∈ Ea, Ea = {ei9 }, i9 = 1, n9 могут быть неориен-
тированными и ориентированными. Неориентированные ребра e0
∈E01
;
(
)<
в сети G0 помечаются следующими тройками T∗j
(ri4 ) , r∗j3 , r∗
, где
3
j3+1
T∗j
(ri4 ) — j3 терм лингвистической переменной (в общем случае j3 = 1, 5 [23])
3
с названием, совпадающим с наименованием соответствующего отношения
ri4(Xi4 ) ∈ R, выполняющегося в ПС между двумя объектами или объектом
и ИР; (r∗j3 , r∗j3+1) — соответственно нижняя и верхняя границы подынтервала
численных значений терма T∗j
(ri4 ) на шкале количественных оценок соответ-
3
ствующей лингвистической переменной.
Ориентированные ребра ei9 ∈ Ea помечаются следующими тройками
< Fi9,(t1j2,t2j2) >, где Fi9 - множество характеристик, описывающих влияние
событий di3 (Yi3 ) ∈ D, определяемых активной вершиной d∗i8 (Y∗) ∈ D∗, на со-i
8
стояние ПС при их появлении; (t1j2 , t2 ) - интервал времени t, в течение кото-j
2
рого может проявиться результат влияния событий di3 (Yi3 ) ∈ D на текущую
деятельность ИР. Кроме того, события di3 (Yi3 ) ∈ D могут также влиять на со-
стояние объекта ПС oi2 (Xi2 ) ∈ O, удовлетворяющего требованиям активной
вершины o∗i7 (X∗ ) ∈ O∗, в которую это ребро входит.i
7
Текущие ситуации ПС Si5 ∈ S в модели представления знаний АР описы-
ваются семантическими сетями, представляющими собой помеченный граф
,Ei5 ), который формируется в сенсорной подсистеме интел-i
Gi5i10 =(v0,
i10
10
лектуального робота на основе информации, поступающей из проблемной
среды. Здесь v0 - ключевая помеченная ИР вершина, относительно кото-
152
рой формируется семантическая сеть. Остальные же вершины Vi5i10 ={vi11},
i11 = 1,n11 графа Gi5 в соответствии с их назначением определяются нахо-i
10
дящимися в ПС объектами oi2 (Xi2 ) ∈ O и происходящими в ней событиями
di3 (Yi3 ) ∈ D. Ребра Ei5i10 ={ei12},i12=1,n12всетиGi50 могутбытьтакже1
ориентированными и неориентированными. Неориентированные ребра в се-
ти Gi5i10 помечаютсяколичественнымиоценкамиri4отношенийri4(Xi4)∈R,
которые выполняются в ПС между ИР и находящимися в ней объектами.
Ориентированные же ребра ei12 ∈ Ei5 , определяющие характер влияния про-i
10
исходящих в среде событий на находящиеся в ней объекты и текущую дея-
тельность ИР, помечаются так же, как и в активных нечетких семантических
сетях тройками < Fi9 , (t1j2 , t2 ) >.j
2
Содержание и структура типовых элементов процедурной модели пред-
ставления знаний определяются функциональным назначением ИР. В общем
случае такие элементы представления знаний с учетом их функционального
назначения могут быть следующих видов.
1. Импликативные решающие правила, позволяющие ИР выявлять необ-
ходимые для достижения заданной подцели процедуры автоматического по-
строения маршрута целенаправленного перемещения в ПС
(1)
Fj4 :
(j4)&Bj1 (j4) → SЦi(j4), j4
= 1, 3,
i5
5
где Fj4 - идентификатор, определяющий назначение решаемой на основе
j4 правила подзадачи, например, “маршрутизация движения в ПС с препят-
ствиями”; SИi(j4) - исходная ситуация участка ПС, на котором ИР находится
5
в текущий момент времени; SЦi(j4) - ситуация, определяющая участок проб-
5
лемной среды, на который ИР требуется перейти для достижения заданной
подцели текущего этапа поведения; Bj1 (j4) - метод планирования маршрута
движения, связанного с переходом ИР в текущее целевое местоположение.
2. Элементы представления знаний, характеризующие требуемые исход-
ные условия и результаты отработки ИР элементарных действий bi1 ∈ B
(2)
(j5)&bi1 (j5) → ΔSРi
(j5) , j5 = 1,m4,
Fj5 : Δ
i1
1
где Fj5 - идентификатор подзадачи, решение которой обеспечивает ИР полу-
чение локального результата ΔSРi(j5); ΔSИi(j5)&bi1 (j5) → ΔSРi(j5) - элемен-
1
1
1
тарный акт поведения ИР, показывающий, что если в текущей ситуации ПС
Si5 ∈ S выполняется условие ΔSИi(j5) ⊂ Si5 , то для получения в среде локаль-
1
ного результата ΔSРi(j5) роботу следует отработать действие bi1 (j5); m5 - под-
1
множество допустимых фрагментов ΔSИi(j5) ⊂ Si5 , определяющих различные
1
локальные условия, которые могут возникнуть в текущей ситуации ПС.
Таким образом, импликативные решающие правила (2) позволяют ИР
устанавливать различные действия bi1 (j5) ∈ B, которые после их отработки
в ПС приводят к получению результата ΔSРi(j5) в соответствии со сложив-
1
шимися в проблемной среде локальными условиями ΔSИi(j4).
1
153
При этом множество элементов представления знаний (2) целесообразно
разбить на классы эквивалентности по идентичности получаемого на их ос-
нове результата ΔSРi(j5). Каждый такой класс определяется либо идентифи-
1
катором Fj5 , либо локальным результатом ΔSРi(j5), который ИР требуется
1
получить для достижения текущей подцели поведения. Следовательно, если
ИР в текущий момент времени необходимо обеспечить локальный результат
ΔSРi(j5) в текущей ситуации ПС Si5 ∈ S, то по соответствующему ему со-
1
держанию в модели представления знаний в первую очередь определяется
обеспечивающий этот результат класс элементов модели представления зна-
ний (2). Затем в выбранном классе устанавливается типовой элемент пред-
ставления знаний, у которого фрагменты ΔSИi(j5) и ΔSРi(j5) являются нечет-
1
1
ко вложенными соответственно в текущую и целевую ситуации проблемной
среды. Например, таким образом группируются в один класс эквивалентно-
сти все действия, связанные с изменением местоположения различных объек-
тов в ПС. Так, одни объекты из-за их габаритных размеров и веса ИР может
поднять и перенести, вторые только перекатить, а третьи — перетащить и т.п.
3. Описание в модели представления знаний ИР условий и результатов
выполнения сложных действий Bj1 определяется следующими актами пове-
дения:
[
(
)
Fj6 :
(j6)&Bj1 S1,Иi
(j6) &b1i
→ ΔS1,Рi
(j6) ≈ ΔS2,Иi
(j6) &b2
→
i5
1
1
1
1
i1
(3)
]
→ΔS2,Рi(j6) ≈, . . . , ≈ΔSk,Иi(j6)&bki
→ ΔSk,Рi(j6)
⇒SЦi(j6) , j6 = 1, m6.
1
1
1
1
5
Импликативные решающие правила (3) означают следующее. Если теку-
щее состояние ПС определяется ситуацией Si5 ∈ S, в которую нечетко вло-
жено обобщенное описание SИi(j6) аналогичных друг другу допустимых под-
5
ситуаций проблемной среды, то для ее преобразования в целевую ситуа-
цию, определяющуюся обобщенным описанием SЦi(j6), ИР требуется выпол-
5
нить сложное действие Bj1 , состоящее из кортежа элементарных действий
<b1i1,b2i1,...,bk
>. Здесь ≈ — знак нечеткого равенства сравниваемых меж-
i1
ду собой семантических сетей.
4. Для планирования многоэтапной деятельности в ПС, в которой спонтан-
но возникают события di3 (Yi3 ) ∈ D, негативно влияющие (препятствующие
эффективной результативной отработке роботом определенных действий) на
целенаправленную деятельность ИР, для построения подплана поведения,
связанного со снижением и устранением такого влияния, используются сле-
дующие два вида импликативных решающих правил.
Первый вид данных импликативных решающих правил имеет следующую
структуру и содержание:
(4)
Fj7 : < Δ
i5
(j7), d∗i
(Y∗i
) > &bi1(j7) →Δd∗i8(Y ∗i)j5 , j7 = 1,m7,
8
8
8
где элементарный акт поведения ΔSИi(j7)&bi1 (j7) →Δd∗i8 (Y∗) означает, чтоi
5
8
если в текущую ситуацию ПС Si5 ∈ S нечетко вложен фрагмент ΔSИi(j7), то
5
154
при появлении в проблемной среде события di3 (Yi3 ) ∈ D, удовлетворяюще-
го требованиям слота d∗i8 (Y∗) ∈ D∗, отработка ИР элементарного действияi
8
bi1(j7) позволяет снизить Δd∗i8(Y∗i)j5 его негативное влияние на дальнейшую
8
целенаправленную деятельность робота.
Второй вид таких правил вывода имеет следующее представление:
(5)
Fj8 :<
i5
(j8), SРi(j8), d∗i
(Y∗i
) > &Bj1(j8) →d∗i8(Y ∗i), j8 = 1,m8,
5
8
8
8
где импликативные решающие правила (5) означают следующее. Если теку-
щая ситуация ПС Si5 является нечетко равной обобщенному описанию SИi(j8)
5
аналогичных друг другу ситуаций проблемной среды, а заданная ИР цель по-
ведения представлена семантической сетью SРi(j8), то при появлении в среде
5
событий di3 (Yi3 ) ∈ D, удовлетворяющих требованиям слота d∗i8 (Y∗) ∈ D∗, вы-i
8
полнение роботом сложного действия Bj1 (j8) позволяет устранить d∗i8 (Y∗)i
8
негативное влияние этого события на дальнейшую целенаправленную дея-
тельность.
Например, при наличии в ПС тумана, ИР для избегания столкновения с
различными находящимися в среде объектами, используя правило (4), опре-
деляет, что ему в этом случае требуется снизить скорость своего передвиже-
ния и т.п.
Следует отметить, что множества решающих правил (3)-(5) по характер-
ному для них общему признаку (например, назначению), как и правила (2),
разбиваются на соответствующие им классы эквивалентности. Это позволяет
ИР эффективным образом определять результативные решающие правила на
каждом этапе планирования целенаправленной деятельности в соответствии
с текущими условиями ПС и заданной подцелью поведения.
4. Методы планирования многоэтапной деятельности ИР
Как уже отмечалось выше, на каждом этапе целенаправленной деятель-
ности ИР в ПС с препятствиями, как правило, требуется автоматическое по-
строение маршрута перемещения для перехода с одного участка проблемной
среды на другой ее участок. В процессе решения данной подзадачи на осно-
ве типовых элементов представления знаний (1) ИР может столкнуться со
следующими тремя случаями:
— целевое местоположение находится в зоне прямой видимости сенсорной
подсистемы робота, а на пути движения к нему имеются препятствия;
— интеллектуальному роботу известны только координаты своего целевого
местоположения в ПС с препятствиями;
— требуется найти заданные объекты в априори неописанной ПС с пре-
пятствиями.
В первом случае для построения маршрута движения к целевому место-
положению в среде с препятствиями, габаритные размеры и координаты ме-
стоположения которых в ПС априори роботу не известны, используется ме-
155
Построение ИР графа “видимости” для выбора эффективного марш-
рута движения к целевому местоположению: (p1-p6) - препятствия;
(ОНП1-ОНП3) - основные направления перемещения; (М1-М4) -
альтернативные маршруты движения к целевому местоположению.
тод 1. На основе метода 1 и данных, поступающих из сенсорной подси-
стемы ИР, в его интеллектуальном решателе задач строится граф “видимо-
сти” GB = (VB, EB). Здесь VB = {vi13 }, i13 = 1, n13 - множество вершин, со-
ответствующих проходимым между препятствиями зонам ПС; EB = {ei14 },
i14 = 1,n14 - множество ребер, определяющих связь между смежными про-
ходимыми зонами ПС, которые определяются “затратами”, связанными с пе-
реходом ИР от одной такой зоны к смежной с ней в проблемной среде зоне.
Параллельно построению данного графа выбирается также и направление
перемещения ИР на каждом шаге целенаправленного движения.
В общем случае метод 1 автоматического построения графа “видимости”
GB = (VB, EB) и локально-оптимального маршрута целенаправленного дви-
жения ИР к воспринимаемому целевому местоположению (при отсутствии
формального описания карты местности) можно представить следующим об-
разом:
1. Принять в качестве исходной вершины v0i13 (0) ∈ VB или истока графа
“видимости”, имеющего нулевую условную стоимость, исходное местополо-
жение ИР (см. рисунок).
2. Определить первое основное направление перемещения к цели (ОНП1),
представляющее собой прямую или кратчайшее расстояние между исходным
и целевым местоположением ИР.
3. Выбрать расположенные по разные стороны от ОНП1 две отстоящие
от него на минимальном расстоянии проходимые между препятствиями зо-
ны, которые будут определять вершины v1i13 (c1i13 ) и v2i13 (c2
) строящегося гра-
i13
фа GB , смежные с вершиной v0(0) и имеющие соответственно условные сто-
имости c1i13 и c2
i13
156
4.
Определить для каждой принятой таким образом вершины
v1i13 (c1i13 ),v2i13 (c2i13 )∈ VB их условные стоимости c1i13 и c2
, равные стоимости
i13
инцидентных им ребер ei14 ∈ EB и зависящие
— от расстояния, которое необходимо преодолеть ИР для перехода от те-
кущего местоположения за пределы соответствующей вершине проходимой
зоны ПС;
— от вида грунта на поверхности, по которому интеллектуальному роботу
предстоит движение к каждой проходимой зоне с учетом конструктивных
особенностей хода моторной системы.
5. Построить для каждой из выявленных на текущем шаге формирования
графа “видимости” вершин v1i13 (c1i13 ), v2i13 (c2i13 ) ∈ VB исходящие из них основ-
ные направления перемещения ИР к целевому местоположению (например,
на приведенном рисунке - это ОНП2 и ОНП3).
6. Выбрать относительно каждого построенного ОНП2 и ОНП3 по две
отстоящие от них по разные стороны на минимальном расстоянии прохо-
димые зоны ПС, которые определяют следующие вершины vki
(cki13 ) ∈ VB,
13
k = 1,4 строящегося графа “видимости” GB, смежные с присоединенными
к нему на предыдущем шаге вершинами. Определить стоимость ck вер-i
8
шин vki
(cki13 ) ∈ VB, складывающуюся из стоимости смежных с ними вершин
13
строящегося графа “видимости” и стоимости инцидентных им ребер ei14 ∈ EB.
7. Продолжить дальнейшее построение графа “видимости” GB = (VB, EB)
по описанному в пп. 1-6 принципу. В этом случае построение графа “види-
мости” происходит до тех пор, пока к каждой входящей в его структуру вер-
шине, найденной на предыдущем шаге его построения, не будет присоединена
вершина, соответствующая проходимой зоне ПС, между которой и заданным
целевым местоположением ИР отсутствуют препятствия.
Определить “стоимость” каждой выявленной таким образом вершины, ко-
торая складывается из “стоимости” смежной с ней вершины и “стоимости”,
зависящей от сложности перемещения ИР по отрезку прямой, связывающему
соответствующую этой вершине проходимую зону и текущее целевое место-
положение робота.
8. Присоединить к каждой вершине строящегося графа “видимости”, удо-
влетворяющей условиям п. 7, вершину - сток vц ∈ EB, соответствующую це-
левому местоположению ИР.
Построенный таким способом граф “видимости” GB = (VB, EB) позволя-
ет ИР определить локально-оптимальный маршрут Lj9 (vи, vц), j9 = 1, m9 с
∑m10
минимальной “стоимостью” Cj9 =
j10=1
ej9i14 (ci914 ,j10) → min. Здесь vи и vц -
вершины графа GB, соответственно определяющие исходное и целевое место-
положение интеллектуального робота; ej9i14 (ci914 , j10) - ребра графа GB, входя-
щие в j9 маршрут движения ИР к целевому местоположению; cj9
- “стои-
i14
мость” j9 ребра ej9i14 ∈ Lj8 (vи, vц).
Следует отметить, что построенный на основе метода 1 граф “видимости”
(см. рисунок) параллельно сопровождается формированием ИР в условиях
157
неопределенности локально-оптимального маршрута движения M2 к задан-
ному целевому местоположению.
Для второго случая, когда заданы только координаты целевого местопо-
ложения, и оно расположено за пределами зоны прямой видимости ИР, для
планирования перемещения используется метод 2, имеющий следующее со-
держание:
1. На первом шаге планирования поведения определяется стратегическое
направление движения ИР к целевому местоположению, которым является
прямая, связывающая его исходное и целевое местоположения в ПС.
2. На втором шаге на стратегическом направлении движения выбирается
наиболее удаленная точка, попадающая в зону прямой видимости и играющая
роль подцели на текущем шаге планирования перемещения ИР.
3. На третьем шаге, используя приведенные выше инструменты плани-
рования поведения при расположении целевого местоположения в зоне пря-
мой видимости, ИР строит относительно выбранной точки, расположенной
на стратегическом направлении движения, подграф “видимости”. Это позво-
ляет ИР определить эффективный маршрут движения к данной точке, т.е.
маршрут, имеющий минимальную “стоимость” в пределах видимого роботу
участка ПС.
4. На четвертом шаге выбирается новая точка, расположенная на страте-
гическом направлении движения, относительно которой строится следующий
соответствующий ей подграф “видимости” и т.д., пока ИР не достигнет за-
данного целевого местоположения.
В случае, когда ИР требуется найти в априори неописанной ПС заданные
объекты, для планирования целесообразного поведения на заданном участке
местности эффективно могут быть использованы алгоритмы самообучения,
предложенные в [24].
Что же касается планирования целенаправленной деятельности ИР, свя-
занной с манипулированием на каждом этапе деятельности находящимися в
ПС объектами, то следует отметить, что основной операцией, которая выпол-
няется в процессе вывода решений в этом случае, является операция срав-
нения между собой различных семантических сетей. В общем случае данная
операция может быть связана
1. С необходимостью сравнения между собой семантической сети, соответ-
ствующей текущей ситуации ПС Si5 ∈ S, и активной нечеткой семантической
сети Sa на предмет их нечеткого равенства в процессе выбора сложного дей-
ствия Bj1 , результативного с точки зрения достижения заданной подцели в
текущих условиях среды.
Определение 1. Сравниваемые между собой семантические сети
Ga = (v0, Va, Ea) и Gi510 = (v0,
i10
,Ei5 ) нечетко равны, если они удовлетво-i
10
ряют следующим условиям [25]:
— данные семантические сети имеют одинаковое количество вершин и
ребер;
158
— для каждой вершины vi7 ∈ Va, помеченной в сети Ga слотом o∗i7 (X∗ )i
7
или слотом d∗i8 (Y∗), имеется структурно эквивалентная ей вершинаi
8
vi11 ∈ Vi5i10 ,помеченнаявсетиGi510 соответственнообъектомoi2(Xi2)или
происходящим в проблемной среде событием di3 (Yi3 ) ∈ D, для которых спра-
ведливы следующие условия X∗i
⊆Xi2 иY∗i
⊆ Yi3. В этом случае принимает-
7
8
ся решение, что пометки структурно эквивалентных вершин в сетях Ga
и Gi5
являются нечетко равными между собой ввиду того, что они опре-
i10
деляются одними и теми же признаками, характерными для аналогичных
друг другу объектов и событий ПС;
— для каждого неориентированного ребра ei9 ∈ Ea, помеченного в сети Ga
тройкой < T∗j
3
(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему
неориентированное ребро ei12 ∈ Ei5i10 ,помеченноезначениемri одноименно-4
го с этой тройкой отношения ri4 ∈ R, для которого выполняется условие
r∗i4 ∈ (r∗j3,r∗j3+1)илипометкисравниваемыхмеждусобойребернечеткорав-
ны между собой, так как определяются одним и тем же термом T∗j
(ri4 );
3
— для каждого ориентированного ребра ei9 ∈ Ea, помеченного в сети Ga
тройкой < T∗j
3
(ri4 ), (r∗j3 , r∗j3+1)>,имеетсяструктурноэквивалентноеему
одинаково с ним помеченное ориентированное ребро ei12 ∈ Ei5 .i
10
В противном случае, если хотя бы одно из перечисленных выше условий не
выполняется, то сравниваемые между собой семантические сети не являются
нечетко равными.
2. С определением нечеткого вложения фрагментов ΔSa = (ΔVa, ΔEa),
,Ei5 ),i
имеющих нечеткое описание, в текущую ситуацию ПС Gi5i10 =(v0,
i10
10
например, в процессе построения целенаправленной последовательности эле-
ментарных действий bi1 ∈ B.
Определение 2. Нечетко заданный фрагмент ΔS = (ΔVa,ΔEa) обоб-
щенного описания аналогичных друг другу ситуаций ПС Si5 ∈ S яв-
ляется( нечетко в)оженным в текущую ситуацию проблемной среды
, если его матрица смежности M(ΔSa) является ча-
Gi5i10
= v0, V i5i10, Ei510
стью матрицы смежности M(Gi5i10)сетиGi50 принечеткомравенствепо-1
меток структурно эквивалентных в этих сетях вершин и ребер.
Необходимо отметить, что столбцы и строки в матрицах смежности, участ-
вующих в определении нечеткого вложения одной семантической сети в дру-
гую, определяются пометками соответствующих им вершин. В свою очередь,
элементы в данных матрицах представлены нечеткими значениями пометок
ребер инцидентных вершинам, определяющим их соответствующие столбцы
и строки.
В общем случае планирование многоэтапной деятельности ИР опирается
на сформулированное роботу задание и имеющиеся у него типовые элемен-
ты модели представления знаний. Пусть на j11 этапе планирования в моде-
ли представления знаний имеется согласованная между собой и с получен-
ным заданием пара импликативных решающих правил <(1),(3)>. Допустим,
что для данных элементов соответственно выполняются следующие условия:
159
фрагмент ситуации SИi
(j4) типового элемента (1) является нечетко вложен-
5
ным в исходную на j11 шаге деятельности ситуацию ПС SИ (см. определе-j
11
ние 2); SЦi(j4) ≈ SИi(j6) и фрагмент ситуации SЦi
(j6) типового элемента (4)
5
5
5
является нечетко вложенным в целевую ситуацию среды SЦ . Тогда задачаi
11
планирования целенаправленной деятельности на данном этапе решается ИР
на основе метода 3 путем построения упорядоченной цепочки, состоящей из
таких пар. При этом типовой элемент (1) при наличии на пути движения
ИР препятствий по заданной ссылке встраивается в структуру типового эле-
мента представления знаний (4) вместо элементарного действия “подойти к
объекту”.
Следует отметить, учитывая, что ИР априори неизвестны условия ПС, в
которых ему предстоит действовать на каждом следующем этапе, робот вна-
чале отрабатывает подплан действий, полученный на текущем этапе функци-
онирования. Затем ИР переходит к планированию дальнейшей целенаправ-
ленной деятельности следующего этапа поведения.
В противном случае, когда ИР для выполнения подзадания текущего этапа
поведения требуется решить несколько подзадач, планирование целенаправ-
ленной деятельности на этом этапе сводится к автоматическому построению
дерева вывода решений на основе импликативных решающих правил (1)-(5)
с использованием метода 4. Данный метод планирования имеет следующее
описание.
1. На первом шаге построения дерева вывода решений соответствующего,
например, текущему j11 этапу деятельности, его корневая вершина v0(j11) по-
мечается целевой ситуацией SЦ . Затем в модели представления знаний опре-j
11
деляется первый акт поведения (3), у которого содержание ситуации S1,Цi(j6)
5
совпадает с содержанием целевой ситуации SЦ .j
11
При этом может возникнуть одно из условий: ситуация S1,Цi(j6) является
5
нечетко равной (см. определение 1), или нечетко вложенной (см. определе-
ние 2) в целевую ситуацию SЦ . В первом случае осуществляется переходj
11
на следующий шаг построения дерева вывода решений (п. 2), в противном
случае выполняется переход к п. 3.
2. На данном шаге построения дерева вывода решений проверяется усло-
вие: является или нет исходная ситуация S1,Иi(j6) выбранного элемента пред-
5
ставления знаний нечетко вложенной в текущую ситуацию ПС Si5 ∈ S. Если
данное условие выполняется, то план поведения, связанный с преобразова-
нием текущей ситуации ПС Si5 в ее целевую ситуацию SЦ , является постро-j
11
енным. Таким образом, для достижения заданной подцели на текущем этапе
деятельности ИР выполняет выбранное сложное действие B1 . В противномj
1
случае построение плана целенаправленной деятельности продолжается сле-
дующим образом.
На текущем k, k = 2, . . . , n шаге построения дерева вывода решений опре-
деляется результативный акт поведения (3), у которого ситуация Sk,Цi(j6)
5
160
является либо нечетко равной исходной ситуации Sk-1,Иi(j6) акта поведения
5
выбранного на предыдущем шаге ее роста, либо нечетко вложена в эту си-
туацию.
В случае, когда Sk,Цi
(j6) ≈ Sk-1,Иi
(j6), проверяется условие: является или
5
5
нет исходная ситуация Sk,Иi(j6) последнего выбранного акта поведения нечет-
5
ко вложенной в текущую ситуацию ПС Si5 ∈ S. Если данное условие является
справедливым, то принимается решение о том, что план целенаправленно-
го поведения сформирован. Таким образом, для достижения заданной под-
цели SЦ ИР требуется выполнить построенный кортеж сложных действийj
10
<Bk,... ,B2j1,B1
>.
j1
В случае же, когда условие Sk,Цi
(j6) ≈ Sk-1,Иi
(j6) не выполняется, построе-
5
5
ние основной ветви дерева вывода решений продолжается по вышеописанно-
му принципу до тех пор, пока к нему не будет присоединен акт поведения z,
у которого исходная ситуация Sz,Иi(j6) является нечетко вложенной в теку-
5
щую ситуацию ПС Si5 ∈ S.
Если же ситуация Sk,Цi(j6) оказывается нечетко вложенной в ситуацию
5
Sk-1,Иi(j6), то это сигнализирует решающей подсистеме ИР о том, что тре-
5
буется разветвление строящегося дерева вывода решений и осуществляется
переход к п. 3.
3. На данном шаге определяются подцели поведения ИР для образующих-
ся ветвей строящегося дерева вывода решений путем выполнения следующих
операций над нечеткими семантическими сетями. Для определения подцели
поведения и продолжения роста основной ветви дерева вывода или его ствола,
например на k + 1 шаге планирования из исходной ситуации Sk-1,Иi(j6) акта
5
поведения, выявленного на k - 1 шаге, вырезается подграф структурно эк-
вивалентный семантической сети Sk,Цi(j6), соответствующей акту поведения,
5
выбранному на k шаге построения дерева вывода решений. Затем выполняет-
ся переход к п.2, на котором продолжается построение ствола дерева вывода
решений на основе полученной таким образом подцели поведения.
В оставшейся же части ΔSk-1,Иi
(j6) ⊂ Sk-1,Иi
(j6) разбиваемой семантиче-
5
5
ской сети к ее разрезанным ребрам присоединяются вершины, которые были
им инцидентны в исходной семантической сети Sk-1,Иi(j5). В результате опре-
5
деляется фрагмент активной нечеткой семантической сети, определяющий
подцель поведения ИР ΔSk+1,Цi(j6) для боковой ветви строящегося дерева
5
вывода решений. Затем выполняется переход к п. 4.
4. На данном шаге для дальнейшего роста боковой ветви дерева выво-
да решений в модели представления знаний определяется акт поведения,
у которого для целевой подситуации SЦi(j6) выполняется условие SЦi(j5) ≈
5
5
≈ΔSk+1,Цi(j5). Если найден такой акт поведения, то для дальнейшего ро-
5
ста боковой ветви выполняется переход к п. 2. Если же выполняется усло-
вие SЦi
(j5) ⊂ ΔSk+1,Цi
(j5), то рост боковой ветви дерева вывода решений осу-
5
5
ществляется по описанному в пп. 3, 4 принципу.
161
В случае же, когда такой акт поведения не найден, то дальнейший рост
боковой ветви дерева вывода решений осуществляется по тому же принципу,
что и на основе формального описания условий и результатов выполнения
сложных действий Bj1 , но только с использованием элементарных актов по-
ведения (2).
Таким образом, построенное описанным выше способом дерево вывода ре-
шений определяет план целенаправленной деятельности ИР, состоящий из
входящих в него различных актов поведения, связанных между собой усло-
виями нечеткого равенства или нечеткого вхождения соответствующих им
фрагментов нечетких семантических сетей. Отработка ИР данного плана це-
ленаправленной деятельности начинается с выполнения последнего сложно-
го действия, присоединенного к стволу дерева вывода решений. При этом
подпланы целенаправленной деятельности, соответствующие боковым вет-
вям построенного дерева, отрабатываются в порядке возникновения условий,
сигнализирующих о необходимости их построения, начиная с последнего при-
соединенного к ним сложного действия.
Примеры планирования целенаправленной деятельности ИР на основе
предложенных типовых элементов представления знаний с использованием
методов 3, 4 приводятся в Приложении П.1.
При самопроизвольном появлении в ПС событий di5 (Yi5 ) ∈ D, препятст-
вующих эффективной отработке действий сформированного на текущем эта-
пе плана поведения, ИР приостанавливает свою текущую целенаправленную
деятельность и переключается к построению и отработке подплана, связан-
ного с устранением негативного влияния этих событий на его дальнейшую
деятельность. Данный подплан поведения автоматически формируется таким
же способом, как и основной план целенаправленной деятельности. Только
в этом случае процесс построения дерева вывода решений на первом шаге
осуществляется на основе импликативных решающих правил (4) и (5). После
устранения негативного влияния возникшего в ПС события di5 (Yi5 ) ∈ D, ИР
продолжает свою многоэтапную целенаправленную деятельность. Для этого
он, в зависимости от сложившейся в ПС ситуации Si5 ∈ S, использует либо
ранее разработанный план целенаправленной деятельности, либо переплани-
рует свою дальнейшую деятельность с учетом произошедших в проблемной
среде изменений.
Предложение 1. Функциональная сложность β метода 4 планирова-
ния целенаправленной деятельности на каждом ее этапе зависит от ко-
личества операций сравнения пометок вершин и ребер в сопоставляемых
между собой семантических сетях и определяется следующими граничны-
ми оценками:
∑
∑
3δ
n2
≤ β ≤ 3δλ
n2
,
j12
j12
j12=1
j12=1
где δ, λ - соответственно общее количество выполненных шагов вывода ре-
шений и импликативных решающих правил, хранящихся в модели представ-
162
ления знаний, связанных с решаемой ИР задачей на текущем этапе дея-
тельности; nj12 - количество вершин у максимальной по размерам семан-
тической сети, участвующей в процессе вывода решений на j12 шаге плани-
рования.
Доказательство сформулированного предложения приводится в Приложе-
нии П.2.
Таким образом, наиболее трудоемкий метод 4 планирования многоэтап-
ной деятельности ИР имеет полиномиальную сложность второго поряд-
ка. Это позволяет ориентировочно определить производительность бортовой
ЭВМ, необходимой для его реализации с учетом функционального назначе-
ния создаваемого интеллектуального робота.
5. Заключение
1. Предложенные элементы модели представления знаний позволяют ИР
адаптироваться к априори неописанным проблемным средам путем конкрети-
зации в процессе вывода решений имеющихся в их структуре слотов с учетом
текущей ситуации ПС. Это, в свою очередь, обеспечивает ИР возможность
на основе разработанных процедур вывода решений автоматически генери-
ровать планы целенаправленной многоэтапной деятельности в нестабильных
априори неописанных условиях функционирования.
2. Разработанные типовые элементы представления знаний позволяют су-
щественным образом сузить пространство поиска решаемых ИР задач за счет
выбора на каждом шаге планирования целенаправленной деятельности не од-
ного, а сразу нескольких результативных действий. Кроме того, определение
таких результативных действий осуществляется не путем перебора, а на осно-
ве целенаправленного выбора с учетом условий ПС, в которых ИР предстоит
решать стоящую перед ним подзадачу на каждом этапе целенаправленной
деятельности.
3. Важная особенность предложенных элементов представления знаний и
методов вывода решений заключается в возможности их использования для
вывода решений на семантических сетях, позволяющих наиболее выразитель-
но и компактно выполнить формальное описание текущих условий функци-
онирования ИР в различных по сложности ПС.
4. К основному недостатку предложенного подхода к построению интел-
лектуального решателя задач, позволяющего ИР планировать целенаправ-
ленную деятельность в априори неописанных нестабильных проблемных сре-
дах, следует отнести громоздкость задаваемой роботу цели. В этой связи воз-
никает необходимость в дальнейшем развитии проведенного исследования,
связанного с построением типовых элементов представления знаний, позво-
ляющих формулировать ИР цель поведения в виде одной общей задачи. За-
тем выполнять разбиение этой задачи на подзадачи, решение которых обес-
печивает достижение полученных подцелей в сложившихся в ПС условиях
на различных этапах функционирования.
163
ПРИЛОЖЕНИЕ
П.1. Примеры решения ИР гипотетических задач
Задача 1. Допустим, что робот получил следующее задание. Находясь
на одном из участков ПС с препятствиями, роботу требуется перейти на
другой ближайший к нему участок этой среды, на котором необходимо пе-
ренести объект o1(X1) и поставить на объект o2(X2). Затем попасть на
следующий участок ПС, на котором следует заменить объект o3(X3) (на-
пример, разряженную батарею питания), находящийся в закрытой дверцей
нише объекта o4(X4) (например, электронного прибора) на объект o5(X5)
(заряженную батарею питания).
Пусть в ПС выполняются следующие условия. В исходном состоянии ИР
наблюдает объект o1(X1), а на пути движения к этому объекту имеются
препятствия. Между объектами o1(X1) и o2(X2) препятствия отсутствуют.
Из местоположения объекта o2(X2) ИР становится видимым объект o4(X4),
а между данными объектами в ПС имеются непреодолимые для робота пре-
пятствия. Объект o5(X5) находится в специальном для этого “кармане 1” ИР.
Следует отметить, что сформулированное ИР задание состоит из следую-
щих двух этапов. На первом этапе ИР требуется перейти в ПС с препятст-
виями к местоположению объекта o1(X1). После этого захватить этот объект
и перенести его к местоположению объекта o2(X2). Затем поставить объ-
ект o1(X1) на поверхность объекта o2(X2).
На втором этапе ИР необходимо перейти в ПС с препятствиями к местопо-
ложению объекта o4(X4). После этого заменить объект o3(X3), находящийся
в специальной для этого нише внутри объекта o4(X4), на объект o5(X5).
Таким образом, ИР для выполнения сформулированного ему задания тре-
буется использовать типовые элементы модели представления знаний, обес-
печивающие решение следующих подзадач.
1. Построить маршрут перемещения ИР в ПС с препятствиями, при усло-
вии воспринимаемого в среде целевого местоположения (типовой элемент
представления процедурных знаний для решения данной подзадачи опреде-
ляется методом 1 ).
2. Отработать сложное действие B1 (поставить объект o∗1(X∗1) на
объект o∗2(X∗2)) при условии, что данные объекты расположены в зоне пря-
мой видимости за пределами рабочей зоны манипулятора ИР. Здесь харак-
теристики X∗1 слота o∗1(X∗1) показывают, что первый, находящийся в ПС объ-
ект o1(X1), для эффективной отработки действий данного элемента модели
представления знаний должен имеет определенные габаритные размеры и
вес, позволяющие ИР захватить поднять и перенести этот объект. В свою
очередь, характеристики X∗2 слота o∗2(X∗2) показывают, что для того, чтобы
ИР мог поставить объект o1(X1) на объект o2(X2), последний должен иметь
плоскую поверхность.
Сложное действие B1 данного элемента представления знаний состоит
из кортежа следующих элементарных действий: <подойти к объекту o∗1(X∗1)
164
(при наличии в ПС препятствий отработать данное действие, используя ме-
тод 1); захватить объект o∗1(X∗1); поднять объект o∗1(X∗1); перейти к объекту
o∗2(X∗2) (при наличии в ПС препятствий отработать данное действие, исполь-
зуя метод 1 ); поставить объект o∗1(X∗1) на поверхность объекта o∗2(X∗2) >.
3. Выполнить сложное действие B2 [провести замену объекта o∗3(X∗3), на-
ходящегося в нише с дверцей объекта o∗4(X∗4), на объект o∗5(X∗5)]. В данном
элементе представления знаний характеристики X∗1 слота o∗1(X∗1) показыва-
ют, что имеющийся у ИР объект o5(X5) для эффективной отработки действий
данного элемента модели представления знаний должен удовлетворять сле-
дующему условию X∗5 ⊆ X5. В свою очередь, для выполнения сложного дей-
ствия B2 для объектов o3(X3) и o4(X4) соответственно должны выполняться
следующие условия X∗3 ⊆ X3 и X∗4 ⊆ X4.
При этом сложное действие B2 состоит из следующего кортежа элементар-
ных действий: <подойти к объекту o∗4(X∗4) [при наличии в ПС препятствий
для отработки действия использовать метод 1 ]; открыть дверцу ниши объ-
екта o∗4(X∗4), в которой расположен объект; отключить объект o∗3(X∗3) от се-
ти питания; вынуть объект o∗3(X∗3) из ниши объекта o∗4(X∗4); опустить объект
o∗3(X∗3) на поверхность земли; достать из “кармана 1” объект o∗5(X∗5); вставить
объект o∗5(X∗5) в нишу объекта o∗4(X∗4); подключить объект o∗5(X∗5) к сети пи-
тания, закрыть крышку ниши объекта o∗4(X∗4); поднять с земли объект o∗3(X∗3)
и поместить его в “карман 2”>.
Таким образом, используя метод 3 и сформулированное задание, ИР при-
ступает к планированию целенаправленной деятельности, связанной с выпол-
нением первого этапа функционирования. Пусть на первом шаге такого пла-
нирования на основе метода 3 робот устанавливает, что для объектов o1(X1),
o2(X2) и типового элемента представления знаний “поставить объект o∗1(X∗1)
на объект o∗2(X∗2)” соответственно выполняются следующие условия X∗1 ⊆ X1
и X∗2 ⊆ X2. Отсюда для решения подзадачи первого этапа целенаправленной
деятельности, ИР использует типовой элемент представления знаний, связан-
ный с выполнением сложного действия B1. Таким образом, подплан первого
этапа будет определяться кортежем элементарных действий этого сложного
действия, в котором слоты o∗1(X∗1) и o∗2(X∗2) помечены соответственно нахо-
дящимися в ПС объектами o1(X1) и o2(X2).
При этом, учитывая, что на пути движения робота к объекту o1(X1) в сре-
де имеются препятствия, отработка первого действия полученного подплана
поведения выполняется с привлечением по ссылке метода 1. В итоге под-
план первого этапа целенаправленной деятельности состоит из двух типовых
элементов процедурной модели представления знаний ИР.
Кроме того, исходя из того, что ИР априори неизвестны условия ПС, в
которых предстоит выполнять второй этап целенаправленной деятельности,
робот непосредственно реализует подплан поведения первого этапа. В ре-
зультате этого ИР переходит на новый участок ПС, на котором, согласно
текущим условиям функционирования, объект o4(X4) ему становится види-
мым. Это позволяет ИР на втором этапе планирования целенаправленной
165
деятельности, для достижения соответствующей ему подцели, выбрать эле-
мент представления знаний, соответствующий сложному действию B2.
Пусть для объектов ПС o3(X3), o4(X4) и o5(X5), а также данного элемен-
та представления знаний, соответственно выполняются следующие условия
X∗3 ⊆ X3, X∗4 ⊆ X4 и X∗5 ⊆ X5. В этом случае, согласно методу 3, подплан це-
ленаправленной деятельности ИР второго этапа будет состоять из кортежа
элементарных действий сложного действия B2, в котором слоты помечены
удовлетворяющими их требованиям объектами ПС. При этом первое дей-
ствие этого кортежа выполняется с привлечением выбранного по его ссылке
метода 1.
В итоге выполнение сформулированного ИР задания сводится к отработке
следующего кортежа сложных действий 〈B1, B2〉, в которых первые элемен-
тарные действия “подойти к заданному объекту” реализуются с привлечением
метода 1.
Задача 2. Рассмотрим случай, когда ИР на одном из этапов требует-
ся решить несколько взаимосвязанных между собой подзадач. Например,
“снять объект o5(X5), расположенный на объекте o6(X6)” и “заменить объ-
ект o7(X7), находящийся в закрытой дверцей нише объекта o8(X8), на объ-
ект o5(X5)”.
В этом случае для планирования целенаправленной деятельности ИР ис-
пользует метод 4. При этом сформированный подплан целенаправленной
деятельности ИР будет состоять из следующего кортежа типовых элемен-
тов модели представления знаний <сложное действие B3, сложное действие
B2>. Здесь третье сложное действие определяется следующим типовом эле-
ментом B3 (снять объект o∗5(X∗5), расположенный на объекте o∗6(X∗6)). При
этом, если на пути движения ИР к объекту o6(X6) и пути перехода от место-
положения объекта o6(X6) к местоположению в ПС объекта o8(X8) имеются
препятствия, то первые элементарные действия сложных действий B3 и B2
отрабатываются роботом с привлечением для этого метода 1.
П.2. Доказательство сформулированного утверждения
Доказательство предложения
1. Справедливость сформулиро-
ванного предложения вытекает из следующих соображений.
1. На каждом j12 шаге вывода решений сравниваются между собой семан-
тические сети, представляющие собой помеченные графы. Следовательно,
количество сравнений между собой пометок имеющихся в них структурно
эквивалентных вершин и ребер не может превышать величины, равной n2
j12
2. Каждый шаг вывода решений в процессе построения плана целенаправ-
ленного поведения на текущем этапе деятельности сводится к выбору путем
направленного перебора акта поведения, удовлетворяющего следующим усло-
виям: SИi(j4) ≈ SИj
,SЦi(j4) ≈ SИi(j6) и SЦi(j6) ≈ SЦ .j
5
11
5
5
5
11
Таким образом, количество сравнений пометок в сопоставляемых между
собой семантических сетях, в лучшем случае, когда результативный акт по-
166
ведения выбирается в первую очередь (что вполне вероятно), может быть не
менее трех. Следовательно, в течение δ шагов синтеза дерева вывода реше-
ний, исходя из п. 1 проводимого доказательства, количество таких сравнений
∑δ
не может быть менее величины, равной 3δ
n2
j12=1
j12
В худшем же случае, когда необходимое импликативное решающее прави-
ло определяется в последнюю очередь, количество сравнений пометок в со-
поставляемых между собой семантических сетях на каждом j12 шаге вывода
решений выполняется не более λ раз. Следовательно, количество сравнений
между собой пометок структурно эквивалентных вершин и ребер в сопостав-
ляемых семантических сетях на протяжении всего процесса построения дере-
ва вывода решений, состоящего из δ шагов, не может превышать величины,
∑δ
равной 3δλ
n2
j12=1
j12
3. Из пп. 1-2 проводимого доказательства с очевидностью следует спра-
ведливость сформулированного предложения.
СПИСОК ЛИТЕРАТУРЫ
1.
Melekhin V.B., Khachumov M.V. Planning polyphasic behavior of autonomous
intelligent mobile systems in uncertain environments // Inform. Control. Syst. 2021.
V. 113. No. 4. P. 28-36.
2.
Амосов Н.М. Алгоритмы разума. Киев: Наукова думка, 1979.
3.
Kelly A. Mobile Robotics: Mathematics, Models, and Methods. Cambridge: Cam-
bridge University Press, 2013.
4.
Давыдов О.И., Платонов А.К. Роботы и искусственный интеллект. Технокра-
тический подход // Препринт ИПМ им. М.В. Келдыша. 2017. № 112. 24 с.
5.
Гаазе-Рапопорт М.Г., Поспелов Д.А. От амебы к роботу. Модели поведения.
4 изд., стереотип. М.: URSS, 2019.
6.
Kober J., Peters J. Learning Motor Skills: From Algorithms to Robot Experiments.
Cham: Springer, 2014.
7.
Абасов И.Б., Игнатьев В.В., Орехов В.В. Дизайн автономного мобильного ро-
бототехнического комплекса // Междунар. науч.-исслед. журн. 2019. № 1-1.
С. 3340-3351.
8.
Russell S., Norvig P. Artificial Intelligence: A Modern Approach. 4 ed. Pearson,
2020.
9.
Вагин В.Н. Дедуктивный вывод на знаниях / Искусственный интеллект. В 3-х
кн. Кн. 2. Методы и модели. Справочник: под ред. Д.А. Поспелова. М.: Радио
и связь, 1990. С. 89-105.
10.
Абросимов В.К. Нейронная пространственно-временная модель движения объ-
ектов управления //Нейрокомпьютеры. Разработка, применение. 2014. № 3.
С. 26-35.
11.
Бодин О.Н., Безбородова О.Е., Спиркин А.Н., Шерстнев В.В. Бионические си-
стемы управления робототехническими комплексами. Пенза: ПГУ, 2022.
12.
Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволю-
ционной кибернетики. М.: Ленанд, 2019.
13.
Каляев А.В., Чернухин Ю.В., Носков В.Н., Каляев И.А. Однородные управ-
ляющие структуры адаптивных роботов. М.: Наука, 1990.
167
14.
Мелехин В.Б., Хачумов М.В. Планирование поведения автономных интеллек-
туальных систем в условиях неопределенности: под ред. проф. М.В. Хачумова.
СПб.: Политехника, 2022.
15.
Павловский В.Е., Павловский В.В. Технологии SLAM для подвижных роботов:
состояние и перспективы // Мехатроника, автоматизация, управление. 2016.
Т. 1. № 6. С. 384-394.
16.
Labbe M., Michaud F. RTAB-Map as an open-source lidar and visual simultaneous
localization and mapping library for large-scale and long-term online operation //
Field Robotics. 2019. No. 35. P. 416-446.
17.
Носков В.П., Рубцов И.В. Ключевые вопросы создания интеллектуальных мо-
бильных роботов // Инженер. журн.: наука и инновации. 2013. Вып. 3. С. 1-11.
18.
Заева К.А., Семенов А.Б. Метод маршрутизации с препятствиями на основе
параллельных вычислений // Вестник ТвГУ. Прикладная математика. 2016.
Вып. 3. С. 85-95.
19.
Tomas L.P., Michael A.W. An algorithm for planning collision-free paths among
polyhedral obstacles // Commun. ACM. 1979. Vol. 22. No. 10. P. 560-570.
20.
Поспелов Д.А. Ситуационное управление: теория и практика. 2-е изд., стереотип.
М.: URSS, 2022.
21.
Мелехин В.Б., Хачумов М.В. Элементы понятийного мышления в планировании
поведения автономных интеллектуальных агентов // Мехатроника, автоматиза-
ция, управление. 2021. Т. 22. № 8. С. 411-419.
22.
Melekhin V.B., Khachumov M.V. Fuzzy semantic networks as an adaptive model
of knowledge representation of autonomous intelligent systems // Sci. Tech. Inf.
Process. 2021. Vol. 48. No. 5. P. 1-8.
23.
Заде Л. Понятие лингвистической переменной и его применение для принятия
приближенных решений: пер. с англ. М.: Мир, 1976.
24.
Мелехин В.Б., Хачумов М.В. Процедуры самообучения автономных интеллек-
туальных мобильных систем в нестабильных априори неописанных проблемных
средах // Мехатроника, автоматизация, управление. 2022. Т. 23. № 7. С. 356-366.
25.
Мелехин В.Б., Хачумов М.В. Принцип построения процедур планирования
поведения автономных интеллектуальных роботов на основе полипеременных
условно-зависимых предикатов // АиТ. 2022. № 4. С. 140-154.
Статья представлена к публикации членом редколлегии О.П. Кузнецовым.
Поступила в редакцию 20.07.2022
После доработки 09.06.2023
Принята к публикации 30.09.2023
168