Известия РАН. Теория и системы управления, 2021, № 3, стр. 39-56

ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА ПЛАНИРОВАНИЯ ГРУППОВЫХ ДЕЙСТВИЙ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ ПРИ НАБЛЮДЕНИИ НАЗЕМНЫХ МОБИЛЬНЫХ ОБЪЕКТОВ НА ЗАДАННОЙ ТЕРРИТОРИИ

В. И. Гончаренко ab*, С. Ю. Желтов c, В. А. Князь cd, Г. Н. Лебедев a, Д. А. Михайлин a, О. Ю. Царева c

a МАИ (национальный исследовательский ун-т)
Москва, Россия

b ИПУ РАН
Москва, Россия

c ФНЦ ФГУП “ГосНИИАС”
Москва, Россия

d МФТИ (национальный исследовательский ун-т)
Москва, Россия

* E-mail: vladimirgonch@mail.ru

Поступила в редакцию 14.04.2020
После доработки 29.10.2020
Принята к публикации 30.11.2020

Полный текст (PDF)

Аннотация

Рассматривается многокритериальная задача предполетного и оперативного планирования групповых действий беспилотных летательных аппаратов с учетом требуемого графика обслуживания. Предложен минимаксный критерий оперативного планирования групповых действий при изменении динамической обстановки. Сформирован облик экспертной системы управления длительностью наблюдения при поиске и обнаружении наземных объектов. Полученные результаты оценки качества решения подзадачи нейросетевого распознавания мобильных объектов на основе глубокого обучения подтвердили эффективность предложенного подхода при мониторинге контролируемой территории.

Введение. Стремительный прогресс в технических характеристиках беспилотных летательных аппаратов (БЛА) позволяет применять их в широком спектре приложений от видеонаблюдения и аэрофотосъемки до автономной доставки грузов в труднодоступные районы. Рост числа приложений, где используются БЛА, во многом основан на достижениях в области интеллектуальной обработки информации как в части планирования миссий, так и в части методов анализа сенсорной информации от датчиков БЛА, позволяющих анализировать оперативную обстановку и, при необходимости, оперативно изменять план миссии.

Важной задачей, решение которой без использования БЛА представляется весьма сложной и ресурсоемкой, является задача наблюдения (мониторинга) мобильных объектов в заданном районе. К такого рода задачам относятся мониторинг транспортных средств при их движении по заданному маршруту, контрольно-спасательный мониторинг спортивно-туристических групп в труднодоступных и опасных районах, мониторинг спортивных соревнований на обширной территории и др. При этом с ростом числа наблюдаемых объектов и увеличением контролируемой территории возрастает необходимость организации мониторинга группой БЛА, взаимодействующих между собой с целью обеспечения оптимального решения задачи.

Для эффективного мониторинга мобильных объектов необходимо решить три взаимосвязанных и взаимообусловленных подзадачи.

1. Предполетное планирование миссии с учетом имеющейся информации о параметрах движения контролируемых мобильных объектов.

2. Вывод БЛА в заданные точки контроля объектов и подтверждение/неподтверждение наличия заданного объекта в заданной области, в том числе и с помощью средств технического зрения.

3. Оперативное изменение плана миссии в соответствии с результатами выполнения подзадачи 2.

Сложность планирования названных наблюдений обусловлена, с одной стороны, многокритериальностью задачи выбора для каждого БЛА очередного наземного объекта с учетом условий их видимости и, с другой стороны, необходимостью координации групповых действий БЛА при многомерной маршрутизации и распределении между ними объектов наблюдения. Особую трудность представляет выполнение требования своевременного наблюдения изменяющих свое состояние динамических объектов (в первую очередь мобильных) “в нужном месте и в нужное время”, согласно указанному графику. Кроме того, в связи с неопределенностью динамической обстановки при существенном изменении важности объектов и их состава при получении новой видеоинформации требуется оперативное перепланирование групповых действий, которое занимает центральное место по сравнению с выполнением предполетного задания.

Анализ состояния последних исследований по данному направлению показывает, что вопросам маршрутизации групповых действий уделяется повышенное внимание [117]. Однако к числу известных эвристических методов относятся “жадный” алгоритм и алгоритм Дейкстры, пригодный только для одномерной маршрутизации, а методы направленного поиска (например, метод ветвей и границ) обладают большой трудоемкостью вычислений [15]. Кроме того, фактор несвоевременности мониторинга выбранных пунктов наблюдения не учитывается, в том числе в задачах целераспределения [46, 13, 14]. Также не уделяется должное внимание совместному нахождению маршрутов и расписания с учетом переменной важности объектов [13, 14, 18]. Таким образом, в известных подходах к планированию миссий не учтен главный фактор – время выполнения каждой операции перелета и самого наблюдения, что особенно важно в динамической обстановке.

Для указанных условий установлено, что ни один отдельно взятый подход к решению многокритериальной задачи не способен обеспечить общее решение. Поэтому предлагается поэтапное решение задачи, основанное на сочетании методов оптимального управления и элементов искусственного интеллекта на этапах предполетного и оперативного планирования групповых действий БЛА.

В данной работе предлагаются методы и алгоритмы комплексного решения трех названных выше подзадач мониторинга мобильных объектов:

− генетический алгоритм многомерной маршрутизации при формировании полетного задания;

− нейросетевые методы обнаружения и распознавания наземных объектов с помощью средств технического зрения;

− алгоритм оперативного планирования при распределении объектов наблюдения между БЛА по минимаксному критерию;

− метод нечеткой логики для оценки допустимой длительности поиска наземных объектов при их наблюдении;

− единый подход к решению задач многомерной маршрутизации и оперативного планирования.

1. Постановка задачи и предлагаемый подход к ее решению. Ставится задача формирования автоматизированной интеллектуальной системы управления групповыми действиями БЛА при наблюдении наземных объектов различного класса. Структура этой системы показана на рис. 1.

Рис. 1.

Структурная схема автоматизированной системы управления групповыми действиями БЛА при наблюдении мобильных объектов

Названная система соответствует организации мониторинга не только при выполнении полетного задания, но и при обслуживании потока заявок, поступающих в самом полете на вход замкнутой системы управления, имеющей обратную связь для коррекции полетных заданий при получении новой видеоинформации.

При решении задачи приняты следующие допущения.

1. Рассматриваются три класса обслуживаемых объектов – неподвижные пункты, координаты местоположения которых и переменные важности Bj которых заданы $(j = \overline {1,n} )$, динамические объекты (ДО) наблюдения с заданным графиком их наблюдения и мобильные объекты (МО), график обслуживания которых не задан, но требуется его определить путем прогнозирования движения МО при их известных курсах и ожидаемых скоростях $(j = \overline {1,M} )$.

2. Задание на обслуживание может поступать как до, так и во время полета БЛА.

3. Задано число $N$однотипных БЛА $(N < n + M)$, а для каждого БЛА – текущие координаты ${{X}_{i}},{{Y}_{i}},{{Z}_{i}},$ $i = \overline {1,N} $, при полете с заданной скоростью V и возможном многократном наблюдении объектов.

4. Обслуживание каждого наземного объекта планируется до полета одним БЛА и только один раз при требуемом качестве наблюдения. При снижении этого качества и других изменениях динамической обстановки необходимо оперативное планирование новых заданий во время самого полета.

5. Общим критерием эффективности планирования является максимум отношения суммарной важности Вj обслуживаемых наблюдаемых объектов к сумме Cj эксплуатационных затрат, зависящих от суммарной длины Sj(i) пройденного каждым БЛА пути группового полета:

(1.1)
$J = \frac{{\sum\limits_{j = 1}^N {\sum\limits_{i = 1}^{n + M} {{{B}_{j}}(i,T)} } }}{{\sum\limits_{j = 1}^N {\sum\limits_{i = 1}^{n + M} {{{S}_{j}}(i,T)} } }},$
где T – заданное время группового полета.

Критерий (1.1) есть величина, обратная известному понятию минимума “цены разведки” или затрат на единицу взвешенной по важности и своевременности “добытой” видеоинформации. Предметом выбора являются состав объектов наблюдения для каждого БЛА и маршруты их облета с учетом переменных параметров динамической обстановки, входящих в числитель и знаменатель критерия (1.1).

Известные попытки решения многомерных задач планирования сводятся к максимизации числителя при фиксированном знаменателе либо к минимизации знаменателя при ограничении числителя, однако в ряде случаев это неэффективно. В данной работе предлагается решение названных выше подзадач целераспределения и маршрутизации при одновременном учете нужного состава динамических переменных как в числителе, так и в знаменателе при возможном использовании не одного, а нескольких частных критериев.

В результате решения задачи требуется:

− определить состав основных динамических переменных, влияющих на “доходную” и “затратную” части критерия (1.1) эффективности системы, и с их учетом разработать алгоритмы многомерной маршрутизации и целераспределения объектов наблюдения между группой БЛА;

− сформировать предполетный план и оперативные планы групповых действий БЛА с учетом своевременности соблюдения графика наблюдения динамических и мобильных объектов и ограниченной длительности самого наблюдения;

− обеспечить “в нужное время и в нужном месте” наблюдение мобильных и других объектов в заданные интервалы времени для их обнаружения и распознавания на изображениях, поступающих от оптико-электронной системы БЛА. В этом и состоит главная особенность постановки решаемой задачи;

− по результатам обнаружения и распознавания скорректировать полетное задание.

2. Назначение динамических приоритетов наблюдаемых объектов с помощью мультипликативного критерия. В рассматриваемой задаче значимость каждого  j-го наземного объекта должна учитывать ряд параметров, имеющих разную физическую размерность – априорную постоянную важность ${{d}_{j}}$, максимальную для ДО и МО, их переменную значимость ${{b}_{j}}$, растущую при увеличении времени ${{\tau }_{j}}$ их ненаблюдения, их меняющуюся в полете удаленность ${{R}_{j}}$ от группы БЛА и ожидаемое в текущий момент время Δtj несоблюдение графика их обслуживания. Для количественной оценки этой значимости решена частная задача динамического программирования [19, 20], когда критерием оптимальности наблюдения является минимум интегрального функционала $I$, оценивающего потери информации при несвоевременном наблюдении объектов во время перелетов БЛА:

(2.1)
$I = \mathop {\min }\limits_{j(t)} \int\limits_0^T {\sum\limits_{j = 1}^{n + M} {{{d}_{j}}{{b}_{j}}{{\tau }_{j}}dt} } .$

Смысл представленного критерия (2.1) состоит в следующем. Произведение первых двух сомножителей dj и bj определяет общую динамическую важность Bj  выбранного объекта и характеризует его ожидаемую “доходную” часть. С другой стороны, чем больше время τj его ненаблюдения, тем выше риск негативных потерь, особенно у МО и ДО, из-за несвоевременности контроля. Поэтому на каждом шаге перелетов нужно выбирать первоочередными такие объекты, чтобы общие потери информации при наблюдении заданной территории были минимальны с учетом динамики изменений переменных ${{b}_{j}}(t)$ и ${{\tau }_{j}}(t)$.

В данной работе принято, что динамика нарастания времени ненаблюдения τj проста – она совпадает с динамикой изменения текущего времени, а динамика нарастания нормированной переменной bj описывается системой дифференциальных уравнений второго порядка в отличие от ранее известной экспоненциальной модели [20]:

(2.2)
$\frac{{d{{x}_{{1i}}}}}{{dt}} = \left\{ \begin{gathered} {{x}_{{2j}}}\quad {\text{при}}\quad i \ne j, \hfill \\ - \frac{{{{x}_{{1j}}}}}{{\Delta t}}\quad {\text{при}}\quad i = j, \hfill \\ \end{gathered} \right.\quad \frac{{d{{x}_{{2i}}}}}{{dt}} = \left\{ \begin{gathered} {{a}_{i}}\quad {\text{при}}\quad i \ne j, \hfill \\ - \frac{{{{x}_{{2j}}}}}{{\Delta t}}\quad {\text{при}}\quad i = j, \hfill \\ \end{gathered} \right.\quad \frac{{d{{\tau }_{i}}}}{{dt}} = \left\{ \begin{gathered} 1\quad {\text{при}}\quad i \ne j, \hfill \\ - \frac{{{{\tau }_{j}}}}{{\Delta t}}\quad {\text{при}}\quad i = j, \hfill \\ \end{gathered} \right.$
где i – номер любого объекта,  j – номер выбранного объекта, ${{\tau }_{j}}$ – время ненаблюдения, ${{x}_{{1i}}} = {{b}_{i}}$ – переменная значимость; ${{x}_{{2i}}}$ – скорость нарастания значимости при ненаблюдении; $\Delta t$ – заданное время наблюдения одного объекта; ai – заданная постоянная величина ускорения постепенного возрастания скорости увеличения значимости ${{x}_{{1i}}}$ в интервале [0, 1]. Использование системы (2.2) обеспечивает малую скорость возрастания значимости в начале ненаблюдения, что более правдоподобно, чем у системы первого порядка, а обнуление переменных ${{\tau }_{j}}$, ${{x}_{{1j}}}$, ${{x}_{{2j}}}$ в процессе успешного наблюдения выбранного j-го объекта соответствует временному исчезновению к нему интереса.

Тогда с учетом (2.1) и (2.2) можно получить уравнение Беллмана в частных производных:

(2.3)
$ - \frac{{\partial \varepsilon }}{{\partial t}} = \mathop {\min }\limits_j \left\{ {\sum\limits_{i = 1}^n {{{d}_{i}}{{x}_{{1i}}}{{\tau }_{i}}} + \sum\limits_{i \ne j}^n {\left( {\frac{{\partial \varepsilon }}{{\partial {{x}_{{1i}}}}}{{x}_{{2i}}} + \frac{{\partial \varepsilon }}{{\partial {{x}_{{2i}}}}}{{a}_{i}} + \frac{{\partial \varepsilon }}{{\partial {{\tau }_{i}}}}} \right)} - \left( {\frac{{\partial \varepsilon }}{{\partial {{x}_{{1j}}}}}\frac{{{{x}_{{1j}}}}}{{\Delta t}} + \frac{{\partial \varepsilon }}{{\partial {{x}_{{2j}}}}}\frac{{{{x}_{{2j}}}}}{{\Delta t}} + \frac{{\partial \varepsilon }}{{\partial {{\tau }_{j}}}}\frac{{{{\tau }_{j}}}}{{\Delta t}}} \right)} \right\},$
где $\varepsilon ({{{\mathbf{\bar {x}}}}_{1}},{{{\mathbf{\bar {x}}}}_{2}},\bar {\tau })$ – искомая функция Беллмана от текущего состояния трех векторов ранее названных переменных x1, x2, τ при оптимальном поведении системы. Последнее слагаемое в фигурных скобках есть приоритет Πj, а первое слагаемое в правой части уравнения (2.3) – подынтегральное выражение функционала I (2.1).

Тогда функцию Беллмана $\varepsilon $ с учетом парных произведений ${{b}_{j}}$ ${{r}_{j}}$ в функционале I можно приближенно представить в виде степенного полинома второго порядка с девятью искомыми коэффициентами ${{\beta }_{i}},{{\psi }_{{ij}}},{{\gamma }_{{ij}}}$:

(2.4)
$\varepsilon = \sum\limits_{i = 1}^n {\left[ {\left( {{{\beta }_{{1i}}}{{x}_{{1i}}} + {{\gamma }_{{1i}}}\frac{{x_{{1i}}^{2}}}{2}} \right)} \right.} + \left( {{{\beta }_{{2i}}}{{x}_{{2i}}} + {{\gamma }_{{2i}}}\frac{{x_{{2i}}^{2}}}{2}} \right) + \left. {\left( {{{\beta }_{{3i}}}{{\tau }_{i}} + {{\gamma }_{{3i}}}\frac{{\tau _{i}^{2}}}{2}} \right) + \left( {{{\psi }_{{12i}}}{{x}_{{1i}}}{{x}_{{2i}}} + {{\psi }_{{13i}}}{{x}_{{1i}}}{{\tau }_{i}} + {{\psi }_{{23i}}}{{x}_{{2i}}}{{\tau }_{i}}} \right)} \right].$

Нахождение этих коэффициентов возможно с помощью метода рабочей точки [21], согласно которого в окрестности этой точки вычисляются ординаты Ci минимального риска, которые необходимо приравнять друг к другу. Поэтому, задавшись 10 ординатами риска, можно получить систему необходимых линейных алгебраических уравнений:

$4\Delta {{x}_{1}}{{\psi }_{{12j}}} + {{\beta }_{{2j}}} + 3\Delta {{x}_{2}}{{\gamma }_{{2j}}} + 2\Delta \tau {{\psi }_{{23j}}} = 0\,;$
${{\beta }_{{1j}}} + {{\gamma }_{{1j}}}3\Delta {{x}_{1}} + 4\Delta \tau {{\psi }_{{13j}}} + 2\Delta {{x}_{2}}{{\psi }_{{12j}}} = 2{{d}_{j}}\Delta \tau \Delta t;$
${{\beta }_{{3j}}} + 3\Delta \tau {{\gamma }_{{3j}}} + 4\Delta {{x}_{2}}{{\psi }_{{23j}}} + 2\Delta {{x}_{1}}{{\psi }_{{13j}}} = {{d}_{j}}\Delta {{x}_{1}}\Delta \tau \,;$
$\left[ {{{\beta }_{{1j}}} + 3\Delta {{x}_{1}}{{\gamma }_{{1j}}} + 2\Delta \tau {{\psi }_{{13j}}}} \right]\Delta {{x}_{1}} - \left[ {{{\beta }_{{2j}}} + 3\Delta {{x}_{2}}{{\gamma }_{{2j}}} + 2\Delta \tau {{\psi }_{{23j}}}} \right]\Delta {{x}_{2}} = {{d}_{j}}\Delta {{x}_{1}}\Delta \tau \,;$
$\left[ {{{\beta }_{{1j}}} + 3\Delta {{x}_{1}}{{\gamma }_{{1j}}} + 2{{\psi }_{{12j}}}\Delta {{x}_{2}}} \right]\Delta {{x}_{1}} - \left[ {{{\beta }_{{3j}}} + 3\Delta \tau {{\gamma }_{{3j}}} + 2\Delta {{x}_{2}}{{\psi }_{{23j}}}} \right]\Delta \tau = 0\,;$
(2.5)
${{\beta }_{{1j}}} + 3\Delta {{x}_{1}}\Delta {{x}_{2}}{{\gamma }_{{1j}}} + 2\psi _{{12j}}^{{}}\Delta {{x}_{2}} + 2\psi _{{13j}}^{{}}\Delta \tau = {{d}_{j}}\Delta {{x}_{1}}\Delta \tau \,;$
${{\gamma }_{{1j}}}\left( {\Delta {{x}_{2}} - \frac{{\Delta {{x}_{1}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\psi }_{{12j}}}\left( {{{a}_{i}} - \frac{{\Delta {{x}_{2}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\psi }_{{13j}}}\left( {1 - \frac{{\Delta \tau }}{{\left( {n - 1} \right)\Delta t}}} \right) = - {{d}_{j}}\Delta \tau ;$
${{\psi }_{{12j}}}\left( {\Delta {{x}_{2}} - \frac{{\Delta {{x}_{1}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\gamma }_{{2j}}}\left( {{{a}_{i}} - \frac{{\Delta {{x}_{2}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\psi }_{{23j}}}\left( {1 - \frac{{\Delta \tau }}{{\left( {n - 1} \right)\Delta t}}} \right) = - {{d}_{j}}\Delta \tau \frac{{\Delta {{x}_{1}}}}{{\Delta {{x}_{2}}}};$
${{\psi }_{{13j}}}\left( {\Delta {{x}_{2}} - \frac{{\Delta {{x}_{1}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\psi }_{{23j}}}\left( {{{a}_{i}} - \frac{{\Delta {{x}_{2}}}}{{\left( {n - 1} \right)\Delta t}}} \right) + {{\gamma }_{{3j}}}\left( {{{a}_{i}} - \frac{{\Delta \tau }}{{\left( {n - 1} \right)\Delta t}}} \right) = - {{d}_{j}}\Delta {{x}_{1}}.$

На основании полученного решения установлено, что назначение динамических приоритетов ${{\Pi }_{j}}$, зависящих от искомых коэффициентов ${{\beta }_{i}},{{\psi }_{{ij}}},{{\gamma }_{{ij}}}$ функции Беллмана, имеет следующую мультипликативную форму, которая выгодно отличается от известной аддитивной за счет исключения “узких мест” в оценке каждого объекта, когда один из сомножителей явно мал:

(2.6)
${{\Pi }_{j}} \approx {{d}_{j}}\left( {{{x}_{{1j}}} + \Delta t{{x}_{{2j}}}} \right)\left( {{{\tau }_{j}} + 3\Delta t} \right).$

Учитывая преимущество найденной формы (2.6) при обслуживании неподвижных пунктов и повышенную важность своевременного обслуживания мобильных и динамических объектов, в данной работе предложено ее обобщение для других динамических переменных в следующем эвристическом виде:

(2.7)
${{\Pi }_{1}} = \mathop {\max }\limits_j ({{X}_{{1j}}} + {{m}_{1}})({{X}_{{2j}}} + {{m}_{2}})({{X}_{{3j}}} + {{m}_{3}}),$
где ${{X}_{{nj}}}$ – безразмерные максимизируемые показатели, полученные путем деления значений ${{b}_{j}},{{r}_{0}}$ и $\Delta {{t}_{0}}$ на их максимальные значения:
(2.8)
${{X}_{{1j}}} = \frac{{{{b}_{j}}}}{{{{b}_{{\max }}}}};\quad {{X}_{{2j}}} = \frac{{{{r}_{0}}}}{{{{r}_{0}} + {{R}_{j}}}};\quad {{X}_{{3j}}} = \frac{{\Delta {{t}_{0}}}}{{\Delta {{t}_{0}} + \Delta {{t}_{j}}}}/,$
a ${{b}_{{\max }}}$, r0, $\Delta {{t}_{0}}$ заданы.

Соответственно в формулах (2.8) значение

${{R}_{j}} = \frac{1}{N}\sum\limits_{i = 1}^N {{{r}_{{ij}}}} $
характеризует среднюю текущую удаленность  j-го объекта от совершающей полет группы БЛА, а $\Delta {{t}_{j}} = \left| {{{\upsilon }_{j}} - t - \mathop {\min }\limits_i ({{r}_{{ij}}}{\text{/}}V)} \right|$ – время несоблюдения заданного графика, где ${{\upsilon }_{j}}$ – требуемый, согласно графику, момент наблюдения, t – текущее время, $\mathop {\min }\limits_i ({{r}_{{ij}}}{\text{/}}V)$ – требуемое минимальное время для перелета БЛА к нужному j-му объекту. Согласно формулам (2.7) и (2.8), знаменатель в выражении для X3 падает с течением времени из-за уменьшения интервала $\Delta {{t}_{j}}$ и приоритет такого объекта растет, что требует его первоочередного обслуживания.

Сомножителями мультипликативной формы одновременно являются показатели числителя и знаменателя общего критерия (1.1), в отличие от “жадного” алгоритма, учитывающего только связанные с длиной пути затраты топлива. В свою очередь mj – весовые коэффициенты, назначаемые заранее и устанавливающие неодинаковую значимость показателей. Уменьшение каждого из них приведет к повышению значимости соответствующего сомножителя в свертке (2.7) при соблюдении условия:

(2.9)
$\sum\limits_{i = 1}^3 {{{m}_{i}}} = 1.$

При условии (2.9) мультипликативные произведения в формуле (2.7) приобретают значимость на порядок выше аддитивных слагаемых. Полученная форма свертки (2.7) требует при технической реализации минимального числа операций умножения и сложения и ниже используется как при предполетном, так и оперативном планировании [22, 23].

3. Алгоритм предполетного планирования маршрутов группового полета. В данной работе предложен высокоэффективный генетический алгоритм, гарантирующий достижение глобального экстремума при особом способе формирования “элиты” и “потомков” на каждом шаге эволюции [24]. Генетический алгоритм отличается тем, что планируемые маршруты группового полета разбиваются на три участка – начала, середины и конца полета, границами которых являются динамические или мобильные объекты с требуемым графиком обслуживания, а внутри этих участков в план попадают менее важные неподвижные пункты, чтобы затем с помощью одного из трех двухпараметрических критериев сформировать первоначальную “элиту” лучших частных одномерных маршрутов.

Для этого используются три следующих частных двухпараметрических критерия:

− формирование первого маршрута полета при выборе очередного объекта по критерию минимальной длины пути, и включающего наиболее важные объекты без учета соблюдения графика полета:

(3.1)
${{J}_{1}} = \mathop {\min }\limits_j \frac{{{{R}_{j}}}}{{{{B}_{j}} + {{B}_{{\max }}}}},$
где ${{R}_{j}}$ характеризует среднюю текущую удаленность j-го объекта от совершающей полет группы БЛА;

− формирование второго маршрута с учетом лишь важности и соблюдения графика очередного объекта с помощью другого критерия:

(3.2)
${{J}_{2}} = \mathop {\max }\limits_j \left[ {\left( {{{B}_{j}} + {{B}_{{\max }}}} \right)\Delta {{t}_{j}}} \right],$
где $\Delta {{t}_{j}}$ характеризует несвоевременность обслуживания объекта наблюдения;

− формирование третьего маршрута без учета важности очередного объекта, но с учетом остальных двух параметров:

(3.3)
${{J}_{3}} = \mathop {\min }\limits_j \frac{{{{R}_{j}}}}{{\Delta {{t}_{j}} + \Delta {{t}_{0}}}}.$

Таким образом, каждый из трех “предков” формируется с учетом двух факторов из трех возможных, которые образуют “элиту” одномерных маршрутов. Затем осуществляется “скрещивание” участков сформированной элиты, а потом “мутация” путем перестановки соседних пунктов на границах участков, чтобы получить улучшенный результат за малое число шагов эволюции. Операция отбора лучшего варианта маршрута полета проводится по критерию (1.1) максимума отношения суммарной важности объектов наблюдения к длине маршрута. Удачное сочетание отдельных участков маршрута друг с другом, каждый из которых сформирован с помощью “своего” частного двухпараметрического критерия, обеспечивает повышение эффективности планирования в отличие от использования полного трехпараметрического критерия.

Далее при формировании многомерных маршрутов из назначенного генетическим алгоритмом множества объектов в данном разделе работы представлено решение задачи целераспределения пока что с помощью известного жадного алгоритма с правом первого выбора для любого БЛА при разрешении конфликтных ситуаций.

Иллюстрация улучшения качества планирования приведена на рис. 2.

Рис. 2.

График зависимости эффективности планирования от выбранного метода решения задачи

Из рис. 2 видно, что эффективность маршрутизации генетическим алгоритмом возрастает на 15–20%. При этом, как показало компьютерное моделирование, время предполетного планирования не превышает 10 с за счет малого числа шагов эволюции.

Следует дополнительно отметить, что время ${{\upsilon }_{j}}$ наблюдения МО, используемое в формулах (2.8), (3.2), (3.3), заранее не задано и его нужно при планировании доопределить. Для этого, зная расчетное текущее время t и место пребывания в этот момент ближайшего к нему БЛА, необходимо спрогнозировать прямолинейное движение МО при его известном курсе и скорости, при сближении с БЛА, чтобы вычислить искомый момент ${{\upsilon }_{j}}$ пролета БЛА над целью. Также с помощью дополнительно планируемых пунктов маршрута самого БЛА в конце сближения с целью необходимо обеспечить его движение вдоль трассы, чтобы добиться наибольшей вероятности обнаружения МО.

Однако значимость наблюдаемых обслуживаемых наземных объектов при получении новой видеоинформации может непредсказуемо меняться и должна быть уточнена с учетом возрастания или падения интереса к ним. Поэтому в различных задачах обслуживания новых полетных заданий необходимо оперативное перепланирование групповых действий БЛА [25].

4. Алгоритм оперативного планирования групповых действий БЛА. Главная особенность оперативного планирования состоит в том, что на каждом шаге планирования от обслуживания освобождается один БЛА, а остальные заняты. Разработанный алгоритм планирования содержит следующие четыре операции.

В первой операции осуществляется выбор первоочередных необслуженных целей (число n которых соизмеримо с числом N БЛА) по мультипликативному критерию (2.7).

Во второй операции сформированный список ранжируется по другому критерию, учитывающему важность и суммарную удаленность каждого наземного объекта от группировки БЛА:

(4.1)
${{\Pi }_{2}} = \mathop {\max }\limits_{j = \overline {1,N} } \left( {{{b}_{j}}\sum\limits_{i = 1}^N {{{r}_{{ij}}}} } \right).$

Необходимость выполнения этой процедуры ранжирования вызвана последующим стремлением уменьшить в первую очередь время обслуживания наиболее удаленных объектов, расположенных в начале проранжированного списка.

В третьей операции распределения БЛА выбирается j-я цель с максимальным рангом, и для нее решается задача назначения “своего” БЛА по третьему критерию максимальной близости:

(4.2)
${{\Pi }_{{3j}}} = \mathop {\min }\limits_{i = \overline {1,N} } ({{r}_{{ij}}}).$

Таким образом, основными являются вторая и третья операции, реализующие модифицированный минимаксный критерий назначения ближайшего БЛА для цели с максимальным временем обслуживания и минимизирующее время выполенния части полетного задания на одном шаге оперативного планирования. При этом, как показано ниже, этот критерий попутно минимизирует суммарную длину пути группы БЛА и исключает пересечение их маршрутов.

Для этого в четвертой операции осуществляется проверка условий непересекаемости маршрутов группового полета, показанных на рис. 3 непрерывными линиями длиной l1 и ${{d}_{2}}$ для двух БЛА (i = 1 и 2).

Рис. 3.

Схема расположения БЛА относительно обслуживаемых целей в декартовой системе координат (x, z)

Пусть дано условие максимальной удаленности по критерию J1 в виде неравенства

(4.3)
${{d}_{1}} + {{d}_{2}} > {{l}_{1}} + {{l}_{2}}.$

Пусть также по критерию J2 для наиболее удаленного объекта с номером  j = 1 выбран ближайший незанятый БЛА с номером $i = 1$, так как

(4.4)
${{l}_{1}} < {{l}_{2}}.$

Но для выпуклого четырехгранника условию (4.4) практически соответствует соблюдение другого неравенства:

(4.5)
${{d}_{2}} < {{d}_{1}}.$

Тогда, складывая неравенства (4.4) и (4.5) друг с другом, получим следующий ответ:

(4.6)
${{l}_{1}} + {{d}_{2}} < {{l}_{2}} + {{d}_{1}},$
т.е. сумма двух сторон четырехгранника меньше суммы его диагоналей, что требовалось доказать – необходимое условие непересекаемости этих сторон соблюдается и общая длина пути минимизируется. В противном случае необходимо поменять объекты наблюдения местами.

На рис. 3 видно, что объект с  j = 1 наиболее удален от двух БЛА с i = 1 и 2, так как ${{l}_{1}} + {{l}_{2}} > {{d}_{1}}$ + d2. Это соответствует критерию ${{\Pi }_{{2j}}}$  по формуле (4.1), если важности обоих объектов одинаковы, т.е. ${{B}_{1}} = {{B}_{2}}$. Тогда ${{r}_{1}} = 0.5({{l}_{1}} + {{l}_{2}})$, а ${{r}_{2}} = 0.5({{d}_{1}} + {{d}_{2}})$. Также видно, что для объекта с j = 1 ближайшим будет БЛА с $i = 1$, что соответствует другому критерию ${{\Pi }_{3}}$ и обеспечивает удачное целераспределение – участки перелета не пересекаются и имеют минимальную длину суммарного пути.

Можно привести другой пример при N = 3, показанный ниже на рис. 4, из которого видно, что наиболее удаленным от группы БЛА является объект с номером  j = 3.

Рис. 4.

Результаты сравнения известного и предложенного минимаксного подхода для N = 3

Тогда если начать целераспределение с него и пользоваться предложенным подходом для остальных целей, обведенные контурами участки перелета будут иметь минимальную суммарную длину. И эти участки не пересекаются. При всех остальных способах это пересечение возникает. Более того, общая длина показанных пунктиром участков возрастает в 1.5 раза.

Поэтому в четвертой операции исключения пересекаемости маршрутов необходимо обеспечить минимум их суммарной длины ${{\Pi }_{4}}$ для выбранного k-го варианта целераспределения:

(4.7)
${{\Pi }_{{4k}}} = \mathop {\min }\limits_{k = \overline {1,N} !} \sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{{r}_{{ij}}}(k)} } $
при условии, что сумма $D$ индексов i и  j при $N$ слагаемых ${{r}_{{ij}}}$ должна быть равна $N(N + 1)$:

(4.8)
$D = \sum\limits_{k = 1}^N {({{i}_{k}} + {{j}_{k}}) = N(N + 1)} .$

Например, если при N = 3 сумма ${{\Pi }_{{4k}}}$ = r11(k) + r22(k) + r33(k), то Dk = (1 + 1) + (2 + 2) + (3 + 3) = = 3 ⋅ 4 = 12.

Проверка суммарной длины пути на минимум позволяет избежать трудоемкого анализа существования общих точек пересечения траекторий группового полета.

5. Единый подход к решению задач назначения приоритетного множества объектов наблюдения и их целераспределения между БЛА при предполетном и оперативном планировании. Указанные преимущества предложенного минимаксного подхода открывают возможность его применения также и в предполетном планировании. Такое объединение позволяет свести все операции планирования к единообразному выполнению двух главных действий – выбор приоритетного множества целей на каждом шаге многомерной маршрутизации с помощью мультипликативной формы критерия (2.7) и их целераспределение между БЛА по минимаксному критерию. Это означает, что при многомерной маршрутизации первая операция заменит известный “жадный” алгоритм при решении подзадачи назначения приоритетного множества объектов, а остальные три операции потребуются для выполнения второго действия при целераспределении. При этом отличие предполетного планирования будет лишь в том, что назначение на одном шаге при неоднократном выборе множества объектов произойдет для всех БЛА, а при оперативном планировании при однократном выборе объектов – только для одного БЛА, освободившегося в текущий момент от обслуживания. Но это отличие не изменит координированного характера групповых действий и их последствий, учитывающих главный фактор своевременности мониторинга объектов наблюдения.

Ниже приводится пример планирования групповых действий трех БЛА с учетом заданного графика экологического мониторинга городов Московской области. В данном примере решалась задача наблюдения 15 городов на северо-востоке Московской области при вылете из Егорьевска трех БЛА. При этом в четырех городах назначен график своевременного контроля экологической обстановки (пункты 10 (Клин), 21 (Сергиев Посад), 24 (Киржач), и 28 (Электросталь) обслуживаются по расписанию). Результат планирования шести разомкнутых маршрутов для двух случаев при известном подходе с помощью “жадного” алгоритма и при предложенном минимаксном подходе представлен на рис. 5.

Рис. 5.

Результат моделирования работы алгоритмов многомерной маршрутизации группового полета при наблюдении городов Московской области

На рисунке пунктиром обозначены маршруты наблюдения, полученные с помощью “жадного” алгоритма. Видно, что они дважды пересекаются. Представленный непрерывными линиями график показывает, что при предложенном подходе маршруты не пересекаются и близость к оптимальному критерию минимума общей длины маршрута подтверждается пониженной “изрезанностью” более или менее прямолинейных траекторий полета.

В целом, если использование представленных выше мультипликативного критерия выбора приоритетных объектов и генетического алгоритма повышает эффективность планирования за счет увеличения числителя в общем критерии (1.1), то минимаксный критерий дополнительно уменьшает на 10–15% его знаменатель за счет сокращения суммарной длины группового полета.

К преимуществам минимаксного алгоритма относятся:

– повышение безопасности группового полета за счет обеспечения непересекаемости маршрутов БЛА, летящих на одной высоте;

– доказано обеспечение минимума длины суммарного пути на перелеты, а значит, снижение затрат топлива;

– снижение трудоемкости вычислений при планировании не менее чем на порядок при N > 5 по сравнению с полным перебором вариантов целераспределения;

– минимум времени полного выполнения локального задания, возникающего в полете при числе объектов наблюдения, соизмеримом с числом БЛА;

– повышение эффективности групповых действий по критерию (1.1) как за счет увеличения его числителя при приоритетном выборе более важных объектов, так и при уменьшении знаменателя из-за снижения длины суммарного пути непересекающихся маршрутов группового полета.

Рис. 6.

Функции принадлежности продолжения обнаружения понятиям “норма”, “отказ”

Таблица 1.

База нечетких правил при оценке допустимой продолжительности очередного наблюдения

l 1 2 3 4 5 6 7 8
X1 Z Z Z PL Z PL PL PL
X2 Z Z PL Z PL Z PL PL
X3 Z PL Z Z   PL Z PL
j 1 1 1 1 2 2 2 2

6. Оценка допустимой длительности наблюдения очередного наземного объекта с помощью экспертной системы нечеткой логики. Назначение допустимой длительности поиска наземной цели с помощью бортовых средств технического зрения происходит в условиях априорной неопределенности, когда заранее неизвестно, насколько велико опережение или отставание от общего графика выполнения всего полета и каковы запасы оставшегося топлива. Кроме того, нужно учитывать динамическую важность ${{B}_{j}}$ обнаруживаемой цели по сравнению с ожидаемой конечной важностью ${{B}_{{{\text{кон}}}}}$ других необслуженных целей. Поэтому для решения задачи в указанных условиях предлагается использовать экспертную систему нечеткой логики. На ее входе кроме динамической важности Bj очередного объекта обслуживания учитываются:

$(t - \tau )$ – несвоевременность обслуживания очередного объекта;

$\Delta {{V}_{j}}$ – оставшийся запас топлива по сравнению с запланированным $\Delta {{V}_{{{\text{кон}}}}}$.

Согласно общепринятому подходу, вначале производится нормирование входных параметров

(6.1)
${{X}_{{1j}}} = {\text{ }}1{\text{ }}--{\text{ B}}j{\text{/}}{{B}_{{{\text{кон}}}}},\quad {{X}_{{2j}}} = {\text{ }}1{\text{ }}--t{\text{/}}{{\tau }_{j}},\quad {{X}_{{3j}}} = {\text{ }}1{\text{ }}--\Delta {{V}_{j}}{\text{/}}\Delta {{V}_{{{\text{кон}}}}},\quad k = {\text{ 1,}} \ldots {\text{,3}}{\text{.}}$

Затем производится фазификация с помощью функций принадлежности ${{F}_{{k1}}}$ и ${{F}_{{k2}}}$, показанных на рис. 6.На рисунке по оси абсцисс приводятся значения нормированных разнородных факторов, по оси ординат – функции принадлежности одному из понятий уверенности в продолжении обнаружения. Граничные значения нормированных параметров ${{a}_{k}}$ и ${{c}_{k}}$ назначаются заранее или в зависимости от условий полета. Для принятия согласованного решения в нечеткой логике используется база правил, число которых равно mk, где m – число терм или качественных оценок (в данной работе m = 2, что соответствует двум оценкам “норма” или “отказ” и лингвистическим переменным Z или PL), а k – число учитываемых факторов (k = 3). Поэтому база нечетких правил имеет вид табл. 1.

В табл. 1 введены следующие обозначения: l = 1, …, 8 – номер нечеткого правила;  j = 1 – принятие решения о продолжении наблюдения,  j = 2 – решение о его прекращении. Видно, что при числе негативных оценок PL в каждом правиле, больше 1, принимается решение прекратить наблюдение. В остальных более благоприятных ситуациях используется дополнительная количественная оценка коэффициента уверенности $K$ продолжения наблюдения. Для этого вначале для каждого фактора в отдельности вычисляется “свой” коэффициент уверенности в виде результата преобразования текущего значения переменной ${{X}_{{kj}}}$ с помощью кусочно-линейной функции ${{F}_{{k1}}}$, показанной на рис. 6. Затем в машине логического вывода полученные коэффициенты перемножаются по формуле

(6.2)
$K = [{{F}_{{11}}}({{X}_{1}}) + {{F}_{{12}}}({{X}_{1}})][{{F}_{{21}}}({{X}_{2}}) + {{F}_{{22}}}({{X}_{2}})][{{F}_{{31}}}({{X}_{3}}) + {{F}_{{32}}}({{X}_{3}})].$

Тогда при ухудшении неблагоприятных факторов значения ${{X}_{{kj}}}$ растут, и поэтому общий коэффициент уверенности $K$ в продолжении поиска цели падает, как показано на рис. 7.

Рис. 7.

График падения коэффициента уверенности в ходе поиска цели при ухудшении негативных факторов в зависимости от продолжительности наблюдения $\Delta {{t}_{j}}$

Чтобы этот коэффициент определить, используется экспертная система нечеткой логики, приведенная на рис. 8.

Рис. 8.

Функциональная схема экспертной системы нечеткой логики

Получаемый на выходе экспертной системы коэффициент K уверенности в продолжении обслуживания вычисляется по формуле (6.2). При достижении этого коэффициента заданного порога F процесс поиска прекращается. Это позволяет в целом сэкономить общее время выполнения всего полета.

7. Нейросетевые алгоритмы обнаружения и распознавания наземных целей с помощью технического зрения. Растущие технические возможности получения, накопления и обработки сенсорной информации обусловили существенный прогресс в нейросетевых методах решения задач анализа данных, в том числе и в задачах обнаружения и распознавания объектов на изображениях. Лучшие модели сверточных нейронных сетей, обученные на представительных наборах данных большого объема, показывают результаты, которые превосходят способность человека распознавать объекты в сложных условиях.

Необходимым условием эффективной работы нейросетевых алгоритмов является их обучение на представительной выборке данных, содержащих, насколько возможно полное и разнообразное множество предполагаемого вида заданного объекта на изображении. Другим требованием к обучающей выборке является соответствие набора данных требуемым условиям применения системы технического зрения. Для рассматриваемой задачи мониторинга мобильных объектов группой БЛА обучающая выборка должна содержать изображения контролируемых объектов в возможных условиях выполнения мониторинга. В настоящее время отсутствует информация о наличии публично доступных аннотированных выборок, соответствующих по составу требованиям задачи. Поэтому для оценки возможностей нейросетевых алгоритмов по решению задачи распознавания мобильных объектов в рамках их мониторинга БЛА использовались специально созданные выборки изображений, соответствующие условиям задачи.

Для исследований использовался специальный мультимодальный набор данных LAERT, созданный в ходе предшествующих исследований [26, 27]. Набор данных LAERT содержит инфракрасные длинноволновые (LWIR) и цветные (RGB) изображения различных сцен (как городских, так и внегородских), полученные съемкой с БЛА. В качестве объектов мониторинга в данной выборке представлены автомобили двух классов (легковые и грузовые) и люди, в том числе аннотированы объекты малого размера на изображениях [28].

7.1. Формирование набора данных для обучения. Изображения для формирования обучающих и тестовых наборов данных были получены комплексной оптико-электронной системой FLIR ONE Pro. Данная система включает два геометрически выровненных сенсора (инфракрасный диапазона 8–14 мкм и цветной), работающих в синхронном режиме. Основные ее технические характеристики приведены в табл. 2.

Таблица 2.

Основные технические характеристики FLIR ONE Pro

Наименование характеристики Значение характеристики
Рабочий диапазон температур 0–35°
Размер 68 × 34 × 14 мм
Разрешение (видимый диапазон) 1440 × 1080
Инфракрасный сенсор
Размер элемента матрицы (IR) 12 мкм
Спектральный диапазон 8–14 мкм
Разрешение (тепловой диапазон) 160 × 120
HFOV/VFOV 55/43°
Частота кадров 8.7 Гц
Глубина резкости 150 мм – ∞
Динамический диапазон –20–400°
Точность ±3°
Чувствительность (MRTD) 150 мК

Комплексная оптико-электронная система FLIR ONE Pro имеет в своем составе микротермическую камеру с тепловым разрешением 160 × 120 пикселей и может измерять температуру до 400°. Камера видимого диапазона разрешением 144 × 1080 пикселей позволяет синхронно получать цветные изображения, выровненные с тепловой камерой, что необходимо для формирования многомодального набора данных для обучения и тестирования разрабатываемых алгоритмов.

Для получения изображений для наборов данных был выполнен ряд полетов квадрокоптера DJI-F450, оснащенного камерой FLIR ONE Pro. Для управления этой камерой использовался смартфон iPhone 5s. Такой квадрокоптер с установленной съемочной системой показан на рис. 9.

Рис. 9.

Квадрокоптер DJI-F450 и снимки с камеры FLIR ONE Pro

Собранный набор данных включает 1680 синхронизированных и выровненных изображений видимого и инфракрасного (8–14 мкм) диапазона светового излучения.

С целью повышения представительности обучающей выборки данные съемки с БЛА были дополнены синтезированными модельными изображениями, сделанными по данным наземной съемки [29] с использованием нейросетевых методов формирования реалистичных тепловых текстур объектов [30].

7.2. Распознавание заданных объектов. В рамках данного исследования выполнены оценки возможностей обнаружения и распознавания объектов заданных классов на основе нейросетевых подходов как одного из этапов решения задачи мониторинга мобильных объектов БЛА. Исследовались возможности распознавания объектов по изображениям, полученным в видимом или тепловом диапазоне, а также потенциал улучшения качества распознавания при комплексировании данных двух типов.

Глубокие сверточные нейронные сети для распознавания объектов можно разделить на два основных класса: одноэтапные и двухэтапные сети распознавания объектов. Для двухэтапного распознавания объекта сначала в области изображения формируются области интереса (возможно, содержащие искомый объект) с последующей классификацией и проверкой обнаруженных кандидатов. Глубокие сверточные нейронные сети R-CNN [31] и их модификация [32, 33] построены на основе данной стратегии.

Одноэтапные нейронные сети пытаются приписать особенности непосредственно рассматриваемым областям изображения и выполнить классификацию в единой модели ГНС. Сеть YOLO [34] (“Вы смотрите только один раз”) – это сверточная модель нейронной сети, работающая как объединенный детектор и классификатор.

Сеть YOLO регрессирует ограничивающие прямоугольники непосредственно из модели CNN. Сеть SSD [35] (однократный многоканальный детектор) может работать с объектами с различного размера на изображении. Сеть SSD пытается предсказать ограничивающие рамки различного масштаба путем регрессии карт характеристик с множественным разрешением.

Двухступенчатые детекторы объектов (Faster R-CNN и аналогичные) обычно показывают более высокую точность обнаружения по сравнению с одноступенчатыми. Предложение области интересов с последующим подходом к уточнению лучше с точки зрения качества распознавания, но требует более трудоемкого и сложного обучения [36].

При оценке качества распознавания заданных объектов как базовая модель использовался предварительно обученный детектор SSD с исходными настройками [35] с дальнейшим дообучением на данных обучающей выборки LAERT.

7.3. Результаты тестирования. В качестве меры правильности распознавания j-го объекта на изображении рассматривался коэффициент Жаккара (или Intersection over Union, IoU, отношение пересечения множеств к их объединению). Он рассчитывался как площадь пересечения Si, отнесенная к площади объединения So ограничивающих прямоугольников для эталонной разметки ${{B}_{{этал}}}$ и результатов распознавания ${{B}_{{расп}}}$:

(7.1)
$Io{{U}^{j}} = \frac{{S_{i}^{j}}}{{S_{o}^{j}}},\quad S_{i}^{j} = {{B}_{{этал}}} \cap {{B}_{{расп}}},\quad S_{o}^{j} = {{B}_{{этал}}} \cup {{B}_{{расп}}},$
где ${{B}_{{этал}}}$ – набор пикселей изображения, охватываемых ограничивающей рамкой эталонной разметки, ${{B}_{{расп}}}$ – набор пикселей изображения, покрываемых ограничивающей рамкой распознанного объекта. Верное распознавание ${{N}_{{в.расп}}}$ объекта соответствует значению IoU выше заданного порога $t = 0.5$.

Для оценки качества распознавания рассматриваются следующие критерии:

точность (precision) распознавания объекта заданного класса:

(7.2)
${{P}^{k}} = \frac{{N_{{в.расп}}^{k}}}{{N_{{расп}}^{k}}},$

вероятность (recall) распознавания объекта заданного класса:

(7.3)
${{R}^{k}} = \frac{{N_{{в.расп}}^{k}}}{{{{N}^{k}}}},$
где $N_{{в.расп}}^{k}$ – истинное положительное число (количество верно распознанных объектов) для класса k, $k = \overline {1,K} $; K – количество классов в наборе данных; $N_{{расп}}^{k}$ – число всех (истинных положительных + ложноположительных) объектов, распознаваемых как объект класса k; ${{N}^{k}}$ – общее число (истинных положительных + ложноотрицательных) объектов класса k в наборе данных. Рисунок 10 иллюстрирует пример распознавания объектов для видимых изображений (a) и инфракрасных изображений (б).

Рис. 10.

Пример распознавания объектов для видимых (a) и инфракрасных (б) изображений

Результаты, представленные в табл. 3, показывают, что распознавание заданных объектов методами глубокого машинного обучения на собранном мультиспектральном наборе данных обеспечивает высокое качество распознавания для реальных изображений из тестовой выборки.

Таблица 3.

Результаты оценки качества распознавания

Диапазон волн Обозначение и значение показателя
${{P}_{{car}}}$ ${{R}_{{car}}}$ ${{P}_{h}}$ ${{R}_{h}}$
Видимый диапазон 0.93 0.91 0.92 0.88
Инфракрасный диапазон 0.92 0.89 0.91 0.93

Заключение. Предложен единый подход к предполетному и оперативному планированию группового полета БЛА, основанный на следующем выполнении двух главных действий – назначение на каждом шаге многомерной маршрутизации приоритетного множества наземных объектов с помощью специальной мультипликативной формы критерия и их целераспределение по минимаксному критерию с помощью ряда простых операций.

Показано, что в сложных полетных ситуациях для повышения эффективности планирования целесообразно использовать элементы искусственного интеллекта:

− при предполетном планировании в генетическом алгоритме в подзадаче назначения формируется не одно, а “элита” множеств объектов с помощью частных двухпараметрических критериев, чтобы затем путем скрещивания и мутации получить близкий к оптимальному маршрут за малое число шагов эволюции, в котором каждый его участок соответствует “своему” частному критерию;

− при подлете БЛА к цели оценка допустимой длительности ее обнаружения с помощью нечеткой логики позволяет сэкономить время полета в условиях несоблюдения его графика и ограниченного запаса топлива;

− при нейросетевом распознавании мобильных и других объектов заданного класса высокое качество мониторинга наблюдений обеспечивается на основе методов глубокого машинного обучения.

При оперативном планировании группового полета обосновано решение задачи целераспределения с помощью не одной, а трех простых операций минимаксного критерия. Вначале выбирается наиболее удаленный от группы БЛА объект, затем ему назначается ближайший БЛА, далее проверяется условие непересекаемости маршрутов по критерию минимума из суммарной длины. Совместное использование этих операций с первым действием подзадачи назначения позволяет быстрее найти экстремум на каждом шаге оптимизации по сравнению с однокритериальным решением задачи при полном переборе вариантов целераспределения. Это определяет главный научный результат работы.

При планировании наблюдения МО с незаданным графиком показано, что путем прогнозирования времени и места его встречи с БЛА обеспечивается возможность автоматизированного управления их сближением наравне с обслуживанием других наземных объектов.

В целом предложенный подход позволяет при предполетном планировании повысить его эффективность в среднем на 25–30% по сравнению с “жадным” алгоритмом и сократить время полного выполнения полетного задания на 30–40% при оперативном планировании. Это открывает путь к единой организации наблюдений не по принципу выполнения предполетного задания, а при обслуживании потока заявок как до, так и во время полета, что особенно важно при мониторинге наблюдения МО.

Список литературы

  1. Левитин А.В. Алгоритмы. Введение в разработку и анализ. М.: Вильямс, 2006. 576 с.

  2. Андреев М.А., Миллер А.Б., Миллер Б.М., Степанян К.В. Планирование траектории беспилотного летательного аппарата в сложных условиях при наличии угроз // Изв. РАН. ТиСУ, 2012. № 2. С. 166–176.

  3. Kamrani, Farzad & Lozano, Marianela Garcia & Ayani, Rassul. Path Planning for UAVs Using Symbiotic Simulation // Proc. 20th annual Europe. Simulation and Modelling Conf., ESM'2006. Toulouse, France, 2006. P. 215–238.

  4. Себряков Г.Г., Красильщиков М.Н., Евдокименков В.Н. Алгоритмическое и программно-математическое обеспечение предполетного планирования групповых действий беспилотных летательных аппаратов // Фундаментальные проблемы группового взаимодействия роботов: материалы отчетного мероприятия РФФИ по конкурсу “офи-м” (тема 604) в рамках международной научно-практической конференции. Волгоград, 2018. С. 30–32.

  5. Rong Zhu, Dong Sun, Zhaoying Zhou. Cooperation Strategy of Unmanned Air Vehicles for Multitarget Interception // J. Guidance. 2005, V. 28. № 5. P. 1068–1076. https://doi.org/10.2514/1.14412

  6. Evdokimenkov V.N., Krasilshchikov M.N., Kozorez D.A. Development of Pre-flight Planning Algorithms for the Functional-program Prototype of a Distributed Intellectual Control System of Unmanned Flying Vehicle Groups // INCAS Bulletin, 2019. V. 11. № 1. P. 75–88. https://doi.org/10.13111/2066-8201.2019.11.S.8

  7. Лебедев Г.Н., Румакина А.В. Нейросетевое планирование маршрута разновысотного полета беспилотного летательного аппарата // Авиакосмическое приборостроение. 2014. № 5. С. 3–8.

  8. Lebedev G., Goncharenko V., Mikhaylin D., Rumakina A. Aircraft Group Coordinated Flight Route Optimization Using Branch-and-Bound Procedure in Resolving the Problem of Environmental Monitoring // ITM Web of Conferences. Les Ulis. France. 2017. V. 10. P. 1003. https://doi.org/10.1051/itmconf/20171001003

  9. Goncharenko V.I., Lebedev G.N., Mikhaylin D.A., Khahulin G.F. Continuous Flight Safety Management Information System for a Group of Converging Aircraft // Russian Aeronautics, 2018. V. 61. Iss. 2. P. 271–278.

  10. Гончаренко В.И., Лебедев Г.Н., Михайлин Д.А. Задача оперативной двумерной маршрутизации группового полета беспилотных летательных аппаратов // РАН. ТиСУ. 2019. № 1. С. 153–166.

  11. Лебедев Г.Н., Мирзоян Л.А. Маршрутизация полета БЛА с учетом его динамики при наблюдении неподвижных наземных объектов // Мехатроника, автоматизация, управление. 2011. № 12. С. 24–28.

  12. Лебедев Г.Н., Ефимов А.В. Применение динамического программирования для маршрутизации облета подвижных объектов в контролируемом регионе // Тр. СГАУ. 2012. № 1. С. 63–70.

  13. Меркулов В.И., Пляшечник А.С. Ранжирование опасных целей по анализу возможности наведения в наивыгоднейшую точку встречи // Информационно-измерительные и управляющие системы. 2018. Т. 16. № 5. С. 3–9.

  14. Меркулов В.И., Пляшечник А.С. Задача упрощенного целераспределения при групповом противоборстве летательных аппаратов // АиТ. 2017. № 3. С. 123–137.

  15. Лебедев Г.Н., Мирзоян Л.А. Нейросетевое планирование действий по облету наземных объектов группой летательных аппаратов // Авиакосмическое приборостроение. 2005. № 12. С. 34–40.

  16. Лебедев Г.Н., Мирзоян Л.А., Ефимов А.В. Нейросетевое планирование групповых действий ЛА при наблюдении заданной группы подвижных объектов // Мехатроника, автоматизация, управление. 2009. № 11. С. 60–65.

  17. Михайлин Д.А., Аллилуева Н.В., Руденко Э.М. Сравнительный анализ эффективности генетических алгоритмов маршрутизации полета с учетом их различной вычислительной трудоемкости и многокритериальности решаемых задач // Тр. МАИ. 2018. № 98. 22 с.

  18. Ивашова Н.Д., Михайлин Д.А., Чернякова М.Е., Шаныгин С.В. Нейросетевое решение задачи оперативного планирования маршрутного полета беспилотных летательных аппаратов и назначение времени наблюдения наземных объектов с помощью нечеткой логики при отображении этих результатов на экране компьютера до вылета // Тр. МАИ. 2019. № 104. 17 с.

  19. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит., 1961. 400 с.

  20. Лебедев Г.Н., Ле Суан Ху. Отображение приоритетной информации на экране при проведении прочностных испытаний // Авиакосмическое приборостроение. 2005. № 5. С. 14–23.

  21. Лебедев Г.Н., Ефимов А.В. Применение динамического программирования для маршрутизации облета мобильных объектов в контролируемом регионе // Вестн. СГАУ. 2011. № 6 (30). С. 222–229.

  22. Гончаренко В.И., Лебедев Г.Н., Михайлин Д.А., Царева О.Ю. Выбор множества приоритетных наземных объектов наблюдения с помощью беспилотных летательных аппаратов и маршрутизация их полета // Вестн. компьютерных и информационных технологий. 2019. № 2. С. 3–12.

  23. Гончаренко В.И., Лебедев Г.Н., Михайлин Д.А. Планирование полета группы беспилотных летательных аппаратов для обнаружения отделяемых частей ракет-носителей // Вестн. ТГТУ. 2019. Т. 25. № 3. С. 381–394.

  24. Лебедев Г.Н., Малыгин В.Б., Михайлин Д.А. Постановка и решение задачи оперативной коррекции потоков прилета и вылета воздушных судов в районе аэродрома с помощью генетического алгоритма // Научный вестник МГТУ ГА. 2017. Т. 20. № 4. С. 8–17.

  25. Knyaz V., Zheltov S., Lebedev G., Mikhailin D., Goncharenko V. Intelligent Mobile Object Monitoring by Unmanned Aerial Vehicles // IEEE EUROCON 2019 – 18th International Conf. on Smart Technologies. Novi Sad, Serbia. 2019. P. 1–6. https://doi.org/10.1109/EUROCON.2019.8861575.

  26. Knyaz V., Zheltov S. Deep Learning Object Recognition in Multi-Spectral UAV Imagery // Proc. SPIE. Optics, Photonics, and Digital Technologies for Imaging Applications. WA, USA. 2018. V. 10679. P. 1067920. https://doi.org/10.1117/12.2307661.

  27. Knyaz V. Multimodal Data Fusion for Object Recognition // Proc. SPIE. Multimodal Sensing: Technologies and Applications / Ed. S. Ettore. International Society for Optics and Photonics. WA, USA. 2019. V. 11059. P. 198–209. https://doi.org/10.1117/12.2526067.

  28. Knyaz V. Recognition of Low-Resolution Objects in Remote Sensing Images // Proc. SPIE. Image and Signal Proc. for Remote Sensing XXV / Eds. L. Bruzzone, F. Bovolo. International Society for Optics and Photonics. WA, USA. 2019. V. 11155. P. 594–603. https://doi.org/10.1117/ 12.2533315.

  29. Kniaz, V.V., Mizginov V.A. Thermal Texture Generation And 3d Model Reconstruction Using Sfm And Gan // ISPRS – International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. WA, USA. 2018. V. XLII-2. P. 519–524. https://doi.org/10.5194/isprs-archives-XLII-2-519-2018

  30. Kniaz V.V., Knyaz V.A. ThermalGAN: Multimodal Color-to-Thermal Image Translation for Person Re-identication in Multispectral Dataset // Computer Vision – ECCV 2018 Workshops / Eds L. Leal-Taixe, S. Roth. Cham: Springer International Publishing, WA, USA. 2019. P. 606–624.

  31. Girshick R., Donahue J., Darrell T., Malik J. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation // 2014 IEEE Conf. on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014. P. 580–587.

  32. Girshick R. Fast R-CNN // Proc. of the 2015 IEEE Intern. Conf. on Computer Vision (ICCV). ICCV ’15. Washington, DC, USA: IEEE Computer Society, 2015. P. 1440–1448. https://doi.org/10.1109/ ICCV.2015.

  33. Ren S., He K., Girshick R., Sun J. Faster R-CNN: Towards Real-time Object Detection with Region Proposal Networks // Proc. 28th Intern. Conf. on Neural Information Processing Systems. V. 1. NIPS’15. Cambridge, MA, USA: MIT Press, 2015. P. 91–99. Access mode: http://dl.acm.org/ citation.cfm?id=2969239.2969250.

  34. Redmon J., Divvala S., Girshick R., Farhadi A. You Only Look Once: Unified, Real-Time Object Detection // 2016 IEEE Conf. on Computer Vision and Pattern Recognition (CVPR). Las Vegas, Nevada, US. 2016. P. 779–788.

  35. Liu W., Anguelov D., Erhan D. SSD: Single Shot MultiBox Detector // Computer Vision – ECCV 2016 / Eds B. Leibe, J. Matas, N. Sebe, M. Welling. Cham: Springer International Publishing, Amsterdam, 2016. P. 21–37.

  36. Huang J., Rathod V., Sun C. Speed/Accuracy Trade-Offs for Modern Convolutional Object Detectors // IEEE Conf. on Computer Vision and Pattern Recognition (CVPR). Honolulu, Hawaii, US. 2017. P. 3296–3297.

Дополнительные материалы отсутствуют.