ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021
ЭЛЕКТРОННАЯ КОМПОНЕНТНАЯ БАЗА, ФОТОНИКА
И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
УДК 629.78
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ
ДЛЯ ДИАГНОСТИКИ СПУТНИКОВЫХ СБОЕВ
© 2021 г. Ю.Л. Лобков, А.А. Парамонов, Д.А. Иванов*, Д.С. Савельев
ФГАУ «Военный инновационный технополис «ЭРА», Анапа, Россия
* E-mail: Ivanov.dmitry0425@gmail.com
В данном исследовании поднимается тема использования методов машинного обучения для диагностики неис-
правностей спутниковых подсистем по параметрам их телеметрии. Данные телеметрии кластеризуются с ис-
пользованием алгоритма кластеризации k-средних в сочетании с функцией t-распределенного стохастического
вложения соседей (t-СВС) для уменьшения размерности. Обсуждается классификация данных с помощью ло-
гического анализа данных (ЛАД), для генерации шаблонов для каждого класса отказов, которые используются
для определения вероятной причины отказа для каждого параметра телеметрии. Эти вероятности позволяют с
помощью анализа дерева отказов (АДО), определить наиболее вероятную причину отказа спутника.
ВВЕДЕНИЕ
Эти подходы включают экспертные системы, ней-
Космические системы дороги из-за высокой
ронные сети, машину опорных векторов (МОВ),
стоимости разработки и запуска в космос. Поте-
метод главных компонент (МГК), оценку параме-
ри таких систем являются постоянными и обычно
тров, фильтры Калмана (ФК).
происходят из-за постепенной деградации компо-
В этой работе исследуются методы машинного
нентов системы и/или устройств. Во избежание
обучения, которые можно использовать для диагно-
непредвиденных обстоятельств и естественных
стики неисправностей КА. Использовался метод
неисправностей желательно, чтобы бортовая си-
интеллектуального анализа данных, чтобы изучить
стема диагностики неисправностей космических
возможную производительность, выраженную
аппаратов (КА) была способна обнаруживать, изо-
любым параметром телеметрии, указывающим
лировать, идентифицировать и классифицировать
на работоспособность определенного бортового
неисправности в системе [1].
устройства. Это позволяет оператору спутника кон-
Анализ и понимание ухудшения и отказов вы-
тролировать его общее состояние, чтобы снизить
бранных подсистем на орбите, то есть ее реальной
риск отказа с помощью точных и автоматизирован-
надежности, обеспечивает полезную обратную
ных методов. Предлагаемая методика существенно
связь для производителей космических аппара-
поможет улучшить принятие решений в аварийных
тов и является важным первым шагом на пути к
ситуациях и временной потере спутников.
повышению общей надежности космических
аппаратов [2].
АНАЛИЗ ПОВЕДЕНИЯ
В последние годы для обнаружения и диагно-
КОСМИЧЕСКИХ АППАРАТОВ
стики аномалий в работе КА предлагаются методы
В контексте этой работы анализ поведения
машинного обучения и интеллектуального анали-
спутника означает:
«оценку функциональности
за данных. Распространенный способ устранения
спутника при определенном рабочем режиме», где
аномалий - анализ истории данных телеметрии,
есть набор спутниковых режимов, таких как ре-
чтобы определить корень проблемы. Специалиста-
жим съемки, нормальный рабочий режим и полно-
ми активно изучается проблема обнаружения, изо-
стью рабочий режим. На основе телеметрических
ляции и идентификации неисправностей, рассма-
измерений возможно определить режим работы
триваются подходы к диагностике неисправностей
спутника и соответствующие функциональные воз-
на основе моделей для аэрокосмических систем.
можности. Для этого распаковываются данные из
57
58
Ю.Л. ЛОБКОВ и др.
необработанных файлов телеметрии и преобразу-
ются в формат временных рядов, который соответ-
ствует предполагаемой методике.
Теория МОВ сводит к минимуму ожидаемую
ошибку обучающейся машины, что снижает про-
блему переобучения. Это явление известно, как
принцип минимизации структурного риска (МСР),
который используется для задач классификации и
регрессии. МОВ имеет два типа: классификация
опорных векторов (КОВ) и регрессия опорных
векторов (РОВ) [3]. КОВ классифицирует данные
на две или более группы на основе введенных
функций, максимизируя поля между введенными
классами, такими как категоризация текста. РОВ
используется с данными временных рядов для про-
Рис. 1. Блок-схема машины опорных векторов
гнозирования следующих значений путем мини-
мизации суммы расстояний от точек данных до ги-
перплоскости, например, прогнозируемых цен на
кращения входных данных до векторов признаков
акции. Приближенная функция используется для
с низкой размерностью, которые применяются к
нелинейной МОВ, называемой функцией ядра, ко-
мультиклассовой модели классификации МОВ с
торая используется для нахождения приближения
целью определения типа неисправности.
функций с действительными значениями на основе
Перед выполнением прогнозирования тесто-
условия Мерсера, таких как линейное ядро, поли-
вых последовательностей создается обучающая
номиальное ядро, сигмовидное ядро и радиальная
модель МОВ, как показано на рис. 1. Подготавли-
базисная функция (РБФ). В этом исследовании ис-
вается «Общий обучающий набор», чтобы сгене-
пользовалась функция ядра РБФ:
рировать обучающую модель для прогнозирова-
ния телеметрии. Все последовательности в общем
2
обучающем наборе сформированы обучающими
-
x
-
x
K
(
x,
x
) = exp
,
(1)
последовательностями.
2
2
ДИАГНОСТИКА ОТКАЗОВ
где РБФ имеет параметр r, и необходимо опреде-
КОСМИЧЕСКИХ АППАРАТОВ
лить значение r до эксперимента.
Раннее обнаружение, как правило, важно для
В последнее время применение вид МОВ для
уменьшения программного воздействия потен-
прогнозирования временных рядов, называемый
циального сбоя. В этом разделе представляется
регрессией опорных векторов, также показал мно-
методология, предложенная для построения спут-
го прорывов и правдоподобных результатов, таких
никовой системы диагностики неисправностей, ос-
как прогнозирование финансового рынка, прогно-
нованную на нескольких последовательных этапах
зирование цен на электроэнергию, оценка мощ-
обработки данных, уменьшения размеров, класси-
ности потребления и реконструкция хаотических
фикации, генерации шаблонов и анализа данных.
систем.
ЛАД - это подход алгоритмов классификации,
В Китае разработали обнаружение аномалий
который используется для классификации двух или
для данных телеметрии КА с использованием ре-
нескольких классов. ЛАД классифицирует наблю-
грессионной модели машины опорных векторов
дения на положительные или отрицательные, где
наименьших квадратов. Регрессионная модель ис-
положительные наблюдения означают ошибочные
пользуется для выявления аномального поведения
данные или что-то неправильное, в то время как
космических аппаратов на орбите.
отрицательный означает, что данные корректны.
Также существует подход к обнаружению не-
Двухклассный ЛАД состоит из трех этапов: бина-
исправностей и диагностике космических аппара-
ризация данных, генерация паттернов и формиро-
тов, основанный на анализе главных компонентов
вание теории.
(АГК) и машинах опорных векторов. АГК исполь-
зуется для выбора наиболее важных функций и со-
ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДИАГНОСТИКИ СПУТНИКОВЫХ СБОЕВ
59
На этапе бинаризации каждый входной объект
за компонентов, которые вызывают режим отказа
преобразуется в набор двоичных атрибутов (пере-
системы. Подход с использованием минимальных
менных). После этапа бинаризации ЛАД генериру-
наборов сокращений - это классический подход,
ет набор логических правил, называемых паттерна-
который предоставляет важную качественную, а
ми (шаблонами); Они отличаются от наблюдений,
также количественную информацию.
принадлежащих к одному классу, а не к другому.
Для количественной оценки вероятности ключе-
Такие шаблоны называются позитивными или не-
вого события в дереве отказов должна быть пред-
гативными шаблонами, где позитивные шаблоны
ставлена вероятность каждого базового события.
описывают ошибочные данные. Паттерны играют
После этого вероятности базовых событий распро-
важную роль в ЛАД, поскольку они допускают чет-
страняются вверх до ключевого события с исполь-
кую интерпретацию экспертами людьми. Каждая
зованием логических отношений для дерева отка-
положительная (отрицательная) точка наблюдения
зов. Количественные данные необходимо вводить
покрывается, по крайней мере, одним положитель-
для базовых событий; входные данные состоят из
ным (отрицательным) шаблоном и не покрывает-
вероятностей этих событий дерева отказов.
ся никакими отрицательными (положительными)
Вероятность главного события - это вероят-
шаблонами, которые были сгенерированы. Кроме
ность общего отказа системы. Она рассчитывается
того, отдельные шаблоны также могут указывать
из дерева отказов в зависимости от вероятностей,
на положительный (отрицательный) характер но-
которые применяются к базовым событиям. Ве-
вых точек наблюдения, и поэтому можно ожидать,
роятность промежуточных событий, также назы-
что правильно выбранный набор шаблонов может
ваемая вероятностью перехода, вычисляется как
быть использован для построения общего правила
вероятность ключевого события из ее поддерева.
классификации. Это правило является расширени-
Вероятность главного события рассчитывается как:
ем частично определенной булевой функции и на-
зывается формацией теории.
Q(t) = 1 - e-λt,
(2)
В 2016 году была предложена методология
прогнозирования, основанная на надежности и
где Q(t) - это ключевое событие недоступности
использующая данные мониторинга состояния,
или ненадежности, а λ - постоянная интенсивность
которые могут иметь дело с любым количеством
отказов компонента.
индикаторов состояния, без выбора наиболее зна-
Наиболее важным результатом АДО являет-
чимых, как предлагают многие методы. Используя
ся набор показателей важности для всех событий
метод Каплана-Мейера в качестве метода оценки,
в дереве отказов; эти показатели рассчитаны для
управляемого временем, в сочетании с логическим
главного события. Как промежуточным, так и ба-
анализом данных в качестве метода диагностики,
зовым событиям можно назначить приоритеты в
управляемого событиями, для отражения влияния
соответствии с их мерой важности. Наивысшая
условий эксплуатации на срок эксплуатации кон-
важность может использоваться для распределения
тролируемого оборудования.
ресурсов, использующихся для минимизации веро-
АДО - это дедуктивный нисходящий подход,
ятности отказа при ключевом событии.
который определяет потенциальный отказ, а затем
Чтобы выполнить процесс обучения для ЛАД
определяет все события, которые могут привести
и сгенерировать паттерн(ы) классификации, ко-
к отказу. АДО предоставляет два типа результатов:
торый(е) соответствует одному классу событий,
качественные и количественные. Целью качествен-
использовались классифицированные данные
ного анализа является сокращение структуриро-
K-средних. Паттерн представляет собой комбина-
ванного дерева отказов. Целью количественного
цию условно меняющихся параметров. Для каж-
анализа является расчет вероятности отказа глав-
дого паттерна рассчитывается его вероятность как
ного события на основе качественного анализа.
умножение вероятности каждого параметра пат-
В качественном анализе законы булевой алге-
терна на основе АДО. Более того, кластеризация
бры используются для удаления избыточных со-
является необходимым шагом перед применением
бытий отказа компонентов из списка основных
ЛАД, чтобы выполнить этап обучения с необходи-
событий для получения минимальных наборов
мой точностью.
сокращений. Наборы минимальных сокращений
Получение вероятности паттерна позволяет нам
представляют собой комбинацию минимальных
судить о возможности появления последователь-
(необходимых и достаточных) состояний отка-
ных комбинированных параметров и возможной
ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021
60
Ю.Л. ЛОБКОВ и др.
причине. Применение этой процедуры к каждой
спутниковой подсистеме приводит к вероятност-
ному подходу к причине отказа. Чтобы вычислить
вероятность отказа подсистемы, используется ана-
лиз дерева отказов на сгенерированных паттернах.
АДО используется для определения вероятности
того, какой компонент подсистемы является причи-
ной отказа спутника.
ОЦЕНКА
Спутник имеет большое количество параметров
телеметрии, которое может превышать несколько
тысяч. Были выбраны параметры, которые отра-
жают производительность критических подсистем,
таких как источник питания, блок кондиционирова-
ния, связь с земной станцией (S-диапазон), темпера-
тура внутри спутника и экранирование солнечных
панелей. Напряжение на шине питания является од-
ним из наиболее важных параметров для различных
подсистем, таких как сама шина питания, коммуни-
кационные и бортовые компьютерные системы. Не-
обходимо использовать первый набор значений для
выполнения процесса обучения МОВ, в то время
как последующий набор данных будет использо-
ваться для сравнения предсказанных значений с ре-
альными значениями для оценки алгоритма. В про-
цессе используются файлы телеметрии за разные
периоды жизни спутника. Можно использовать две
трети значений телеметрии для обучения алгорит-
ма, а оставшуюся треть для его оценки. Прогно-
зируемые значения сопоставляются с реальными
значениями параметров, извлеченных из файла те-
леметрии. Затем оценивается среднеквадратичная
ошибка для предсказанных значений, чтобы оце-
нить производительность алгоритма. Предлагаемая
методика представлена на рис. 2.
K-средние используются для классификации
данных непересекающихся групп (кластеры) на
основе их сходства. Метод K-средних использует
Рис. 2. Блок-схема предлагаемой методики
центроиды для представления кластеров путем оп-
тимизации функции квадратичной ошибки. Алго-
уменьшения размерности, такой как t-распределен-
ритм кластеризации K-средних зависит от евклидо-
ное стохастическое вложение соседей. t-СВС - это
ва расстояния для вычисления центроида каждой
метод нелинейного уменьшения размерности, в
группы, поэтому точки данных в одном кластере
котором стохастическое вложение соседей начина-
считаются принадлежащими одному классу, а точ-
ется с преобразования многомерных евклидовых
ки в разных кластерах считаются принадлежащи-
расстояний между точками данных в условные
ми к разным классам. Рис. 3-5 представляют со-
вероятности, которые представляют собой сход-
бой применение метода K-средних к параметрам
ства [4]. t-СВС часто используется не только для
из разных спутниковых подсистем для получения
уменьшения размерности, но и для визуализации
двух кластеров, введенных в ЛАД.
данных, потому что его основная цель - сокраще-
Для большого количества функций в набо-
ние набора данных функций до 2-D или 3-D, что-
ре данных для K-средних потребуется алгоритм
бы обеспечить более визуальное представление
ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ДИАГНОСТИКИ СПУТНИКОВЫХ СБОЕВ
61
данных. Если необходимо более трех измерений,
t-СВС может не пригодиться.
Данные извлекаются и форматируются, что по-
зволяет легко манипулировать значениями. Можно
использовать первые 20% значений телеметрии
для процесса обучения, 30% - для тестирования
и, наконец, остальные 50% - для классификации,
параметры телеметрии, извлеченные из необрабо-
танных данных, полученных со спутника, форма-
тируются так, чтобы их можно было использовать
в качестве входных данных для ЛАД.
ЗАКЛЮЧЕНИЕ
Рекомендуется использовать более простые
методы регрессии такие как регрессия опорных
Рис. 3. Блоковая кластеризация
векторов для реализации интеллектуального ана-
лиза данных спутниковой телеметрии с низкой
околоземной орбиты. Данные классифицируются
(отказ и исправность) в соответствии с различны-
ми режимами работы с использованием метода
классификации K-средних в сочетании с функцией
уменьшения размерности t-СВС. Использовались
K-средние для классификации данных, а затем
введение этих данных для обучения в логический
модуль метода логического анализа данных для
получения некоторых паттернов, которые указыва-
ют значения условных параметров. Затем каждый
паттерн переводится в количество условий/собы-
тий определенных параметров. Затем использует-
ся анализ дерева отказов для оценки вероятности
и зависимости каждого диапазона параметров от
ключевого события (отказа спутника). ЛАД обна-
руживает общие закономерности отказа, в то время
Рис. 4. Батарейная кластеризация
как АДО определяет, какое базовое событие (со-
ответствует определенной схеме) вызывает отказ
спутника.
Использование предлагаемой цепочки подходов
«K-средние - ЛАД - АДО» имеет преимущество,
заключающееся в том, что система автономно спо-
собна обнаруживать и определять все возможные
схемы отказа независимо, что обеспечивает луч-
шую точность диагностики неисправностей.
СПИСОК ЛИТЕРАТУРЫ
1. Управление космическими полетами: учеб.
пособие: в
2 ч. В.А. Соловьев, Л.Н. Лысен-
ко, В.Е. Любинский; под общ. ред. Л.Н. Лысен-
ко. М.: Изд-во МГТУ им. Н.Э. Баумана, 2015.
Ч. 2. - 426 с.
2. Системы контроля и испытания вооружения
Рис. 5. S-Band кластеризация
и военной техники, военная метрология: элек-
ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021
62
Ю.Л. ЛОБКОВ и др.
тронное учебное пособие / В.Н. Арсеньев [и др.]. -
торов%20-%20является,названием%20SVM%20
СПб.: ВКА имени А.Ф. Можайского, 2016. - 600 с.
(Support-%20Vec-tor%20Machine), свободный
-
3.
Сайт machinelearning.ru
[Электронный
Загл. с экрана (дата обращения 06.04.2021).
ресурс].
- Профессиональный информацион-
4. Сайт Data Science - наука о данных по-русски
но-аналитический ресурс, посвященный ма-
[Электронный ресурс] - Сайт посвященный ин-
шинному обучению, распознаванию образов и
теллектуальному анализу данных. Режим доступа:
интеллектуальному анализу данных. Режим досту-
http://datascientist.one/k-means-algorithm/, свобод-
па http://www.machine-learning.ru/wiki/index.php?
ный - Загл. с экрана (дата обращения 09.04.2021).
title=SVM#:~:text=Машина%20опорных%20век-
ВЕСТНИК ВИТ «ЭРА», том 2, номер 2, 2021