Известия РАН. Энергетика, 2020, № 2, стр. 123-132

Анализ применения метода опорных векторов в многомерной релейной защите

А. Л. Куликов 1, Д. И. Бездушный 1*, М. В. Шарыгин 1, В. Ю. Осокин 1

1 Нижегородский государственный технический университет
Нижний Новгород, Россия

* E-mail: dimok.93@mail.ru

Поступила в редакцию 11.02.2020
После доработки 25.02.2020
Принята к публикации 27.02.2020

Полный текст (PDF)

Аннотация

Цифровая трансформация электроэнергетики, использование различных интеллектуальных электронных устройств (ИЭУ), высокоскоростных протоколов коммуникаций создают широкие возможности для модернизации систем релейной защиты (РЗ) электроэнергетических объектов. Одним из перспективных направлений ее развития является разработка новых устройств РЗ, принцип работы которых основан на элементах искусственного интеллекта и машинного обучения. В статье рассматриваются особенности применения одного из распространенных алгоритмов машинного обучения – метода опорных векторов – на примере построения трехмерного пускового органа, служащего для повышения селективности функционирования ступенчатой защиты линии электропередачи. Предлагаемый пусковой орган обладает высокой распознающей способностью и простотой технической реализации в составе ИЭУ РЗ.

Ключевые слова: многомерная релейная защита, метод опорных векторов, метод Монте-Карло, дистанционная защита, принцип максимального правдоподобия

Современные электроэнергетические системы представляют собой технически сложные комплексы, состоящие из большого количества взаимосвязанных элементов. При этом, как производители, так и потребители электрической энергии предъявляют все более жесткие требования к надежности электроснабжения. В процессе интеллектуализации электроэнергетики важнейшую роль играет совершенствование релейной защиты, цель которой состоит в отключении поврежденных элементов и участков электрической сети. Современные терминалы РЗА помимо функций защиты, выполняют функции управления, регистрации, осциллографирования и др., участвуя в обмене данными с другими устройствами, находящимися на подстанции и за ее пределами, посредством систем сбора и передачи информации (ССПИ) [1]. В частности, внедрение протокола МЭК 61850 предполагает наличие единой внутриподстанционной системы передачи данных не только для устройств РЗ, но и других систем автоматизации [2]. Это открывает устройствам РЗ доступ к большому объему информации о защищаемом объекте в режиме реального времени. К сожалению, основные алгоритмы РЗ за последние десятилетия принципиально не изменились и, по сути, являются цифровыми аналогами своих электромеханических предшественников [3, 4].

Перспективен подход к организации РЗ, основанный на множественном имитационном моделировании и статистической обработке результатов имитационных экспериментов [например, 4–9]. В частности, для реализации функций распознавания режимов электрической сети целесообразно применение машинного обучения [1012]. Использование такого подхода для организации защиты электроэнергетических объектов потенциально несет в себе следующие преимущества:

– признаки, на основе которых принимается решение о срабатывании РЗ, могут быть индивидуальными для каждого энергетического объекта и подбираться из условия максимальной информативности процесса распознавания. Поскольку алгоритмы машинного обучения предполагают многомерную реализацию, количество признаков для каждой РЗ может быть произвольным и ограничиваться лишь вычислительной способностью используемого цифрового устройства (терминала защиты);

– выбор параметров срабатывания РЗ связан с процедурой обучения распознающего алгоритма на совокупности реализаций, описывающих поведение защищаемого объекта в нормальных и аварийных режимах. Требуемые реализации могут быть получены как по результатам имитационного моделирования, так и непосредственно во время эксплуатации. Такой подход позволяет защите адаптироваться к условиям эксплуатации в режиме реального времени (самообучаться).

Алгоритмы машинного обучения могут применяться не только в составе процедур принятия решения РЗ, но и в составе пусковых органов, дополняющих традиционные виды защиты и обеспечивающих улучшение их основных характеристик (быстродействия, селективности, чувствительности). Ниже приводится пример разработки специального пускового органа для дистанционной защиты линии электропередач, на основе одного из наиболее простых и наглядных, но в то же время эффективных [11, 12] методов машинного обучения – метода опорных векторов (англ. – SVM, support vector machine).

Принципы применения метода опорных векторов. Задачи, решаемые при помощи машинного обучения, могут быть разделены на два класса: задачи классификации и регрессии. Задача регрессии заключается в восстановлении вида некоторой функции F(x) по имеющейся эмпирической информации о значениях F1Fn, принятых этой функцией при аргументах x1xn. Задача классификации состоит в отнесении некоторого вектора признаков x к одному из классов Y1Ym на основе обучающей выборки, состоящей из набора векторов x1xn, для которых известно, к каким классам они относятся. Как можно видеть, задача РЗ очень близка к задаче классификации и может быть сформулирована в терминах машинного обучения. В этом случае классификации подлежит вектор, состоящий из параметров токов и напряжений, оцененных измерительными органами РЗ (токи, напряжения и т.д.), а классы соответствуют режимам работы защищаемого объекта (нормальный режим, короткое замыкание в зоне защиты, короткое замыкание вне зоны защиты и т.д.).

В наиболее простом виде метод опорных векторов применяется для распознавания двух классов (например, нормальный или аварийный режим), а процедура принятия решения включает проведение в пространстве признаков гиперплоскости, которая будет разделять между собой элементы, относящиеся к разным классам, и находиться при этом максимально далеко от представителей обоих классов.

Пусть имеется обучающая выборка x1xN, состоящая из N векторов, расположенных в M-мерном пространстве признаков. Для каждого элемента обучающей выборки имеется метка класса y1yN такая, что yi = 1, если i-тый элемент принадлежит к одному классу (обозначим его как класс α) и yi = –1, если i-тый элемент принадлежит к другому классу (обозначим его как класс β). Тогда, если данная выборка линейно разделима, то можно провести гиперплоскость, такую, что все точки, принадлежащие классу α, будут лежать по одну сторону от нее, а все точки, принадлежащие классу β – по другую. Уравнение гиперплоскости можно записать в виде

(1)
$Q({\mathbf{a}}) = {{{\mathbf{w}}}^{\operatorname{T} }} \cdot {\mathbf{a}} + b = 0,$
где w, b – коэффициенты, задающие гиперплоскость; a – вектор, описывающий произвольную точку в пространстве признаков, в котором строится гиперплоскость.

Если гиперплоскость действительно разделяет точки обучающей выборки, то справедливо следующее неравенство

(2)
$\forall i \in 1 \ldots N,~~{{y}_{i}} \cdot \left( {{{{\mathbf{w}}}^{\operatorname{T} }} \cdot {{{\mathbf{x}}}_{i}} + b} \right) > 0.$

В общем случае, гиперплоскость, удовлетворяющая (2) не единственна. На рисунке 1 изображены точки обучающей выборки, относящиеся к двум классам, а также два варианта размещения разделяющей гиперплоскости (a и b). Поскольку пример (рис. 1) приведен для двухмерного пространства, гиперплоскости вырождаются в прямые. Несмотря на то, что обе гиперплоскости успешно разделяют классы между собой, из рис. 1 видно, что вариант (a) более подходит для классификации предложенных данных, так как обеспечивает большую ширину полосы между представителями различных классов. Ширину полосы принято называть зазор (англ. margin). Таким образом, метод опорных векторов позволяет отыскать гиперплоскость, обеспечивающую максимальный зазор между классами.

Рис. 1.

Различные варианты размещения разделяющих гиперплоскостей.

Доказано [11], что уравнение гиперплоскости, обеспечивающей максимальный зазор, может быть получено в результате отыскания условного минимума системы выражений

(3)
$\left\{ {\begin{array}{*{20}{c}} {{{{\min }}_{{{{{\mathbf{w}}}_{{\text{н}}}},{{b}_{{\text{н}}}}}}}\frac{1}{2}{\mathbf{w}}_{{\text{н}}}^{\operatorname{T} } \cdot {{{\mathbf{w}}}_{{\text{н}}}},} \\ {\forall i \in 1 \ldots N,\,\,\,\,{{y}_{i}} \cdot \left( {{\mathbf{w}}_{{\text{н}}}^{\operatorname{T} } \cdot {{{\mathbf{x}}}_{i}} + {{b}_{{\text{н}}}}} \right) \geqslant 1.} \end{array}} \right.$

Однако, в большинстве практических случаев, обучающая выборка не является линейно разделимой, то есть не существует ни одной гиперплоскости, удовлетворяющей системе неравенств (2). Для того, чтобы алгоритм SVM мог быть применен в таком случае, он подлежит модификации и допускает некоторую неправильную классификацию объектов обучающей выборки. За суммарную ошибку классификации вводится штраф, а задача оптимизации принимает вид

(4)
$\left\{ {\begin{array}{*{20}{c}} {{{{\min }}_{{{{{\mathbf{w}}}_{{\text{н}}}},{{b}_{{\text{н}}}},{{\xi }_{1}}..{{\xi }_{N}}}}}\frac{1}{2}{\mathbf{w}}_{{\text{н}}}^{\operatorname{T} } \cdot {{{\mathbf{w}}}_{{\text{н}}}} + C\sum\limits_{i = 1}^N {{{\xi }_{i}}} ,} \\ {\forall i \in 1 \ldots N,\,\,\,\,{{y}_{i}} \cdot \left( {{{{\mathbf{w}}}^{\operatorname{T} }} \cdot {{{\mathbf{x}}}_{i}} + b} \right) \geqslant 1 - {{\xi }_{i}},} \\ {\forall i \in 1 \ldots N,\,\,\,\,{{\xi }_{i}} \geqslant 0,} \end{array}} \right.$
где ${{\xi }_{i}}$ – переменная, характеризующая ошибку классификации i-го объекта обучающей выборки; С – коэффициент, устанавливающий величину штрафа за неверную классификацию.

Коэффициент С позволяет регулировать, что для алгоритма будет более важно – максимизация ширины разделяющей полосы, или минимизация суммарной ошибки классификации. Рисунок 2 демонстрирует влияние значения данного коэффициента на поведение алгоритма. Как можно видеть, при большом значении С алгоритм не допускает неверной классификации точек, несмотря на узкую разделяющую полосу, в то время как при малом значении, разделяющая полоса существенно шире, однако одна из точек обучающей выборки классифицируется неверно.

Рис. 2.

Работа SVM при различных значениях коэффициента C: (а) С = 10; (б) С = 1.

На практике, вместо прямой задачи SVM, описываемой выражением (4), решается так называемая двойственная задача, которая аналогична исходной, с точки зрения конечного ответа, однако, может быть решена с применением более быстрых итерационных методов. При решении двойственной задачи SVM, оптимизация происходит по переменным λ1…λn (выражение (5)), то есть по множителям Лагранжа. Двойственная задача SVM для линейно-неразделимой выборки выводится из прямой задачи [10] и записывается в следующем виде

(5)
$\left\{ {\begin{array}{*{20}{c}} {{{{\min }}_{{{{\lambda }_{1}} \ldots {{\lambda }_{n}}}}}\left( {\sum\limits_{i = 1}^n {{{\lambda }_{i}}} - \frac{1}{2} \cdot \left( {\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^n {{{{\lambda }}_{i}}{{{\lambda }}_{j}}{{y}_{i}}{{y}_{j}}{\mathbf{x}}_{i}^{\operatorname{T} }{{{\mathbf{x}}}_{j}}} } } \right)} \right),} \\ {\forall i \in 1 \ldots N,\,\,\,\,0 \leqslant {\text{\;}}{{{\lambda }}_{i}} \leqslant C,} \\ {\forall i \in 1 \ldots N,\,\,\,\,{{{\lambda }}_{i}}{{y}_{i}} = 0.} \end{array}} \right.$

Задача квадратичного программирования (5) может быть решена при помощи одного из известных методов [например, 12].

Получив оптимальные множители Лагранжа λ1…λn в результате решения (5), можно восстановить уравнение разделяющей гиперплоскости

(6)
${\mathbf{w}} = ~~\sum\limits_{i = 1}^n {{{{\lambda }}_{i}}{{y}_{i}}{{{\mathbf{x}}}_{i}}} ,\,\,\,\,b = \frac{1}{{{{y}_{s}}}} - {\mathbf{w}} \cdot {{{\mathbf{x}}}_{s}},$
где s – индекс вектора, для которого 0 < λs < C.

Алгоритм классификации может быть выражен через коэффициенты λ1…λn следующим образом

(7)
$a\left( {\mathbf{x}} \right) = ~\operatorname{sign} \left( {\sum\limits_{i = 1}^n {} {{{\lambda }}_{i}}{{y}_{i}}{\mathbf{x}}_{i}^{{\text{T}}}{\mathbf{x}} - b} \right).$

Отметим, что для корректной работы классификатора, описываемого выражением (7) достаточно провести суммирование только по тем i, для которых λi ≠ 0, т.е. только по опорным векторам, количество которых гораздо меньше общего размера обучающей выборки.

Применение метода опорных векторов в задачах релейной защиты. Рассмотрим пример использования SVM алгоритма для увеличения распознающей способности релейной защиты. Пусть имеется комплект релейной (дистанционной) защиты, установленный на линии ω1 участка сети на рис. 3.

Рис. 3.

Схема рассматриваемого участка сети.

В основную зону данного комплекта входит вся линия ω1, а в резервную – участки линий ω2 и ω3, прилегающие к ПС Б. При этом, для обеспечения требуемой чувствительности, необходимо, чтобы короткие замыкания на линиях ω2 и ω3 отключались отдельными ступенями, имеющими отличные друг от друга уставки. Обозначим их как “Ступень ω2” и “Ступень ω3” соответственно. Такое разбиение резервной зоны между двумя ступенями позволит выбрать более чувствительные уставки для каждой из них, не приводя к неселективному действию защиты в резервной зоне. Данные ступени должны быть отстроены по времени от быстродействующих ступеней резервируемых ими защит на ступень селективности (0.5 с.).

Многократно промоделируем короткие замыкания на линиях ω2 и ω3 в соответствии с методом Монте-Карло [13] и зафиксируем параметры режима (токи и напряжения), наблюдаемые в месте установки защиты в виде комплексных значений.

Анализ полученных модельных данных показывает, что на комплексной плоскости активного и реактивного замеров сопротивления, множество коротких замыканий на линиях ω2 и ω3 различной удаленности и с различным значением переходного сопротивления расположится так, как показано на рис. 4.

Рис. 4.

Множество результатов имитационных экспериментов.

Как можно видеть, практически все короткие замыкания на ω3 находятся в области “перекрытия” и не могут быть однозначно идентифицированы. Очевидно, что на рассматриваемой уставочной плоскости не удастся выбрать такие характеристики срабатывания ступеней, чтобы одна из них срабатывала при КЗ только на ω2, а другая – только на ω3.

Воспользовавшись методом опорных векторов, разработаем дополнительный пусковой орган, который будет срабатывать при КЗ на ω3 и блокироваться при КЗ на ω2. Логика совместной работы пускового органа и комплекта дистанционной защиты показана на рис. 5.

Рис. 5.

Логика совместной работы дистанционного органа и органа, функционирующего в соответствии с методом опорных векторов.

В качестве информационных признаков для функционирования дополнительного пускового органа выберем активный (R) и реактивный (X) замеры сопротивления, а также ток параллельной линии (Iω2), измеренный на стороне, на которой установлена проектируемая защита (рис. 3). Объединим выбранные признаки в единое трехмерное пространство. Разброс значений указанных параметров в соответствующем пространстве признаков показан на рис. 6.

Рис. 6.

Разброс данных имитационных экспериментов в трехмерном пространстве признаков.

Поскольку разрабатываемый пусковой орган функционирует совместно с двумя ступенями комплекта дистанционной защиты, с целью увеличения точности алгоритма и снижения временных затрат на обучение, возможно ограничить обучающую выборку лишь теми модельными экспериментами, в которых возможно срабатывание хотя бы одной из данных ступеней. По данной причине нецелесообразно включать в обучающую выборку результаты моделирования режимов, в которых данные ступени заведомо не сработают (КЗ “за спиной”, нормальные режимы).

Таким образом, выполним обучение алгоритма на экспериментах с короткими замыканиями на части линии ω3, которая входит в зону защиты “ступени ω3” (обозначим их как α-режимы), и противопоставим им короткие замыкания на части линии ω2, входящей в зону защиты “ступени ω2” (обозначим их как β-режимы). Точки в пространстве признаков, вошедшие в обучающую выборку, представлены на рис. 7.

Рис. 7.

Обучающая выборка.

Выясним, насколько каждый из выбранных признаков эффективен в отдельности для решения поставленной задачи классификации. На рисунке 8 показаны статистические распределения каждого из выбранных признаков в α- и β-режимах.

Рис. 8.

Распределения условных плотностей вероятностей признаков.

С учетом каждого из признаков построим одномерные классификаторы, принимающие решения по одной из двух гипотез: “КЗ на ω2”и “КЗ на ω3”, в зависимости от значения признаков. Решающее правило одномерных классификаторов реализуем по критерию максимального правдоподобия [например, 14]. Каждый из классификаторов будет выбирать ту гипотезу, при которой, наблюдаемое значение отслеживаемого им признака более вероятно. Таблица 1 показывает, какую вероятность ошибки обеспечивает каждый из признаков при его использовании в соответствующем классификаторе. Так вероятность правильного распознавания анализируемых режимов по признакам активного R и реактивного X сопротивлений лишь немногим превышает таковую при выборе ответа “наугад”.

Таблица 1.  

Вероятности ошибок классификации одномерных классификаторов

R X Iω2
40.32% 41.21% 4.79%

Реализуем процедуру “обучения” алгоритма SVM с линейной функцией ядра [8] и коэффициентом C = 100 на предварительно полученной выборке. Полученную в результате обучения разделяющую плоскость изобразим на рис. 9.

Эффективность работы полученного алгоритма может быть продемонстрирована при помощи матрицы ошибок (табл. 2), в которую сведены вероятности правильной работы алгоритма, а также вероятности ошибок первого и второго рода.

Таблица 2.  

Матрица ошибок работы разрабатываемого пускового органа

Результаты работы алгоритма SVM
α-режим β-режим
Фактический режим α-режим 100% 0%
β-режим 0.03% 99.97%
Рис. 9.

Разделяющая плоскость, полученная в результате работы метода опорных векторов.

Алгоритм распознавания на основе SVM, реализуемый для специального пускового органа РЗ, характеризуется ошибкой, не превышающей 0.03%, что значительно меньше, чем может обеспечить самый эффективный из одномерных классификаторов. Таким образом, рассмотренный пример подтверждает, что объединение информационных признаков РЗ в единое многомерное признаковое пространство позволяет добиться значительного выигрыша при распознавании режимов в задачах защиты электрических сетей.

ЗАКЛЮЧЕНИЕ

1. Цифровизация энергетики, в частности, релейной защиты, сделала возможным применение принципиально нового подхода к построению РЗ, основанного на имитационном моделировании и машинном обучении.

2. Перспективно применение метода опорных векторов в задачах РЗ как при формировании новых алгоритмов защиты, так и в качестве дополнительного инструмента повышения селективности и быстродействия существующих видов защит.

3. Несмотря на то, что увеличение размерности пространства признаков с целью повышения точности распознавания является традиционным приемом, применяемым в задачах классификации, построение многомерных алгоритмов релейной защиты – это новое перспективное направление, требующее дальнейшего развития.

4. Объединение информационных признаков в многомерное признаковое пространство позволяет реализовать классификатор, имеющий большую вероятность правильного распознавания, чем при использовании информационных признаков в отдельности.

Список литературы

  1. Лизунов И.Н. Технологии передачи данных в современных системах релейной защиты и автоматики и их показатели качества / И.Н. Лизунов, А.Н. Васев, Р.Ш. Мисбахов // Известия высших учебных заведений. Проблемы энергетики. 2017. № 1–2. С. 52–63.

  2. Adamiak M. IEC 61850 communication networks and systems in substations: An overview for users / M. Adamiak, D. Baigent, R. Mackiewicz // Prot. Control J. 2009. P. 61–68.

  3. Шнеерсон Э.М. Цифровая релейная защита / Э.М. Шнеерсон. М.: Энергоатомиздат, 2007. 549 с.

  4. Шарыгин М.В. Защита и автоматика систем электроснабжения с активными промышленными потребителями // Шарыгин М.В., Куликов А.Л. Нижний Новгород: НИУ РАНХиГС, 2017. 286 с.

  5. Куликов А.Л., Шарыгин М.В. Применение статистических критериев распознавания режима релейной защиты сетей электроснабжения // Электротехника. 2019. № 2. С. 58–64.

  6. Бездушный Д.И., Куликов А.Л. Формирование обобщенных признаков срабатывания релейной защиты на основе метода главных компонент // Релейная защита и автоматизация. 2019. Т. 34. № 1. С. 20–27.

  7. Шарыгин М.В., Куликов А.Л. Статистические методы распознавания режимов в релейной защите и автоматике сетей электроснабжения // Электрические станции. 2018. № 2(1039). С. 32–39.

  8. Ван-Трис Г. Теория обнаружения, оценок и модуляции. Т.1: Теория обнаружения, оценок и линейной модуляции: пер. с англ. под ред. проф. В.И. Тихонова / Г. Ван-Трис. М.: Советское радио, 1972. 744 с.

  9. Gose E. Pattern recognition and image analysis. Upper Saddle River: Prentice Hall PTR, 1997. 484 p.

  10. Bishop C.M. Pattern Recognition and Machine Learning. Berlin: Springer, 2006. 738 p.

  11. Wang L. Support Vector Machines: Theory and Applications. Berlin: Springer, 2005. 28 p.

  12. Bottou L. Support Vector Machine Solvers / L. Bottou, C-J. Lin // Large Scale Kernel Machines. 2007. № 1. C. 1–28.

  13. Ермаков С.М. Метод Монте-Карло в вычислительной математике: Вводный курс / С.М. Ермаков. Санкт-Петербург: 2009. 192 с.

  14. Зюко А.Г. Теория передачи сигналов / А.Г. Зюко, Д.Д. Кловский, М.В. Назаров. М.: Радио и связь, 1986. 304 с.

Дополнительные материалы отсутствуют.