Доклады Российской академии наук. Химия, науки о материалах , 2020, T. 495, № 1, стр. 35-41

Локально-потенциально-морфометрический алгоритм информационно-энтропийной оценки воздействия техногенных химических загрязнений на лесные массивы

Академик РАН В. П. Мешалкин 12, О. Б. Бутусов 13*, Р. Р. Кантюков 4, А. Ю. Белозерский 1

1 Российский химико-технологический университет имени Д.И. Менделеева
Москва, Россия

2 Институт общей и неорганической химии имени Н.С. Курнакова Российской академии наук
Москва, Россия

3 Московский международный университет
Москва, Россия

4 НИИ природных газов и газовых технологий – Газпром ВНИИГАЗ
Москва, Россия

* E-mail: butusov-1@mail.ru

Поступила в редакцию 29.06.2020
После доработки 29.08.2020
Принята к публикации 21.09.2020

Полный текст (PDF)

Аннотация

Предложен оригинальный локально-потенциально-морфометрический алгоритм информационно-энтропийной оценки воздействия техногенных химических загрязнений на лесные массивы, отличающийся применением процедуры выделения бинарных объектов – пиксельных кластеров (односвязных, плотно упакованных совокупностей белых и черных пикселей) на спутниковых фотоснимках с помощью потенциального преобразования и процедуры оценки изменений локальной конфигурации пиксельных кластеров на основе вычисления значений информационной энтропии для виртуального потенциала моделей взаимодействия псевдочастиц (белых и черных пикселей) бинарного изображения, что позволяет с использованием точечных статистических оценок геометрических показателей кластеров практически оценивать пространственные нарушения в лесных массивах из-за воздействия техногенных химических загрязнений. Предложенный алгоритм отличается от классических алгоритмов, использующих для выделения границ бинарных объектов методы статистического анализа с помощью либо матриц совстречаемости, либо точечных статистических оценок конфигурации пикселей.

Ключевые слова: бинаризация, бинарные объекты, информация, кластер, пиксель, потенциальное преобразование, спутниковые фотоснимки, химическое загрязнение, энтропия

ВВЕДЕНИЕ

В результате воздействия техногенных химических загрязнений на леса происходят их морфологические изменения: изреживание и трансформация пространственной структуры древостоя [1], визуально отображаемые на спутниковых фотоснимках лесов в виде изменения конфигурации специально выделенных бинарных объектов (БО) [2]. БО – это односвязные, плотно упакованные кластеры белых и черных пикселей бинарного изображения (БИ) фотоснимка. Односвязность обозначает возможность соединения любых двух пикселей некоторого БО непрерывной цепью пикселей этого же БО. Плотная упаковка пиксельных кластеров отображает отсутствие внутри БО “островов”, состоящих из пикселей другого класса.

Для количественного анализа локальной структуры белых и черных пикселей в каждом БО на фотоснимках ранее разработаны: вейвлетно-текстурный морфометрический алгоритм анализа конфигурации пикселей на фотоснимках природных систем, текстуры газовых потоков и наноматериалов [35]; алгоритм текстурно-фрактального анализа локальных конфигураций пикселей и нечетко-логический алгоритм анализа локальной конфигурации пикселей [6].

Авторами предложен оригинальный локально-потенциальный морфометрический алгоритм информационно-энтропийной оценки текстурных характеристик техногенных нарушений в структуре лесов, отличающийся применением потенциального преобразования БИ с целью выделения БО-пиксельных кластеров, морфометрического анализа выделенных БО и использованием статистики морфометрических показателей (площадь, периметр, эксцентриситет, ориентация) для расчета информационной энтропии. Следует отметить, что алгоритмы преобразования БИ для оценки конфигураций выделенных БО с учетом пространственных расстояний между пиксельными кластерами применялись в качестве эффективного показателя оценки характеристик фотоснимков [79]. Предлагаемое потенциальное преобразование БИ относится к классу преобразований, учитывающих пространственные расстояния между кластерами. Информационная энтропия представляет собой оценку хаотичности сигналов, отображающих мозаику размещения БО. В работе [9] показано, что использование весовых коэффициентов, рассчитанных с учетом расстояний между пикселями в каждом кластере, увеличивает чувствительность энтропии к степени фрагментарности и хаотичности мозаики пикселей.

Приведем концептуальные предпосылки разработанного алгоритма. Рассмотрим исследуемую техногенно-природную систему (ТПС) в виде совокупности техногенной системы и лесных массивов как замкнутую термодинамическую систему. Любая техногенная система (химическое, нефтехимическое или металлургическое производство) представляет собой сложную высокоорганизованную информационную систему с низким уровнем информационной энтропии. Уменьшение энтропии в одной подсистеме исходной замкнутой системы должно приводить к увеличению энтропии в других ее подсистемах, например, в окружающих производство лесных массивах. При этом, согласно второму закону термодинамики, суммарная информационная энтропия ТПС должна возрастать. Для лесных массивов возрастание энтропии проявляется, в частности, в увеличении хаотичности структурной мозаики БО-пиксельных кластеров на спутниковых фотоснимках лесов.

Авторы использовали информационную энтропию в качестве интегральной комплексной количественной оценки изменений структурной мозаики древостоя, происходящих в лесах под воздействием техногенных химических загрязнений, которые проявляются в виде изменений конфигурации пиксельных кластеров на фотоснимках. При этом предполагается, что изменение пространственной структуры древостоя может иметь количественную оценку в виде информационной энтропии вероятностного распределения площадей БО.

При расчетах информационной энтропии использованы формулы Шеннона (Shannon), Цалиса (Tsallis) [10], Реньи (Rényi) [11, 12] и др. Наиболее известна формула Шеннона (Shannon):

(1)
$H(X) = - \sum\limits_{i\, = \,1}^n {{{p}_{i}}{{{\log }}_{2}}} {{p}_{i}},$
где X – дискретная случайная величина, принимающая значения из множества {x1, x2, …, xn}; pi = = p(xi) – вероятность, с которой случайная величина принимает значение xi. При вычислении информационной энтропии фотоизображений в качестве xi используется яркость пикселей. Энтропия Шеннона (Shannon) с успехом применялась для сегментации изображений [10]. Иногда для расчета энтропии используют однопараметрическую формулу Цалиса (Tsallis) [11]:
(2)
$H_{q}^{T} = \frac{1}{{q - 1}}\left( {1 - \sum\limits_{i\, = \,1}^n {p_{i}^{q}} } \right),$
где q – энтропийный индекс или показатель. Цалис (Tsallis)-энтропия не является аддитивной, однако в пределе при q → 1 Цалис (Tsallis)-энтропия совпадает с энтропией Шеннона (Shannon) [11].

Другой вид однопараметрической энтропии – это аддитивная энтропия Реньи (Rényi) [12], которая вычисляется по следующей формуле:

(3)
$H_{q}^{R} = \frac{1}{{1 - q}}\ln \left( {\sum\limits_{i\, = \,1}^n {p_{i}^{q}} } \right).$

В работе [12] получена формула, связывающая Цалис (Tsallis)-энтропию и энтропию Реньи (Rényi):

(4)
$H_{q}^{R} = \frac{1}{{1 - q}}\ln (1 + (1 - q)H_{q}^{T}).$

Анализ результатов обработки изображений, выполненный в работе [12], показал, что использование для обработки изображений Цалис (Tsallis)- и Реньи (Rényi)-энтропий приводит к лучшим результатам по сравнению с применением энтропии Шеннона (Shannon). Результаты обработки изображений также существенным образом зависят от использованных методов вычисления гистограммы частот распределения пикселей, с помощью которой вычисляют значения информационной энтропии. Наилучшие результаты классификации и кластеризации пикселей на фотоснимках получены с помощью процедур, учитывающих расстояния между пикселями (d-энтропии) [9].

Структура и процедуры локально-потенциально-морфометрического алгоритма. Предложенный алгоритм состоит из следующих этапов и основных шагов (рис. 1).

Рис. 1.

Блок-схема локально-потенциально-морфометрического алгоритма информационной энтропийной оценки воздействия техногенных химических загрязнений на лесные массивы.

Этап 1. Агрегирование (трансформация) трехканальных цветных изображений на фотоснимках в черно-белые пиксельные изображения.

Шаг 1.1. Усреднение компонент цветного изображения по формуле:

(5)
${{A}_{{ij}}} = \frac{1}{3}\left( {{{R}_{{ij}}} + {{G}_{{ij}}} + {{B}_{{ij}}}} \right),$
где R, G, B – красный, зеленый и синий компоненты цветного изображения, A – агрегированное изображение, i, j – координаты пикселей в двухмерной прямоугольной системе координат изображения.

Шаг 1.2. Усреднение по медиане:

(6)
${{B}_{{ij}}} = sort({{R}_{{ij}}},{{G}_{{ij}}},{{B}_{{ij}}}),\quad {{M}_{{ij}}} = {{B}_{{ij}}}(2),$
где оператор sort сортирует пиксели цветных компонент изображения по возрастанию, Bij(2) – второй элемент отсортированного массива L, состоящего из трех элементов L = (Rij, Gij, Bij), M – медиана.

Шаг 1.3. Вычисление модуля разности:

(7)
${{D}_{{ij}}} = \left| {{{A}_{{ij}}} - {{M}_{{ij}}}} \right|.$

Этап 2. Бинаризация полученного черно-белого пиксельного изображения с использованием двух методик расчета: по максимуму гистограммы Db1 : T = arg(maxHk) и по средней яркости пикселей ($D{{b}_{2}}:T = \sum\nolimits_{k\, = \,1}^n {k{{H}_{k}}} $), где k – яркость пикселей, Hk – относительные частоты гистограммы, n – количество уровней яркости, T – порог бинаризации.

Бинаризация одноцветного изображения осуществляется с применением формулы:

(8)
${{B}_{i}} = \left\{ \begin{gathered} 1,\quad {{D}_{i}} \geqslant T \hfill \\ 0,\quad {{D}_{i}} < T \hfill \\ \end{gathered} \right.,$
где Di, Bi – пиксели исходного и бинаризованного изображения.

Этап 3. Потенциальное преобразование БИ на основе следующей аналогии. Предположим, что белые пиксели (БП) бинарного изображения, которые принадлежат одному классу взаимодействующих между собой объектов, можно представить в виде псевдочастиц. При этом для анализа виртуального взаимодействия псевдочастиц могут быть использованы различные математические модели молекулярной динамики [13], в том числе аналог кулоновского взаимодействия частиц или аналог спин-спинового взаимодействия в модели Изинга (Ising) [14].

Шаг 3.1. Вычисление аналога потенциала с использованием модели Изинга (Ising). В этой модели спин-спиновое взаимодействие не зависит от расстояния между спинами и существует только между ближайшими объектами, т.е. формула для вычисления потенциала Изинга (Ising) имеет ступенчатый характер. Это ограничение достаточно просто реализовать в процессе потенциального преобразования фотоснимка с помощью скользящего окна (СО), при котором результат каждого вычисления виртуального потенциала записывается в центральный пиксель СО. В алгоритме виртуальная двухмерная модель Изинга (Ising) представлена шагами 3.1.1 и 3.1.2.

Шаг 3.1.1. Вычисление виртуального псевдопотенциала Изинга (Ising) с учетом псевдовзаимодействия только между белыми пикселями. На этом шаге используется вариант расчета, при котором взаимодействуют только псевдоспины, расположенные в БП фотоснимка. Черные (фоновые) пиксели (ЧП) не учитываются.

В приближении одинаковых псевдоспинов единичной длины виртуальный потенциал Изинга (Ising) вычисляют по формуле:

(9)
${{U}_{{{\text{Ising}}}}}\left( c \right) = \frac{{n(n - 1)}}{2},$
где n – количество БП в скользящем окне.

Шаг 3.1.2. Вычисление виртуального псевдопотенциала Изинга (Ising) с учетом псевдовзаимодействия как БП, так и ЧП. На этом шаге рассмотрен вариант, при котором учитываются как БП (положительные псевдоспины Si = 1), так и ЧП (отрицательные псевдоспины Si = –1) фотоизображения. В приближении псевдоспинов единичной длины виртуальный потенциал Изинга (Ising) вычисляют по формуле:

(10)
$U = \frac{1}{2}n(n - 1) + \frac{1}{2}m(m - 1) - nm,$
где n, m – количество БП и ЧП.

Шаг 3.2. Вычисление аналога потенциала в кулоновской модели, представленной шагами 3.2.1 и 3.2.2.

Шаг 3.2.1. Вычисление виртуального кулоновского псевдопотенциала с учетом псевдовзаимодействия только между БП. На этом шаге рассмотрен вариант кулоновского взаимодействия с учетом только БП, которые рассматриваются как одинаковые единичные виртуальные положительные заряды qi = +1 (ЧП не учитываются, т.е. qi = 0).

Отличие модели кулоновского взаимодействия от модели Изинга (Ising) состоит в использовании при расчете виртуального кулоновского взаимодействия матрицы обратных расстояний между псевдочастицами.

Шаг 3.2.2. Вычисление виртуального псевдокулоновского потенциала с учетом псевдовзаимодействия как БП (положительные заряды qi = = +1), так и ЧП (отрицательные заряды qi = –1) фотоизображения.

При использовании других форм расчета псевдопотенциала, например, потенциалов Ленарда–Джонса (Lennard–Jones) или Терзофа (Tersoff) будут получены несколько иные мозаики пикселей потенциального преобразования.

Этап 4. Бинаризация одноцветных потенциальных изображений. Бинаризация потенциальных изображений осуществляется с целью выделения бинарных объектов БО-пиксельных кластеров, по гистограмме геометрических показателей которых далее рассчитывается информационная энтропия Реньи (Rényi) для исследованных фрагментов лесных массивов:

(11)
$H\left( {q,a} \right) = \frac{1}{{1 - q}}\ln \left( {\sum\limits_{i\, = \,1}^n {h(a)_{i}^{q}} } \right),$
где H(q, a) – информационная энтропия, вычисленная с помощью гистограммы относительных частот геометрического показателя a, h(a)i – относительные частоты, q – показатель Реньи (Rényi), n – количество шагов гистограммы.

В качестве критерия для выбора порога бинаризации использовано условие выделения максимального количества БО.

Этап 5. Вычисление и анализ морфометрических (геометрических или механических) показателей распределения БО. Создается таблица точечных статистических оценок для каждого морфометрического показателя распределения БО и выбирается показатель, гистограмма частот которого на следующем этапе будет использована для расчета информационной энтропии (уравнение 11). Критерием выбора морфометрического показателя является значительное различие этого показателя для сравниваемых фрагментов лесных массивов по одной из точечных статистических оценок, например по величине среднего арифметического.

Этап 6. Вычисление энтропии Реньи (Rényi) по гистограмме выбранного морфометрического показателя (уравнение 11). Информационная энтропия – это комплексный количественный показатель, характеризующий изменения в пространственной структуре пикселей фрагментов исходного фотоснимка, – является показателем пространственных изменений в древостое под воздействием химического загрязнения.

Результаты тестирования алгоритма. Разработанный алгоритм использован для практического анализа спутниковых фотоснимков лесных массивов, расположенных в районе Карабашского медеплавильного комбината (КМК). Исходные космические фотоснимки – это цветные трехканальные изображения, полученные с помощью средств дистанционного обзора земной поверхности L3Harris Geospatial в системе глобального поиска “IntelliEarth” [15]. На исходном цветном снимке выделены два квадратных фрагмента фотоизображений лесных массивов размером 460 × × 460 пикселей, расположенных на различных расстояниях от КМК: далекий – FFS и близкий – NS (рис. 2).

Рис. 2.

Два фрагмента исходных космических фотоснимков состояний лесных массивов в районе КМК: (а) – FFS; (б) – NS.

В результате потенциального преобразования исходных фотоснимков (этап 3 алгоритма) и последующей бинаризации потенциальных изображений (этап 4 алгоритма) для фрагментов FFS и NS получены следующие количества бинарных объектов – кластеров черно-белых пикселей: 23 и 189 (виртуальная модель Изинга (Ising)), 22 и 206 (виртуальная кулоновская модель).

На этапе 5 алгоритма в качестве морфометрических показателей выбраны следующие геометрические показатели распределения БО-пиксельных кластеров: площади объектов, их периметры, эксцентриситеты и ориентации. Для каждого из указанных геометрических показателей рассчитаны следующие точечные статистические оценки: среднее арифметическое, стандартное отклонение, коэффициент асимметрии и коэффициент эксцесса (табл. 1).

Таблица 1.

Результаты расчета ненормализованных точечных статистических оценок геометрических показателей БО на фотоснимках для двух фрагментов: (а) – фрагмент FFS; (б) – фрагмент NS

    Геометрические показатели
    Площадь Эксцентриситет Ориентация Периметр
(a)
Статистические оценки Среднее арифметическое 3285.1304 0.6732 –3.5652 262.7599
Стандартное отклонение 8900.5586 0.3455 33.5497 529.8378
Коэффициент асимметрии 3.3282 1.1940 0.1108 2.8330
Коэффициент эксцесса 13.1420 2.9076 4.5273 10.3632
(б)
Статистические оценки Среднее арифметическое 95.0423 0.7853 9.0301 34.8314
Стандартное отклонение 190.1559 0.2402 53.2009 39.5941
Коэффициент асимметрии 4.8680 2.2520 –0.0875 2.3290
Коэффициент эксцесса 33.3556 7.6524 2.1641 9.8762

На этапе 5 алгоритма необходимо выбрать показатель с наибольшими различиями в точечных статистических оценках для фрагментов FFS и NS. Как следует из табл. 1, статистические показатели БО проявляют существенное различие только для одного геометрического показателя – площадь БО. Например, среднее арифметическое площадей БО фрагмента FFS почти в 35 раз больше аналогичного показателя фрагмента NS. По остальным показателям наблюдаются лишь небольшие различия.

На этапе 6 алгоритма по гистограмме частот для показателя “площадь БО” рассчитаны значения информационной энтропии Реньи (Rényi) (рис. 3).

Рис. 3.

Графики информационных энтропий Реньи (Rényi) в зависимости от величины показателя Реньи (Rényi) q (уравнение 11): энтропия фрагмента FFS (сплошная линия); энтропия фрагмента NS (пунктирная линия).

Как следует из рис. 3, существенные различия значений информационной энтропии для фрагментов фотоизображений наблюдаются для всех значений показателя Реньи (Rényi) q (см. формулу (3)). При этом энтропия фрагмента, расположенного на большом расстоянии от КМК, всегда меньше энтропии фрагмента, расположенного ближе к комбинату. Это обусловлено тем, что энтропия фрагментарной мозаики всегда больше энтропии объектов с однородной структурой.

ЗАКЛЮЧЕНИЕ

Для численных оценок воздействия техногенных химических загрязнений на пространственную структуру и деградацию растительного состава окружающих промышленные системы лесных массивов предложен оригинальный локально-потенциально-морфометрический информационный энтропийный алгоритм, позволяющий оценивать фрагментарность и хаотичность расположения белых и черных пикселей на фотоснимках на основе использования процедуры потенциального преобразования БИ, процедуры расчета морфометрических показателей распределения бинарных объектов с использованием критерия максимального различия для участков с разной степенью фрагментарности и использовании гистограммы частот этого показателя для расчета значений информационной энтропии Реньи (Rényi).

Процедура потенциального преобразования фотоизображений основана на аналогии между пикселями БИ и частицами молекулярной динамики. Потенциальное преобразование БИ осуществляется с помощью скользящего окна, в центральный пиксель которого записывается псевдопотенциал виртуального взаимодействия псевдочастиц – белых и черных пикселей. Информационная энтропия используется в качестве интегрального показателя деградации и структурных нарушений лесных массивов под воздействием техногенных химических загрязнений.

Разработанный алгоритм практически использован для оценки нарушений пространственной структуры лесов, расположенных на различных расстояниях от медеплавильного комбината. В результате тестирования алгоритма по цветным спутниковым фотоснимкам лесных массивов определено существенное превышение значений информационной энтропии Реньи (Rényi) для более химически загрязненных территорий по сравнению с менее загрязненными.

Разработанный алгоритм представляет собой эффективный инструмент анализа степени воздействия химических загрязнений на лесные массивы. Алгоритм может быть применен в различных областях научных исследований, использующих метод интроскопии для изучения постепенных структурных изменений в сложных техногенных и живых системах под воздействием различных внешних и внутренних факторов, например, в материаловедении, биологии, медицине, почвоведении и пр.

Список литературы

  1. Smith W.H. Air Pollution and Forests. Interactions between Air Contaminants and Forest Ecosystems / New York: Springer-Verlag; 1981. 388 p.

  2. Chen C.H. Image Processing for Remote Sensing / United States of America: Taylor & Francis Group; 2008.

  3. Бутусов О.Б. Алгоритмы текстурной классификации типов лесов на основе анализа космических снимков с ИСЗ “Landsat-7” // Исследование Земли из Космоса. 2002. № 5. С. 87–96.

  4. Саркисов П.Д., Бутусов О.Б., Мешалкин В.П. Декомпозиционный вейвлетно-морфометрический алгоритм анализа микрофотоизображений текстуры твердофазных наноматериалов // ДАН. 2010. Т. 434. № 5. С. 651–655.

  5. Саркисов П.Д., Бутусов О.Б., Мешалкин В.П., Севастьянов В.Г., Галаев А.Б. Компьютерный метод анализа текстуры нанокомпозитов на основе расчета изолиний фрактальных размерностей // Теоретические основы химической технологии. 2010. Т. 44. № 6. С. 620–625.

  6. Бутусов О.Б., Мешалкин В.П. Текстурные и фрактальные методы анализа характеристик нестационарных газовых потоков в трубопроводах // Теоретические основы химической технологии. 2006. Т. 40. № 3. С. 313–327.

  7. Borgefors G. Distance transform in digital image // Computer Vision, Graphics and Image Processing. 1986. V. 34. P. 344–371. https://doi.org/10.1016/S0734-189X(86)80047-0

  8. Danielsson P.E. Euclidean distance mapping // Computer Graphics and Image Processing. 1980. V. 14. P. 227–248. https://doi.org/10.1016/0146-664X(80)90054-4

  9. Gao P., Li Z., Zhang H. Thermodynamics-Based Evaluation of Various Improved Shannon Entropies for Configurational Information of Gray-Level Images // Entropy. 2018. V. 20. P. 19–44. https://doi.org/10.3390/e20010019

  10. Tsallis C. Possible generalization of Boltzmann-Gibbs statistics // J. Stat. Phys. 1988. V. 52. P. 479–487. https://doi.org/10.1007/BF01016429

  11. Sahoo P., Wilkins C., Yeager J. Thresholding selection using Rényi’s entropy // Pattern Recognition. 1997. V. 30. P. 71–84. https://doi.org/10.1016/S0031-3203(96)00065-9

  12. Sparavigna A.C. On the Role of Tsallis Entropy in Image Processing // Int. Sci. Res. J. 2015. V. 1. № 6. P. 16–24. https://doi.org/10.18483/IRJSci.79

  13. Rapaport D.C. The art of molecular dynamics simulation. UK, Cambridge: Cambridge University Press; 2004. 564 p.

  14. Биндер К., Хеерман Д.В. Моделирование методом Монте-Карло в статистической физике: Введение. Пер. с англ. В.Н. Задкова / М.: Наука. Физматлит; 1995. 144 с.

  15. Geospatial Data & Imagery. Harris Geospatial. Доступно по: https://www.harrisgeospatial.com/Data-Imagery. Ссылка активна на 20 сентября 2020 г.

Дополнительные материалы отсутствуют.