ЖЭТФ, 2019, том 155, вып. 4, стр. 693-701
© 2019
НЕЙРОСЕТЕВАЯ АСТРОНОМИЯ КАК НОВЫЙ ИНСТРУМЕНТ
НАБЛЮДЕНИЯ ЯРКИХ И КОМПАКТНЫХ ОБЪЕКТОВ
А. А. Шацкийa*, И. Ю. Евгеньевb
a Московский государственный университет им. М. В. Ломоносова
119991, Москва, Россия
b Московский авиационный институт
125993, Москва, Россия
Поступила в редакцию 24 сентября 2018 г.,
после переработки 5 ноября 2018 г.
Принята к публикации 13 ноября 2018 г.
Предложен новый метод решения важной проблемы астрономии, возникающей при наблюдениях на
интерферометрах со сверхвысоким угловым разрешением. Этот метод основан на применении теории
искусственных нейросетей. Предложена и рассчитана многопараметрическая модель небесного объекта
типа Sgr A*. Для этой модели численно построен ряд вероятных изображений для обучения нейросети.
После обучения нейросети на этих изображениях качество ее работы проверено на другом ряде изобра-
жений из этой же модели. Доказано, что нейросеть может распознавать и классифицировать небесные
объекты (получаемые в том числе с интерферометров) практически не хуже, чем это способен делать
человек.
DOI: 10.1134/S0044451019040126
Как известно (см., например, [1]), интерферомет-
ры не видят изображений объектов, они видят (из-
меряют) амплитуду A(u, v) и фазу Φ(u, v) комплекс-
1. ВВЕДЕНИЕ
ной функции видности V (u, v) := A exp(iΦ) этих
объектов:
Для наблюдения характеристик объектов, угло-
∫∫
[
]
2πi(xu + yv)
вые размеры которых сопоставимы с угловыми раз-
V (u, v) =
I(x, y) exp -
dx dy, (1)
λ
мерами диаметра горизонта сверхмассивных чер-
∫∫
[2πi(xu + yv)]
ных дыр, необходимы интерферометры с угловым
I(x, y) =
V (u, v) exp
du dv.
(2)
разрешением меньше 50 мкс дуги.
λ
В то же время наблюдения многих объектов Все-
Здесь I(x, y) — функция плотности яркости наблю-
ленной на одиночных телескопах, даже космичес-
даемого объекта в угловых координатах, λ — длина
ких, не дают возможности исследовать их структу-
волны, на которой ведется наблюдение. Координаты
ру ввиду малости угловых размеров. При этом уг-
(u, v) являются фактически двумерными координа-
ловое разрешение современных интерферометров с
тами базы интерферометра и называются координа-
большой базой в оптическом, инфракрасном и ра-
тами на (u, v)-плоскости.
диодиапазонах (последние — так называемые радио-
Наблюдения на сверхмалых угловых масштабах
интерферометры со сверхдлинными базами, РСДБ)
могут быть выполнены только интерферометрами
приближается к десяти угловым микросекундам ду-
со сверхбольшими базами: более 5 · 109λ, см. [1].
ги1) (см. [1-6]).
Главной проблемой здесь является измерение фа-
Речь идет в первую очередь о наблюдениях объ-
зы при достаточно большой разнице путей до теле-
ектов Sgr A* (угловой диаметр тени 60 μas) и ядра
скопов интерферометра. Минимально необходимой
M87 (угловой диаметр тени 40 μas).
точностью при этом является четверть длины вол-
ны λ/4, что соответствует фазе, измеренной с точ-
* E-mail: shatskiyalex@gmail.com
ностью, много меньшей π/2. Для интерферометров
1) Угловая микросекунда дуги 1 µas 4.8 · 10-12 рад.
в инфракрасном и оптическом диапазонах данное
693
А. А. Шацкий, И. Ю. Евгеньев
ЖЭТФ, том 155, вып. 4, 2019
Magnitude
Original
Final image
Phase
Рис. 1. Прямое и обратное преобразование Фурье для изображения кота. Изображение для амплитуды (Magnitude) полу-
чено как восстановленное (обратным преобразованием Фурье) изображение с фазой равной единице и амплитудой кота,
а изображение для фазы (Phase) получено как восстановленное изображение с амплитудой равной единице и фазой кота
Magnitude
Original
Final image
Phase
Рис. 2. То же, что на рис. 1, но для изображения автомобиля
требование является, в принципе, выполнимым, но
На сегодняшний день это соответствует телеско-
спектральная разрешающая способность телескопов
пам, работающим на длинах волн больше1 мм.
(λ/Δλ) в таких интерферометрах оказывается по-
рядка или меньше единицы. Это приводит к силь-
2. ОСОБЕННОСТИ ИНТЕРФЕРЕНЦИОННОЙ
ному размытию интерференционной картины. По-
АСТРОНОМИИ
этому без точного знания спектров деталей изобра-
жения обработка этого сигнала бессмысленна в при-
К сожалению, большинство интерферометров со
нимаемом диапазоне Δλ. К сожалению, мы можем
сверхвысоким угловым разрешением (т. е. со сверх-
измерить лишь суммарный спектр всего изображе-
большими базами) не могут измерять фазу функции
ния, но не можем измерить спектры деталей это-
видности, они регистрируют только ее амплитуду.
го изображения. Поэтому количественно обработать
В русскоязычной литературе вместо слова ампли-
интерферометрические данные мы можем только в
туда принято использовать термин «автокорреля-
тех диапазонах, где допустимо монохромное при-
ционная функция», а в англоязычной — «correlated
ближение для спектральной разрешающей способ-
flux density», далее везде мы будем использовать со-
ности: λ/Δλ ≫ 1.
кращение CFD. Фаза функции видности безвозврат-
694
ЖЭТФ, том 155, вып. 4, 2019
Нейросетевая астрономия как новый инструмент наблюдения.. .
а
(Amodel,i - Aobs,i)2
χ2 =
(3)
Cat’s magnitude + car’s phase
= car’s type of image
2
ΔA
i
obs,i
Здесь индексы «model» и «obs» отвечают соот-
+
=
ветственно модельной и наблюдаемой амплитудам,
суммирование ведется по всем точкам изображения,
б
данные о которых имеются в распоряжении наблю-
Car’s magnitude + cat’s phase
= cat’s type of image
дателя.
Критерий минимальности хи-квадрат является
+
=
достаточно простым и надежным, однако при боль-
шом числе параметров модели он требует экспонен-
циально большого времени счета.
Рис. 3. а) Амплитуда кота + фаза автомобиля, таким обра-
Допустим, мы имеем N-параметрическую мо-
зом восстановленное изображение похоже на автомобиль.
дель CFD как двумерную функцию на (u, v)-плос-
б) Амплитуда автомобиля + фаза кота, таким образом
кости.
восстановленное изображение похоже на кота
Пусть также имеются T наблюдательных точек
на (u, v)-плоскости, в которых мы будем сравнивать
результаты наблюдений и модели. В N-мерном па-
но теряется при превышении длины корреляции, а
раметрическом пространстве мы должны выбрать
также из-за атмосферных (и других) помех. Тем не
куб и каждое ребро этого куба разбить на K час-
менее, даже знание одной только функции CFD мо-
тей (в принципе, это число может быть разным для
жет многое прояснить об изображении объекта и его
каждого ребра). Тогда полное число точек (ячеек), в
свойствах.
которых мы должны вычислить величину хи-квад-
рат, получается равным KN , а для вычисления хи-
Что можно сказать об изображении без знания
квадрат мы должны умножить KN на 5T , чтобы по-
фазы? На эту тему написано немало работ (см., на-
лучить полное число необходимых арифметических
пример, [7, 8]).
операций. Реально же нам потребуется еще больше
На рис. 1-3 продемонстрированы прямые и об-
вычислительных ресурсов, так как каждая модель-
ратные преобразования Фурье для двух изображе-
ная точка обычно представляет собой арифметиче-
ний (в оттенках серого): кота и автомобиля. Как по-
ское выражение из специальных функций (обычно
нятно из самих рисунков и подписей к ним, основная
функций Бесселя) и их вычисление также требует
информация, позволяющая человеку отождествить
времени. Например, полное число арифметических
изображение, находится в фазе Φ. Но это еще не
операций X для N = 5, K = 100 и T = 100 полу-
означает, что в CFD содержится меньше информа-
чается равным X = 5 · 1012 (не считая вычислений
ции, чем в фазе Φ. При этом по каким-то причинам
самих модельных точек). Этот пример мы выбрали
человеческий мозг и его зрение не в состоянии раз-
не случайно: он соответствует готовому расчету мо-
личать информацию, содержащуюся в CFD. Чело-
делей астрофизиками из группы проекта телескопа
век различает только информацию, содержащуюся
горизонта событий [9].
в фазе Φ.
Возникает вопрос: почему нельзя использовать
Зная только CFD, мы до недавнего времени име-
стандартные методы нахождения глобального мини-
ли единственную возможность определять харак-
мума N-мерной функции в N-мерном пространстве
теристики изображения — сравнивать распределе-
параметров?
ние наблюдаемой CFD с ее модельными значени-
К сожалению, прямые и очевидные методы опти-
ями в виде некоторой двумерной функции, зави-
мизации таких вычислений, например метод гради-
сящей от определенного набора параметров. Таким
ентного спуска в функционале (3), в данном случае
образом, мы могли выбирать наилучшее модельное
неприменим. Это связано с тем, что вычисление та-
изображение, соответствующее определенному на-
кого рода стандартными методами приводит к од-
бору этих параметров (наилучшему вектору в про-
ному из локальных минимумов. А нам необходим
странстве параметров). Существует много матема-
глобальный минимум (или локальный, но рядом с
тических критериев степени сходства (и различия)
глобальным). Поскольку при больших N локаль-
функций. Одним из них является известный крите-
ных минимумов становится экспоненциально мно-
рий минимальности хи-квадрат (χ2):
го, шансов найти среди них глобальный становит-
695
А. А. Шацкий, И. Ю. Евгеньев
ЖЭТФ, том 155, вып. 4, 2019
Но что делать, если наша модель сложнее и име-
ет, например, 11 параметров? В этом случае (при
K = 100 и T = 100) число арифметических опера-
ций достигает величины 1025. Это уже запредель-
ная величина даже для современных суперкомпью-
теров. А ведь число параметров N в более реаль-
ных моделях может быть гораздо большим (около
сотни).
Что делать в этом случае?
3. НЕЙРОСЕТЕВАЯ АСТРОНОМИЯ
Наука о нейросетевой астрономии является со-
вершенно новой, и данное определение было введе-
но одним из авторов этой работы. Сначала поясним,
что такое искусственные нейронные сети (или сокра-
Рис. 4. Модель «размытого» (по Гауссу) полумесяца, хо-
щенно нейросети), о которых далее пойдет речь.
рошо аппроксимирующая тень от черной дыры
Искусственная нейронная сеть — это математи-
ческая модель (а также ее программное или аппа-
ратное воплощение), построенная по принципу ор-
ся чрезвычайно мало. Также стоит отметить, что,
ганизации и функционирования биологических ней-
несмотря на неприменимость метода градиентно-
ронных сетей — сетей нервных клеток живого орга-
го спуска к нахождению минимума функционала
низма. Это понятие возникло при изучении процес-
(3), этот метод повсеместно применяется при обуче-
сов, протекающих в мозге, и при попытке модели-
нии нейронных сетей — алгоритм обратного распро-
ровать эти процессы.
странения ошибки (о котором будет сказано ниже)
Практически решаемыми задачами для многих
как раз позволяет эффективно вычислить градиент
(искусственных) нейросетей являются задачи прог-
функции потерь по весам.
нозирования, аппроксимации, кластеризации, сжа-
В работе [10] были исследованы свойства CFD
тия данных, локализации объектов, а также разби-
для объектов, которые могут являться черными ды-
ение заданного множества объектов на классы (а
рами. Общим для моделей черных дыр являются
иногда еще и на подклассы). Нас будет интересо-
тени, которые гравитация черной дыры оставляет
вать именно разбиение заданного множества объ-
на фоне излучения, источником которого являет-
ектов на классы, т. е., кратко говоря, классифика-
ся материя, окружающая черную дыру. Источником
ция множества. С этой целью проводится обучение
этого излучения может быть материя, составляю-
нейросети — на ее вход по очереди подаются объ-
щая аккреционный диск вокруг черной дыры, или
екты, выбранные случайным образом из обучающе-
это излучение просто является фоновым, в том чис-
го множества. На выходе нейросеть выдает вектор
ле реликтовым микроволновым излучением. В лю-
классификатора. В идеале для совершенно обучен-
бом случае форма этой тени на картине излучения,
ной нейросети этот вектор заполнен нулями и одной
регистрируемого наблюдателем, весьма характерна.
единицей — номер позиции этой единицы соответ-
Очень хорошим приближением для этой формы яв-
ствует номеру класса текущего объекта на входе. В
ляется модель полумесяца, или модель «размыто-
реальности же этот вектор состоит из нецелых чисел
го» по Гауссу (см. рис. 4) полумесяца (см., напри-
(float) и нормирован на единицу. Из этого вектора
мер, [9]).
можно получить величину ошибки, с которой ней-
Модель полумесяца весьма проста и эффектив-
росеть определила искомый класс. С помощью ал-
на для численного моделирования. В ней всего пять
горитма «обратного распространения ошибки» эта
числовых параметров и, как сказано выше, число
ошибка распространяется от конца сети к ее нача-
арифметических операций для этой модели пример-
лу и в процессе этого происходит коррекция весовых
но равно 1013. Для современных компьютеров это
коэффициентов нейросети (которые и составляют ее
посильная задача.
основу). Этот процесс повторяют до тех пор, пока
696
ЖЭТФ, том 155, вып. 4, 2019
Нейросетевая астрономия как новый инструмент наблюдения.. .
ошибка на выходе не становится достаточно малой,
га) и яркость полумесяца. Кроме того, добавляем к
тогда нейросеть готова к работе.
модели еще два точечных объекта2) (две звезды), у
Подробнее про искусственные нейронные сети
каждого из которых по три параметра: координаты
можно прочитать в работах [11-14]. Про нейросети,
и яркость (рис. 5).
используемые в настоящей работе, можно прочитать
При этом согласно исследованию, проведенному
в цикле статей [15-21], а также в [22].
в работе [10], звезды внутри внешнего круга полуме-
Как упоминалось выше, по каким-то причинам
сяца соответствуют модели черно-белой дыры, или
человеческий мозг и его зрение не в состоянии раз-
кротовой норы, а звезды вне внешнего круга полу-
личать информацию, содержащуюся в CFD, хотя
месяца соответствуют просто звездам на фоне чер-
там также содержится достаточно много информа-
ной дыры (или звездам гравитационно-линзирован-
ции об объекте. Идея данной работы состоит в том,
ным этой черной дырой).
чтобы обучить нейросеть на объектах, являющих-
Обучение можно провести как на оригинальных
ся амплитудами фурье-образов изображений, т. е.
изображениях модели (которых в реальности мы не
CFD. Как будет видно ниже, это оказывается вполне
имеем, как было показано в разд. 2), так и на изобра-
решаемой задачей.
жениях CFD, соответствующих оригинальным изоб-
Таким образом, можно обучить нейросеть на раз-
ражениям.
ных классах в выбранной модели — для широкого
Кроме того, мы также можем попытаться выпол-
круга протяженных астрономических объектов или
нить обратные фурье-преобразования для изобра-
группы точечных объектов.
жений CFD, взяв при этом вместо отсутствующей
Обучить нейросеть можно одинаково хорошо
фазы постоянную двумерную функцию, и получить
вне зависимости от сложности моделей этих объек-
в результате еще один набор изображений (также
тов. Эта уникальная возможность решает проблему,
разбитых на классы), а после этого обучить нейро-
сформулированную в предыдущем разделе.
сеть на этом новом наборе изображений.
4. МОДЕЛЬ ДЛЯ НЕЙРОСЕТИ
5. ОБУЧЕНИЕ НЕЙРОСЕТИ
Для данной работы мы выбрали относительно
простую модель, содержащую 11 параметров. Тем не
Мы выбрали для обучения нейросеть YOLOv3
менее, как упомянуто выше, даже с помощью супер-
из пакета DARKNET [22] (см. Приложение). Этот
компьютеров эта модель не может быть рассчитана
пакет относится к числу открытого программного
стандартными методами. Мы покажем, что нейросе-
обеспечения с лицензией BSD. Такой выбор обу-
ти способны классифицировать такую модель с ве-
словлен тем, что, во-первых, данная нейросеть до-
роятностью, близкой к 100 %.
статочно качественно может различать классы, на
В основу модели положим модель полумесяца —
которых была обучена. Во-вторых, эта нейросеть
это пять параметров: радиус внешнего круга, ради-
может также строить рамки вокруг найденных на
ус внутреннего круга, две координаты центра внут-
изображении объектов — это может потребоваться
реннего круга (относительно центра внешнего кру-
для идентификации подклассов (подмножеств) на
множествах объектов (в дальнейших исследовани-
а
б
в
ях). В-третьих, эта нейросеть также выдает вероят-
ность определенного ей объекта (обведенного рам-
кой, с присвоением ей идентификатора), таким об-
разом мы можем отсекать те объекты, вероятность
обнаружения которых недостаточно велика для нас.
2) В самой модели мы добавляем на картинки не яркие точ-
ки, а яркие кружки, радиус которых пропорционален модель-
ной яркости звезды, так как численное моделирование точеч-
Рис. 5. 11-параметрическая модель для обучения нейро-
ных объектов дает неадекватные результаты по сравнению с
сети на трех классах: а — нулевой класс (нет звезд вне
моделированием протяженных объектов. Кроме того, в ре-
круга полумесяца), б — первый класс (одна звезда вне кру-
альных телескопах звезды дают изображения именно в виде
га полумесяца), в — второй класс (две звезды вне круга
кружков (а не точек), причем чем ярче звезда, тем больше
полумесяца)
кружок. А в дальнейших фурье-преобразованиях мы модели-
руем эти же звезды именно как точки (дельта-функции).
697
А. А. Шацкий, И. Ю. Евгеньев
ЖЭТФ, том 155, вып. 4, 2019
Мы также пытались обучить гораздо более про-
стые (неглубокие) нейросети на этом же множестве
изображений. Эти неглубокие нейросети представ-
ляли собой всего три сверточных слоя и один полно-
связный (перцептрон) слой на выходе. Однако дан-
ная конфигурация не позволила получить вероят-
ность распознавания классов выше 70 %.
Качество обучения нейросети мы решили прове-
рить для трех разных наборов картинок: 1) для на-
бора оригинальных картинок модели, 2) для набо-
ра CFD-картинок, полученных аналитическим фу-
рье-преобразованием из оригинальных (с учетом
использования дельта-функции в фурье-преобразо-
вании для моделей звезд), 3) для набора карти-
нок, полученных из CFD-картинок путем численно-
го обратного фурье-преобразования с использовани-
ем постоянной функции фазы (далее для краткости
CFD2DFT-картинки).
Для аналитического получения CFD-картинок
по заданным 11 параметрам мы использовали фор-
мулу для CFD из работы [10]:
Рис. 6. Слева расположены оригинальные картинки, в
центре — CFD-картинки, полученные с теми же 11 пара-
Acrescent+points(u, v) =
метрами, что и оригинальные, справа — картинки, полу-
[
(
)
ченные из CFD-картинок путем обратного фурье-преоб-
0
2πi(xcu+ycv)
=
B
-
×
разования с использованием постоянной функции фазы
routJ1(ηrout)- exp
η
λ
(CFD2DFT-картинки). Верхний ряд — для нулевого класса,
средний — для первого, нижний — для второго
]
(
)
2πi(xju+yjv)
× rinJ1(ηrin) +
Bj exp
-
.
(4)
λ
j
лежали слишком близко к границе внешнего круга
полумесяца, чтобы классы явно отличались друг от
Здесь η :=
u2 + v2, B0 — плотность яркости по-
друга.
лумесяца, rin и rout — его внутренний и внешний
Примеры таких картинок (для каждого из трех
радиусы, xc и yc — координаты центра внутренне-
классов) представлены на рис. 6.
го круга полумесяца (относительно внешнего), Bj
яркость звезды с индексом j, xj и yj — ее коорди-
6. РЕЗУЛЬТАТЫ ОБУЧЕНИЯ НЕЙРОСЕТИ
наты, J1 — функция Бесселя первого порядка, λ
длина волны, на которой ведутся наблюдения.
В числе прочих характеристик и параметров (о
Все картинки и преобразования над ними мы
которых будет сказано ниже) нейросеть выдает ве-
подготовили с использованием пакета OpenCV
роятность «prob» распознавания классифицируемо-
на C++.
го ей объекта (см. Приложение). Обозначим probmin
Для каждого из этих трех наборов картинок мы
минимальный порог для этой вероятности.
подготовили обучающее множество из 3000 карти-
Далее фигурирует еще одна вероятность пра-
нок — по 1000 картинок для каждого из трех клас-
вильного распознавания классов, определяемая как
сов (0, 1, 2). На каждом из этих наборов (по 3000
часть правильных ответов среди всех ответов нейро-
картинок) нейросеть проходила обучение.
сети на выборке из 600 тестовых картинок (по 200
Кроме того, мы подготовили еще по 600 карти-
картинок в каждом классе), обозначим эту вероят-
нок для каждого набора (по 200 картинок в каждом
ность символом ϱ.
классе) для тестов обученных нейросетей. Все эти
При probmin = 0.1 вероятности ϱ получились
картинки по 11 параметрам модели случайным об-
следующими:
разом отличаются друг от друга. Кроме того, мы
— для оригинальных картинок ϱ ≈ 98.83 %,
проследили, чтобы в картинках две звезды не на-
— для CFD-картинок ϱ ≈ 97.67 %,
кладывались друг на друга (слишком близко) и не
— для CFD2DFT-картинок ϱ ≈ 92.20 %.
698
ЖЭТФ, том 155, вып. 4, 2019
Нейросетевая астрономия как новый инструмент наблюдения.. .
При этом все картинки были распознаны (ли-
При размерах области «размытия» 3 × 3 пиксе-
бо правильно, либо нет), т.е. величина prob для
лей:
всех шести сотен картинок оказалась больше, чем
— для probmin = 0.1 имеем ϱ ≈ 98.17 %, все кар-
probmin. Анализ ошибок показал, что нейросеть
тинки были распознаны;
ошибалась только в случаях, когда две звезды ча-
— для probmin = 0.9 имеем ϱ ≈ 98.80 %, 15 кар-
стично накладывались друг на друга, т. е. нейросеть
тинок были нераспознаны;
принимала их за одну звезду (а вторую найти не
могла).
— для probmin = 0.95 имеем ϱ ≈ 99.13 %, 27 кар-
Если же мы хотим отбросить недостоверные ре-
тинок были нераспознаны.
зультаты, то нужно повысить минимальный порог
При размерах области «размытия» 5 × 5 пиксе-
probmin.
лей:
При probmin = 0.9 вероятности ϱ получились
— для probmin = 0.1 имеем ϱ ≈ 96.83 %, все кар-
следующими:
тинки были распознаны;
— для оригинальных картинок ϱ ≈ 99.32 %, 15
— для probmin = 0.9 имеем ϱ ≈ 98.78 %, 27 кар-
картинок были нераспознаны;
тинок были нераспознаны;
— для CFD-картинок ϱ ≈ 98.97 %, 20 картинок
были нераспознаны;
— для probmin = 0.95 имеем ϱ ≈ 99.10 %, 42 кар-
— для CFD2DFT-картинок ϱ ≈ 95.19 %, 122 кар-
тинки были нераспознаны.
тинки были нераспознаны.
При размерах области «размытия» 10 × 10 пик-
При probmin = 0.95 вероятности ϱ получились
селей:
следующими:
— для probmin = 0.1 имеем ϱ ≈ 93.67 %, все кар-
— для оригинальных картинок ϱ ≈ 99.30 %, 28
тинки были распознаны;
картинок были нераспознаны;
— для CFD-картинок ϱ ≈ 99.13 %, 28 картинок
— для probmin = 0.9 имеем ϱ ≈ 96.55 %, 50 кар-
были нераспознаны;
тинок были нераспознаны;
— для CFD2DFT-картинок ϱ ≈ 95.57 %, 171 кар-
— для probmin = 0.95 имеем ϱ ≈ 96.82 %, 65 кар-
тинка была нераспознана.
тинок были нераспознаны.
При размерах области «размытия» 20 × 20 пик-
селей:
7. ДОБАВЛЕНИЕ ШУМОВ НА КАРТИНКИ
— для probmin = 0.1 имеем ϱ ≈ 65.61 %, 1 кар-
При реальных измерениях на интерферомет-
тинка была нераспознана;
рах у наблюдателя нет полностью заполненной
— для probmin = 0.9 имеем ϱ ≈ 71.69 %, 155 кар-
(u, v)-плоскости, имеются лишь отдельные кривые
тинок были нераспознаны;
линии на этой плоскости. Поэтому, чтобы получить
— для probmin = 0.95 имеем ϱ ≈ 74.18 %, 205 кар-
результат, незаполненную часть (u, v)-плоскости ап-
тинок были нераспознаны.
проксимируют на основе имеющихся наблюдатель-
ных данных (линий на (u, v)-плоскости). При этом
Отсюда видно, что данное «размытие» (или сгла-
неизбежно возникают ошибки, связанные с этой ап-
живание) картинок, как и следовало ожидать, отри-
проксимацией. Кроме того, добавляются ошибки,
цательно влияет на результаты правильного распо-
связанные с шумами, накладывающимися на дан-
знавания классов нашей нейросетью. Но итоговые
ные наблюдений.
результаты все равно оказываются вполне прием-
Для того чтобы оценить влияние всех этих оши-
лемыми для использования нейросетей в качестве
бок и шумов на наши результаты, мы искусственно
искусственного интеллекта распознавания астроно-
«испортили» сгенерированные CFD-картинки. Сде-
мических объектов. Мы предполагаем, что столь
лали мы это, наложив на картинки blur-фильтр, ко-
незначительное влияние шумов на результаты свя-
торый делает «размытие» (или сглаживание) кар-
зано с тем, что CFD-картинки уже по сути явля-
тинки с заданным параметром области «размытия».
ются неким интегральным «размытием» оригиналь-
При этом нейросеть на «размытых» картинках не
ных картинок, так как фурье-преобразование и есть
переобучалась.
такое интегральное «размытие»: каждая точка в
Размеры всех наших картинок составляют
CFD-картинке содержит в себе информацию, полу-
480 × 480 пикселей.
чаемую от всех точек в оригинальной картинке.
699
А. А. Шацкий, И. Ю. Евгеньев
ЖЭТФ, том 155, вып. 4, 2019
8. ОБСУЖДЕНИЕ
кретизации (upsampling) и по сути делает детек-
тирование в трех масштабах, деля изображение на
Как было доказано в предыдущем разделе, ис-
ячейки-клетки 13 × 13, 26 × 26, 52 × 52. На выхо-
пользование нейросетей для определения типов объ-
де мы получаем три тензора 13 × 13 × (B × (5 + C)),
ектов CFD дает очень хорошие результаты: вероят-
26×26×((5+C)), 52×52×((5+C)), где B — ко-
ность распознавания при классификации CFD-кар-
личество рамок, центр которых находится в ячейке,
тинок близка к 100 %.
при этом размеры рамки могут выходить за грани-
Кроме вероятности распознавания prob класси-
цу ячейки, C — вероятности классов из датасета (их
фицируемого объекта, нейросеть выдает еще ряд
сумма равна единице), цифра 5 обозначает пять па-
прочих полезных параметров: координаты рамки,
раметров: вероятность P того, что в данной ячейке
ограничивающей определенный на картинке объект,
обнаружен объект, координаты рамки x, y, ее высота
идентификатор этой рамки, необходимый для выде-
и ширина w, h. Количество рамок B, большее одной,
ления и дальнейшего сопровождения деталей объек-
необходимо в том числе для таких ситуаций, когда в
та. Поэтому, если вероятность распознавания ока-
одной ячейке находятся центры двух объектов (на-
жется недостаточно высокой, это будет означать,
пример, пешеход на фоне машины). Например, для
что используемая модель недостаточно полно и хо-
B = 2 и C = 3 для каждой ячейки-клетки в трех
рошо описывает входящую в нейросеть картинку,
масштабах получим 3549 (13·13+26·26+52·52) векто-
т. е. нужно будет расширить и усложнить модель,
ров P 1, x1, y1, w1, h1, C1_1, C1_2, C1_3, P 2, x2, y2,
а затем переобучить нейросеть. С другой стороны,
w2, h2, C2_1, C2_2, C2_3, из которых впослед-
если мы получим достаточно высокую вероятность
ствии отфильтруем только нужные нам. В архи-
классифицируемого объекта, то модель для этого
тектуре YOLOv3 B = 3. Возвращаясь к вопросу о
объекта можно будет расширить: разбить имеющие-
вероятности prob, которую выдает программа для
ся классы на дополнительные подклассы и переобу-
каждого найденного ей объекта, это вероятность P ,
чить нейросеть на новом наборе классов и подклас-
умноженная на C того класса, чей тип вероятности
сов. Таким образом можно будет выявить на входя-
(score probability) (C1_1, C1_2, C1_3) максимален
щей картинке отдельные детали объекта (класса),
для данной рамки.
соответствующие подклассам объекта со сложной
структурой. И так далее с новыми подклассами. Ни-
чего подобного стандартные методы изучения CFD
ЛИТЕРАТУРА
не позволяют сделать.
1. A. R. Thompson, J. M. Moran, and G. W. Swenson,
Таким образом, использование нейросетей дает
Jr., Interferometry and Synthesis in Radio Astrono-
гораздо более надежные результаты, чем стандарт-
my, Wiley (2001).
ные методы моделирования по нескольким парамет-
рам (где вероятность ошибки обычно в несколько
2. K. I. Kellermann and J. M. Moran, Ann. Rev. Astron.
раз больше, чем у нейросетей). Но главное — ис-
Astrophys. 39, 457 (2001).
пользование нейросетей не ограничено количеством
3. A. Quirrenbach, Ann. Rev. Astron. Astrophys. 39,
параметров в модели. То есть практически с тем же
353 (2001).
успехом можно использовать сколь-угодно сложную
(многопараметрическую) модель оригинальной кар-
4. A. Quirrenbach, ISSI Sci. Rep. Ser. 9, 293 (2010).
тинки (и соответственно CFD-картинки тоже).
5. R.-S. Lu, A. E. Broderick, F. Baron, J. D. Monnier,
Результаты этой работы могут оказаться полез-
V. L. Fish, S. S. Doeleman, and V. Pankratius, Ast-
ны исследователям международного проекта Event
rophys. J. 788, 120 (2014).
Horizon Telescope: https://eventhorizontelescope.org.
6. Н. С. Кардашев и др., Астрон. ж. 90, 179 (2013).
7. P. Coles and L.-Y. Chiang, Nature 406, 376 (2000).
ПРИЛОЖЕНИЕ
8. L.-Y. Chiang et al., Astrophys. J. 590, L65 (2003).
Архитектура нейросети YOLOv3
9. A. B. Kamruddin and J. Dexter, Month. Not. Roy.
Архитектура сети YOLOv3 основана на Dark-
Astron. Soc. 434, 765 (2013).
net-53 (цифра в названии говорит о количестве свер-
точных слоев в архитектуре). Архитектура исполь-
10. А. А. Шацкий, Ю. Ю. Ковалев, И. Д. Новиков,
зует остаточные (residual) блоки и повышение дис-
ЖЭТФ 147, 926 (2015).
700
ЖЭТФ, том 155, вып. 4, 2019
Нейросетевая астрономия как новый инструмент наблюдения.. .
11. В. В. Круглов, В. В. Борисов, Искусственные ней-
16. J. Redmon and A. Farhadi, arXiv:1804.02767.
ронные сети. Теория и практика, Горячая линия.
Телеком, Москва (2002).
17. D. Gordon, A. Kembhavi, M. Rastegari, J. Redmon,
D. Fox, and A. Farhadi, arXiv:1712.03316.
12. R. Hadsell, S. Chopra, and Y. LeCun, Dimensionality
Reduction by Learning an Invariant Mapping (2006),
18. J. Redmon and A. Farhadi, arXiv:1612.08242.
http://yann.lecun.com/exdb/publis/pdf/hadsell-cho-
pra-lecun-06.pdf.
19. M. Rastegari, V. Ordonez, J. Redmon, and A. Farha-
13. К. В. Воронцов, Нейронные сети, видеокурс
di, arXiv:1603.05279.
(2016), https://www.youtube.com/watch?v=WjwA5
DqxL-c.
20. J. Redmon, S. Divvala, R. Girshick, and A. Farhadi,
arXiv:1506.02640.
14. F.-F. Li, J. Johnson, and S. Yeung, Convolutional
Neural Networks (2018), http://cs231n.stanford.edu/
21. J. Redmon and A. Angelova, arXiv:1412.3128.
syllabus.html.
15. K. Ehsani, H. Bagherinezhad, J. Redmon, R. Mot-
22. A. Bochkovskiy, https://github.com/AlexeyAB/
taghi, and A. Farhadi, arXiv:1803.10827.
darknet.
701