Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 508, № 1, стр. 33-40

ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ ЦИФРОВОЙ ТРАНСФОРМАЦИИ ПРОМЫШЛЕННЫХ ПРОИЗВОДСТВ

А. В. Бухановский 1*

1 Федеральное государственное автономное образовательное учреждение высшего образования “Национальный исследовательский университет ИТМО”
Санкт-Петербург, Россия

* E-mail: avbukhanovskii@itmo.ru

Поступила в редакцию 28.10.2022
После доработки 31.10.2022
Принята к публикации 01.11.2022

Полный текст (PDF)

Аннотация

Представлены облик и ключевые результаты деятельности исследовательского центра в сфере искусственного интеллекта “Сильный ИИ в промышленности” на базе Университета ИТМО. Изложены концепция и целеполагание центра, ключевые научные результаты, открытые фреймворки и библиотеки, а также практические результаты, демонстрирующие внедрения в различных областях промышленности. Отдельное внимание уделено активностям в развитии таких перспективных технологий ИИ, как автоматическое машинное обучение, генеративный дизайн и планирование целесообразной деятельности в условиях неопределенности и неполноты данных.

Ключевые слова: искусственный интеллект, автоматическое машинное обучение, генеративный дизайн, баейсовы сети, эвристическая оптимизация, открытый фреймворк

1. ВВЕДЕНИЕ

Исследовательский центр “Сильный искусственный интеллект в промышленности” создан при Университете ИТМО в 2021 г. в рамках реализации федерального проекта “Искусственный интеллект” и постановления Правительства Российской Федерации от 5 июля 2021 г. № 1120. Целью деятельности Центра является создание программного обеспечения (ПО) на базе технологий сильного ИИ для воспроизведения творческих профессиональных функций отраслевого специалиста – в целях разработки систем поддержки принятия решений (СППР), обеспечивающих процессы цифровой трансформации и интеллектуализации промышленных производств. В данном случае под сильным ИИ, в логике [1], понимается алгоритмическое воспроизведение высших когнитивных функций человека при решении творческих задач, связанных с извлечением и оперированием смыслами для широкого класса приложений на основе перспективных технологий ИИ. Это отличает его от традиционного (“слабого”) ИИ, работающего с базовыми когнитивными функциями (распознавание речи, машинное зрение, вывод на априорных знаниях конкретной области и пр.).

Стратегическим партнером Центра выступает Ассоциация “Искусственный интеллект в промышленности” [2], учрежденная в 2021 г. ПАО “Газпром нефть” и Правительством Санкт-Петербурга в формате государственно-частного партнерства. Она координирует проектную и образовательную деятельность вузов и индустриальных партнеров из различных отраслей промышленности. Несмотря на значимое проникновение технологий ИИ в деятельность промышленных предприятий, они в большинстве своем обеспечивают лишь фрагментарную автоматизацию отдельных операций или процессов за счет решения таких задач, как структурирование данных, анализ временных рядов технических параметров и изображений, а также диагностика и прогнозирование технологических процессов и состояния оборудования. Однако для системной цифровой трансформации производств необходимо решение задач, связанных с поддержкой или даже автоматизацией воспроизведения высших когнитивных функций специалистов, связанных с креативным принятием решений. Особенную значимость это приобретает в ситуациях с неопределенностью и неполнотой данных, например, в ходе концептуального инжиниринга, на этапах технико-экономического обоснования, организации и строительства производств, когда последействие любой ошибки может быть значимо, а цена высока.

Промышленность является благодарной областью приложения технологий ИИ, поскольку не только опирается на эффективные средства сбора и измерения (первичной интерпретации) данных с контролируемым качеством, но и имеет альтернативные источники априорных знаний (причинно-следственные математические модели, инженерное ПО, экспертные обобщения, справочники, руководства, регламенты и пр.). Потому это позволяет гибко сочетать подходы ИИ на данных с технологиями символьного ИИ на знаниях, что в ряде случаев является ключевым для приближения к возможностям сильного ИИ.

Концепция и продукт Центра. Центр ориентирован на решение и практическое воплощение в форме отраслевого ПО новых классов задач, являющихся объектом творческой деятельности предметного специалиста (конструктора, технолога, управленца), связанных с объектами техники и технологий, и характерных именно для деятельности промышленных предприятий. К ним относятся:

Автоматическое создание и обучение новых интеллектуальных цифровых объектов (предсказательных моделей и иных сущностей ИИ). Специфика промышленных производств состоит в существенно большей вариативности технологических и обеспечивающих процессов, чем в традиционных областях применения ИИ (банки, ритейл и пр.). Как следствие, прямое тиражирование прикладных систем ИИ даже между разными филиалами одного предприятия требует значимого труда специалистов в области машинного обучения. Потому применение технологий автоматического машинного обучения (МО), позволяющего существенно сократить временные и ресурсные затраты, в данном случае является приоритетным. Особенно это важно для решения задач автоматического моделирования, когда модели ИИ на данных комбинируются с объектами прикладной математики, реализуемыми классическими численными методами моделирования и оптимизации.

Автоматическое проектирование объектов реального мира и абстрактных цифровых структур, определяющих процессы целесообразной деятельности. Несмотря на обширный отраслевой задел в области систем автоматизированного проектирования, в подавляющем большинстве сейчас такие решения носят советующий характер и основаны на воспроизведении лучших практик специалистов-конструкторов. Однако переход к парадигме генеративного дизайна, имитирующего логику конструктора не на основе априорных знаний, а за счет использования альтернативных процессов рационального выбора (например, эволюционных вычислений), позволяет формировать нестандартные конструкторские решения, часто превышающие когнитивные возможности человека.

Автоматическая валидация и верификация проектных, технических и управленческих решений. Цифровая трансформация производств неизбежно приводит к усложнению условий формирования и принятия решений за счет увеличения объема учитываемых факторов. В этих условиях даже решения, принимаемые квалифицированным специалистом (и даже группами специалистов, не говоря про системы ИИ), могут считаться лишь условно адекватными и достоверными. Потому принципиальным является развитие алгоритмов ИИ, которые (а) обеспечивают контролируемое качество предварительной аналитической обработки данных для определения фактов, и (б) решают обратную задачу оценки решений путем автоматической генерации минимальной системы критериев, необходимых для проверки их содержательности и непротиворечивости. Таким образом, это дает основу для создания самообъясняющихся систем ИИ, способных интерпретировать решения, как принятые человеком, так и рекомендованные иными системами ИИ.

Автоматическая настройка вычислительно-сложных многопараметрических математических моделей. Практика внедрения промышленных цифровых двойников связана с использованием крайне ресурсоемких вычислительных моделей (например, на основе уравнений трехмерной гидроаэродинамики, тепломассопереноса и пр.). В силу объективного наличия экспериментальных замыканий такие модели обычно имеют большое число эмпирических параметров, настраиваемых по данным. Однако сами данные, как правило, ограничены в объеме и одинаковых условиях эксперимента. Как следствие, применить для настройки таких моделей классические методы оптимизации не всегда возможно в силу (а) вычислительной ресурсоемкости, (б) неполноты данных (работа с малой выборкой), (в) разнообразия условий получения данных (их гетерогенности). Однако эта проблема решается паллиативным аппаратом – интеллектуальными (эвристическими) методами оптимизации, сочетающими классические методы с алгоритмами ИИ, имитирующими процесс поиска решения специалистом-предметником или использующими иные (например, био-инспирированные) принципы.

Автоматическое комплексирование цифровых решений с элементами ИИ, созданными на основе различных подходов и парадигм. Процессы цифровой трансформации крупных предприятий, как правило, ставят своей целью объединение возможностей различных (в том числе, уже имеющихся) цифровых систем, формирующих процессы подготовки и принятия решений. Это включает в себя совместное использование традиционного моделирования, методов оптимизации и прикладных систем ИИ, в т.ч. построенных на совершенно разных принципах (от экспертных систем – до глубокого обучения). Как следствие, это требует развития технологий композитного ИИ, позволяющих бесшовно комбинировать различные системы ИИ, а также строить на их основе новые решения с заданным функциональным назначением.

Полноценное решение перечисленных выше задач, по-видимому, невозможно путем использования существующих библиотек ИИ, средств разработки и отраслевого инженерного ПО. Потому Центр в своей деятельности ориентируется на создание комплексной информационной технологии управления жизненным циклом крупных распределенных промышленных предприятий, которая включает в себя библиотеки и фреймворки алгоритмов сильного ИИ, средства разработки и оценки моделей ИИ, концептуальные СППР для различных видов отраслевой деятельности, а также конкретные решения (ПО для различных задач промышленности), кастомизируемые для разных индустриальных партнеров. На рис. 1 приведен облик цифрового продукта Центра.

Рис. 1.

Облик продукта центра (на горизонте 2024 г.): информационная технология управления жизненным циклом крупных распределенных промышленных предприятий.

Научные результаты. В 2022 г. научная повестка Центра была ориентирована на разработку новых методов и алгоритмов, реализующих перспективные технологии, потенциально пригодные для решения задач сильного ИИ, включая автоматическое машинное обучение, генеративный дизайн, работу с малыми или частично-размеченными наборами данных и др.

В части автоматического моделирования и автоматического машинного обучения основное внимание уделено развитию подхода для работы с композитными моделями МО, обеспечивающего их адаптацию под сложность конкретной прикладной задачи и/или изменяющихся условий среды за счет алгоритмических манипуляций со структурой модели. Для порождения таких моделей используются различные механизмы эволюционных вычислений. Они позволяют оперировать не только моделями классического МО, но и нейросетевыми моделями, и даже – гибридными моделями, включающими в себя структурные элементы на основе априорных знаний (в т.ч. уравнения в частных производных). Альтернативным направлением, обеспечивающим требуемую гибкость, является оперирование структурой ансамблей моделей МО. Так, в Центре разработан алгоритм АВВ (AutoBalanceBoosting), основанный на различных комбинациях ансамблирования (бэггинг и бустинг), в котором все параметры подбираются автоматически. На рис. 2 на несбалансированных данных приведено сравнение результатов работы алгоритма АВВ и наиболее популярных аналогов, к которым относятся SOTA-классификаторы (например, RF+Smote) и специальные алгоритмы (BCC, SBAC и пр.).

Рис. 2.

Сравнение качества результатов классификации алгоритмом ABB и аналогами на несбалансированных наборах данных.

Из рис. 2 видно, что по отдельным наборам данных ABB стабильно входит в пятерку лучших, а в среднем заметно лучше всех конкурирующих решений.

В области генеративного дизайна существенное внимание уделено развитию гибридных методов, позволяющих эффективно сочетать априорные знания предметной области (формализованные, например, в виде графов знаний), нейронные сети и эвристические методы оптимизации. Их сопряжение в условиях жестких системных ограничений обеспечивается за счет обучения на основе генеративно-состязательных сетей. Отработаны подходы к применению технологий генеративного дизайна с учетом специфики данных и особенностей предметной области для задач проектирования локомоционных робототехнических устройств, волнозащитных сооружений и даже цифровых систем кодирования.

Отдельное внимание уделено автоматическому обучению композитных моделей для многомерных распределений на основе адаптивных байесовых сетей (БС). В частности, предложен алгоритм BigBraveBN, который позволяет обучать большие БС за счет сокращения пространства поиска по принципу отбрасывания “слабых” связей, число связей измеряется с помощью коэффициента Браве. На рис. 3 приведено его сравнение на бенчмарках пакета BNLEARN с аналогами – sparcebn и BiDAG. Видно, что предложенный Центром алгоритм обеспечивает качество по метрике SHD в среднем выше на 20% за в два раза меньшее время.

Рис. 3.

Сравнение результатов обучения больших БС на разных данных по метрике SHD (меньше – лучше).

Одной из научных задач Центра являются развитие алгоритмов для работы с графовыми нейронными сетями (ГНС) и оснащение их новыми механизмами, включая автономное объяснимое обучение, имплементацию времени для моделирования динамики эволюции графов знаний, автоматическую генерацию и структурное обучение композитных графовых моделей МО. Разработано семейство методов, которые на основе ГНС обеспечивают работу с моделями комплексных сетей на данных. Это включает в себя: восстановление пропущенных связей, узлов и атрибутов комплексной сети, предсказательное моделирование макро-характеристик комплексной сети, а также предсказание (экстраполяция) эволюции отдельных узлов и связей комплексной сети во времени. Данный аппарат пригоден как для классических задач на графах (распространение информации, логистика и пр.), так и для работы со сложными структурами данных на основе разнородных источников.

Также в Центре выполняются исследования в области алгоритмов эвристической оптимизации в условиях неопределенности и неполноты данных, развития технологий объяснимого ИИ для обработки изображений, а также генеративного ИИ для поддержки принятия решений. Результаты исследований представлены в 2022 г. на конференциях уровня А* в области ИИ: ICASSP, CEC, ACM SIGKDD, AAAI, NeurlPS, ICRA, Interspeech, см., например, [36].

Открытые фреймворки, библиотеки и средства разработки. Научные результаты Центра формируют основу отечественных библиотек и фреймворков, обеспечивающих их распространение в сообществе разработчиков ИИ. Для этого в Университете ИТМО развернута система экспортного контроля научно-технических материалов в области ИИ, которая обеспечивает легитимность их открытого опубликования и продвижения на веб-хостингах. В 2022 г. Центр развивает несколько ключевых продуктов.

Фреймворк автоматического машинного обучения FEDOT.Industrial (https://github.com/ITMO-NSS-team/Fedot.Industrial). Позволяет автоматически создавать композитные математические модели МО на промышленных данных. Он предназначен для ускорения процессов создания и обучения моделей на данных для задач предиктивной аналитики (прогноза временных рядов, классификации их фрагментов, выявления выбросов и аномалий) без потери качества. Областью применения являются различные отраслевые задачи диагностики оборудования, обеспечивающие непрерывный сбор данных в виде временных рядов. Фреймворк основан на аппарате автоматического машинного обучения на основе эволюционных вычислений и символьной регрессии для построения композитных моделей на данных (включающих как ИНС, так и классические процедуры машинного обучения). На его базе отработано решение таких типовых задач, как детектирование аномалий в промышленных трубопроводах по данным магнитометрии, оценка рентабельности обогащения полезных ископаемых, определение аномальных режимов работы ротационного оборудования. В целом использование фреймворка позволяет ускорить процесс разработки моделей МО в 10–18 раз, при этом сравнение с SOTA показывает, что в 75% случаев результат не хуже, чем решения, созданные лучшими специалистами вручную.

Фреймворк генеративного дизайна GEFEST (https://github.com/ITMO-NSS-team/GEFEST). Предназначен для решения задач генеративного дизайна геометрических объектов в сплошных средах, динамика которых описывается внешними моделями. Позволяет посредством эволюционных вычислений воспроизводить оптимальную конфигурации и атрибуты геометрического объекта, исходя из заданных критериев качества. При этом сохраняется вся эволюционная цепочка объектов, что является основой для интерпретации и объяснения результатов работы алгоритма. На основе фреймворка отработано решение таких типовых задач, как автоматическое проектирование гидротехнических сооружений на шельфе и проектирование объектов наносенсорики. В целом использование фреймворка позволяет ускорить процесс выработки проектных решений в 15–25 раз по сравнению с квалифицированным специалистом; это значение зависит от степени стандартизации задачи и наличия успешных прототипов.

Помимо фреймворков, коллективами Центра развивается ряд открытых библиотек в области ИИ, в том числе, библиотека автоматического моделирования текстов AutoTM (https:// github.com/ngc436/AutoTM) и библиотека предсказательного моделирования комплексных сетей на основе ГНС (https://gitlab.actcognitive.org/anpolol/graphpred).

Для удобства работы с фреймворками и библиотеками Центр разрабатывает инструментальную облачную платформу для проектирования, быстрой разработки и обучения прикладных систем ИИ. В отличие от существующих аналогов, ориентированных, в первую очередь, на удобства разработчика, данная платформа реализует компромиссную стратегию, обеспечивая интересы как разработчика, так и заказчика разработки систем ИИ. При этом разработчик получает поддержку полного цикла создания и эксплуатации моделей ИИ, возможность работы как с традиционными (причинно-следственными) моделями, так и с моделями на данных, простой способ построения моделей без программирования на языках низкого уровня (low-code-диаграммы), а также возможность доступа к удаленным суперкомпьютерным системам и облачным ресурсам. Заказчик, в свою очередь, приобретает прозрачность всего процесса разработки моделей ИИ, доступность всех создаваемых цифровых решений и массивов данных, а также возможности выполнить испытания или исследования конкретной разработки модели ИИ “ad hoc”.

Платформа реализует прозрачную и нативно понятную отраслевому специалисту (не программисту) организацию структуры проектов по разработке моделей ИИ, которая предполагает четкое разделение этапов и формирования по ним отдельных результатов, автоматизацию анализа кода и практическую инкапсуляцию отдельных артефактов для переиспользования и независимого развития, идентификацию наиболее важных и критических точек проекта. При этом ключевой особенностью платформы является использование механизмов автоматического моделирования и машинного обучения для поддержки пользователей в ходе разработки и применения моделей ИИ. К ним относятся: собственно построение моделей с помощью автоматического машинного обучения, достройка (развитие) элементов готовых моделей с целью их улучшения, интеллектуальный анализ содержательной структуры моделей, а также работа с семантическим пространством артефактов, которое отображает единое представление всех элементов, участвующих в проектах данного класса (включая модели, результаты, данные, пользователей, проекты и т.д.). Платформа позволяет публиковать созданные модели ИИ путем генерации артефактов в виде сервиса, библиотеки или программного модуля, а также дорабатывать отдельные логические блоки (программные модули) в рамках низкоуровневых сценариев, программируя на языке Python.

Дополнительно в состав платформы входит цифровой полигон для оценки качества систем ИИ. Он предназначен для автоматизации процедуры оценки характеристик качества систем ИИ, основанных на методах статистического обучения на данных, в соответствии с требованиями ГОСТ Р 59898-2021: определение точностных характеристик, устойчивости работы систем ИИ и границ их работоспособности. Полигон применяется для валидации систем ИИ на данных в процессе разработки, проверки релевантности обучения систем ИИ актуальным данным, оценки, сравнения и реинжиниринг работы сторонних систем ИИ на данных. Полигон может использоваться для моделей, построенных на различных видах данных (табличные, текст, изображения) в разнообразных отраслях. При этом он также является системой ИИ, т.к. использует автоматическое машинное обучение для построения псевдо-эталонов для моделей в виде “черного ящика”, бутстреп и генеративные методы синтеза данных для оценки устойчивости, а также реализует функции экспертной системы на основе анализа вычислительного графа модели ИИ для управления ее качеством. Полигон успешно апробирован на задачах ранжирования и анализа моделей распознавания медицинских изображений, а также оценки качества реализаций алгоритмов предиктивной аналитики технического оборудования. Применение полигона способствует увеличению покрытия систем ИИ тестами в 3–10 раз по сравнению с существующими практиками, что необходимо для обеспечения априори заданного качества разработки при ограниченных компетенциях персонала, отвечающего за их разработку и эксплуатацию.

2. ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ

В 2021 г. Центром в интересах индустриальных партнеров проведен ряд пилотных проектов, в рамках которых подтверждена и апробирована на практике применимость технологий ИИ для построения оптимальных план-графиков работ по освоению месторождения, оптимальных планов обслуживания скважин, гибких организационных структур для решения задач добычи и бурения, суррогатных моделей для предиктивной аналитики нефтегазового оборудования, а также создания стратегий управления человеческим капиталом предприятий. На их основе запущена разработка семейства прикладных интеллектуальных систем, в т.ч.:

система комплексного планирования обустройства месторождений на основе усвоения инженерного опыта и генеративных технологий (обеспечивающая повышение эффективности планов до 30%, сокращение трудозатрат по их созданию в 16–20 раз);

система генеративного дизайна пространственных объектов промышленной и логистической инфраструктуры в условиях Крайнего Севера (обеспечивающая работу с территориями площадью до 1000 Га и ускорение процесса выпуска проектной документации до 10 раз);

система планирования процессов добычи нефти и газа на основе интеллектуальной мультиагентной системы оптимизации технических решений (повышение качества планов на 20–25%, снижение времени подготовки планов в 5 раз).

Целесообразность создания системы комплексного планирования обустройства месторождений по заказу ПАО “Газпром нефть” связана с многомерностью исходной задачи, значимой неопределенностью и неполнотой данных на начальных этапах, что исключает возможность эффективно делать это вручную. Назначением системы является создание эффективных и устойчивых планов работ по комплексному освоению месторождений нефти и газа (включая создание инженерной инфраструктуры) в условиях неопределенности и вариативности ресурсов на этапах концептуального проектирования и экономического обоснования проекта. В основе системы заложены механизмы мультиагентного планирования на базе гибридных эволюционных алгоритмов ИИ, использующие суррогатные модели производительности операций на графах знаний, отражающих опыт строительства похожих объектов. Усвоение знаний в алгоритмы выполняется на основе автоматизированного анализа имеющейся документации по ранее реализованным проектам. В состав разработки входят: библиотека мультиагентного планирования производственных процессов в условиях неопределенности, вычислительный стенд для реализации различных алгоритмов планирования, ядро и интерфейс интеллектуальной системы планирования комплексного освоения месторождений. В совокупности система позволяет за разумное время обеспечить планирование до 60 тысяч взаимосвязанных операций, реализуемых бригадами общим числом до 500 единиц. Система может применяться как для создания общих планов освоения месторождений, так и их составных элементов, включая строительство кустов скважин, трубопроводов и ЛЭП. На рис. 4 приведены примеры интерфейсов системы, реализующей функции планирования.

Рис. 4.

Интерфейсы системы комплексного планирования обустройства месторождений на основе усвоения инженерного опыта и генеративных технологий.

Практические результаты работ Центра используются в деятельности его индустриальных партнеров, в первую очередь, ПАО “Газпром нефть” и ПАО “Роснефть”.

3. ЗАКЛЮЧЕНИЕ

Исследовательский Центр “Сильный ИИ в промышленности” на базе Университета ИТМО имеет четкую научно-практическую фокусировку, непосредственно связанную с обеспечением технологического суверенитета России в области ИИ. Он ориентирован на создание математического и программного инструментария, обеспечивающего демократизацию и тиражирование решений ИИ за счет автоматизации процесса разработки при сохранении общего уровня качества. Это позволяет не только получать работоспособные решения ИИ массовым специалистам, не имеющим высокой квалификации и навыков разработки, но и существенно (в разы) сократить время разработки. Как следствие, таким образом может быть преодолен кадровый барьер, затрудняющий массовое внедрение ИИ в отечественные отраслевые решения и инженерное ПО. Практическое подтверждение этой позиции основано на том, что прикладные решения, созданные сотрудниками Центра на основе разработанных им продуктов, системно попадают в победители и призеры различных хакатонов (например, “Цифровой прорыв”, хакатоны МЧС и Россельхозбанка). Таким образом, это демонстрирует, что даже начинающий специалист в области анализа данных, оснащенный необходимым инструментарием ИИ, способен выступать на равных с профессионалами, традиционно опирающимися на “ручной труд”.

Результаты работы Центра в 2022 г. представлены на 14 конференциях уровня А* в области ИИ и 7 журналах Q1 в области ИИ.

Список литературы

  1. Национальная стратегия развития искусственного интеллекта на период до 2030 года / Указ Президента Российской Федерации 10 октября 2019 г. № 490 [http://www.kremlin.ru/acts/bank/44731]

  2. Ассоциация “Искусственный интеллект в промышленности” [https://rusindustrial.ai/]

  3. Hvatov A. Data-Driven Approach for the Floquet Propagator Inverse Problem Solution //ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2022. C. 3813–3817.

  4. Sarafanov M., Pokrovskii V., Nikitin N.O. Evolutionary Automated Machine Learning for Multi-Scale Decomposition and Forecasting of Sensor Time Series // 2022 IEEE Congress on Evolutionary Computation (CEC). IEEE, 2022. C. 01–08.

  5. Borisov I.I. et al. Reconfigurable Underactuated Adaptive Gripper Designed by Morphological Computation // 2022 International Conference on Robotics and Automation (ICRA). IEEE, 2022. C. 1130–1136.

  6. Velichko A. et al. Complex Paralinguistic Analysis of Speech: Predicting Gender, Emotions and Deception in a Hierarchical Framework // INTERSPEECH 2022. 2022. C. 4735–4739.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления