Опыт работы в промышленных проектах на базе машинного обучения и искусственного интеллекта и мониторинге состояния электролизеров

Здравствуйте, меня зовут Юрий Кацер! Я ведущий специалист по данным, к.т.н. студент, исследователь и преподаватель. Сфера моих интересов — обнаружение аномалий, техническая диагностика, анализ временных рядов, промышленная обработка данных, прогнозная аналитика.

Недавно я делал презентацию о проекте, в ходе которого мы разработали систему и алгоритмы контроля технического состояния электролизера:

В видео я выделил некоторые моменты процесса разработки. В этом посте я хочу рассказать о реализации проектов по науке о данных в промышленности в целом, добавив больше подробностей о процессе разработки на примере проекта «Электролизаторы». Давайте поговорим об этапах, проблемах таких проектов и дорожной карте, чтобы увидеть, как мы двигались к конечному результату.

Список сокращений на всякий случай:

МО — машинное обучение
DS — наука о данных
ИИ — искусственный интеллект

Технологический процесс

Важной и обычно большой частью проекта является понимание бизнеса (предметной области). Некоторые знания о технологическом процессе могут помочь при работе с данными, например, при выборе или создании физических признаков для моделирования. К тому же правильно сформулировать задачу и оценить качество проекта, не зная бизнеса, непросто. Бизнес-понимание и анализ процесса обычно начинаются в самом начале и не прекращаются до конца проекта. Хотя мы стараемся поддерживать тесный контакт с техническим персоналом, часто этого недостаточно для эффективной работы специалистов по данным.

В этом проекте необходимо понять, как производится ядерное топливо. Прежде всего, давайте кратко поговорим о процессе производства ядерного топлива в целом. Длинная производственная цепочка ядерного топлива начинается с добычи урановой руды. Его добывают несколькими способами: подземным выщелачиванием, шахтами или открытым способом. Затем урановую руду измельчают и растворяют с образованием концентрированной соли урана, затем сушат до сухого концентрата. Полученные оксиды урана смешивают со фтором, превращая их в гексафторид урана, легко принимающий газообразную форму. Это понадобится на следующем этапе (обогащении).

В предыдущем абзаце я упомянул о фторе, необходимом для производства гексафторида урана. Это важный элемент процесса производства ядерного топлива. Для его производства используются среднетемпературные электролизеры. Далее в ходе проекта мы глубоко проанализировали работу ячейки, сырье на входе и продукт на выходе на данном этапе технологического процесса, нормальные параметры оборудования, типовые неисправности, эксплуатационную документацию и другую доступную информацию.

Постановка задачи

Обычно в самом начале работы над кейсом у нас возникает только боль заказчика, типа: «слишком часто ломается техника». В нашем случае электролизеры, как и любое промышленное оборудование, подвержены износу и поломке. Мы называем такую формулировку боли клиента — бизнес-проблемой. С ним сложно работать, потому что он не содержит никакой явной информации о задаче, метриках, ожидаемых результатах или планируемых изменениях в бизнесе. Поэтому мы пытаемся превратить ее в бизнес-гипотезу — формулировку, лишенную этих недостатков.

Раннее выявление аномалий в работе электролизеров позволяет заблаговременно реагировать на прогнозируемые инциденты, связанные с отключением оборудования, и планировать ремонт превентивно. Подробнее о задаче обнаружения аномалий и неисправностей можно прочитать в этой статье. Итак, с электролизерами возникают следующие проблемы:

вынужденный простой;
внеплановый ремонт;
неоптимальные капитальные ремонты (объемы и сроки выполнения работ).

Частично эти проблемы можно решить с помощью моделей обнаружения аномалий. В данном проекте ставилась задача разработать систему раннего обнаружения аномалий в электролизерах, используемых в производстве технического фтора. Разрабатываемая система должна превзойти балл F1 существующих алгоритмов, основанных на экспертных правилах, реализованных персоналом в SCADA.

Приведенные выше формулировки можно назвать бизнес-гипотезой, которую мы и проверим.

Ожидаемые результаты и экономический эффект

После формулировки бизнес-гипотезы мы оценили потенциальные экономические эффекты и сформулировали драйверы эффектов. Мы определили следующие драйверы эффектов:

снижение стоимости капитальных ремонтов за счет меньшего количества самих капитальных ремонтов, их оптимального графика, сокращения объемов работ;
увеличение межремонтных интервалов за счет сокращения количества внеплановых остановок и ремонтов;
повышение производительности при производстве фтора, как косвенный эффект более качественной работы оборудования.

Более подробная информация об эффектах от AI и ML доступна в этой статье.

Некоторые интересные моменты из предварительного анализа

Несколько интересных моментов, которые стоит отметить:

Мы считали True Positive (подробно о метриках здесь) только тревогу, которая была не позднее, чем за 5 минут до записи в журнал оператора. Отметка в журнале оператора свидетельствует о визуальной фиксации аномалии, обнаружении алгоритмами в SCADA или начале существенных проблем в работе оборудования.
Подобрано оборудование с похожей конструкцией.
Выбрана только одна группа возможных неисправностей для обнаружения с помощью моделей машинного обучения, так как эта группа имеет наибольшую статистику в исторических данных. Остальные группы были оставлены для следующих этапов проекта.
F1-оценка была выбрана в качестве метрики DS, но метрики Precision и Recall были ограничены из-за требования уменьшить количество ложных срабатываний.
Начал собирать больше данных о каждом инциденте после начала проекта. Например, иногда не фиксировались аномалии, которые устранялись без остановки производственного процесса.
На более поздних этапах мы изменили процесс сбора и агрегирования данных. Изначально не было возможности подтвердить текущий метод агрегации данных, а также нас не устраивала частота дискретизации данных (раз в минуту). Мы стали собирать данные без регулярной сетки (на смену), а записывать в базу только последнюю точку раз в секунду. Это, естественно, приводило к тому, что обучение модели приходилось перезапускать после того, как в ходе проекта было накоплено достаточное количество данных, собранных по-новому.
Потенциальные эффекты в деньгах были рассчитаны. Дополнительную информацию о влиянии решений машинного обучения на обрабатывающую промышленность можно найти в этой статье.
Модели машинного обучения необходимо интегрировать в существующую систему мониторинга процессов.
Вместе с персоналом предприятия мы переразметили инциденты в исторических данных и договорились обсудить все спорные случаи, детально проанализировав сигналы для честной и открытой оценки моделей.

Дорожная карта части Data Science

Дорожная карта части проекта DS была следующей:

Мы наметили поэтапно, что и в какие сроки будем делать, кроме описанного ранее этапа предварительного анализа.

Карта гипотез науки о данных

После части бизнес-понимания началась работа с гипотезой DS. Визуализация всех гипотез на одной карте может оказаться весьма полезной, поэтому для этих целей мы часто используем интеллект-карту. Снимок карты гипотезы DS в середине проекта выглядит следующим образом:

Проверка гипотез DS представляет собой итеративный процесс, состоящий из 3 основных этапов:

подготовка данных;
Обучение модели;
Оценка модели.

Позже в отдельной научной статье мы, вероятно, поделимся частями проекта, связанными с ML, включая модели, предварительную обработку данных, базовые уровни и уже существующие эвристические решения (алгоритмы в SCADA).

Тестирование

Наконец, мы протестировали разработанное решение. Результаты теста алгоритма обнаружения аномалий на основе ML следующие:

Интересные моменты и характеристики теста:

Создание плана и процедуры тестирования вместе с заказчиком
3 месяца испытаний
Сравнение с существующей системой (SCADA)
Еженедельная проверка и анализ результатов
Тест признан успешным

Об окончательном решении

Разработана система прогнозного анализа и мониторинга оборудования на основе ИИ с интегрированными алгоритмами обнаружения аномалий на основе машинного обучения для диагностики работы электролизеров. В системе реализован автоматический поиск скрытых дефектов, возникающих в процессе эксплуатации, обеспечивается визуализация информации о прогнозируемых событиях и предупреждение оператора для принятия решений и формировать аналитику об аномалиях и факторах, внесших наибольший вклад в их обнаружение.

Модели измеряют различные параметры процесса при электролизе, в том числе уровень электролита, напряжение, давление в выпускных коллекторах и т. д. Полученные показатели позволяют прогнозировать и обнаруживать различные проблемы с оборудованием.

В отличие от существующих систем и алгоритмов диагностики, цифровые модели позволяют лучше управлять рисками возникновения технических дефектов и принимать превентивные меры для предотвращения вынужденных отключений оборудования. В результате значительно сокращается время простоя оборудования, увеличивается межремонтный интервал, увеличивается доля автоматизации в процессах диагностики.

Для дальнейшей работы мы выбрали следующие направления:

Расширение ассортимента оборудования и процессов
Переход к оптимизации всего процесса
Интеграция платформенных решений

Выводы

Некоторые важные примечания по проектам машинного обучения в производстве, которыми мы считаем важным поделиться:

Необходимо общаться с клиентами ЕЩЕ БОЛЬШЕ на всех этапах. В то же время личное общение делает все быстрее.
На крупных предприятиях существует множество стандартизированных процедур, которые требуют выполнения дополнительных требований к заполнению документов и фиксации принятых решений. У них, безусловно, есть преимущества, и для большинства проектов они снижают трудозатраты, повышают надежность, повышают безопасность труда. Но в случае разработки принципиально новых продуктов они могут оказаться совершенно избыточными и лишь затормозить процессы или сделать новые продукты бесполезными. Это необходимо учитывать на всех этапах проекта при проектировании, разработке и интеграции решения.
Безопасность (включая информационную и кибербезопасность) является промышленным приоритетом; это необходимо учитывать на каждом этапе.
Специалисты занимаются выпуском продукции; они не всегда заинтересованы в участии в нашей работе. Чтобы задействовать их, можно использовать следующие приемы:

ищите людей, разрабатывающих похожие системы/алгоритмы, или людей, интересующихся диагностикой оборудования — они смогут понять значимость ваших результатов и поделиться своими знаниями
использовать административный ресурс, в том числе добавить соответствующие ключевые показатели эффективности для ответственных сотрудников и лиц, принимающих решения
использовать знания производственного персонала в разрабатываемых решениях и моделях — повышает уверенность в результатах
доказать качество решения, подробно объяснить, как все работает, использовать простые, понятные и интерпретируемые модели/подходы
чаще общайтесь с персоналом
обучать и обучать персонал

Начните собирать данные об инцидентах и как можно скорее измените и улучшите методы сбора данных.
Важно, чтобы результаты модели можно было интерпретировать. Персонал и руководство должны понимать результаты модели.
Трудно рассчитать экономический эффект. В этом процессе должна участвовать команда машинного обучения.
Известных лучших практик в области науки о промышленных данных нет. Есть положительные примеры и решенные кейсы.

Ознакомиться с различными вариантами использования машинного обучения в промышленности можно в моем обзорном репозитории (в основном кейсы на русском языке):

смотрите также:

Новые материалы

Угловая структура архитектуры

Обратите внимание, что эта статья устарела, я решил создать новую с лучшей структурой и с учетом автономных компонентов: https://medium.com/@marekpanti/angular-standalone-architecture-b645edd0d54a..

«Данные, которые большинство людей используют для обучения своих моделей искусственного интеллекта, поставляются со встроенным…

Первоначально опубликовано HalkTalks: https://hacktown.com.br/blog/blog/os-dados-que-a-maioria-das-pessoas-usa-para-treinar-seus-modelos-de-inteligencia-artificial- ja-vem-com-um-vies-embutido/..

Сильный ИИ против слабого ИИ: различия парадигм искусственного интеллекта

В последние годы изучению и развитию искусственного интеллекта (ИИ) уделяется большое внимание и прогресс. Сильный ИИ и Слабый ИИ — две основные парадигмы в области искусственного интеллекта...

Правильный способ добавить Firebase в ваш проект React с помощью React Hooks

React + Firebase - это мощная комбинация для быстрого и безопасного создания приложений, от проверки концепции до массового производства. Раньше (знаете, несколько месяцев назад) добавление..

Создайте API с помощью Python FastAPI

Создание API с помощью Python становится очень простым при использовании пакета FastAPI. После установки и импорта вы можете создать приложение FastAPI и указать несколько конечных точек. Каждой..

Веселье с прокси-сервером JavaScript

Прокси-серверы JavaScript — это чистый сахар, если вы хотите создать некоторую общую логику в своих приложениях, чтобы облегчить себе жизнь. Вот один пример: Связь клиент-сервер Мы..

Получить бесплатный хостинг для разработчиков | Разместите свой сайт за несколько шагов 🔥

Статические веб-сайты — это веб-страницы с фиксированным содержанием и его постоянным содержанием. Но теперь статические сайты также обрабатывают динамические данные с помощью API и запросов...

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Typescript Front End Development Java NLP Computer Science Tech Data CSS Algorithms Development Productivity ChatGPT Programming Languages HTML Neural Networks Tutorial Angular Reactjs Javascript Tips Mathematics API Startup Javascript Development AWS Csharp