Здравствуйте, меня зовут Юрий Кацер! Я ведущий специалист по данным, к.т.н. студент, исследователь и преподаватель. Сфера моих интересов — обнаружение аномалий, техническая диагностика, анализ временных рядов, промышленная обработка данных, прогнозная аналитика.
Недавно я делал презентацию о проекте, в ходе которого мы разработали систему и алгоритмы контроля технического состояния электролизера:
В видео я выделил некоторые моменты процесса разработки. В этом посте я хочу рассказать о реализации проектов по науке о данных в промышленности в целом, добавив больше подробностей о процессе разработки на примере проекта «Электролизаторы». Давайте поговорим об этапах, проблемах таких проектов и дорожной карте, чтобы увидеть, как мы двигались к конечному результату.
Список сокращений на всякий случай:
- МО — машинное обучение
- DS — наука о данных
- ИИ — искусственный интеллект
Технологический процесс
Важной и обычно большой частью проекта является понимание бизнеса (предметной области). Некоторые знания о технологическом процессе могут помочь при работе с данными, например, при выборе или создании физических признаков для моделирования. К тому же правильно сформулировать задачу и оценить качество проекта, не зная бизнеса, непросто. Бизнес-понимание и анализ процесса обычно начинаются в самом начале и не прекращаются до конца проекта. Хотя мы стараемся поддерживать тесный контакт с техническим персоналом, часто этого недостаточно для эффективной работы специалистов по данным.
В этом проекте необходимо понять, как производится ядерное топливо. Прежде всего, давайте кратко поговорим о процессе производства ядерного топлива в целом. Длинная производственная цепочка ядерного топлива начинается с добычи урановой руды. Его добывают несколькими способами: подземным выщелачиванием, шахтами или открытым способом. Затем урановую руду измельчают и растворяют с образованием концентрированной соли урана, затем сушат до сухого концентрата. Полученные оксиды урана смешивают со фтором, превращая их в гексафторид урана, легко принимающий газообразную форму. Это понадобится на следующем этапе (обогащении).
В предыдущем абзаце я упомянул о фторе, необходимом для производства гексафторида урана. Это важный элемент процесса производства ядерного топлива. Для его производства используются среднетемпературные электролизеры. Далее в ходе проекта мы глубоко проанализировали работу ячейки, сырье на входе и продукт на выходе на данном этапе технологического процесса, нормальные параметры оборудования, типовые неисправности, эксплуатационную документацию и другую доступную информацию.
Постановка задачи
Обычно в самом начале работы над кейсом у нас возникает только боль заказчика, типа: «слишком часто ломается техника». В нашем случае электролизеры, как и любое промышленное оборудование, подвержены износу и поломке. Мы называем такую формулировку боли клиента — бизнес-проблемой. С ним сложно работать, потому что он не содержит никакой явной информации о задаче, метриках, ожидаемых результатах или планируемых изменениях в бизнесе. Поэтому мы пытаемся превратить ее в бизнес-гипотезу — формулировку, лишенную этих недостатков.
Раннее выявление аномалий в работе электролизеров позволяет заблаговременно реагировать на прогнозируемые инциденты, связанные с отключением оборудования, и планировать ремонт превентивно. Подробнее о задаче обнаружения аномалий и неисправностей можно прочитать в этой статье. Итак, с электролизерами возникают следующие проблемы:
- вынужденный простой;
- внеплановый ремонт;
- неоптимальные капитальные ремонты (объемы и сроки выполнения работ).
Частично эти проблемы можно решить с помощью моделей обнаружения аномалий. В данном проекте ставилась задача разработать систему раннего обнаружения аномалий в электролизерах, используемых в производстве технического фтора. Разрабатываемая система должна превзойти балл F1 существующих алгоритмов, основанных на экспертных правилах, реализованных персоналом в SCADA.
Приведенные выше формулировки можно назвать бизнес-гипотезой, которую мы и проверим.
Ожидаемые результаты и экономический эффект
После формулировки бизнес-гипотезы мы оценили потенциальные экономические эффекты и сформулировали драйверы эффектов. Мы определили следующие драйверы эффектов:
- снижение стоимости капитальных ремонтов за счет меньшего количества самих капитальных ремонтов, их оптимального графика, сокращения объемов работ;
- увеличение межремонтных интервалов за счет сокращения количества внеплановых остановок и ремонтов;
- повышение производительности при производстве фтора, как косвенный эффект более качественной работы оборудования.
Более подробная информация об эффектах от AI и ML доступна в этой статье.
Некоторые интересные моменты из предварительного анализа
Несколько интересных моментов, которые стоит отметить:
- Мы считали True Positive (подробно о метриках здесь) только тревогу, которая была не позднее, чем за 5 минут до записи в журнал оператора. Отметка в журнале оператора свидетельствует о визуальной фиксации аномалии, обнаружении алгоритмами в SCADA или начале существенных проблем в работе оборудования.
- Подобрано оборудование с похожей конструкцией.
- Выбрана только одна группа возможных неисправностей для обнаружения с помощью моделей машинного обучения, так как эта группа имеет наибольшую статистику в исторических данных. Остальные группы были оставлены для следующих этапов проекта.
- F1-оценка была выбрана в качестве метрики DS, но метрики Precision и Recall были ограничены из-за требования уменьшить количество ложных срабатываний.
- Начал собирать больше данных о каждом инциденте после начала проекта. Например, иногда не фиксировались аномалии, которые устранялись без остановки производственного процесса.
- На более поздних этапах мы изменили процесс сбора и агрегирования данных. Изначально не было возможности подтвердить текущий метод агрегации данных, а также нас не устраивала частота дискретизации данных (раз в минуту). Мы стали собирать данные без регулярной сетки (на смену), а записывать в базу только последнюю точку раз в секунду. Это, естественно, приводило к тому, что обучение модели приходилось перезапускать после того, как в ходе проекта было накоплено достаточное количество данных, собранных по-новому.
- Потенциальные эффекты в деньгах были рассчитаны. Дополнительную информацию о влиянии решений машинного обучения на обрабатывающую промышленность можно найти в этой статье.
- Модели машинного обучения необходимо интегрировать в существующую систему мониторинга процессов.
- Вместе с персоналом предприятия мы переразметили инциденты в исторических данных и договорились обсудить все спорные случаи, детально проанализировав сигналы для честной и открытой оценки моделей.
Дорожная карта части Data Science
Дорожная карта части проекта DS была следующей:
Мы наметили поэтапно, что и в какие сроки будем делать, кроме описанного ранее этапа предварительного анализа.
Карта гипотез науки о данных
После части бизнес-понимания началась работа с гипотезой DS. Визуализация всех гипотез на одной карте может оказаться весьма полезной, поэтому для этих целей мы часто используем интеллект-карту. Снимок карты гипотезы DS в середине проекта выглядит следующим образом:
Проверка гипотез DS представляет собой итеративный процесс, состоящий из 3 основных этапов:
- подготовка данных;
- Обучение модели;
- Оценка модели.
Позже в отдельной научной статье мы, вероятно, поделимся частями проекта, связанными с ML, включая модели, предварительную обработку данных, базовые уровни и уже существующие эвристические решения (алгоритмы в SCADA).
Тестирование
Наконец, мы протестировали разработанное решение. Результаты теста алгоритма обнаружения аномалий на основе ML следующие:
Интересные моменты и характеристики теста:
- Создание плана и процедуры тестирования вместе с заказчиком
- 3 месяца испытаний
- Сравнение с существующей системой (SCADA)
- Еженедельная проверка и анализ результатов
- Тест признан успешным
Об окончательном решении
Разработана система прогнозного анализа и мониторинга оборудования на основе ИИ с интегрированными алгоритмами обнаружения аномалий на основе машинного обучения для диагностики работы электролизеров. В системе реализован автоматический поиск скрытых дефектов, возникающих в процессе эксплуатации, обеспечивается визуализация информации о прогнозируемых событиях и предупреждение оператора для принятия решений и формировать аналитику об аномалиях и факторах, внесших наибольший вклад в их обнаружение.
Модели измеряют различные параметры процесса при электролизе, в том числе уровень электролита, напряжение, давление в выпускных коллекторах и т. д. Полученные показатели позволяют прогнозировать и обнаруживать различные проблемы с оборудованием.
В отличие от существующих систем и алгоритмов диагностики, цифровые модели позволяют лучше управлять рисками возникновения технических дефектов и принимать превентивные меры для предотвращения вынужденных отключений оборудования. В результате значительно сокращается время простоя оборудования, увеличивается межремонтный интервал, увеличивается доля автоматизации в процессах диагностики.
Для дальнейшей работы мы выбрали следующие направления:
- Расширение ассортимента оборудования и процессов
- Переход к оптимизации всего процесса
- Интеграция платформенных решений
Выводы
Некоторые важные примечания по проектам машинного обучения в производстве, которыми мы считаем важным поделиться:
- Необходимо общаться с клиентами ЕЩЕ БОЛЬШЕ на всех этапах. В то же время личное общение делает все быстрее.
- На крупных предприятиях существует множество стандартизированных процедур, которые требуют выполнения дополнительных требований к заполнению документов и фиксации принятых решений. У них, безусловно, есть преимущества, и для большинства проектов они снижают трудозатраты, повышают надежность, повышают безопасность труда. Но в случае разработки принципиально новых продуктов они могут оказаться совершенно избыточными и лишь затормозить процессы или сделать новые продукты бесполезными. Это необходимо учитывать на всех этапах проекта при проектировании, разработке и интеграции решения.
- Безопасность (включая информационную и кибербезопасность) является промышленным приоритетом; это необходимо учитывать на каждом этапе.
- Специалисты занимаются выпуском продукции; они не всегда заинтересованы в участии в нашей работе. Чтобы задействовать их, можно использовать следующие приемы:
- ищите людей, разрабатывающих похожие системы/алгоритмы, или людей, интересующихся диагностикой оборудования — они смогут понять значимость ваших результатов и поделиться своими знаниями
- использовать административный ресурс, в том числе добавить соответствующие ключевые показатели эффективности для ответственных сотрудников и лиц, принимающих решения
- использовать знания производственного персонала в разрабатываемых решениях и моделях — повышает уверенность в результатах
- доказать качество решения, подробно объяснить, как все работает, использовать простые, понятные и интерпретируемые модели/подходы
- чаще общайтесь с персоналом
- обучать и обучать персонал
- Начните собирать данные об инцидентах и как можно скорее измените и улучшите методы сбора данных.
- Важно, чтобы результаты модели можно было интерпретировать. Персонал и руководство должны понимать результаты модели.
- Трудно рассчитать экономический эффект. В этом процессе должна участвовать команда машинного обучения.
- Известных лучших практик в области науки о промышленных данных нет. Есть положительные примеры и решенные кейсы.
Ознакомиться с различными вариантами использования машинного обучения в промышленности можно в моем обзорном репозитории (в основном кейсы на русском языке):