Здравствуйте, меня зовут Юрий Кацер! Я ведущий специалист по данным, к.т.н. студент, исследователь и преподаватель. Сфера моих интересов — обнаружение аномалий, техническая диагностика, анализ временных рядов, промышленная обработка данных, прогнозная аналитика.

Недавно я делал презентацию о проекте, в ходе которого мы разработали систему и алгоритмы контроля технического состояния электролизера:

В видео я выделил некоторые моменты процесса разработки. В этом посте я хочу рассказать о реализации проектов по науке о данных в промышленности в целом, добавив больше подробностей о процессе разработки на примере проекта «Электролизаторы». Давайте поговорим об этапах, проблемах таких проектов и дорожной карте, чтобы увидеть, как мы двигались к конечному результату.

Список сокращений на всякий случай:

  • МО — машинное обучение
  • DS — наука о данных
  • ИИ — искусственный интеллект

Технологический процесс

Важной и обычно большой частью проекта является понимание бизнеса (предметной области). Некоторые знания о технологическом процессе могут помочь при работе с данными, например, при выборе или создании физических признаков для моделирования. К тому же правильно сформулировать задачу и оценить качество проекта, не зная бизнеса, непросто. Бизнес-понимание и анализ процесса обычно начинаются в самом начале и не прекращаются до конца проекта. Хотя мы стараемся поддерживать тесный контакт с техническим персоналом, часто этого недостаточно для эффективной работы специалистов по данным.

В этом проекте необходимо понять, как производится ядерное топливо. Прежде всего, давайте кратко поговорим о процессе производства ядерного топлива в целом. Длинная производственная цепочка ядерного топлива начинается с добычи урановой руды. Его добывают несколькими способами: подземным выщелачиванием, шахтами или открытым способом. Затем урановую руду измельчают и растворяют с образованием концентрированной соли урана, затем сушат до сухого концентрата. Полученные оксиды урана смешивают со фтором, превращая их в гексафторид урана, легко принимающий газообразную форму. Это понадобится на следующем этапе (обогащении).

В предыдущем абзаце я упомянул о фторе, необходимом для производства гексафторида урана. Это важный элемент процесса производства ядерного топлива. Для его производства используются среднетемпературные электролизеры. Далее в ходе проекта мы глубоко проанализировали работу ячейки, сырье на входе и продукт на выходе на данном этапе технологического процесса, нормальные параметры оборудования, типовые неисправности, эксплуатационную документацию и другую доступную информацию.

Постановка задачи

Обычно в самом начале работы над кейсом у нас возникает только боль заказчика, типа: «слишком часто ломается техника». В нашем случае электролизеры, как и любое промышленное оборудование, подвержены износу и поломке. Мы называем такую ​​формулировку боли клиента — бизнес-проблемой. С ним сложно работать, потому что он не содержит никакой явной информации о задаче, метриках, ожидаемых результатах или планируемых изменениях в бизнесе. Поэтому мы пытаемся превратить ее в бизнес-гипотезу — формулировку, лишенную этих недостатков.

Раннее выявление аномалий в работе электролизеров позволяет заблаговременно реагировать на прогнозируемые инциденты, связанные с отключением оборудования, и планировать ремонт превентивно. Подробнее о задаче обнаружения аномалий и неисправностей можно прочитать в этой статье. Итак, с электролизерами возникают следующие проблемы:

  • вынужденный простой;
  • внеплановый ремонт;
  • неоптимальные капитальные ремонты (объемы и сроки выполнения работ).

Частично эти проблемы можно решить с помощью моделей обнаружения аномалий. В данном проекте ставилась задача разработать систему раннего обнаружения аномалий в электролизерах, используемых в производстве технического фтора. Разрабатываемая система должна превзойти балл F1 существующих алгоритмов, основанных на экспертных правилах, реализованных персоналом в SCADA.

Приведенные выше формулировки можно назвать бизнес-гипотезой, которую мы и проверим.

Ожидаемые результаты и экономический эффект

После формулировки бизнес-гипотезы мы оценили потенциальные экономические эффекты и сформулировали драйверы эффектов. Мы определили следующие драйверы эффектов:

  • снижение стоимости капитальных ремонтов за счет меньшего количества самих капитальных ремонтов, их оптимального графика, сокращения объемов работ;
  • увеличение межремонтных интервалов за счет сокращения количества внеплановых остановок и ремонтов;
  • повышение производительности при производстве фтора, как косвенный эффект более качественной работы оборудования.

Более подробная информация об эффектах от AI и ML доступна в этой статье.

Некоторые интересные моменты из предварительного анализа

Несколько интересных моментов, которые стоит отметить:

  • Мы считали True Positive (подробно о метриках здесь) только тревогу, которая была не позднее, чем за 5 минут до записи в журнал оператора. Отметка в журнале оператора свидетельствует о визуальной фиксации аномалии, обнаружении алгоритмами в SCADA или начале существенных проблем в работе оборудования.
  • Подобрано оборудование с похожей конструкцией.
  • Выбрана только одна группа возможных неисправностей для обнаружения с помощью моделей машинного обучения, так как эта группа имеет наибольшую статистику в исторических данных. Остальные группы были оставлены для следующих этапов проекта.
  • F1-оценка была выбрана в качестве метрики DS, но метрики Precision и Recall были ограничены из-за требования уменьшить количество ложных срабатываний.
  • Начал собирать больше данных о каждом инциденте после начала проекта. Например, иногда не фиксировались аномалии, которые устранялись без остановки производственного процесса.
  • На более поздних этапах мы изменили процесс сбора и агрегирования данных. Изначально не было возможности подтвердить текущий метод агрегации данных, а также нас не устраивала частота дискретизации данных (раз в минуту). Мы стали собирать данные без регулярной сетки (на смену), а записывать в базу только последнюю точку раз в секунду. Это, естественно, приводило к тому, что обучение модели приходилось перезапускать после того, как в ходе проекта было накоплено достаточное количество данных, собранных по-новому.
  • Потенциальные эффекты в деньгах были рассчитаны. Дополнительную информацию о влиянии решений машинного обучения на обрабатывающую промышленность можно найти в этой статье.
  • Модели машинного обучения необходимо интегрировать в существующую систему мониторинга процессов.
  • Вместе с персоналом предприятия мы переразметили инциденты в исторических данных и договорились обсудить все спорные случаи, детально проанализировав сигналы для честной и открытой оценки моделей.

Дорожная карта части Data Science

Дорожная карта части проекта DS была следующей:

Мы наметили поэтапно, что и в какие сроки будем делать, кроме описанного ранее этапа предварительного анализа.

Карта гипотез науки о данных

После части бизнес-понимания началась работа с гипотезой DS. Визуализация всех гипотез на одной карте может оказаться весьма полезной, поэтому для этих целей мы часто используем интеллект-карту. Снимок карты гипотезы DS в середине проекта выглядит следующим образом:

Проверка гипотез DS представляет собой итеративный процесс, состоящий из 3 основных этапов:

  • подготовка данных;
  • Обучение модели;
  • Оценка модели.

Позже в отдельной научной статье мы, вероятно, поделимся частями проекта, связанными с ML, включая модели, предварительную обработку данных, базовые уровни и уже существующие эвристические решения (алгоритмы в SCADA).

Тестирование

Наконец, мы протестировали разработанное решение. Результаты теста алгоритма обнаружения аномалий на основе ML следующие:

Интересные моменты и характеристики теста:

  • Создание плана и процедуры тестирования вместе с заказчиком
  • 3 месяца испытаний
  • Сравнение с существующей системой (SCADA)
  • Еженедельная проверка и анализ результатов
  • Тест признан успешным

Об окончательном решении

Разработана система прогнозного анализа и мониторинга оборудования на основе ИИ с интегрированными алгоритмами обнаружения аномалий на основе машинного обучения для диагностики работы электролизеров. В системе реализован автоматический поиск скрытых дефектов, возникающих в процессе эксплуатации, обеспечивается визуализация информации о прогнозируемых событиях и предупреждение оператора для принятия решений и формировать аналитику об аномалиях и факторах, внесших наибольший вклад в их обнаружение.

Модели измеряют различные параметры процесса при электролизе, в том числе уровень электролита, напряжение, давление в выпускных коллекторах и т. д. Полученные показатели позволяют прогнозировать и обнаруживать различные проблемы с оборудованием.

В отличие от существующих систем и алгоритмов диагностики, цифровые модели позволяют лучше управлять рисками возникновения технических дефектов и принимать превентивные меры для предотвращения вынужденных отключений оборудования. В результате значительно сокращается время простоя оборудования, увеличивается межремонтный интервал, увеличивается доля автоматизации в процессах диагностики.

Для дальнейшей работы мы выбрали следующие направления:

  • Расширение ассортимента оборудования и процессов
  • Переход к оптимизации всего процесса
  • Интеграция платформенных решений

Выводы

Некоторые важные примечания по проектам машинного обучения в производстве, которыми мы считаем важным поделиться:

  • Необходимо общаться с клиентами ЕЩЕ БОЛЬШЕ на всех этапах. В то же время личное общение делает все быстрее.
  • На крупных предприятиях существует множество стандартизированных процедур, которые требуют выполнения дополнительных требований к заполнению документов и фиксации принятых решений. У них, безусловно, есть преимущества, и для большинства проектов они снижают трудозатраты, повышают надежность, повышают безопасность труда. Но в случае разработки принципиально новых продуктов они могут оказаться совершенно избыточными и лишь затормозить процессы или сделать новые продукты бесполезными. Это необходимо учитывать на всех этапах проекта при проектировании, разработке и интеграции решения.
  • Безопасность (включая информационную и кибербезопасность) является промышленным приоритетом; это необходимо учитывать на каждом этапе.
  • Специалисты занимаются выпуском продукции; они не всегда заинтересованы в участии в нашей работе. Чтобы задействовать их, можно использовать следующие приемы:
  1. ищите людей, разрабатывающих похожие системы/алгоритмы, или людей, интересующихся диагностикой оборудования — они смогут понять значимость ваших результатов и поделиться своими знаниями
  2. использовать административный ресурс, в том числе добавить соответствующие ключевые показатели эффективности для ответственных сотрудников и лиц, принимающих решения
  3. использовать знания производственного персонала в разрабатываемых решениях и моделях — повышает уверенность в результатах
  4. доказать качество решения, подробно объяснить, как все работает, использовать простые, понятные и интерпретируемые модели/подходы
  5. чаще общайтесь с персоналом
  6. обучать и обучать персонал
  • Начните собирать данные об инцидентах и ​​как можно скорее измените и улучшите методы сбора данных.
  • Важно, чтобы результаты модели можно было интерпретировать. Персонал и руководство должны понимать результаты модели.
  • Трудно рассчитать экономический эффект. В этом процессе должна участвовать команда машинного обучения.
  • Известных лучших практик в области науки о промышленных данных нет. Есть положительные примеры и решенные кейсы.

Ознакомиться с различными вариантами использования машинного обучения в промышленности можно в моем обзорном репозитории (в основном кейсы на русском языке):