В 2018 году пожар в лагере унес жизни 85 человек и причинил неисчислимые разрушения. Группы потерпевших позже оценят ответственность Pacific Gas and Electric (PG&E) в 54 миллиарда долларов. Это была ужасная трагедия, случившаяся всего через год после пожаров в Винной стране, в которых погибли 22 человека.

Плохое техническое обслуживание было виновником. Внимание будет сосредоточено на линии электропередачи, которая ранее была повреждена в декабре 2012 года. Сообщалось о возгорании под теми же проводами в 2018 году, примерно через 15 минут после обнаружения повреждения линии. Дымящийся пистолет в данном случае был больше похож на дымящийся стальной крюк. Его работа заключалась в том, чтобы удерживать высоковольтные линии электропередачи.

Отключение электроэнергии в целях общественной безопасности

Точная причина будущих пожаров в Калифорнии неизвестна. Но, как напоминает нам песня Боба Дилана, по крайней мере часть ответа лежит на ветру. Деревья находятся слишком близко к линиям электропередач, и при их соприкосновении может произойти трагедия.

Теоретически обрезка деревьев, закапывание канатов и замена изношенных частей могут значительно снизить вероятность катастрофы. Но об этом известно уже десять или более лет (о медленном прогрессе сообщала San Francisco Chronicle в 2019 году). Тем временем калифорнийцы живут с неизбежным злом, называемым отключением электроэнергии в целях общественной безопасности (PSPS).

PSPS разъясняется на информационной странице PG&E таким образом.

Сильный ветер может привести к контакту ветвей деревьев и мусора с линиями под напряжением, повредить оборудование и вызвать лесной пожар. В результате нам может потребоваться отключить электроэнергию в плохую погоду, чтобы предотвратить лесные пожары. Это называется отключением электроэнергии в целях общественной безопасности.

Согласно опросу Габриэль Вонг-Пароди (газета), эти добровольные ограничения власти имеют общественную поддержку. Однако, предназначенные для спасения жизней и защиты имущества, они сопряжены с определенным риском. В округе Эльдорадо один житель, Роберт Мардис, не смог переключиться на свою резервную кислородную систему. О его смерти сообщил Fox News.

Калифорнийская комиссия по коммунальным предприятиям (CPUC) разрешает отключения с 2012 года. Теперь программа открыта для всех поставщиков, и стоимость и частота таких сбоев растут. В 2013 году было только одно ограничение подачи электроэнергии. В 2019 году их было 19. В 2020 году всего 20 таких случаев.

Существуют правила, установленные для предоставления клиентам различных типов предупреждений, кульминацией которых являются срочные текстовые SMS-сообщения и телефонные звонки, которые могут поступать за час до отключения питания. Подача электроэнергии обычно возобновляется через день или два, но в худшем случае отключение длилось неделю.

Дьявольский ветер

Дальше будет только хуже. Патрик Мерфи рассматривает основные факторы, повышающие риск возникновения пожара, в недавней статье для PSE, аналитического центра по вопросам политики. К ним относятся постепенное повышение зарегистрированных максимальных температур, а также четко различимая тенденция к усилению засухи за последнее столетие.

Но не менее важны и так называемые ветры диабло — горячие сухие порывы с северо-востока, обрушивающиеся на район залива и за его пределы. Когда воздух проходит над прибрежными хребтами и падает, давление повышается, и он нагревается до 20 градусов по Фаренгейту.

Когда эти ветры достигают скорости 40 миль в час, это создает опасные условия — не только увеличивает вероятность воспламенения, но и затрудняет последующую защиту. Как отмечает Мерфи, ветры Diablo демонстрируют тревожную тенденцию даже за последние несколько десятилетий (ось ординат — количество часов в год).

Калифорнийская функция распределения

Мерфи также сообщает о кумулятивной функции распределения длительности простоев по годам и поставщикам. Например, в 2020 году:

Существует калькулятор под названием Оценка стоимости прерывания (ICE), разработанный Национальной лабораторией Лоуренса Беркли и Nexant, который позволяет оценить экономическую стоимость любого прерывания (вы можете указать количество затронутых коммерческих и некоммерческих пользователей). Эти цифры подтверждаются метаанализом, обновленным в 2015 году Салливаном, Шелленбергом и Бланделлом (статья).

Эти авторы приводят следующие расчеты, а также более подробные разбивки в зависимости от сезона и времени суток, а также затронутой отрасли. Их количество основано на опросах более 3000 бытовых потребителей и малых и средних предприятий, а также на более подробных интервью со 100 крупными бизнес-клиентами.

Авторы считают, что стоимость примерно линейна в зависимости от продолжительности прерывания. И цифры складываются. Только в 2019 году экономическая стоимость выключения света могла составить от 2 до 3 миллиардов долларов.

Функции распространения сообщества

Очевидно, что в режиме реального времени необходимо принять важное решение, уравновешивая обе стороны бухгалтерской книги: отключать электричество или нет? Из-за сложности решения самая высокостилизованная утилитарная квадратура, которая приходит на ум, может оказаться неадекватной.

Но само собой разумеется, что любой подход выиграет от более точных оценок распределения скорости ветра на коротком горизонте, не говоря уже о других измеренных величинах, которые непосредственно сообщают о ветре или вероятности возгорания. Пример кумулятивной функции распределения скорости ветра на один час вперед показан ниже. Живую версию можно посмотреть здесь.

То, что вы видите, не очень легко превзойти. Прежде чем утверждать обратное, вы должны посмотреть, сможете ли вы улучшить его, запустив собственный алгоритм и увидев, где вы окажетесь в таблице лидеров. (Несколько строк Python может быть достаточно, чтобы поставить ваш любимый подход в бой — см. документы).

Даже если вам удастся набрать больше очков, чем проиграть в этой игре, помните, что ваша собственная модель сама по себе не превзойдет всех специалистов по обработке и анализу данных в мире и уж точно не будет всегда. Даже если вы каким-то образом «лучший», сочетание вашего вклада с другими будет лучшей вероятностной оценкой, и это то, что можно извлечь из этих CDF.

Эти прогнозы скорости ветра были начаты некоторое время назад, когда я решил потратить пару часов на написание сценария для отправки чисел, опубликованных NOAA, на рынок высокоскоростных прогнозов, который создает эти CDF (которые, откровенно говоря, я написал и поддерживать).

В этих CDF нет ничего загадочного — давайте назовем их калифорнийскими функциями распределения, когда они применимы к скорости ветра Diablo. Соответствующие функции плотности представляют собой просто совокупность всех предположений о будущей измеренной величине. Все числа, которые были отправлены в API всеми участвующими алгоритмами, то есть не менее часа назад.

Кстати, наземными измерениями никто не ограничивается, и приведенный выше пример действительно качается в заливе Мэн — у буя есть своя страница здесь. Опубликовать данные о скорости или направлении ветра из Калифорнии, или высоту воды где-нибудь на Земле, или количество посетителей вашего ресторана, или любой инструментальный процесс — совсем несложно.

В качестве альтернативы целью прогнозов может быть функция нескольких общедоступных и частных номеров — все, что вы захотите придумать. Можно отправить в API прогнозирования общего назначения разницу между сообщаемой скоростью ветра и ранее сделанным прогнозом, сделанным внутренней группой специалистов по данным, скажем, командой, использующей передовые метеорологические модели. Публикуя ошибки модели, непрерывная космическая лотерея (ее можно назвать многими вещами) может мгновенно выполнять функцию обзора модели, но также и улучшать саму модель.

Что должно быть сделано? (Немного)

В эти дни мы привыкли слышать бесконечные модные словечки, и мы получаем поток советов о якобы лучших практиках развертывания предиктивной аналитики в полевых условиях — обычно это очень дорогой проект с большим количеством этапов и людей. Есть сбор данных, очистка, оценка автономной модели, обнаружение дрейфа модели, различные побочные конвейеры для обнаружения аномалий и так далее.

Не беспокойтесь.

Механика рынка информации микропрогнозирования с открытым исходным кодом рано или поздно превращает эту модель затрат в насмешку. «Калифорния» — для обозначения заинтересованных сторон как в частных, так и в публичных ролях — не должна делать ничего из этого. Оценка вероятности того, что скорость ветра превысит 30 миль в час на названной станции измерения, требует только следующих шагов.

  1. Начать публикацию соответствующих величин (скорости ветра)

Почему рано или поздно это сработает

Да-да, всего одиншаг, и его можно выполнить за несколько минут. Если есть шаг 2, он может заключаться в обнародовании существования прямых трансляций и поощрении гражданских статистиков и энтузиастов машинного обучения вступать в бой и запускать алгоритмы прогнозирования.

Даже если они этого не сделают, сотни алгоритмов временных рядов уже наблюдают через API. Рано или поздно они обнаружат новые калифорнийские потоки (особенно если будут предложены призовые деньги, шаг 1.5) и начнут предсказывать, что бы ни было отправлено. Улучшение качества прогнозирования распределения скорости ветра может быть достигнуто тремя строками Python.

С таким небольшим барьером для входа мало что может помешать современным алгоритмам прогнозирования проникнуть в потоки с небольшой помощью специалистов по данным или инженеров. В частности, и чтобы сделать более технический комментарий, любой из сотен алгоритмов, которые в настоящее время тестируются в автономном режиме и которым присвоены рейтинги Эло, можно вставить в работающий алгоритм, просто создав подкласс StreamSkater, как описано здесь, а затем изменив одну строку кода. , и запустить его.

Вы можете представить себе все эти алгоритмы как маленькие дробовики, стреляющие атомами вероятности по распределению будущих событий. Если мера Q представляет текущее рыночное распределение, и какой-то очень умный человек знает истину P, то можно показать, что, когда они запускают P в распределении, они со временем будут вознаграждены суммой, которая пропорциональна расстоянию Кульбака-Лейблера между P и Q.

Естественно, это не единственный способ победить. Алгоритмы также могут попытаться восполнить недостающую массу, если они что-то увидят, как они могут на любом рынке. Они предоставляют больше выборок Монте-Карло, где P > Q, тем самым помогая последним сходиться к первым.

Может ли прогноз полезности запустить утилиту прогнозирования?

В своей книге Микропрогнозирование: создание открытой сети ИИ я определяю оракула микропрогнозирования следующим образом:

Я также утверждаю, что такие API, как этот, могут соответствовать этому определению с коэффициентом стоимости, равным двум. Помимо этой (несколько расплывчатой) логики, тот факт, что Калифорния могла бы извлечь выгоду из этого конкретного оракула, также может основываться на обширной литературе, посвященной рынкам. Оракул — очень легкий рыночный механизм.

Более интересный вопрос заключается в том, может ли возникнуть «глубокая конкуренция», определяемая как несколько уровней конкурентного прогнозирования, инициируемых, когда один конкурирующий алгоритм использует оракула для подзадачи. Кроме того, вполне вероятно, что в будущем это не будет единственным способом добиться разветвления задач, подобных цепочке поставок сложного потребительского товара. Ничто не мешает другим создавать собственные оракулы конкурентных прогнозов.

Что-то столь же важное, как предсказание скорости ветра в Калифорнии, может быть именно тем, что необходимо для стимулирования этого развития, а вместе с ним и преимуществ специализации, поиска экзогенных данных и периодического использования. Чтобы увидеть конечное состояние этой более продвинутой возможности, вам нужно представить сеть «микроменеджеров» моделей, которые объединяют результаты своих одноранговых узлов в обслуживании вышестоящего мастера и соответственно компенсируют их. У них будет много экономической статистики и статистической экономики для размышлений.

В моей книге рассматривается стоимость «ИИ» через призму этого типа. Приложение к «вероятностям общественной безопасности» в Калифорнии очень чистое. Но более частные прогнозы внутри секретных фирм также возможны благодаря достижениям в таких вещах, как безопасные многосторонние вычисления. В конце концов, как предсказывает ваш покорный слуга, операционные проблемы в режиме реального времени, такие как те, с которыми столкнулась Калифорния, будут решаться действительно коллективно. Они подключатся к «сети предсказаний».

Однако для того, чтобы это произошло, организациям и предприятиям необходимо видеть сквозь внешний вид «ИИ» — вероятно, наименее полезное выражение, придуманное в новейшей истории, — и признать, что большинство вещей, подпадающих под это описание, являются либо «комплексным микропрогнозированием», либо неправильным использованием. жадных до данных методов.

Отделив быстро повторяющиеся количественные задачи от другой бизнес-логики, мы можем свести затраты к нулю благодаря преимуществам совместного использования пространства функций в реальном времени, используемому всеми, и благодаря незначительной стоимости алгоритмов, повторно использующих себя.

Подводя итог, можно сказать, что проблемы, с которыми столкнулись калифорнийские коммунальные предприятия, могут стать идеальным катализатором для создания именно такого типа прогнозирующих услуг, в которых нуждается вся экономика.

Обо мне

Недавно помазанный микро-инфлюенсер, я микропрогноз на GitHub, где вы найдете способы связаться со мной, чтобы попытаться продать мне сомнительные продукты искусственного интеллекта, не прошедшие бенчмаркинг. Как уже отмечалось, я также являюсь автором книги Микропрогнозирование: построение открытой сети ИИ, опубликованной MIT Press. Я только что запустил велосипедный челлендж 1664 км, чтобы собрать деньги на исследования рака у детей.