Машинное обучение Azure — это универсальное решение для всех ваших проектов машинного обучения, которое экономит ваше время и деньги. С помощью Azure Machine Learning Studio легко разрабатывать и обучать модели машинного обучения со сложными алгоритмами. В этом руководстве мы узнаем больше о Студии машинного обучения Azure, а также поработаем над небольшим проектом, чтобы понять, как работает студия? Давайте начнем!

Что такое Azure Machine Learning Studio?

Предположим, что ваша организация пытается разработать и обучить модель машинного обучения. Если проект небольшой, вы можете легко его выполнить, но что, если вы хотите обучить модель с возможностями больших данных или если у вас есть огромные наборы данных, хранящиеся в облаке. Лучшей практикой будет обучение модели в облаке, чтобы исключить дополнительное время, затраты и другие проблемы, связанные с инфраструктурой. Поэтому вам, безусловно, нужна единая платформа, на которой вы сможете выполнять все соответствующие задачи в защищенной среде. Машинное обучение Azure — это универсальная облачная служба для этого. В нем есть что-то для каждого отдела вашей команды, от инженеров машинного обучения, специалистов по данным до разработчиков приложений. Он поддерживает общие записные книжки и вычислительные ресурсы для расширения сотрудничества между командами.

Итак, что такое Студия машинного обучения Azure? Это среда без кода от Azure для подготовки и обучения моделей машинного обучения. Студия машинного обучения Azure предоставляет рабочую область проекта на основе графического интерфейса для моделей машинного обучения. Некоторые из основных функций студии:

● Вы можете управлять активами и учетными данными.

● Предлагает визуальное представление метрик, отчетов и результатов.

● Кроме того, вы можете писать и редактировать блокноты.

● Вы можете легко использовать наборы данных, хранящиеся в облаке, с простой интеграцией.

● Самая важная функция студии машинного обучения Azure — интерфейс перетаскивания для обучения моделей.

Хотя службы машинного обучения Azure и студии кажутся вам похожими, у них есть некоторые ключевые отличия. Как и служба Azure ML, это среда кодирования, в которой Azure ML Studio, у вас есть среда перетаскивания без необходимости кода. У студии есть некоторые ограничения, поскольку она работает с предопределенными алгоритмами, но в службе машинного обучения Azure вы можете использовать любую библиотеку или алгоритм. И то, что использовать, полностью зависит от ваших потребностей. Я имею в виду, зачем делать вещи сложными, когда вы можете легко их достичь. Поэтому, если ваша задача может быть выполнена через студию, сделайте это, в противном случае используйте службу Azure ML.

Работа с Машинным обучением Azure

Как я уже говорил ранее, в студии машинного обучения Azure есть несколько предопределенных алгоритмов, которые мы можем использовать в наших моделях. Теперь возникает вопрос: как мне узнать, какой алгоритм использовать? Microsoft уже предоставила шпаргалку для этого, но давайте упростим это здесь.

  1. Чтобы предсказать значение на основе отношений переменных, вы можете использовать регрессию.

● Линейная регрессия

● Порядковая регрессия

● Квантильная регрессия Fast Forest

● Регрессия Пуассона

● Регрессия нейронной сети

● Регрессия леса решений

2. Чтобы сгруппировать похожие данные в один набор, вы можете использовать алгоритм кластеризации K-средних.

3. Если у вас есть две категории и вы хотите сделать прогноз между ними. Например, является ли предложение положительным или отрицательным. Затем вы можете использовать:

● Двухклассовый SVM

● Лес решений двух классов

● Усиленное дерево решений с двумя классами

● Двухклассовая нейронная сеть

● Двухклассовая байесовская точечная машина

● Двухклассный усредненный персептрон

4. И если у вас есть несколько категорий и вы хотите сделать прогноз среди них, вы можете использовать:

● Мультикласс "один против всех"

● Многоклассовый лес решений

● Мультиклассовая логистическая регрессия

● Мультиклассовая нейронная сеть

С другой стороны, служба машинного обучения Azure поддерживает языки программирования Python, R и .NET. И если вы работаете с Python, вы можете использовать некоторые распространенные фреймворки, такие как PyTorch, TensorFlow, LightGBM и scikit-learn.

Машинное обучение Azure также поддерживает интеграцию с другими службами Azure, такими как:

● Служба приложений Azure для развертывания приложений на основе машинного обучения.

● Хранилище и базы данных, такие как Azure Blob и SQL.

● Azure Arc для использования среды Kubernetes.

● Вы также можете подключить его к Azure Synapse Analytics для обработки и потоковой передачи данных.

Обучение модели машинного обучения с помощью Azure Machine Learning Studio

Здесь мы увидим, как вы можете обучить студию машинного обучения без необходимости кодирования. Мы обучим модель прогнозирования, которая будет прогнозировать спрос на услугу велопроката. Для начала у вас должна быть рабочая область машинного обучения Azure. Вы можете следовать этому руководству для создания рабочего пространства или выполнить следующие шаги:

  1. Войдите на свой портал Azure и найдите машинное обучение.
  2. На вкладке машинного обучения нажмите создать и введите необходимые данные:

Имя рабочей области. Назовите свою рабочую область.

Подписка. Выберите подписку.

Группа ресурсов. Создайте новую группу ресурсов.

Регион. Выберите регион для создания рабочей области.

Учетная запись хранения. По умолчанию создается новая учетная запись хранения.

Хранилище ключей. Новое хранилище будет создано по умолчанию.

Информация о приложении: новая создается по умолчанию.

Реестр контейнеров. Новый реестр не будет создаваться сейчас по умолчанию, но он будет создан, когда вы будете использовать образ Docker во время обучения или развертывания.

3. Нажмите Просмотреть + Создать, а затем Создать.

4. После создания ресурса вы можете нажать Запустить студию, и вы будете перенаправлены на веб-сайт студии машинного обучения Azure, который будет выглядеть следующим образом:

А набор данных, который мы будем использовать в этом уроке, можно скачать здесь.

Войдите в Студию машинного обучения Azure и выберите подписку и рабочую область. Затем перейдите к разделу Начало работы › Автоматическое машинное обучение › + Новый автоматический запуск машинного обучения.

Создайте и загрузите набор данных

Сначала мы загрузим наш файл данных в рабочую область как набор данных машинного обучения Azure.

● На левой панели нажмите Набор данных, а на следующей странице нажмите +Создать набор данных и выберите один из локальных файлов.

● Введите имя и описание для вашего набора данных. Студия ML поддерживает только табличные наборы данных, поэтому тип набора данных по умолчанию будет табличным. Нажмите Далее.

● Для хранилища данных и выбора файла по умолчанию будет выбран автоматически созданный набор данных. Нажмите Обзор и выберите файл набора данных, который вы только что загрузили.

● После загрузки файла вы окажетесь на панели настроек и предварительного просмотра. Снова нажмите Далее.

● Оставьте форму схемы как есть и нажмите «Далее».

● Подтвердите данные и нажмите Создать.

● Когда это будет сделано, щелкните набор данных в списке и просмотрите предварительный просмотр данных. Затем нажмите «Закрыть» и «Далее».

Настроить запуск

Мы загрузили наши данные, и теперь пришло время настроить эксперимент.

  1. Нажмите кнопку Создать новую на главной странице ML studio и выберите Автоматический запуск ML. Выберите недавно загруженный набор данных и введите необходимую информацию.

● Название эксперимента: дайте название эксперименту.

● В столбце «y» указано, подписался ли клиент на срочный вклад. И это то же самое, что мы хотим предсказать.

● Тип вычислений: вычислительный кластер.

● Нажмите +Создать, чтобы настроить цель вычислений, которая выступает в качестве среды для запуска сценариев обучения. Вы можете выбрать облачную или локальную вычислительную среду. Здесь мы пойдем с облачными технологиями. В форме цели вычислений вам будет предложено указать конфигурации виртуальной машины. Выберите расположение, выделенное как уровень машины, ЦП в качестве типа машины и Standard_DS12_V2 в качестве размера машины.

Нажмите «Далее», и вам будет предложено настроить параметры вычислений. Укажите имя вычисления, установите 1 минимальный узел, 6 максимальных узлов, время простоя 120 секунд и игнорируйте дополнительные настройки.

Нажмите Создать, и ваша цель вычислений будет создана через несколько минут. Теперь из раскрывающегося списка вы можете выбрать недавно созданную цель вычислений. Нажмите Далее.

2. Вы окажетесь на странице Выберите задачу и настройки. Здесь вам нужно указать еще несколько вещей, касающихся вашего автоматизированного эксперимента по машинному обучению. Выберите Классификация в качестве типа задачи машинного обучения, нажмите Просмотреть дополнительные параметры конфигурации и введите следующие данные:

● Основной показатель: AUC_weighted.

● Объясните лучшую модель: включите

● Заблокированный алгоритм: нет

● Дополнительные настройки классификации: положительная метка класса: нет

● Критерий выхода: 1 час обучения и отсутствие порогового значения метрики.

● Параллелизм: максимальное количество одновременных итераций 5

Нажмите Сохранить, а затем Далее.

3. На странице проверки и тестирования выберите тип перекрестной проверки k-fold и 2 перекрестные проверки.

4. Нажмите Готово, и эксперимент начнется. Подготовка займет 10–15 минут, а каждая итерация — 2–3 минуты.

Развертывание модели

Вы также можете развернуть свою модель с помощью Машинного обучения Azure в качестве веб-службы всего за несколько шагов. После завершения эксперимента вы увидите лучшую модель, которая является VotingEnsemble для этого эксперимента. Нажмите на него и выберите кнопку развертывания в левом верхнем углу. Здесь вам будет предложено несколько деталей, настройте их и нажмите «Развернуть».

Подведение итогов

Машинное обучение Azure — это универсальное решение для всех ваших задач машинного обучения с простой интеграцией с другими службами Azure. Студия машинного обучения Azure предлагает вам среду без кода для быстрого выполнения заданий машинного обучения.