Публикации по теме 'reinforcement-learning'
Глубокое обучение с подкреплением в производстве в Zynga
СОБЫТИЯ РАЗГОВОРЫ
Глубокое обучение с подкреплением в производстве в Zynga
Патрик Халина и Мехди Бен Айед | TMLS2019
В новостях о глубоком обучении с подкреплением говорилось о многих прорывах, от таких игр, как Go, Atari и Dota, до беспилотных автомобилей, но его применение к миллионам людей на производстве создает множество проблем.
Обещание обучения с подкреплением - это автоматическая оптимизация взаимодействия с пользователем. Zynga, одна из крупнейших в мире компаний,..
Создание эмерджентного поведения с помощью обучения с подкреплением и Unreal Engine
Создавайте эмерджентное поведение персонажей ИИ с помощью Unreal Engine и бесплатного плагина машинного обучения MindMaker.
В следующей статье я расскажу, как создать эмерджентное поведение у персонажей ИИ с помощью Unreal Engine , обучения с подкреплением и бесплатного плагина машинного обучения MindMaker . Цель состоит в том, чтобы заинтересованный читатель мог использовать это в качестве руководства для создания эмерджентного поведения в своем собственном игровом проекте или..
Обучение с подкреплением с помощью Multi Arm Bandit (Часть 2)
Позвольте сделать проблему немного более… сложной!
Резюме
Это продолжение оригинального поста , я настоятельно рекомендую сначала пройти его, где мы поняли интуицию многорукого бандита и попытались применить электронные жадные алгоритмы для решения типичной проблемы. Но мир не так прост. Есть несколько факторов, при введении которых проблема полностью меняется, и решение необходимо пересматривать. Мы выберем место, где мы остановились, представим новую проблему, покажем, как наш..
CarlyXO — Tic Tac Toe AI с использованием обучения с подкреплением при поиске по дереву Монте-Карло
Это действительно игра, которой может наслаждаться каждый, молодой или старый. В этом сообщении блога я поделюсь своим опытом создания CarlyXO, бота Tic Tac Toe, который использует обучение с подкреплением поиска по дереву Монте-Карло для выполнения разумных движений.
Я был вдохновлен узнать больше об обучении с подкреплением после просмотра документального фильма AlphaZero. Я сразу же прочитал статью Освоение шахмат и сеги путем самостоятельной игры с помощью общего алгоритма обучения..
Введение в слабую типичность
Слабая типичность:
Краткий справочник по машинному обучению — Часть 1
Искусственный интеллект
ИИ был одной из самых горячих тем в последние годы. Это изменило способ ведения бизнеса и открыло новые возможности для стартапов. Речь идет не только об умных алгоритмах, которые могут превзойти людей, но и о гуманизации искусственного интеллекта.
Одно из самых больших изменений, которые ИИ привносит в нашу жизнь, — это беспилотные автомобили. Для многих эти нововведения могут серьезно изменить жизнь.
Потребуется время, прежде чем ИИ сможет делать все..
Обучение с подкреплением: часть 9: характеристика с использованием агрегации состояний, кодирования курса, кодирования плитки…
В предыдущем блоге мы видели, как мы можем использовать параметризованный алгоритм для изучения среды таким образом, чтобы мы могли обобщать, а также различать состояния и их значения.
В этом блоге мы увидим, как мы можем создавать функции для лучшего представления состояний в среде.
Допустим, у нас есть 100 состояний, и нам нужен числовой способ представления каждого состояния. Это может показаться знакомым. Раньше мы делали одно горячее кодирование для категориальных функций...
Новые материалы
Очистить файлы Program .cache в Ubuntu 20.10
Очистите кеш за несколько простых шагов!
GNU / Linux реализовал эффективное управление хранилищем для своих пользователей. Но заметили ли вы, что в вашей системе Linux заканчивается место,..
Использование Node.js для чтения действительно больших файлов (часть 1)
В этом сообщении в блоге есть интересный источник вдохновения. На прошлой неделе кто-то на одном из моих каналов в Slack опубликовал тестовое задание, которое он получил на должность..
Введение в градиентный спуск и обратное распространение
Введение в градиентный спуск и обратное распространение
Как машинное обучение?
Машинное обучение ( ML ) - это исследование компьютерных алгоритмов, которые автоматически улучшаются по..
Шаблон CQRS — C#
Этот архитектурный шаблон в основном говорит о том, что мы можем использовать одну модель для операций чтения, а другую — для операций записи. Звучит хорошо, но реализовать его может быть..
Освоение функций потерь в машинном обучении для регрессии: полное руководство по оптимизации…
Введение:
Функция потерь является важным компонентом алгоритмов машинного обучения и статистических моделей. Его роль заключается в измерении несоответствия между прогнозируемым выходом модели и..
10 языков программирования, которые изменят мир в 2023 году
Мир программирования постоянно развивается, и востребованные языки постоянно меняются. Однако есть несколько языков, которые выдержали испытание временем и по-прежнему очень ценны для изучения в..
Чем заняться в наших библиотеках (апрель 2023 г.)
В апреле этого года мы празднуем обучение по-разному — от принятия позитивного и устойчивого мышления до понимания и сохранения местных популяций пчел, а также изучения новейших и новейших..