Squeak.ru - шаблоны программирования

Публикации по теме 'reinforcement-learning'


Глубокое обучение с подкреплением в производстве в Zynga
СОБЫТИЯ РАЗГОВОРЫ Глубокое обучение с подкреплением в производстве в Zynga Патрик Халина и Мехди Бен Айед | TMLS2019 В новостях о глубоком обучении с подкреплением говорилось о многих прорывах, от таких игр, как Go, Atari и Dota, до беспилотных автомобилей, но его применение к миллионам людей на производстве создает множество проблем. Обещание обучения с подкреплением - это автоматическая оптимизация взаимодействия с пользователем. Zynga, одна из крупнейших в мире компаний,..

Создание эмерджентного поведения с помощью обучения с подкреплением и Unreal Engine
Создавайте эмерджентное поведение персонажей ИИ с помощью Unreal Engine и бесплатного плагина машинного обучения MindMaker. В следующей статье я расскажу, как создать эмерджентное поведение у персонажей ИИ с помощью Unreal Engine , обучения с подкреплением и бесплатного плагина машинного обучения MindMaker . Цель состоит в том, чтобы заинтересованный читатель мог использовать это в качестве руководства для создания эмерджентного поведения в своем собственном игровом проекте или..

Обучение с подкреплением с помощью Multi Arm Bandit (Часть 2)
Позвольте сделать проблему немного более… сложной! Резюме Это продолжение оригинального поста , я настоятельно рекомендую сначала пройти его, где мы поняли интуицию многорукого бандита и попытались применить электронные жадные алгоритмы для решения типичной проблемы. Но мир не так прост. Есть несколько факторов, при введении которых проблема полностью меняется, и решение необходимо пересматривать. Мы выберем место, где мы остановились, представим новую проблему, покажем, как наш..

CarlyXO — Tic Tac Toe AI с использованием обучения с подкреплением при поиске по дереву Монте-Карло
Это действительно игра, которой может наслаждаться каждый, молодой или старый. В этом сообщении блога я поделюсь своим опытом создания CarlyXO, бота Tic Tac Toe, который использует обучение с подкреплением поиска по дереву Монте-Карло для выполнения разумных движений. Я был вдохновлен узнать больше об обучении с подкреплением после просмотра документального фильма AlphaZero. Я сразу же прочитал статью Освоение шахмат и сеги путем самостоятельной игры с помощью общего алгоритма обучения..

Введение в слабую типичность
Слабая типичность:

Краткий справочник по машинному обучению — Часть 1
Искусственный интеллект ИИ был одной из самых горячих тем в последние годы. Это изменило способ ведения бизнеса и открыло новые возможности для стартапов. Речь идет не только об умных алгоритмах, которые могут превзойти людей, но и о гуманизации искусственного интеллекта. Одно из самых больших изменений, которые ИИ привносит в нашу жизнь, — это беспилотные автомобили. Для многих эти нововведения могут серьезно изменить жизнь. Потребуется время, прежде чем ИИ сможет делать все..

Обучение с подкреплением: часть 9: характеристика с использованием агрегации состояний, кодирования курса, кодирования плитки…
В предыдущем блоге мы видели, как мы можем использовать параметризованный алгоритм для изучения среды таким образом, чтобы мы могли обобщать, а также различать состояния и их значения. В этом блоге мы увидим, как мы можем создавать функции для лучшего представления состояний в среде. Допустим, у нас есть 100 состояний, и нам нужен числовой способ представления каждого состояния. Это может показаться знакомым. Раньше мы делали одно горячее кодирование для категориальных функций...

Новые материалы

Очистить файлы Program .cache в Ubuntu 20.10
Очистите кеш за несколько простых шагов! GNU / Linux реализовал эффективное управление хранилищем для своих пользователей. Но заметили ли вы, что в вашей системе Linux заканчивается место,..

Использование Node.js для чтения действительно больших файлов (часть 1)
В этом сообщении в блоге есть интересный источник вдохновения. На прошлой неделе кто-то на одном из моих каналов в Slack опубликовал тестовое задание, которое он получил на должность..

Введение в градиентный спуск и обратное распространение
Введение в градиентный спуск и обратное распространение Как машинное обучение? Машинное обучение ( ML ) - это исследование компьютерных алгоритмов, которые автоматически улучшаются по..

Шаблон CQRS — C#
Этот архитектурный шаблон в основном говорит о том, что мы можем использовать одну модель для операций чтения, а другую — для операций записи. Звучит хорошо, но реализовать его может быть..

Освоение функций потерь в машинном обучении для регрессии: полное руководство по оптимизации…
Введение: Функция потерь является важным компонентом алгоритмов машинного обучения и статистических моделей. Его роль заключается в измерении несоответствия между прогнозируемым выходом модели и..

10 языков программирования, которые изменят мир в 2023 году
Мир программирования постоянно развивается, и востребованные языки постоянно меняются. Однако есть несколько языков, которые выдержали испытание временем и по-прежнему очень ценны для изучения в..

Чем заняться в наших библиотеках (апрель 2023 г.)
В апреле этого года мы празднуем обучение по-разному — от принятия позитивного и устойчивого мышления до понимания и сохранения местных популяций пчел, а также изучения новейших и новейших..