Reinforcement Learning

Войти

Вопросы

Курсы

Курс

Артём Сорокин

Цель курса «Обучение с подкреплением» познакомить студентов с основными формализмами и идеями в этой области, но в тоже время дать возможность собственноручно реализовать некоторые из state-of-the-art алгоритмов глубокого RL. Курс состоит из двух частей. В первой части слушатели познакомятся с теоретическими основами RL на игрушечных примерах. Во второй части мы сосредоточимся на нейросетевых методах, которые позволяют применить RL для куда более сложных задач.

Обучение с подкреплением — это обучение тому, что делать, т. е. как отобразить ситуации на действия, чтобы максимизировать численный сигнал — вознаграждение. Обучаемому агенту не доступна информация о том, какие действия являются правильными; он должен установить, какие действия приносят максимальное вознаграждение на основе собственного опыта. В наиболее интересных и трудных случаях действия могут влиять не только на непосредственное вознаграждение, но и на следующую ситуацию, а значит, на все последующие вознаграждения. Эти две характеристики — поиск методом проб и ошибок и отложенное вознаграждение — значительно отличают RL задачу от классической задачи обучения с учителем.

Лектор

Программа курса

Aimasters 2023 © All Rights Reserved. aimasters.msu@gmail.com Персональные данные опубликованы в соответствии со ст.10.1 Федерального закона РФ № 152-ФЗ от 27 июля 2006г. «О персональных данных» с согласия субъекта. Какая-либо иная обработка, в том числе, дальнейшее распространение персональных данных третьими лицами запрещена.

Дизайн и разработка / Василий Конкрет

Мы собираем данные Cookies. Оставаясь на сайте, вы соглашаетесь с нашей политикой сбора и обработки персональных данных.

ок