Computer Science Club

Машинное обучение обычно делится на обучение с учителем и без оного. Обучение с подкреплением -- это третий путь, в котором обучающийся агент взаимодействует с окружением, получая от него награды или наказания за свои действия. Обучение с подкреплением в последние годы производит много громких новостей: только в играх мы уже слышали об AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а это только одно применение... В мини-курсе мы поговорим об основных постановках задач в обучении с подкреплением, разберёмся, как в обучение с подкреплением вошли глубокие нейронные сети, и постараемся дойти до самых последних результатов.

Прочтения курсов

Семестр	Отделение
осень 2020	Санкт-Петербург

Обучение с подкреплением: от определений до AlphaZero и Dactyl

Прочтения курсов