DRL Course 2023 | Value Function Approximation. Deep Q-Networks (DQN)

Описание к видео DRL Course 2023 | Value Function Approximation. Deep Q-Networks (DQN)

Курс Deep Reinforcement Learning 2023: https://ods.ai/tracks/drlcourse23
Сезон курсов :https://ods.ai/events/course_season_a...

В пятой лекции:
Рассматриваются MDP с бесконечным пространством состояний
Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей
Выводится алгоритм Deep Q-Networks (DQN)
Обсуждаются его различные модификации


Автор курса: Антон Плаксин, исследователь в группе Yandex.Research и доцент Уральского федерального университета.


Наши соц.сети:
Telegram: https://t.me/datafest
Вконтакте: https://vk.com/datafest
Канал с вакансиями в telegram: https://t.me/odsjobs
Канал с апдейтами по курсам: https://t.me/odscourses
Как попасть в чат сообщества ODS Mattermost: https://ods.ai/tracks/mattermost

Комментарии

Информация по комментариям в разработке