Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс.

ШАДмашинное обучениеобучение с подкреплениеммногорукий бандитUCBexploration-exploitationмарковский процесс принятия решенийQ-обучениеградиент стратегииpolicy gradientконтекстуальный многорукий бандит

Скачать Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс. бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс. или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

Cкачать музыку Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс. бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс.

Процесс обучения представляется в виде игры агента со средой, в которой агент совершает действия, среда в ответ даёт премии, и агент должен корректировать свою стратегию принятия решений таким образом, чтобы максимизировать суммарную будущую премию. Задача имеет черты классификации и прогнозирования. В простейшем случае это задача выбора действия по накопленной статистике премий, называемая задачей о многоруком бандите. В более сложном случае на каждом шаге известно, в каком из состояний находится среда. Если состояние среды описывается вектором признаков, то для принятия решений возможно приспособить инкрементные методы классификации, а для оптимизации стратегии агента применять градиентные методы. Во всех случаях основным вопросом обучения с подкреплением остаётся компромисс «exploration-exploitation» между изучающими действиями и действиями, непосредственно нацеленными на получение премий.

Комментарии

Информация по комментариям в разработке