Введение в обучение с подкреплением в MATLAB (reinforcement learning)

Описание к видео Введение в обучение с подкреплением в MATLAB (reinforcement learning)

Российская платформа математических вычислений и динамического моделирования Engee:
сайт: https://clck.ru/37kCz5
Телеграм канал: https://clck.ru/37kCww

###############

Файлы вебинара лежат здесь (требуется регистрация)
https://hub.exponenta.ru/post/vebinar...

00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение

Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.

Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.

Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:

Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:

Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:

Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.

По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar...

Все видео на тему глубокого обучения и описание https://exponenta.ru/news/deep-learni...
Подробнее о глубоком обучении https://exponenta.ru/ai
Наш тренинг "Глубокое обучение в MATLAB" https://exponenta.ru/MLDL
Deep Learning Toolbox https://exponenta.ru/neural-network-t...

Подписывайтесь на наш канал, чтобы не пропустить продолжение.

Мы в соцсетях:
VK ‣ https://vk.com/mathworks
Telegram ‣ https://t.me/exponenta_ru

#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления

Комментарии

Информация по комментариям в разработке