Llama 3.1: разбор статьи. Часть 5. DPO.

Описание к видео Llama 3.1: разбор статьи. Часть 5. DPO.

Разбираем статью "The Llama 3 Herd of Models" (2024) со слушателями нашей AI-школы, раздел 4.1.4 Direct Preference Optimization.

Таймкоды:
00:00 Приветствие
01:37 Direct Preference Optimization

Плейлист с разбором Llama 3.1:
   • Llama 3.1:  разбор статьи  

Все видео плейлиста:
1. Intro & Data mix:    • Llama 3.1: разбор статьи. Часть 1.Int...  
2. Model Architecture & Scaling laws:    • Llama 3.1: разбор статьи. Часть 2. Ar...  
3. Pre-training:    • Llama 3.1: разбор статьи. Часть 3. Pr...  
4. Reward modeling & Supervised Fine-tuning:    • Llama 3.1: разбор статьи. Часть 4. Re...  

Телеграм-канал:
https://t.me/razinkov_ai

Список моих открытых курсов по AI на YouTube:
https://t.me/razinkov_ai/622

Предварительная регистрация в следующий поток AI-школы:
https://razinkov.ai/school

Комментарии

Информация по комментариям в разработке