Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper

Скачать Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

Cкачать музыку Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper

In this talk we present how we trained a 530B parameter language model on a DGX SuperPOD with over 3,000 A100 GPUs and a high speed Infiniband interconnect, and how we can scale to even larger models. We explore three types of parallelism: data, tensor, and pipeline and how these different types can be composed to achieve maximum efficiency. Our approach allows us to perform training iterations on a model with 1 trillion parameters at 502 petaFLOP/s on 3072 GPUs (per-GPU throughput of 52% of theoretical peak). We discuss challenges that we faced when training the 530B Megatron-Turing NLG model and give practical advice on how to successfully train very large language models.

Комментарии

Информация по комментариям в разработке

Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper

Скачать Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper бесплатно в качестве 4к (2к / 1080p)

Cкачать музыку Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper бесплатно в формате MP3:

Описание к видео Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM | Jared Casper

Похожие видео