Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt

  • Anyscale
  • 2020-10-03
  • 217
EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt
  • ok logo

Скачать EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt

EfficientBERT: Trading off Model Size and Performance - Meghana Ravikumar, SigOpt

"With the publication of BERT, transfer learning was suddenly accessible for NLP, unlocking a plethora of model zoos and boosting performances for domain specific problems. Although BERT has accelerated many modeling efforts, its size is limiting. In this talk, we will explore how to reduce the size of BERT while retaining its capacity in the context of English Question Answering tasks. We’ll show how scalable hyperparameter optimization can help you tackle difficult modeling problems, draw insights, and make informed decisions.

Our approach encompasses fine-tuning, distillation, architecture search, and hyperparameter optimization at scale. First, we fine-tune BERT on SQUAD 2.0 (our teacher model) and use distillation to compress fine-tuned BERT to a smaller model (our student model). Then, combining SigOpt and Ray, we use multimetric Bayesian optimization at scale to find the optimal architecture for the student model. Finally, we explore the trade-offs of our hyperparameter decisions to draw insights for our student model’s architecture."

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]