Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть GTC 2021: Systematic Neural Network Quantization

  • Amir Gholaminejad
  • 2021-04-26
  • 3247
GTC 2021: Systematic Neural Network Quantization
quantizationneural network quantizationpruningneural network pruningsecond-order methodscompressionneural networksdistillationefficient neural networks
  • ok logo

Скачать GTC 2021: Systematic Neural Network Quantization бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно GTC 2021: Systematic Neural Network Quantization или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку GTC 2021: Systematic Neural Network Quantization бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео GTC 2021: Systematic Neural Network Quantization

An important next milestone in machine learning is to bring intelligence at the edge without relying on the computational power of the cloud. This could lead to more reliable, lower latency, and privacy preserving AI for a wide range of applications. However, state-of-the-art NN models often require prohibitive amounts of compute, memory, and energy resources for edge deployment. To address these challenges, I will present our latest work on hardware-aware quantization that achieve optimal tradeoff between accuracy, latency, and model size. In particular, I will discuss HAWQV3, which is a new second-order quantization method where the entire inference can be performed with integer-only arithmetic and without any floating point operations.

Related papers are:
A survey of quantization methods for efficient neural network inference. arXiv preprint arXiv:2103.13630.

HAWQV3: Dyadic neural network quantization. ICML, 2021.

-HAWQ-V2: Hessian aware trace-weighted quantization of neural networks. NeurIPS, 2020.

HAWQ: Hessian AWare quantization of neural networks with mixed-precision. ICCV, 2019.

I-BERT: Integer-only BERT quantization. ICML, 2021.

Q-BERT: Hessian based ultra low precision quantization of BERT. AAAI, 2020.

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]