Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть Quantization in LLM to Trinary State

  • Stephen Blum
  • 2024-08-20
  • 564
Quantization in LLM to Trinary State
computingefficiencyinnovation
  • ok logo

Скачать Quantization in LLM to Trinary State бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно Quantization in LLM to Trinary State или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку Quantization in LLM to Trinary State бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео Quantization in LLM to Trinary State

We take a 16-bit floating point number, convert it to a one-bit integer by rounding to the nearest whole number. This makes computation faster, requires less hardware, uses less energy, and speeds up the process. This process is called quantization, which is basically rounding to the nearest data point.

When they say 1.58 bits, it means using three states: negative one, zero, and one. Using just one bit gives us only zero and one. With two bits, we can include a sign, allowing a negative number, but we ignore the fourth state.

So, in hardware, we use two bits, but in software, the algorithm uses three states. This lets us convert floating-point numbers into a matrix of, 1, 0, and 1, making it easier to add matrices instead of multiplying them. This keeps the quality of the output close to the full precision model while reducing cost, latency, speed, and energy.

It works, but they mention needing new hardware to better handle the trinary state, which does sound like a bit of a cheat, though it makes sense. The math is still correct, and the benefits are real as we get a net gain by using this method.

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]