Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis

  • Speech and Audio in the Northeast (SANE)
  • 2024-11-22
  • 371
SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis
  • ok logo

Скачать SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео SANE2024 | Zhiyao Duan - Frontiers of Speech Synthesis

Zhiyao Duan, associate professor in Electrical and Computer Engineering, Computer Science and Data Science at the University of Rochester and co-founder of Violy, presents his work on "Frontiers of Speech Synthesis: Controllability, Expressiveness, and Natural Conversations" at the SANE 2024 workshop at Google, Cambridge, MA, on October 17, 2024.
More info on the SANE workshop series: http://www.saneworkshop.org/

Abstract: Speech synthesis research has made profound progress in the last decade. State-of-the-art text-to-speech and voice conversion systems are able to synthesize speech with high quality that is often indistinguishable from bonafide speech by human ears. However, such systems still lack controllability and expressiveness, and they show limited naturalness in conversational settings. In this talk, I will argue that controllability, expressiveness, and natural conversations are the new frontiers of speech synthesis research. I will present our recent work on these frontiers. Specifically, I will introduce ControlVC, a voice conversion system allowing users to control pitch and speech dynamically; GTR-Voice, our attempt to extend the definition of expressiveness to articulatory phonetics as professional voice actors do; and Parakeet, a system that can synthesize conversational speech with natural pauses, interruptions, and nonverbal events.

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]