Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction)

  • INTERSPEECH2021
  • 2022-01-06
  • 189
Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction)
  • ok logo

Скачать Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction) бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction) или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction) бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction)

Title: Multimodal Speech Summarization through Semantic Concept Learning - (3 minutes introduction)

Authors: Shruti Palaskar (Carnegie Mellon University, USA), Ruslan Salakhutdinov (Carnegie Mellon University, USA), Alan W. Black (Carnegie Mellon University, USA), Florian Metze (Carnegie Mellon University, USA)

Category: Spoken Language Processing I

Abstract: We propose a cascaded multimodal abstractive speech summarization model that generates semantic concepts as an intermediate step towards summarization. We describe a method to leverage existing multimodal dataset annotations to curate groundtruth labels for such intermediate concept modeling. In addition to cascaded training, the concept labels also provide an interpretable intermediate output level that helps improve performance on the downstream summarization task. On the open-domain How2 data, we conduct utterance-level and video-level experiments for two granularities of concepts: Specific and Abstract. We compare various multimodal fusion models for concept generation based on the respective input modalities. We observe consistent improvements in concept modeling by using multimodal adaptation models over unimodal models. Using the cascaded multimodal speech summarization model, we see a significant improvement of 7.5 METEOR points and 5.1 ROUGE-L points compared to previous methods of speech summarization. Finally, we show the benefits of scalability of the proposed approaches on 2000 h of video data.

For more details and PDF version of the paper visit: https://www.isca-speech.org/archive/i...

d01s18t08trim

Комментарии

Информация по комментариям в разработке

Похожие видео

  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]