Давайте будем честны: записывать озвучку для слайдов — это настоящая пытка. Вы запинаетесь, качество нестабильная, а пересъёмка занимает целую вечность. С другой стороны, большинство стандартных инструментов для преобразования текста в речь на базе ИИ по-прежнему кажутся совершенно роботизированными и бездушными.
В этом видео я показываю вам мощный рабочий процесс, который, пожалуй, лучше платных инструментов, таких как ElevenLabs, и он абсолютно бесплатный. Используя Gemini и Google AI Studio, мы можем «управлять» ИИ дыханием, паузами и акцентированием слов, как профессиональный актёр озвучивания.
Мы не просто генерируем текст; мы создаём «режиссёрский сценарий» с метаданными, которые точно указывают ИИ, как говорить.
В этом видео вы узнаете:
✅ Как заставить Gemini генерировать сценарий с «сценическими указаниями» (заданиями тональности и темпа).
✅ Как настроить рабочий процесс «Мозг и тело» в Google AI Studio. ✅ Почему Gemini 2.5 Pro Preview — лучшая модель для детальной речи.
✅ Как добиться профессиональных результатов без микрофона.
✅ Бонус для разработчиков: как использовать код Python/Apps Script для автоматизации этого процесса.
🎥 Смотрите далее:
1️⃣ Как я создавал слайды: • Gemini Can NOW Create Google Slides! (Full...
2️⃣ Как добавить аудио в Google Презентации (автовоспроизведение): • Make Google Slides SING! ✨ Add & Control A...
⌚ Временные метки:
00:00 — Проблема с записью закадрового голоса
00:55 — Шаг 1: Создание «режиссёрского сценария» в Gemini
01:57 — Секретная подсказка для сценических указаний
03:18 — Шаг 2: Настройка Google AI Studio
04:08 — Выбор правильной модели (Gemini 2.5 Pro)
05:03 — Рабочий процесс «Мозг и тело»
06:22 — Выбор идеального голоса (Enceladus)
06:56 — Совет разработчикам: автоматизация с помощью Код
07:39 — Результат: Прослушивание финальной аудиозаписи
08:47 — Дальнейшие шаги: Добавление аудио к слайдам
🚚 Ресурсы: Подсказка, использованная в этом видео:
Выступите в роли эксперта по озвучиванию и преобразуйте предоставленный контент презентации в отточенный, готовый к записи текст. Пожалуйста, организуйте заметки докладчика последовательно для каждого слайда, чтобы создать связный текст, убедившись, что конечный вывод правильно отформатирован в Markdown для удобства копирования и вставки. Для структуры используйте чёткий разделитель между слайдами, кратко опишите визуальный контекст курсивом (чтобы диктор понимал, что происходит на экране), а затем представьте устный текст непосредственно под ним.
Важно, что вы должны вставлять подробные инструкции по выступлению по всему тексту строго в [квадратных скобках]. Эти подсказки должны быть подробными и охватывать конкретный тон и энергетику (например, [Теплый и гостеприимный], [Серьёзный и авторитетный]), точный темп речи с указанием длительности пауз (например, [Пауза 1 с], [Замедлить]) и указания по интонации. Кроме того, пожалуйста, выделяйте жирным шрифтом конкретные слова в устном тексте, требующие акцента, чтобы диктор мог сразу же визуализировать акцентные моменты.
После завершения сценария предоставьте в конце краткое «Руководство по стилю для дикторов». В этом разделе следует описать образ персонажа, предполагаемую аудиторию и то, как именно следует интерпретировать выделенные скобками подсказки и текст. Убедитесь, что весь ответ не содержит речевых наполнителей или цитат. Предоставьте только сценарий и руководство.
#GoogleAIStudio #Gemini #AIVoiceover #TextToSpeech #ElevenLabsAlternative #FreeAI #TechTutorial #ContentCreation #Productivity
Музыка из #Uppbeat
https://uppbeat.io/t/blue-wednesday/l...
Информация по комментариям в разработке