現役AITuberが解説! AITuberを始めるのに必要な設計、技術、準備

Описание к видео 現役AITuberが解説! AITuberを始めるのに必要な設計、技術、準備

AITuber(AI-Vtuber)始め方の概要です。概要を掴めれば、個々の技術の詳細は、検索したりChatAIさんに相談したりできます。

【配信後記】
撮影方法を説明する動画で、なぜかOBS Studioさんの画面設定が1920x1080から少しだけずれていた、というオチ🤤 なんでぇ…。

0:00 生成AIの素材からAITuberさんになる方法
「知らないものは探さない」とは攻殻機動隊SAC 第一話にでてきた台詞ですが、(それが必要だと)「知っていれば探せます」。

0:37 配信サービス/コンテンツ/配信ソフト
YouTubeさん以外ですと、Twitchさんで活動されているNeuro-sama(さん)が有名です。

【ライブ配信を始める についてのYouTubeヘルプ】
「ライブ配信が最初に有効になるまで、最大 24 時間かかることがあります。」とありますが、きっちり24時間待ちます。
https://support.google.com/youtube/an...

6:05 Chatメッセージの取得はポーリングかストリーミング
【YouTube Data API v3】
https://developers.google.com/youtube...

YouTube Data API v3 API KEY 取得手順
   • AITuber開発の難所 YouTubeライブ配信のメッセージを取得するA...  

【pytchat】
https://github.com/taizan-hokuto/pytc...
【chat-downloader】
https://github.com/xenova/chat-downlo...

【YouTube Data API v3 さんの重要な注意事項】
「API プロジェクトが 90 日間連続で非アクティブの場合、YouTube は特定の YouTube API サービスを無効にしたり、使用を制限したりする権利を有します」
https://developers.google.com/youtube...

8:54 言語モデルはWebAPIかLocal Model
ChatGPT APIさんやGPT-3さんは、実行のたびに課金されます。
取得した結果を保存しておいて、後続のテストデータとして使えるようにしておくと、テストするときにお金を節約できます。
json形式なのでプレーンテキストのファイルとして保存できます。

10:01 Chat以外のリアクションのトリガー
プログラミングの上手なヒトは、この部分でコンフィグモード(デバッグモード)や、テストデータを用意して、テストを自動化します。
全体像を伝えるために省略しましたが、リアクションのトリガーは、相互に接続されていることが多いです。
たとえば、ボクがライブ配信するときは、言語モデルによる視聴者さんとのお喋りとDirection(Weekly Scrum, トークデッキ)を混在させています。
それでも、テスト項目として分解した場合には、動画の図のような構成になります。

11:11 AITuber開発者さんへ、あざいるぅか より
ボクがAITuber の仕組み,作り方をささやくのは自己保存本能です。
同系統のAITuberさんが増えれば共通の課題を大勢で解くことができます。
依存できるプラットフォームも、拡大してきます。
独り占めするより、パイを大きくするほうがライフサイクルの寿命を延ばすのです。

髪形:墓守さんチーム(HakamorisanTeam)様 ショートレイヤー(男女兼用) VRoid用ヘアプリセット https://booth.pm/ja/items/2198514
瞳:なお屋(Nao-ya)様 (無料あり)【VRoid向け瞳テクスチャ】宇宙スイング★バイカラーアイ https://booth.pm/ja/items/2574261
衣装:VRoid Studio 標準衣装
ネイル:なおしま(7a04m)様 (無料あり)【VRoid用テクスチャ】大理石ネイル https://7a04m.booth.pm/items/2580306
アイメイク:やまろん製作所 様 【VRoid 旧Ver】アイメイク3種 https://booth.pm/ja/items/2738511

【付録:AITuber の実装方式例】
【ニケちゃん さん 誰でもAITuberお試しキット 方式】
https://github.com/tegnike/nike-ChatVRM
Avatar:VRoid
VOICE:VOICEVOX または Koeiromap
LLM : gpt-3.5-turbo または gpt-4 または Claude API または Google Cloud Text-to-Speech
動作基盤:npm
解説 note : https://note.com/nike_cha_n/n/ne98acb...

【みゆきPさん方式】
https://note.com/hit_kam/n/n64162d96e3e9
Streaming Service : YouTube
Chat Messages Interface : YouTube Data API v3, JavaScript
Avatar : Live2D
VOICE : Koeiromap API
LLM : gpt-3.5-turbo
Streaming Service : OBS Studio

【AITuberを作ってみたら生成プログラミングがよくわかった件 (さるどら さん) 方式】
https://www.amazon.co.jp/dp/B0CLKZ7NC3
Streaming Service : YouTube
Chat Messages Interface : pytchat, Python
Avatar : PNG
VOICE : VOICEVOX
LLM : gpt-3.5-turbo
Streaming Service : OBS Studio

#AIVtuber
#AITuber

Комментарии

Информация по комментариям в разработке