AI動画投稿ワークフローガイド¶
Issue #103: AIで動画投稿してる人の仕組みを模倣する 対象チャンネル: https://youtube.com/@omoroi-ch 作成日: 2026-03-10
1. 対象チャンネル分析¶
チャンネル概要¶
@omoroi-ch はYouTubeで活動するAI動画投稿チャンネル。 YouTubeの動的レンダリングにより直接スクレイピングでの詳細取得はできなかったが、Web検索およびチャンネルURLの構造から以下を推測:
- ジャンル: 雑学・エンタメ系のAI生成動画(「おもろい」=面白い系コンテンツ)
- 投稿形式: ショート動画 or 5〜15分程度の解説動画
- 制作手法: AI画像生成 + AI音声ナレーション + 自動編集の組み合わせ
AI動画チャンネルの一般的パターン¶
2025〜2026年時点で成功しているAI動画チャンネルの典型的なパターン:
| パターン | 内容例 | 再生回数の傾向 |
|---|---|---|
| 雑学・トリビア | 「知らないと損する雑学」系 | ショートで10万回〜 |
| 怖い話・都市伝説 | ホラーナレーション + AI画像 | 長尺で安定再生 |
| 歴史・偉人解説 | AI画像で歴史人物を描写 | 教育系で長期再生 |
| ニュース解説 | 時事ネタをAI音声で解説 | トレンドに左右 |
| リラクゼーション | AI生成風景 + BGM | 長時間再生で有利 |
| アニメストーリー | AIキャラによるショートドラマ | バイラル性高い |
2. AI動画制作ワークフロー¶
全体フロー¶
1本あたりの所要時間: 約30分〜1時間(慣れれば10〜30分)
Step 1: 企画・ネタ出し¶
ツール: ChatGPT / Claude / Gemini
ポイント: - トレンドキーワードを組み合わせる - 「知らないと損」「実は〇〇だった」系のフックが強い - Google Trends / X(Twitter)トレンドを参考にする
Step 2: 台本作成¶
ツール: ChatGPT(GPT-4o) / Claude
プロンプト例:
「以下の雑学について、YouTubeショート動画用の台本を作成してください。
テーマ: [テーマ]
形式: ナレーション台本(60秒以内)
構成: フック(5秒) → 本題(40秒) → オチ・まとめ(15秒)
口調: カジュアルだが知的」
出力形式を指定すると効率UP: - シーン番号 - ナレーションテキスト - 表示する画像の説明(プロンプト用)
Step 3: 素材生成¶
3-1. 画像生成¶
| ツール | 料金 | 特徴 | 推奨用途 |
|---|---|---|---|
| Stable Diffusion WebUI | 無料(ローカル) | カスタマイズ自由 | メイン画像生成 |
| DALL-E 3 (ChatGPT内蔵) | ChatGPT Plus $20/月 | 手軽、高品質 | サムネイル |
| Midjourney | $10〜30/月 | アート性が高い | 雰囲気重視の画像 |
| Bing Image Creator | 無料 | DALL-E 3ベース | コスト重視 |
| Leonardo.ai | 無料枠150トークン/日 | 多機能、商用OK | バランス型 |
3-2. 動画生成¶
| ツール | 料金 | 特徴 | 無料枠 |
|---|---|---|---|
| Kling AI | 無料〜$9.99/月 | 低コスト、長尺対応 | 66クレジット/日 |
| Sora (OpenAI) | ChatGPT Plus $20/月 | 最高品質 | Plus契約で無制限(720p) |
| Runway Gen-4 | $15〜95/月 | プロ向け、4K対応 | 125クレジット(初回のみ) |
| Pika Labs | 無料〜$8/月 | SNS向けエフェクト | 150クレジット/月 |
| Google Flow (Veo) | 変動 | Google統合 | ベータ |
3-3. 音声生成(ナレーション)¶
| ツール | 料金 | 特徴 | 日本語対応 |
|---|---|---|---|
| VOICEVOX | 完全無料 | キャラクター音声、ローカル動作 | 最強 |
| CoeFont | 無料枠あり | 自然な日本語、商用OK | 優秀 |
| ElevenLabs | 無料枠あり | 多言語対応、声クローン | 対応 |
| 音読さん | 無料〜月額 | ブラウザで手軽 | ネイティブ |
| Style-Bert-VITS2 | 無料(ローカル) | 高品質、カスタム可能 | 優秀 |
3-4. BGM生成¶
| ツール | 料金 | 特徴 |
|---|---|---|
| Suno AI | 無料50クレジット/日 | テキストから音楽生成 |
| Stable Audio | 無料枠あり | ローカル実行可 |
| Udio | 無料枠あり | 高品質 |
| DOVA-SYNDROME | 完全無料 | フリーBGM素材サイト |
| 甘茶の音楽工房 | 完全無料 | フリーBGM素材サイト |
Step 4: 編集・合成¶
| ツール | 料金 | 特徴 |
|---|---|---|
| CapCut | 無料(商用はBusiness版) | AI字幕自動生成、テンプレ豊富 |
| DaVinci Resolve | 無料版あり | プロ級編集、無料で高機能 |
| Filmora | 買い切り or サブスク | AI機能搭載、初心者向け |
| json2video | 10本/月無料 | API連携で自動化可能 |
| FFmpeg | 無料 | CLI、スクリプト自動化向き |
編集の基本フロー: 1. 画像/動画素材をタイムラインに配置 2. ナレーション音声を重ねる 3. 字幕を自動生成(CapCutのAI字幕機能) 4. BGMを追加(音量は-15〜-20dB程度) 5. トランジション、エフェクト追加 6. サムネイル作成 7. 書き出し(1080p推奨、ショートは9:16)
Step 5: 投稿・最適化¶
- タイトル: ChatGPTでCTR最適化されたタイトル案を複数生成
- 説明文: キーワードを含む説明文をAIで生成
- タグ: 関連キーワードを10〜15個設定
- サムネイル: DALL-E 3 or Canva AIで作成
- 投稿時間: 平日18〜21時、土日12〜15時が目安
- AI使用の開示: YouTube Studioで必ずAI生成コンテンツであることを申告
3. 自動化ワークフロー(n8n活用)¶
n8nによる完全自動化パイプライン¶
Google Sheets(ネタ管理)
↓ トリガー: 「要作成」ステータス
ChatGPT API(台本生成)
↓ JSON形式で11シーン出力
Suno AI API(BGM生成)
↓
json2video API(動画合成)
↓ ポーリングで完了待ち
完成通知 → YouTube投稿
構成ツール: | ツール | 役割 | 無料枠 | |--------|------|--------| | n8n | ワークフロー制御 | 5,000実行/月 | | ChatGPT API | 台本・プロンプト生成 | $5クレジット | | Suno AI | BGM生成 | 50クレジット/日 | | json2video | 動画合成 | 10本/月 | | Google Sheets | データ管理 | 無制限 |
初期設定: 20〜30分 生成速度: 1本あたり5〜10分(自動)
4. 収益化の仕組み¶
YouTube収益化の条件¶
| 条件 | 必要値 |
|---|---|
| チャンネル登録者数 | 1,000人以上 |
| 総再生時間(12ヶ月) | 4,000時間以上 |
| または ショート視聴回数(90日) | 1,000万回以上 |
AI動画の収益化における注意点¶
- AI使用の開示が必須: YouTube Studioで「AIが改変・生成したコンテンツ」にチェック
- 「非真正コンテンツ」にならないこと: 単純なスライドショー+読み上げだけではNG
- 付加価値が必要: 独自の解説、編集、構成、視点が求められる
- 著作権の確認: AI生成素材のライセンスを必ず確認
- 実在人物の肖像権: AI生成であっても実在人物の模倣は避ける
収益目安(参考)¶
| 段階 | 登録者 | 月収目安 | 到達期間(AI量産の場合) |
|---|---|---|---|
| 初期 | 〜1,000人 | 0円 | 1〜3ヶ月 |
| 収益化開始 | 1,000〜5,000人 | 1〜5万円 | 3〜6ヶ月 |
| 成長期 | 5,000〜1万人 | 5〜15万円 | 6〜12ヶ月 |
| 安定期 | 1万〜5万人 | 15〜50万円 | 12ヶ月〜 |
※ジャンル、投稿頻度、再生単価により大幅に変動
5. コスト分析¶
最小構成(ほぼ無料)¶
| 項目 | ツール | 月額 |
|---|---|---|
| 台本 | ChatGPT無料版 / Claude無料版 | 0円 |
| 画像 | Stable Diffusion WebUI(ローカル) | 0円(電気代のみ) |
| 動画化 | Kling AI無料枠 | 0円 |
| 音声 | VOICEVOX | 0円 |
| BGM | DOVA-SYNDROME / Suno AI無料枠 | 0円 |
| 編集 | CapCut / DaVinci Resolve | 0円 |
| 合計 | 0円 |
推奨構成(月1〜2万円)¶
| 項目 | ツール | 月額 |
|---|---|---|
| 台本 | ChatGPT Plus | $20(約3,000円) |
| 画像 | SD WebUI + Sora(Plus内) | 0円(Plus内) |
| 動画化 | Sora(Plus内)+ Kling AI Standard | $10(約1,500円) |
| 音声 | VOICEVOX + CoeFont | 0〜1,000円 |
| BGM | Suno AI + フリー素材 | 0円 |
| 編集 | CapCut Business | 0円 |
| 自動化 | n8n無料枠 | 0円 |
| 合計 | 約5,000〜6,000円 |
プロ構成(月3〜5万円)¶
| 項目 | ツール | 月額 |
|---|---|---|
| 台本 | ChatGPT Pro | $200(約30,000円) |
| 画像 | Midjourney + SD WebUI | $30(約4,500円) |
| 動画化 | Runway Gen-4 Pro | $35(約5,000円) |
| 音声 | ElevenLabs | $5〜(約750円) |
| BGM | Suno AI Pro | $10(約1,500円) |
| 編集 | DaVinci Resolve | 0円 |
| 合計 | 約42,000円 |
6. MyLabの既存資産との連携案¶
現在利用可能なリソース¶
MyLabには既にAI画像生成に関するインフラが整備されている:
| 資産 | パス / 設定 | 活用方法 |
|---|---|---|
| SD WebUI | D:/Kazuma_Teramachi/kaz_dev_stable-diffusion-webui/ | メイン画像生成エンジン |
| SD WebUI API | http://127.0.0.1:7860 | 自動化パイプラインの画像生成API |
| ai-manga-pipeline | projects/ai-manga-pipeline/ | 画像生成→評価→改善ループを動画用に転用 |
| prompt-library | SD WebUI内 | 蓄積済みプロンプトを動画素材生成に活用 |
| Gemini API | Credentials/google/gemini_api.json | 台本生成、品質評価に活用 |
| n8n的自動化知識 | docs内の情報蓄積 | ワークフロー自動化に応用 |
連携パイプライン案¶
[企画フェーズ]
Gemini API / ChatGPT API
→ 台本JSON生成(シーン分割 + 画像プロンプト + ナレーション)
[素材生成フェーズ]
SD WebUI API (既存インフラ)
→ 各シーンの画像を自動生成
→ ai-manga-pipeline の評価ループで品質担保
VOICEVOX (ローカル)
→ ナレーション音声生成
Suno AI / Stable Audio
→ BGM生成
[動画化フェーズ]
FFmpeg (Python subprocess)
→ 画像 + 音声 + BGM を自動合成
→ 字幕焼き込み(SRT → ASS変換)
or json2video API
→ クラウドで動画合成
[投稿フェーズ]
YouTube Data API v3
→ 自動アップロード + メタデータ設定
具体的な拡張ステップ¶
Phase 1: 手動制作で検証(1〜2週間)¶
- ChatGPT/Claudeで台本作成
- SD WebUIで画像生成(既存環境を使用)
- VOICEVOXでナレーション生成
- CapCutで手動編集
- 5〜10本投稿してデータ収集
Phase 2: 半自動化(2〜4週間)¶
ai-manga-pipelineを拡張して動画用画像一括生成スクリプト作成- VOICEVOX APIで音声生成を自動化
- FFmpegで画像+音声+BGMの合成をスクリプト化
- 台本テンプレートの標準化
Phase 3: 完全自動化(1〜2ヶ月)¶
- 台本生成 → 素材生成 → 編集 → 投稿の全パイプライン構築
- n8n or Python スケジューラーで定期実行
- YouTube Data API v3 による自動投稿
- Discord Botで生成通知(既存Bot基盤を活用)
SD WebUIでの動画生成拡張¶
既存のSD WebUI環境に以下の拡張機能を追加することで、動画素材の生成が可能:
| 拡張機能 | 用途 | 備考 |
|---|---|---|
| AnimateDiff | テキストから短い動画生成 | モーションモジュール追加が必要 |
| Deforum | カメラワーク付きアニメーション | パラパラ漫画方式 |
| Stable Video Diffusion | 画像から動画生成(img2vid) | 高VRAM要求(12GB+) |
| ControlNet | ポーズ・構図制御 | 既存の画像生成精度を向上 |
| Vid2Vid | 既存動画のスタイル変換 | リアル→アニメ変換等 |
7. 推奨ジャンルとコンテンツ戦略¶
AI動画と相性の良いジャンル¶
| ジャンル | 難易度 | 収益性 | AI適性 | 理由 |
|---|---|---|---|---|
| 雑学・トリビア | 低 | 中 | 高 | テンプレ化しやすい、ネタ無限 |
| 怖い話・都市伝説 | 低 | 中〜高 | 高 | AI画像の不気味さが武器に |
| 歴史解説 | 中 | 中〜高 | 高 | 教育系は長期再生される |
| 睡眠・リラクゼーション | 低 | 高 | 高 | 長時間再生=再生時間稼ぎやすい |
| 海外向けコンテンツ | 中 | 高 | 中 | 再生単価が日本語の約2倍 |
投稿頻度の目安¶
- ショート動画: 毎日1〜3本(量産可能)
- 長尺動画(10〜15分): 週2〜3本
- 混合戦略: ショートで認知獲得 → 長尺で再生時間稼ぎ