AI動画投稿ワークフローガイド¶

Issue #103: AIで動画投稿してる人の仕組みを模倣する対象チャンネル: https://youtube.com/@omoroi-ch 作成日: 2026-03-10

1. 対象チャンネル分析¶

チャンネル概要¶

@omoroi-ch はYouTubeで活動するAI動画投稿チャンネル。 YouTubeの動的レンダリングにより直接スクレイピングでの詳細取得はできなかったが、Web検索およびチャンネルURLの構造から以下を推測:

ジャンル: 雑学・エンタメ系のAI生成動画（「おもろい」=面白い系コンテンツ）
投稿形式: ショート動画 or 5〜15分程度の解説動画
制作手法: AI画像生成 + AI音声ナレーション + 自動編集の組み合わせ

AI動画チャンネルの一般的パターン¶

2025〜2026年時点で成功しているAI動画チャンネルの典型的なパターン:

パターン	内容例	再生回数の傾向
雑学・トリビア	「知らないと損する雑学」系	ショートで10万回〜
怖い話・都市伝説	ホラーナレーション + AI画像	長尺で安定再生
歴史・偉人解説	AI画像で歴史人物を描写	教育系で長期再生
ニュース解説	時事ネタをAI音声で解説	トレンドに左右
リラクゼーション	AI生成風景 + BGM	長時間再生で有利
アニメストーリー	AIキャラによるショートドラマ	バイラル性高い

2. AI動画制作ワークフロー¶

全体フロー¶

企画・ネタ出し → 台本作成 → 素材生成 → 編集・合成 → 投稿・最適化
   (5分)        (5〜10分)    (10〜20分)    (10〜20分)     (5分)

1本あたりの所要時間: 約30分〜1時間（慣れれば10〜30分）

Step 1: 企画・ネタ出し¶

ツール: ChatGPT / Claude / Gemini

プロンプト例:
「YouTubeショート動画のネタを10個提案してください。
ジャンル: 雑学・トリビア
ターゲット: 20〜30代
条件: 意外性があり、30秒〜60秒で伝えられるもの」

ポイント: - トレンドキーワードを組み合わせる - 「知らないと損」「実は〇〇だった」系のフックが強い - Google Trends / X(Twitter)トレンドを参考にする

Step 2: 台本作成¶

ツール: ChatGPT（GPT-4o） / Claude

プロンプト例:
「以下の雑学について、YouTubeショート動画用の台本を作成してください。
テーマ: [テーマ]
形式: ナレーション台本（60秒以内）
構成: フック(5秒) → 本題(40秒) → オチ・まとめ(15秒)
口調: カジュアルだが知的」

出力形式を指定すると効率UP: - シーン番号 - ナレーションテキスト - 表示する画像の説明（プロンプト用）

Step 3: 素材生成¶

3-1. 画像生成¶

ツール	料金	特徴	推奨用途
Stable Diffusion WebUI	無料（ローカル）	カスタマイズ自由	メイン画像生成
DALL-E 3 (ChatGPT内蔵)	ChatGPT Plus $20/月	手軽、高品質	サムネイル
Midjourney	$10〜30/月	アート性が高い	雰囲気重視の画像
Bing Image Creator	無料	DALL-E 3ベース	コスト重視
Leonardo.ai	無料枠150トークン/日	多機能、商用OK	バランス型

3-2. 動画生成¶

ツール	料金	特徴	無料枠
Kling AI	無料〜$9.99/月	低コスト、長尺対応	66クレジット/日
Sora (OpenAI)	ChatGPT Plus $20/月	最高品質	Plus契約で無制限(720p)
Runway Gen-4	$15〜95/月	プロ向け、4K対応	125クレジット(初回のみ)
Pika Labs	無料〜$8/月	SNS向けエフェクト	150クレジット/月
Google Flow (Veo)	変動	Google統合	ベータ

3-3. 音声生成（ナレーション）¶

ツール	料金	特徴	日本語対応
VOICEVOX	完全無料	キャラクター音声、ローカル動作	最強
CoeFont	無料枠あり	自然な日本語、商用OK	優秀
ElevenLabs	無料枠あり	多言語対応、声クローン	対応
音読さん	無料〜月額	ブラウザで手軽	ネイティブ
Style-Bert-VITS2	無料（ローカル）	高品質、カスタム可能	優秀

3-4. BGM生成¶

ツール	料金	特徴
Suno AI	無料50クレジット/日	テキストから音楽生成
Stable Audio	無料枠あり	ローカル実行可
Udio	無料枠あり	高品質
DOVA-SYNDROME	完全無料	フリーBGM素材サイト
甘茶の音楽工房	完全無料	フリーBGM素材サイト

Step 4: 編集・合成¶

ツール	料金	特徴
CapCut	無料（商用はBusiness版）	AI字幕自動生成、テンプレ豊富
DaVinci Resolve	無料版あり	プロ級編集、無料で高機能
Filmora	買い切り or サブスク	AI機能搭載、初心者向け
json2video	10本/月無料	API連携で自動化可能
FFmpeg	無料	CLI、スクリプト自動化向き

編集の基本フロー: 1. 画像/動画素材をタイムラインに配置 2. ナレーション音声を重ねる 3. 字幕を自動生成（CapCutのAI字幕機能） 4. BGMを追加（音量は-15〜-20dB程度） 5. トランジション、エフェクト追加 6. サムネイル作成 7. 書き出し（1080p推奨、ショートは9:16）

Step 5: 投稿・最適化¶

タイトル: ChatGPTでCTR最適化されたタイトル案を複数生成
説明文: キーワードを含む説明文をAIで生成
タグ: 関連キーワードを10〜15個設定
サムネイル: DALL-E 3 or Canva AIで作成
投稿時間: 平日18〜21時、土日12〜15時が目安
AI使用の開示: YouTube Studioで必ずAI生成コンテンツであることを申告

3. 自動化ワークフロー（n8n活用）¶

n8nによる完全自動化パイプライン¶

Google Sheets（ネタ管理）
    ↓ トリガー: 「要作成」ステータス
ChatGPT API（台本生成）
    ↓ JSON形式で11シーン出力
Suno AI API（BGM生成）
    ↓
json2video API（動画合成）
    ↓ ポーリングで完了待ち
完成通知 → YouTube投稿

構成ツール: | ツール | 役割 | 無料枠 | |--------|------|--------| | n8n | ワークフロー制御 | 5,000実行/月 | | ChatGPT API | 台本・プロンプト生成 | $5クレジット | | Suno AI | BGM生成 | 50クレジット/日 | | json2video | 動画合成 | 10本/月 | | Google Sheets | データ管理 | 無制限 |

初期設定: 20〜30分 生成速度: 1本あたり5〜10分（自動）

4. 収益化の仕組み¶

YouTube収益化の条件¶

条件	必要値
チャンネル登録者数	1,000人以上
総再生時間（12ヶ月）	4,000時間以上
またはショート視聴回数（90日）	1,000万回以上

AI動画の収益化における注意点¶

AI使用の開示が必須: YouTube Studioで「AIが改変・生成したコンテンツ」にチェック
「非真正コンテンツ」にならないこと: 単純なスライドショー+読み上げだけではNG
付加価値が必要: 独自の解説、編集、構成、視点が求められる
著作権の確認: AI生成素材のライセンスを必ず確認
実在人物の肖像権: AI生成であっても実在人物の模倣は避ける

収益目安（参考）¶

段階	登録者	月収目安	到達期間（AI量産の場合）
初期	〜1,000人	0円	1〜3ヶ月
収益化開始	1,000〜5,000人	1〜5万円	3〜6ヶ月
成長期	5,000〜1万人	5〜15万円	6〜12ヶ月
安定期	1万〜5万人	15〜50万円	12ヶ月〜

※ジャンル、投稿頻度、再生単価により大幅に変動

5. コスト分析¶

最小構成（ほぼ無料）¶

項目	ツール	月額
台本	ChatGPT無料版 / Claude無料版	0円
画像	Stable Diffusion WebUI（ローカル）	0円（電気代のみ）
動画化	Kling AI無料枠	0円
音声	VOICEVOX	0円
BGM	DOVA-SYNDROME / Suno AI無料枠	0円
編集	CapCut / DaVinci Resolve	0円
合計		0円

推奨構成（月1〜2万円）¶

項目	ツール	月額
台本	ChatGPT Plus	$20（約3,000円）
画像	SD WebUI + Sora（Plus内）	0円（Plus内）
動画化	Sora（Plus内）+ Kling AI Standard	$10（約1,500円）
音声	VOICEVOX + CoeFont	0〜1,000円
BGM	Suno AI + フリー素材	0円
編集	CapCut Business	0円
自動化	n8n無料枠	0円
合計		約5,000〜6,000円

プロ構成（月3〜5万円）¶

項目	ツール	月額
台本	ChatGPT Pro	$200（約30,000円）
画像	Midjourney + SD WebUI	$30（約4,500円）
動画化	Runway Gen-4 Pro	$35（約5,000円）
音声	ElevenLabs	$5〜（約750円）
BGM	Suno AI Pro	$10（約1,500円）
編集	DaVinci Resolve	0円
合計		約42,000円

6. MyLabの既存資産との連携案¶

現在利用可能なリソース¶

MyLabには既にAI画像生成に関するインフラが整備されている:

資産	パス / 設定	活用方法
SD WebUI	`D:/Kazuma_Teramachi/kaz_dev_stable-diffusion-webui/`	メイン画像生成エンジン
SD WebUI API	`http://127.0.0.1:7860`	自動化パイプラインの画像生成API
ai-manga-pipeline	`projects/ai-manga-pipeline/`	画像生成→評価→改善ループを動画用に転用
prompt-library	SD WebUI内	蓄積済みプロンプトを動画素材生成に活用
Gemini API	`Credentials/google/gemini_api.json`	台本生成、品質評価に活用
n8n的自動化知識	docs内の情報蓄積	ワークフロー自動化に応用

連携パイプライン案¶

[企画フェーズ]
  Gemini API / ChatGPT API
    → 台本JSON生成（シーン分割 + 画像プロンプト + ナレーション）

[素材生成フェーズ]
  SD WebUI API (既存インフラ)
    → 各シーンの画像を自動生成
    → ai-manga-pipeline の評価ループで品質担保
  VOICEVOX (ローカル)
    → ナレーション音声生成
  Suno AI / Stable Audio
    → BGM生成

[動画化フェーズ]
  FFmpeg (Python subprocess)
    → 画像 + 音声 + BGM を自動合成
    → 字幕焼き込み（SRT → ASS変換）
  or json2video API
    → クラウドで動画合成

[投稿フェーズ]
  YouTube Data API v3
    → 自動アップロード + メタデータ設定

具体的な拡張ステップ¶

Phase 1: 手動制作で検証（1〜2週間）¶

ChatGPT/Claudeで台本作成
SD WebUIで画像生成（既存環境を使用）
VOICEVOXでナレーション生成
CapCutで手動編集
5〜10本投稿してデータ収集

Phase 2: 半自動化（2〜4週間）¶

ai-manga-pipeline を拡張して動画用画像一括生成スクリプト作成
VOICEVOX APIで音声生成を自動化
FFmpegで画像+音声+BGMの合成をスクリプト化
台本テンプレートの標準化

Phase 3: 完全自動化（1〜2ヶ月）¶

台本生成 → 素材生成 → 編集 → 投稿の全パイプライン構築
n8n or Python スケジューラーで定期実行
YouTube Data API v3 による自動投稿
Discord Botで生成通知（既存Bot基盤を活用）

SD WebUIでの動画生成拡張¶

既存のSD WebUI環境に以下の拡張機能を追加することで、動画素材の生成が可能:

拡張機能	用途	備考
AnimateDiff	テキストから短い動画生成	モーションモジュール追加が必要
Deforum	カメラワーク付きアニメーション	パラパラ漫画方式
Stable Video Diffusion	画像から動画生成(img2vid)	高VRAM要求(12GB+)
ControlNet	ポーズ・構図制御	既存の画像生成精度を向上
Vid2Vid	既存動画のスタイル変換	リアル→アニメ変換等

7. 推奨ジャンルとコンテンツ戦略¶

AI動画と相性の良いジャンル¶

ジャンル	難易度	収益性	AI適性	理由
雑学・トリビア	低	中	高	テンプレ化しやすい、ネタ無限
怖い話・都市伝説	低	中〜高	高	AI画像の不気味さが武器に
歴史解説	中	中〜高	高	教育系は長期再生される
睡眠・リラクゼーション	低	高	高	長時間再生=再生時間稼ぎやすい
海外向けコンテンツ	中	高	中	再生単価が日本語の約2倍

投稿頻度の目安¶

ショート動画: 毎日1〜3本（量産可能）
長尺動画（10〜15分）: 週2〜3本
混合戦略: ショートで認知獲得 → 長尺で再生時間稼ぎ