インタビュー音声データを3分で記事化 & ポッドキャスト音声まで自動生成する驚愕AI活用術¶
- URL: https://www.youtube.com/watch?v=ba2rgTfSSUg
- 文字起こし日: 2026-02-24 02:56
内容概要¶
- ベストなプロンプトを使うとインタビュー音声データから3分で記事化が可能。
- 2025年5月のGoogle I/Oで発表された新機能、ジェネレートスピーチを活用。
- OMT(オーマイティーズ)では仲間を積極的に募集している。
- まずは音声データを文字起こしし、Geminiでインタビュー記事を作成。
- Geminiにアクセスし、文字起こしデータと指示書をもとにインタビュー記事を生成。
- プロンプトはOmaity's用になっているため、適宜編集が必要。
- ミッション・ビジョン・バリューを明示すると、記事がそれらに偏りやすくなる点に注意。
- より制度を上げるために、社員のインタビューでは職務経歴書も参考にすると良い。
- Geminiを使ってエクスポートする際、ボタンを押すとGoogleドキュメントにエクスポートできる。
- ジェネレートスピーチ機能を使い、テキストデータを音声データ化する。
文字起こし¶
ベストなプロンプトができました。正直もう出すかどうか迷った動画なんですけれども、ぜひ皆さん活用していただきたいな、このプロンプトは最強です。皆さんこんにちは。OMTの西野です。今日はですね、インタビューの音声データからたった3分で、もうそのまま公開できるんじゃないかなというぐらいの対談記事の作成の仕方。そして、2025年の5月のGoogle I/O、Googleの年次の開発者イベントで発表された新機能、ジェネレートスピーチを使ってオーナーズラジオ山本大地さんをお迎えしています。 よろしくお願いします。 OMTってどんな会社なんだろう? 未来のシカ体験を生み出すというミッションを掲げています。 こんな感じの疑似的な対談音声の作り方までご紹介します。これはですね、正直もう出すかどうか迷ったぐらいの動画なんですけれども、これはぜひ皆さん活用していただきたいなと思ったので、そのやり方をもう徹底的に0から解説しますので、ぜひ最後までご覧ください。このチャンネルでは、僕が見つけたOなAIの活用方法ガジェット毎日配信してますのでチャンネル登録をよろしくお願いします。それでは行ってみましょう。
OMTでは仲間を積極的に募集してます。で、仲間ももちろん誰でもいいというわけじゃなくて、ミッション、ビジョン、バリュー、OMTのカルチャーに共感していただく方に入っていただきたいと思っております。で、そのためにも自社のカルチャーですとか、中の様子ですとか、目指してる世界っていうのをしっかり発信していく必要があると思っておりまして、そのために今OMTではメンバーのインタビューですとか、ま、そういったような動画記事、中のコンテンツっていうのをどんどんどんどん発信を強化しようと。なので、積極的に僕もこれまで少し控えてたんですけども、これからですね、積極的にメディアに出演させていただけたりですとか、そういったことを頑張っていきます。で、今日も早速1件メディアの取材を頂いたり、あとは密着動画のためのヒアリングインタビューみたいなものも今やっております。で、ふと思ったのがですね、そういった時のインタビューの音声データをですね、世の中に出すって考えた時にインタビュー自体は1時間とかで終わるじゃないですか。結構何問も質問できたりとかするんですけど、そっからじゃ世の中に出せるクオリティのものにいい感じで編集するというのが大変だったと思うんですよ。ということでこれ何とかできないかなというので、さっき色々ジェミナイ使ったりとかやってたらですね、もうベストなプロンプトができましたし、こんな感じでですね、これ1発で出てきたものなんですけど、1発でこのクオリティが出せるっていうプロンプトができたので、それをちょっと皆さんにぜひこんな感じで創ったっていうのをお見せしたいなと思っております。で、さらにこの動画撮ってるのが、5月23日の1時前なので、実質22日ですと。で、その前の日がですね、Google I/O、Googleの年に1回の開発者イベント、いろんな新機能とか新しいサービスのローンチ発表っていうのがありました。そのイベントで出てた機能っていうのも使うとこういう風に輪切り分化された文章データから複数の話者の音声データを作成できるみたいな、そんな機能も利用可能にもうすでに日本語で対応になってましたので、その機能を使うとOMTは未来のシカ体験を生み出すというミッションを掲げています。 OMTにジョインされるまでのキャリアも非常にユニークだと伺いました。 こんな感じで、あたかもパーソナリティとゲストみたいな感じで、そんな番組まで作れる。そこまで今日はもうこの1本でお伝えします。
はい、じゃあ早速やってみましょう。ステップは3つです。1個目がまずは音声データを文字起こしするというステップ。2つ目がジェミナイでインタビュー記事を作成するというステップ。で、3つ目がそのインタビュー記事をポッドキャスト風の番組にするという。この3つの手順になります。なのでもうインタビュー記事だけでいいよという方はもう2ステップですので、めちゃくちゃ簡単です。まずはですね、用意するものとしてはもう1個だけです。音声データですね。対談でもいいですしインタビューの音声データ。これを用意してください。ま、これはですね、もうおすすめは気軽にメンバー同士でもいいと思いますし、1時間ぐらいどんどんもう質問していくっていう形で大丈夫です。とにかくそういったデータを用意してくださいと。まず用意するものとしてはそれだけです。じゃ、こっから実際にパソコンを使った作業になります。では、まずは文字起こしですけれども、いくつか色んなツールありますし、この後ちらっと出てくる以前動画でも紹介したAIスタジオで文字起こしすることもできるんですけれども、一定長い音声データだと、なんかフリーズすることもあったので、僕は個人的にはこのグラディアという文字起こしツールを気に入って使っています。ま、これは正直いろんな今ものが有ると思うので、これじゃなくてもいいと思いますが、グラディアを一応おすすめしておきますと。で、毎回のご案内になりますけれども、これから扱うデータですとか、くれぐれもクラウドにアップするわけですので、機密情報とかそういったところは社内のセキュリティガイドラインですとか、利用するサービスのポリシーっていうのはしっかりご確認の上ご利用いただければなと思います。で、まずはここでこのツールを使って文字起こしを作成します。その方は簡単で音声データをiPhoneのボイスメモで全然大丈夫です。それで録音するとこのmp4aっていう形式なんですけど、そのままアップロードしてネクスト押しますと。で、オーディオランゲージに関しては、もうオートでも大丈夫なんですけど、なんか僕の場合はですね、もう名示的に一応日本語を選択をしてます。そしてトランスクライブを押したらこんな感じで文字起こしが完了しまして、これをエクスポートすることができるということになります。で、そのデータをプレーンテキスト形式、あるいはま、そのままコピペでも大丈夫ですけれども、出力してくださいと。これがステップ1で文字起こしデータを取得するです。グラディアのアクセスの方法は、概要欄とコメント欄にURLを載せておきますので、そこからアクセスしてください。
続いてジェミナイにアクセスします。先ほどの文字起こしのデータと指示書ですね。今この画面で写っている、これも概要欄とコメント欄に貼っておきますけれども、この指示書をもとにインタビュー記事を生成してもらいます。指示書に関しては公開しますが、これはあくまであのOMT仕様になってしまっているので、適宜編集していただければなと思います。で、編集の仕方も簡単にお伝えさせていただくと、まずはこのプロンプトを全部コピーして、それもジェミナイでやりましょう。まずはキャンバスモードをオンにして、下記を参考に、なんかどの会社がいいすかね?なんか分かんないすけど、下記を参考にオーラルテクノロジーという会社ようにアップデートしてくださいみたいな感じで、ここはあの、ご自身の会社の物に替えてもらって。で、ま、オーラルテクノロジーのMVVは下記です。要はインタビューなのでミッションとか理念とか、そういった物に絡めて書くと分かりやすくなりますから、それをま、貼り付けておきますと。こんな感じでま、これも社内資料とかでそのまま大丈夫です。これはデモで今、サクっとGPTに作ってもらったやつなんですけどま、載せて。で、その後に聖書指示書を後ろに貼り付けて。で、キャンバスモードでゴーと。で、そうすると多分恐らくいい感じでMVVを差し替えてくれるので、全体的に皆さんのご自身の会社のものにアップデートできるはずです。はい、こんな感じでオーラルテクノロジー社員インタビュー記事の聖書指示書にアップデートされる感じですと。これがちょっと出来上がる前にちょっとポイントを伝えておくと、ミッション・ビジョン・バリューを明示しておくと、それにやたら引っ張られるっていうことが起きるんですね。何でもかんでもエピソードをプロという視点ではとか、まさにプロですねとか、サクっとですななんかやたら絡み始めるので、ちょっとこの後デモでお見せする物も結構一定引っ張られてるので、その後ちょっと何回も何回もこれ改良しまして気づいたらなので今もう1時前って感じなんですけど、今これ最新のバージョンはだいぶいい感じになってるので、これ皆さんにお使いいただきたいんですけれども、ま、ポイントとしてはこんな感じで、OMTのミッション、ビジョン、バリューを理解しつつ、それらを無理に前面に押し出すのではなく、社員の言葉や具体的なエピソードを通じて自然に感じられるようにすることを目指しますっていうことを、これ追加してから結構だいぶいい感じにチューニングされるようになったので、補足です。はい、走行してる間に指示書のアップデート版ができたので、もうこれをコピーして使ってもらったり、ま、社内で展開したい場合は、これもね、バグなのか何なのか分かんないすけど、こうボタン押せないような感じなんですけれども、ワークスペースのジェミナイを使ってエクスポートどうなったのかと。Googleドキュメントに変換する機能これなくなっちゃったのかなってという風に思った方いませんか?僕も焦って個人用のやつでやったりとかしてたんですけど、実はこのボタン、共有することはできませんって書いてあるんですけどもボタンを押すとこんな感じでGoogleドキュメントにエクスポートっていうのが現れますので、それで普通にこうエクスポートできますので、ここもねタイトルがなんかプロンプトになっちゃってるので、ここはコピペでこういう感じでこれでま、社内で展開してもらえたらなと思います。これが準備です。指示書ができました。こっからはとにかく簡単です。ジェミナイ開いてですね、プロンプトはめっちゃシンプルです。下記はOMT仕様の大地さんにインタビューした時の文字起こしですと。聖書指示書をもとに記事を作成してくださいという形で、まず文字起こしをここに貼り付けます。このプロンプトもここに貼りますね。これも概要欄にこのプロンプトをしたらそこに貼っておきますので、よしなにに使ってください。ここはま、そのままこれがファイルのでここに文字起こしを入れればできるっていう感じですね。なのでここに文字起こしを入れてくださいと。文字起こしを貼り付けてこれでキャンバスモードオンにしてゴーです。もうこれだけです。これでおそらく1発で結構いい感じの記事になります。で、一応流れをこんな感じで正しく指示が動いてるのかここで確認することができます。集約はインタビュー対象者読者ファーストOMT社の自然な反映ストーリーテリング情報量の重視。で、これも結構ポイントですね。あんまり何も指示しないでいくと、結構ガッと圧縮されてしまう傾向があるんですね。なので情報量を出来るだけ維持した状態で創ってくださいって言うと、後から削る分には人の目でやってもいけるかなと思ったので、一旦まずはインタビューの内容を出来るだけ反映させた物を作った方が良いと思ったので、ま、こんな感じでできましたと。もうほんとこれで3分でできるので、こんな感じでやってもらうと良い。ま、ちょっとありえないミスはしてたりはするんですけど、西野さんになっちゃってますけど。なんでこう西野になったんだろう?多分西野って言葉が結構出てくるからかな?でもこのクオリティですからね。ちょっとそこだけ変えましょうか。さすがに変なんで。もう明らかこれ名前間違っちゃってるなっていう時は、ま、こういうようなねだから、あるあるですよね。完全に理解してなかったらこういう間違いしちゃうんで、こういう感じで直ぐ修正してあげるともう自動的にこのドキュメントが置き換わってきますからここで編集もできますので、ある程度の編集っていうのはここのもうジェミナイ上で行なっちゃうことをお勧めします。逆に代表の山本になってますね。
ま、これは大地さんがちゃんとインタビューに答えたっていうのもあると思うんですけど、文字起こしの内容が良かったって話もあると思うんですけど、もうこんな感じで普通にもうこのままリリースされててもおかしくない記事ができますよね?しかもまとめまでありますしそんな彼がたどり着いたOMT新たな挑戦の舞台。手触り感のある事業をやりたい、本気で世の中を変えたいという想いを胸に、これはほんとでも語ってた話なので、なんかそれをより魅力的に書いて。で、こんな感じでま、もうどんどんどんどん指示していったら編集されていきますし、でここで1個ティップスじゃないですけれども、よりこのインタビューを精度上げるためにはとにかく情報を与えた方が良いので、例えば社員のインタビューだったり職務経歴書これ本人への許可が必ず必要ですけど、ま、要はこの資料も参考に内容を強化してくださいみたいな。ちょっと日本語がも変ですけれども、一旦これでこういう職務経歴書、こういうの物アップしたんですけれどもま、こういう学歴とか職歴とかっていう経歴が持ってる物があるので、でこういう感じでアップデートするとどんどんどんどんこういう内容を補足して出てくるんだね例えばあ、こんな感じですね。さっきまでは大学名までは書いてなかったですけれども文系を選び、慶応義塾大学の法学部法律学科に進学しましたって言う感じでより整合性が取れたインタビューになるというかやっぱりどうしても文字起こしだと限界があるんですよね。固有名称が弱かったりとか、あとはもう普通にインタビューしてても脱線したりとかするじゃないですか。だからそういった時にこういう風な情報を入れてあげるとよりストーリーとしても分かりやすい物になるので、こんな感じの資料が出来上がるという感じです。で、このプロンプトにはですね、こう写真の提案もしてくださいっていう話があるので、あとはこの通り写真を入れるだけでもいいインタビュー記事できると思います。ま、文字起こしされた状態って言っても、この文字起こしそのまま使えるかというと結構使いづらいですね。ここがやっぱりLLMの良さであるほど保管機能ですよね。どんどんどんどん保管していくので違和感ない文章を構築するっていうことができるんですけれども、まさにこんな感じで出来上がるっていうところです。で、そのままこれを社内向けにまずは展開したいっていう場合は、もうGoogleドキュメントにエクスポートをするとこんな感じで。やっぱねタイトルがプロンプトなのは修正して欲しいですけどま、ここだけコピーしてあげたら出来上がるという感じです。はい。ここまでが記事を作成する方法です。ここからですね応用編として今の時代音声で聴きたいていう方も居ると思います。もう記事読みたくないよと。ポッドキャスト的にできないのかというところですけど、ではこっからはポッドキャストの音声を創って行きます。
はい、じゃあいよいよステップ3ですね、最後のステップですけどこのインタビューをもとに聴きやすい耳に入って来る社内ラジオこれから創って行きたいと思います。ではこの記事をもとに採用候補者向けのラジオ番組オーナーズという音声入力使います。番組の台本を作成して欲しい。オーナーズというのは、OMTのメンバーのことを指している用語であります。OMTが登録してるんでもうねダイレクトにちゃんと変換してくるんですよね。今、ちなみにこの使ってるツールはスーパーウィスパーというツールです。これも需要があれば紹介します。パーソナリティは女性、答える側は男性というそんな構成にして欲しいです。めちゃくちゃ雑ですけど、ま、こんな感じで。ま、これはあくまでサンプルですけど、これでやってみましょうと。で、えーっと、フォーマットだけ指定したくて、下記フォーマットで出力して欲しいと。プレーンテキスト。このじゃあ、プロンプトも先ほどのここに載せておきますね。記事化プロンプトとラジオ番組台本化プロンプトと。はい。プロンプトはここに貼っておりますけど、これをやって頂く感じです。で、これも最初の聖書指示書と同じくですね、これをコピーして下記プロンプトを自社の物にアップデートしてくださいって言えば出て来ますと。で、このプロンプトをここで入力しますと。これにほんとにハマりすぎて一日一本ペースで飲んでますね。はい。で、このプロンプトはですね、特徴はですね、通常表記版とひらがな版も出してます。で、このなぜひらがな版が必要かと言うと、この後作業としてこれを音声合成のAIに投げますので、それで出来るようにいくつか試してみたんですけど結構漢字が苦手なのでひらがなにしといた方が確実に発音されるのでそういったものもこう出るようにしています。もうなのでその意味でこのプロンプトは最強です。ではこんな感じで出来たら、こっちの部分を、ま、内容は上のこの部分を確認しつつ、ま、問題無ければひらがなの部分音声合成AI向け読み上げ版っていうのをコピーして、で、これで台本が出来上がりました。これを最初期機能であるジェネレートスピーチ機能を使って音声データ化して行きます。やり方ですね、まずはこのGoogle AIスタジオにアクセスします。で、そこからですね、ジェネレートメディアにアクセスして、で、そこからこちらをですね、ジェミナイのスピーチジェネレーションニューって書いて有りますけれども、こちらをクリックします。そうするとこの画面に開きます。今の言い方でも良いですし、概要欄にこちらのURLを貼っておきますので、そちらからもアクセス可能です。で、使い方は簡単です。ここにですね、先ほどのこちらですね、先ほど作った台本をコピーしてここに貼り付けるだけです。で、さっきのプロンプト公開してる僕のプロンプトで行くと、ここがしっかりとそのまんま貼付ければスピーカー1、2という感じに分かれるようになってますのでそのまんま使ってて大丈夫ですと。ここの画面簡単に説明させて貰うとロードストラクターとスプリットビレラーって構成で、ここはあの同期してません。ストラクターとビレラーってのは同期していて例えばこの一行目をこういじるとスタイルのインストラクション、要はどういうトーンで発話しますかみたいなところをこういじれるようになってます。で内容も同じくでここ変えたらこちら変わるみたいな、そんな構成になってます。ここはモデルを設定することができますが基本的にフラッシュで問題ありません。で、モードも今回2人なので、ラジオを創るのでマルチスピーカーですと。で、ボイスセッティングの所ネームはそのまんまで良いんですけれどもこのボイスの所を変更することができます。で、今回はスピーカー1は女性のイメージなのでready to build something awesome today?ま、これとかでも良いですね。 what kind of project are you thinking of?こんな感じ色々音声に。 なんかこれにしようか。ゼフィアさんとスピーカーには男性なのでwhat kind of project? まあちょっとこれで行きましょう。であとはこれをスタートすると創れますと言う感じです。あ、そっかスピーカー佐藤。すごい佐藤さんなんだ。佐藤になってますけどもここにスピーカー1を名前決め打ちで入れたら当然佐藤さんじゃなくなりますと。これはちょっとめちゃくちゃ早かったら驚くんすけど、あの普通に少し待ちます。おお。今録画止めたら丁度完成しまして。だから大体3分ぐらいで完成するみたいですね。はい。で、出来たのがこちらになります。リスナーの皆さん、こんにちは。オーナーズラジオ、株式会社OMTの魅力をお届けし、一緒に働く仲間を見つける為のラジオです。さて、本日のオーナーズラジオにはOMTのCOO山本大地さんをお迎えしています。 よろしくお願いします。OMTってどんな会社なんだろう?と興味深々の方も多いと思います。 OMTは未来のシカ体験を産み出すと言うミッションを掲げています。OMTにジョインされるまでのキャリアも非常にユニークだと伺いました。そうですね。ふりかえると色んな事に挑戦して来たなと思います。で、補足なんですけれどもこのラジオ番組の音声データは出来上がった後そちらの3点リーダー押してこのダウンロードを押すとダウンロードすることができます。ダウンロードする形式がwebと言う形式WAVと言うこの形式なのでweb形式と言うのは結構重いファイルだったりするのでそれを社内に共有するとかだとしたらもうちょっと軽い方が良いのでそれはこのwebからMP3のコンバーターって言うのをこれは色んな種類有るんですけど、これをかますとMP3に見慣れた形式になるかなと思いますので、これも概要欄に貼っておきます。補足でした。はい、如何だったでしょうか?一時間の音声データインタビューの音声データから直ぐに公開出来るインタビュー記事そしてラジオまで作成すると言う一連の流れをババっと解説させて頂きました。今日結構試行錯誤して出来た今週のプロンプト、シェアさせて頂いたので、これからもこういう風な動画創って欲しいと言う方は、是非高評価チャンネル登録励みになっておりますので、よろしくお願いします。そんな感じでこちら深夜の今一時半にお送りさせて頂きました。いや、もうこの時間でもやっぱ愉しめるって言うのがこのAIの面白さだなと思います。直ぐ時間経っちゃいますよね?少しでもそんな風なAIの魅力をこの番組では発信出来ればなと思ってるのでチャンネル登録をよろしくお願いします。最後に宣伝です。そんな私が経営するOMTでは今仲間を募集しています。OMTミッションは未来のシカ体験を生み出す。ビジョンは革命的なシカプロダクトを世界中へと言うことで現在社員100名と共にこのミッション実現に向けて日々挑戦しています。少しでも興味持っていただけ下さった方、僕とAIについて話してみたい。ガジェットについて話したいと思って下さった方は概要欄に有る15分メンターリンクから僕とお話しさせてください。そんな我々が開発した変わらないマウスピース矯正OMTが今大好評です。平均三ヶ月、33万円でこんなガタガタの歯並びや隙間が空いてる歯並び出っ張っている歯並び、そんな歯並びが歯医者に通うこと無く改善出来るそんなサービスを開発してます。少しでも歯並び気になるな。そもそも歯並び直すべきか分からない。矯正すべきか分からないと言う方は、先ずは無料の3D歯型スキャンにお越しください。3D歯型スキャンは現在東京大阪名古屋そして福岡の導入ストアーで受けれます。30分無料ですのでお気軽にお越しください。それでは今日も大勢に変えて行きましょう。有難う御座いました。 これか。新しい矯正って。 通院は最初だけ。 すっごく丁寧。 すごい!わくわくしてくる。 来た来た。 こんなに簡単で良いんだ。 こんな矯正初めて。
OMT。