【最速レビュー】OpenAIのGPT-OSSとは?実際に使ってみた感想と活用方法を徹底解説!¶
- URL: https://www.youtube.com/watch?v=bVFY5BYX4RE
- 文字起こし日: 2026-02-24 02:38
内容概要¶
- Open AIからオープンウェイトな推論モデル「GPT-OSS」が登場。
- 重みが公開されており、自分のパソコンにダウンロードして利用可能。
- ソフトウェアとしてはOllamaやLM Studioなどが使用可能。
- ChatGPTのようなインターフェースで言語モデルを利用できる。
- ChatGPTには入れられない秘密情報なども気兼ねなく使える。
- コスト面では自分のパソコンの電気代だけで言語モデルを使えるメリット。
- GPT-OSSはタスクの難易度やパソコンのスペックで状況が変わる。
- 日本語の性能評価はMMMLUのベンチマークで測定されている。
- グロックやセレブラスといったプラットフォームでもGPT-OSSを利用可能。
- 大規模なファインチューニングを行っても高い能力レベルに到達できない。
文字起こし¶
はい、皆さんこんにちは。ニャンタです。 本日は、Open AIの最新モデルについて紹介していこうと思います。 先ほどOpen AIからGPT-OSSと呼ばれる、オープンウェイトなリーズニングモデルが2つ登場しました。 で、オープンウェイトって何って人もいると思うんですけども、これらのモデルは重みが公開されていて、自分のパソコン上にモデルをダウンロードして利用することができるというものになっています。 オープンなモデルを、自分のパソコン上で動かすソフトとしては、オーラマとかLMスタジオとか、え、そういったものがあって、え、それらを使うと、こんな感じのチャットGPTみたいなインターフェースで、自分のパソコン上で言語モデルを使うことができます。 で、自分のパソコン上で言語モデルが動いているので、チャットGPTには入れられない、秘密情報とか、そういったものでも気兼ねせず入れることができますし、あとはコストの面でも、自分のパソコンで動かすための電気代だけで言語モデルを使えるというメリットがあったりします。 で、そういったオープンなモデルが今回Open AIからリリースされたというところで非常に盛り上がってるんですけども、ま、じゃあチャットGPTはもう不要なのかと言うと、ま、そういうわけじゃなくて、皆さんが言語モデルに行わせたいタスクの難易度とか、あとは、え、自分のパソコンで動かすということは、ある程度パソコンのスペックが必要になってくるので、ま、そういったところでも状況が変わってくるかと思います。 で、本日は最新のGPT-OSSについて、どういったモデルなのかというところとか、ま、実際に使ってみて、どんな感じかというところを見ていこうと思います。 最新の生成やについて知りたいという人は、ぜひ見ていってもらえればと思います。 それでは早速やっていきましょう。 はい、こちらが今回リリースされたGPT-OSSについて書かれている公式のページになっています。 なんか今週はですね、色々とりリースされそうな雰囲気があって、Open AIのCEOのサムアルトマンのツイート見てみると、今後数日間でたくさんの新しいものがあなたを待っていますと。 で、今回出たGPT-OSSは大きくて小さな何かですと。 で、今週の後半には大きなアップグレードがありますよという風に言われてるので、ま、もしかしたらGPT 5とかですね、そこら辺が出ると個人的には嬉しいなという風に思います。 で、今回リリースされたのは2つあって、GPT-OSSの120ビリオンと、え、20ビリオンということで、モデルのパラメーターが大きいものと小さいものという2つがリリースされています。 これら の モデル は 、 ハギング フェイス と 呼ば れる AI の モデル が 色々 と 置い て ある プラットフォーム が あっ て 、 こちら から ダウンロード し て 利用 する こと が でき ます と 。 小さ な 20 B の モデル と 大き な 120 B の モデル が あっ て 、 それぞれ です ね 、 大き な モデル に 関し て は 、 1 つ の 80GB の GPU で 利用 でき ます と 。 20 B の 小さ な モデル に 関し て は 、 16GB の メモリ を 搭載 し た デバイス だっ たら 使え ます よ と いう 感じ に なっ て い ます 。 おそらく 少し 良い ノート パソコン 使っ てる 人 は メモリ と し て 16GB くらい ある と 思う の で 、 20 B の 方 だっ たら ダウンロード し て 利用 する こと が できる と 思い ます 。 私 も MacBook 使っ てる ん です けど も 、 こちら の モデル だっ たら サクサク と 動かす こと が でき て い まし た 。 え 、 制度 に 関し て は 、 120 B の 方 は 少し 前 に 出 た オー4 Mini と ほぼ 同等 の 結果 です と 。 20 B に 関し て は 、 O3 Mini と 同等 です よ と いう ところ で 、 各 ベンチマーク で の 結果 が こちら に なっ て い ます が 、 120 B の 方 は 一部 の 試験 に おい て は O3 すら も 超え て いる と いう 状態 に なっ て い て 、 今回 リリース さ れ た モデル は 非常 に 精度 が 高い と いう ところ が 分かり ます 。 さらに どちら の モデル も ツール の 使用 と か 、 ファンクション コーリング と か 、 AI エージェント の モデル と し て 利用 する 際 に 必要 な こう いっ た 能力 も 高い です よ と いう ところ で 、 例えば 言語 モデル に Web 検索 を 搭載 し て 使おう と か 、 Python の コード を 実行 し て もらおう と か 、 そう いっ た こと も 高い 制度 で できる と いう ところ が アピール さ れ て い ます 。 あと 気 に なる の は 、 日本 語 の 性能 が どれ ぐらい いい の か と いう ところ が ある か と 思い ます 。 そちら に 関し て は 一緒 に 公開 さ れ て い た 、 え 、 システム カード の 方 で 評価 さ れ て い て 、 と いう ベンチマーク で いろんな 言語 の 制度 が まとめ られ て い ます 。 120 B と 20 B で それぞれ ロー と ミディアム と ハ と いう 3 つ が あっ て 、 これ は こちら の ページ に も 書い て あっ た ん です が 、 リーズニング エフォート と 呼ば れる 、 ま 、 どれ ぐらい 頑張っ て 思考 過程 を 生成 さ せる の か と いう パラメーター が あっ て 、 これ の 3 段階 の パラメーター に 応じ て 制度 が どう なる の か と いう ところ が 確認 でき ます と 。 で 、 日本 語 は こちら に なっ てる ん です けど も 、 この 評価 指標 だっ たら 120 B の 方 に 関し て は リーズニング エフォート の パラメーター を ハ に し て やっと O3 と 同じ ぐらい の スコア に なる と 。 20 B の 方 に 関し て は ハ に し た と し て も 、 ま 、 スコア が 結構 低い の で 、 数学 の 問題 と か 論理 的 な 問題 は 強い と いう ところ は あり そう な ん です が 、 と か おそらく 持っ てる 知識 に よっ て スコア が 変わる よう な そう いっ た タイプ の 問題 に 関し て は まだ O3 Mini と か O4 Mini の 方 が 制度 が 高い な と いう 感じ が し ます よ ね 。 あと は 使う 時 に リーズニング エフォー の パラメーター が ロー と ハ で は 結構 スコア が 違う の で 、 ここ ら 辺 は 使う 上 で 注意 点 か な と いう 感じ が し ます 。 で 、 今回 オープンウェイト な モデル と いう ところ で ハギング フェイス など から ダウンロード し て 、 そのモデルを、え、そのまま使うということ も できる ん です けど も、オープンなモデルなので、皆さんが持っている独自のデータをモデルに学習させるということもできたりします。 一方で悪い人が有害な出力を出るようにモデルを学習するということができてしまうわけですね。 例えば爆弾の作り方を教えてくださいと言うと、今のチャットGPTは拒否をするんですけども、悪い人が爆弾の作り方とかを文章として用意して学習させることもできてしまうと。 で、そういったリスクがあるんですけども、Open AIの方で、ま、そういった悪意があるファインチューニングが行われた場合に、どれぐらい精度が出るのかというところのリスク評価も行われているようです。 で、結果としては、大規模なファインチューニングを行ったとしても、高い能力レベルには到達できないことが示されていますと。 なので爆弾の作り方とかを覚えさせようとしても、難しいですよというところが言われてるかと思います。 安全にするというところで素晴らしい取り組みだなという風に思う一方で、これ何を示唆してるかと言うと、おそらく、ま、言語モデルに新しい知識を埋め込むっていうところが難しいということも言えるんじゃないかと思います。 ま、有害なことに関しては、バイアスがあって覚えにくいとかそういった面ももしかしたらあるかもしれないんですけども、私の感覚としても、新しい知識を言語モデルに覚えさせるってのは難しいイメージがあるので、今回このGPT-OSSが出て、よし、自分の会社のデータを学習させて、独自のモデルを作るぞという風に思っても、なかなか難しいところもあるかもしれないですね。 ここら辺は私もゴリゴリにファインチューニングしてるわけじゃないので、何か知ってる人とかいれば、コメントの方で教えてもらえるとありがたいです。 はい、それでは実際に使っていきたいんですけども、モデルを使う方法としては色々あって、まずOpen AIの方から紹介されている、え、プレイグラウンドというところで、おそらくハギングフェイス上で提供されているプレイグラウンドなんですが、こちらから利用することができます。 ただ何回か使ってしまうと、ま、こんな感じで利用回数の制限が来てしまうので、今回は自分のノートパソコンから使っていこうと思います。 で、自分のパソコンで使う場合はLMスタジオというものとかオーラマというものがあって、こちらが一般的に使われるものかなと思います。 今回はLMスタジオの方を使っていきますと。 私はMacなので、こちらからダウンロードして利用していきます。 はい、こちらがLMスタジオを起動した時の画面になっていて、下にテキストボックスがあって、使い方も分かりやすいかと思います。 で、まずは自分のパソコン上にモデルをダウンロードする必要があって、左下のパワーユーザーというところからディスカバーを押してですね、モデルを選択してダウンロードします。 私はすでにGPT-OSSをダウンロードしてるんですけども、初めてダウンロードする場合 は 右下 の 方 に ダウンロード ボタン が 出 て くる か と 思い ます 。 こちら で ダウンロード し たら 上 の ところ で モデル が 選択 できる の で 、 私 は 今 Google の ジェマ と Open AI の 20 B の モデル を ダウンロード し てる の で 、 2 つ 選択 でき ます と 。 Open AI の 方 を 選択 する と モデル が 読み込ま れ て チャット が 行え ます 。 読み込み が 終わる と 右下 に どれ ぐらい の メモリー を 使っ てる の か と いう の が 表示 さ れ ます 。 今 11.68 と いう ところ で 先ほど 16GB 使う と いう 話 だっ た ん です が 、 LM スタジオ と か オーラマ で も 量子 化 と 言っ て モデル の 内部 の パラメーター の 表現 力 を 落とし て サイズ を 軽く し た もの を 使っ てる の で 、 必要 な メモリー の 容量 が やや 少ない と いう ところ が あり ます 。 早速 使っ て いき ましょう と いう ところ で 、 こちら の リーズニング エフォート から ロー ミディアム ハ が 選べる の で こちら を 選択 し て 今 ローカル の 有用 性 に 関し て 実験 しよう と 思っ てる ん です けど も 、 どう いっ た プロンプト を 入力 し て 何 が 解ける か を 評価 すれ ば いい と 思い ます か ? 理由 と 共 に 教え て ください 。 はい 、 こんな 感じ で 入力 し て み ます 。 はい 、 そう する と リーズニング モデル な の で 、 え 、 シンキング が スタート し て 、 え 、 これ ぐらい の 速度 で 回答 が 今 作ら れ て い ます 。 シンキング の 中身 が 英語 に なっ て しまい ます が 、 速度 と し て も なかなか いい ん じゃ ない でしょう か ? はい 、 今 回答 の 生成 が 終わっ て 、 結構 長い 時間 文章 を 出力 し て い まし た 。 で 、 内容 見 て いく と 、 個人 的 に は かなり チャット GPT に 近い 文章 の 形式 だ な と いう 風 に 感じ て 不 自然 だ な と いう ところ は そこ まで ない か と 思い ます 。 はい 、 なかなか いい ん じゃ ない でしょう か ? 1 秒間 で 12 トークン 生成 する と いう 速度 だっ た ん です けど も 、 今回 MacBook の CPU しか 使っ て なかっ た の で 、 これ GPU も 使わ せる と どんな 感じ な の か と いう の を 見 て み ましょう 。 左側 の 前 モデルズ の ところ から こちら の GPTOSS の 設定 画面 を 選ん で GPU を 24 に し ます と 。 で 、 クローズ すれ ば 設定 に なっ て ます ね 。 あと は ここ から コンテキスト の 長 さ を 設定 でき たり と か 、 プロンプト 設定 でき たり と か 色々 できる みたい です 。 はい 、 もう 1 回 です ね 、 今 GPU が オン に なっ てる と 思う の で 、 同じ プロンプト で 入力 し て み ます と 。 はい 、 そう する と さっき より も ちょっと 早い と いう 感じ です か ね 。 ちょっと これ GPU に なっ て ない 気 が する な 。 1 回 モデル を 読み直さ ない と いけ ない 気 が する の で もう 1 回 選択 し ます 。 で 、 リロード し ます と 。 読み込み が でき た の で 入力 を し て み ましょう 。 あ 、 そう する と 早く なり まし た ね 。 チャット GPT と か で も 、 ま 、 これ ぐらい の 速度 で 出し て くれる 気 が する の で 、 なかなか いい ん じゃ ない でしょう か ? これ が ノート パソコン で 簡単 に 使える と いう ところ は 結構 感動 し ます よ ね 。 はい 、 出力 が 終わっ て 1 秒 で 約 31 トークン と いう ところ で 3 倍 近く の 速度 で 出力 でき て い ます 。 ちょっと 回答 の 質 に 関し て は なかなか 見分け が つき にくく なっ てる ん です が 、 例えば ユーザー の 入力 が 簡単 な もの で 、 ま 、 こんにちは と か そう いっ た 挨拶 で あれ ば こう いう モデル を 使っ て コスト 削減 する と か そんな 感じ で 使う 分 に は 問題 ない の か な と いう クオリティ な 感じ が し ます よ ね 。 はい 、 こちら の LM スタジオ 簡単 に セットアップ でき ます の で 、 興味 が ある 人 は 見 て み て ください 。 で 、 他 に も オープン ソース の モデル と いう ところ で 、 セレブラス と いう プラットフォーム や 、 え 、 グロック と 呼ば れる プラットフォーム で も 今回 出 た GPT OSS を 利用 する こと が でき ます 。 で 、 言語 モデル で 文章 を 生成 する に は GPU と いう 機会 が 一般 的 に 使わ れる ん です けど も 、 この グロック と か セレブラス と いう プラットフォーム で は 言語 モデル 用 に チップ を 開発 し てる の で 、 出力 さ れる 文章 の 速度 が めちゃくちゃ 早い です 。 例えば です ね 、 ま 、 グロック の 方 から 見 て いく と こちら で Open AI の 20 B の 方 を 選ん で 先ほど と 同じ よう な 、 え 、 プロンプト を 入力 する と 、 ま 、 こんな 感じ で 用意 し た 文章 を 出し てる の か と いう ぐらい 早く て です ね 、 1 秒間 で 、 え 、 1200 トークン と 先ほど 自分 の パソコン で 実行 する と 1 秒間 で 30 トークン だっ た ん です が 、 グロック だ と 、 え 、 1200 トークン と いう の で めちゃくちゃ 高速 に 文章 を 生成 でき ます 。 で 、 セレブラス の 方 が グロック より も 早く て こちら は 今回 出 た モデル の 20 B の 方 は まだ 提供 さ れ て ない ん です けど も 、 120 B の 方 で 同じ 入力 を し て みる と こんな 感じ で 生成 さ れ ます と いう ところ で 先ほど より も パラメーター 数 が 6 倍 大きい ん です けど も 1 秒間 で 1200 トーク 出力 できる と いう の で めちゃくちゃ 早い か と 思い ます 。 速度 が 求め られる 場面 で 120 B だ と タスク に よっ て は O4 Mini と 同じ ぐらい の 精度 と いう ところ で こんな 高速 で 使え たら 今後 使う 場面 も あり そう な 感じ が し ます よ ね 。 両方 とも API と 言っ て プログラム から 利用 できる と 料金 と し て も 100万 トークン あたり 入力 が 0.15 で 出力 が 0.75 と いう ところ で O4 Mini と 比べ たら 何 倍 も 安い の で 今後 です ね 、 何か 活用 方法 と か あっ たら 紹介 し て いけれ ば な と いう 風 に 思い ます 。 はい、GPT-OSSについて紹介してきたんですけども、皆さんどういう風に感じたでしょうか? 日本の企業はですね、クラウダルのサービスとか扱うのに結構慎重なところが多いと思うので、こういうオープンなモデルでかつそこまでハイスペックなパソコンが必要ない、ま、20Bのモデルとかそういったところは活用する場所が結構あるかもしれないですね。 皆さんも仕事の中で、こういう風に使いたいとか、そういう話があったらですね、ぜひコメントの方で教えてください。 今週のGPT 5を期待して、本日の動画を終了したいと思います。 はい、最後に私の本の紹介なんですけども、え、ゼロからわかるディファイの教科書と呼ばれる本を技術評論社様から出版させていただいております。 で、先日ありがたいことに第3冊の増殺が決まりまして、たくさんの方にご購入いただきまして、ありがとうございます。 こちら の 本 は 、 ディファイ と 呼ば れる 生成 AI を 活用 し た アプリ を 簡単 に 作れる ツール の 使い 方 の 紹介 に なっ て ます の で 、 仕事 で 生成 AI を 使っ て いき たい と いう 人 は 書店 に 行っ た 際 に こちら の ピンク ボーン を パラパラ と 見 て いただける と 大変 ありがたい です 。 はい、以上で本日の動画を終了したいと思います。 本日も見ていただきましてありがとうございました。 この動画が良かったなって思った人は、高評価、コメント、チャンネル登録の方よろしくお願いします。 それではまた次回の動画でお会いしましょう。 バイバイ。