AI(人工知能/ディープラーニング)

ChatGPT4が最適化されて「ChatGPT-4o」となりました!Turbo版より2倍速くて高性能です

この記事は約4分で読めます。

ChatGPT-4oChatGPT4が最適化されて「ChatGPT-4o」となりました。予定通り2024年5月13日に公開され、日本時間でも5月14日の早朝から利用開始できるようになりました。
「ChatGPT-4o」の末尾についた「o」は「optimized for performance」を略したものだとChatGPTは回答しました。「最適化されたパフォーマンス」というような意味ですね。また、oは「すべての」を意味する「オムニ」の頭文字からとったというニュースサイトの紹介もあります。どちらが本当なのかわかりません。

ChatGPT-4oは2024年5月13日発表

OpenAIの公式発表

OpenAIの公式サイトでは「hello-gpt-4o」というページができていました。

Just a moment...

GPT-4oは、OpenAIの新しいフラッグシップモデルで、リアルタイムで音声、視覚、テキストの推論が可能ということです。

関連記事は以下のとおりです。

OpenAIが「GPT-4o」発表、2倍高速に 人の反応速度で会話 - 日本経済新聞
【シリコンバレー=渡辺直樹】対話型AI(人工知能)「Chat(チャット)GPT」を手がける米新興企業のオープンAIは13日、新型AI「GPT-4o(フォーオー)」を開発したと発表した。従来に比べて処理スピードを2倍に高速化した一方、運用コストを半減した。声で話しかけると、ヒトと同じ反応速度で会話ができる。弱点だった反応の遅延を克服し、AIの活用がさらに広がりそうだ。生成AIはオープンAI以外の
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIが、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。
「GPT-4o」発表 人のように音声・画像・テキストで高速応答
OpenAIは13日(米国時間)、最新のAIモデル「GPT-4o」を発表した。テキスト・音声・画像をシームレスに扱え、かつ高速な応答が特徴となり、今後数週間で全てのChatGPTユーザーに提供開始する。まずは有料のChatGPT PlusとTeamユーザーに提供開始し、その後エンタープライスへ拡げていく。

ChatGPT-4oの概要

  • 利用可能なプラットフォーム GPT-4oは、ChatGPT(無料版、Plus、Team、近日提供予定のEnterprise)およびAPI(Chat Completions API、Assistants API、Batch API)で利用できます。Voice Mode機能を介して音声サポートも提供されます。
  • GPT-4 TurboとGPT-4oの比較
    • 価格: GPT-4oはGPT-4 Turboの50%安価で、入力トークンあたり$5、出力トークンあたり$15。
    • レート制限: GPT-4oのレート制限はGPT-4 Turboの5倍で、1分あたり最大1000万トークン。
    • 速度: GPT-4oはGPT-4 Turboの2倍速い。
    • 視覚能力: GPT-4oは視覚関連の評価でGPT-4 Turboより優れた性能を発揮。
    • 多言語対応: GPT-4oは非英語言語のサポートが改善。
  • APIでの利用 OpenAI APIアカウントを持つすべてのユーザーがGPT-4oを利用可能。Chat Completions API、Assistants API、Batch APIで利用できます。機能呼び出しやJSONモードもサポート。
  • 支払い後のアクセス $5以上の支払いを行うと、GPT-4、GPT-4 Turbo、GPT-4oモデルがOpenAI API経由で利用可能。
  • APIリクエスト制限 ChatGPTのレート制限はAPIのレート制限とは独立しています。APIプラットフォームの制限セクションでレート制限を確認できます。
  • データの取り扱い OpenAI APIに送信されたデータやファイルは、ユーザーが明示的にトレーニングに参加しない限り、モデルのトレーニングには使用されません。
  • ChatGPTでのGPT-4oアクセス 無料ユーザーはGPT-4oにデフォルトで設定されますが、使用可能なメッセージ数に制限があります。利用できない場合、無料ユーザーはGPT-3.5に戻されます。無料ユーザーは、データ分析、ファイルアップロード、ブラウズなどの高度なツールを使用するメッセージにも制限があります。いつでもPlusにアップグレード可能です。

レスポンス向上を確認しました

早速、「ChatGPT-4o」を使ってみました。

ChatGPTの画面でモデルを選択できます。「GPT-4o」を選べばすぐに使えました。

まずはChromeの脆弱性について注意喚起する画像を生成してみました。

画像をよく見ると、細部に至るまで丁寧に生成されていることがわかります。

ChatGPTのバージョンアップはDALL-Eの画像生成にも好影響を与えています。具体的には、以下の点で改善が見られます。

  1. 画像の精度と品質の向上:新しいバージョンは、より細かいディテールやリアリズムを持つ画像を生成する能力が向上しています。
  2. プロンプトの解釈精度:ユーザーのプロンプトをより正確に理解し、それに基づいてより適切な画像を生成する能力が向上しています。
  3. 多様なスタイルのサポート:異なるスタイルやテーマに対応できる柔軟性が高まり、ユーザーの多様な要求に応えることができます。

これらの改善により、より満足度の高い画像生成結果が得られるようになっているということでした。

上記の画像を生成したプロンプトは「ChatGPT4oが使えるようになりました。4oを訴求するために日本人の若い女性事務員が笑顔で「ChatGPT4oが便利ですよ」と伝えているような画像を生成してください。」です。

生成AIの性能アップ競争が巨大IT企業同士で繰り広げられていますが、どんどん進んでいく感じが楽しみです。