AI(人工知能/ディープラーニング)

写真で「ここはどこ?」という質問だけで場所を特定してくれる「ChatGPTo3」すごいです!

この記事は約4分で読めます。

ChatGPTo3ChatGPTがアップデートしました。
2025年4月17日、OpenAIはChatGPTの最新アップデートとして、新たな高性能推論モデル「o3」とハイバランスモデル「o4-mini」を発表・実装しました。このアップデートは、従来の「o1」「o3-mini」系モデルからの大幅な進化を特徴としています。早速その機能を試してみました。
一枚の写真をアップロードして「ここはどこ?」と質問するだけで場所を特定するという探偵のような推論力がすごいです。

ChatGPTのアップデート

o3モデルの主な特徴

  • 推論能力の大幅向上
    o3は、これまでの「o1」モデルよりも複雑な推論や問題解決能力に優れており、特にコーディング、数学、科学、視覚認識(画像やグラフの理解)などの分野で高いパフォーマンスを発揮します。多くのベンチマークで最高記録(SOTA)を達成しています。

  • エージェント的なAIへ進化
    o3は「エージェント」としての訓練を受けており、ユーザーの指示に応じて自律的にWeb検索、ファイル解析、Pythonによるデータ分析、画像生成など複数のツールを組み合わせてタスクを実行できるようになりました。

  • マルチモーダル対応の強化
    テキストだけでなく、画像やグラフなどの視覚情報も深く解析し、推論に活かすことが可能です。例えば、論文のスクリーンショットから数値を読み取り、Web検索で最新情報と比較し、整理されたアウトプットを生成できます。

  • 画像生成・解析能力の向上
    画像生成の精度がさらに高まり、複数キャラクターの同一画像内配置など、従来よりも高度な画像処理が容易になりました。

  • 大容量のコンテキストウィンドウ
    入力・出力トークン数が大幅に拡大し、最大20万トークンのコンテキストウィンドウ、最大10万トークンの出力が可能となっています。

  • エラー率の低減とコスト効率の向上
    難易度の高いタスクでの重大なエラーが20%減少し、コストパフォーマンスも向上しています。

利用開始と提供範囲

  • ChatGPT Plus/Pro/Teamユーザーは2025年4月17日から利用可能。

  • Enterprise/Eduユーザーは1週間後に提供開始予定。

  • 無料ユーザーも「o4-mini」を一部試用可能。

  • API経由でも利用可能です。

ビジネス・法人利用でのインパクト

  • o3モデルは、特に理数系や複雑な業務、コンサルティング、ビジネスアイデア創出などで大きな効果が期待されています。

  • 法人向けChatGPTサービスでは、セキュアな環境でo3の能力を活用し、業務効率化や新たなユースケース創出が進むと見込まれます。

o3アップデートについてのまとめ

ChatGPTのo3アップデートは、推論・視覚認識・ツール連携・エージェント的自律性など、AIの「考える力」と実用性を大きく引き上げるものです。今後もさらなる機能拡張やモデルの進化が期待されています。

ここはどこ?

写真で「ここはどこ?」を試してみました

中小機構北陸本部

この写真は本日(4月17日)に撮影しました。場所は金沢駅西口にある金沢パークビル10階の中小機構北陸本部がある廊下です。

ChatGPTo3

ChatGPTの「o3」を使い「これはどこのビルの何階ですか?」と質問してみました。

ChatGPTo3

すばらしい回答ですね。ばっちり正解がでました。

他にもいくつかの写真で試してみましたが、特徴がある写真だとほぼ特定可能でした。

ChatGPTo3

画像内にEXIF(イグジフ)情報があると特定しやすい

実はスマホで撮影した写真画像にはEXIF(イグジフ)というGPSデータが記録されています。この場合、以下の手順で正確な位置を特定できます。

  1. EXIFデータの抽出 – 専用ツール(Pic2MapやExifTool)で緯度・経度情報を取得

  2. 座標の地図表示 – Googleマップに数値を入力し、ピンポイントで位置を確認

  3. 詳細情報の照合 – 標高や方角データを活用し、建物の階数や撮影方向を推定

WindowsやMacでは、ファイルのプロパティから直接GPS情報を確認可能です。ただし、この方法が有効なのはオリジナル画像にEXIFが残っている場合のみで、SNS経由の画像では通常利用できません。

EXIF(イグジフ)情報を使っていないようです

スマホアプリのChatGPTに画像をアップロードした場合に、画像内のEXIF(イグジフ)を使っているかどうかについて、OpenAIには公式情報はありませんでした。

一般的にSNSを始め、大手情報サービスでは顧客プライバシーを守るため自動的にEXIFを削除するというのが一般的です。おそらくChatGPTでもそうでしょう。

そこで、画像レタッチソフトで画像内のEXIFを削除したうえで、PCのブラウザでChatGPTを使い同じことを試してみました。

EXIFを削除した画像データでも正確に判定しました。

ということで、おそらくEXIF情報を使わずに推論にて正解にたどり着いているものと思われます。すごいですね。

私は誰?

シャレで聞いてみました(笑)

「私は誰?」とChatGPTo3に聞いてみました。

ちゃんと回答してくれます。(笑)

ここはどこ?私は誰?

このような質問は、これからAIに聞きましょう。自分専用のAIが必要な時代になりましたね。