AI(人工知能/ディープラーニング)

生成AIでPDFを読み込んで要約するという性能比較をしたら、有料のChatGPTより無料のClaude(クロード)がいい回答をしてくれました

この記事は約3分で読めます。

生成AIでPDFを読み込んで要約私は最近の生成AIの使い方では、PDFやワードなどのファイルをアップロードし読み込んで要約してもらう、というのが便利で多用しています。ただし、このような機能はChatGPTでは有料版しか使えませんでした。ですから、無料版の生成AIしか利用していない方にこのような使い方を説明することが難しかったです。
それが無料で使える生成AIのClaude(クロード)だと可能です。しかもあるPDFファイルで試したところChatGPTではうまく読み込めなかったのに、Claude(クロード)ならうまく回答してくれたという例もありました。

PDFやワードなどのファイルを読み込んで生成AIで要約する

画像埋め込みしているPDFのテキストを読めるかどうか

今回テストしたPDFは、どもども通信の最新版(2023年11月号)です。このマインドマップ形式で作成してある面は、マインドマネージャーで作成したものを画像にしてパワポの画面に貼り付けています。なので、PDFですが中身は画像です。

このPDFを使って、生成AIがうまく回答できるかどうかを試してみました。

なお、どもども通信はメルマガでも受信できます。
興味ある方は
https://www.dm2.co.jp/data/domodomo/

から無料でメルマガ登録できますので、ぜひともご登録ください。

ChatGPTの有料版を使ってPDFを読み込む

ChatGPT有料版には、「アドバンスドデータアナリシス」という機能があります。この機能を使うと手持ちのファイルをアップロードして、そのファイル内を読み取った上で希望する回答を引き出すことができます。

308 Permanent Redirect

ChatGPTは上記のURLから利用できます。

やってみました。

すると、このPDFでは読み込めないという回答でした。残念。

Claude(クロード)の無料版を使う

今度は無料版の生成AIで最近話題になっているClaud(クロード)でやってみます。

新しいチャット型AIサービスのClaude(クロード)が日本語対応になったので使ってみました
Claude(クロード)という生成AIサービスが日本語対応したことでAI業界ではちょっとした話題になっています。Claudeは、Anthropic(アンスロピック)というITベンチャー企業が提供していますが、この企業はOpenAI出身の研究者が中心となって2021年に設立されたといういきさつもあります。すでにGoogleがに投資しており、最近になってAmazonも多額の投資を発表したことで、Cla...

Claudの詳細は上記にて解説しています。

なんと、Claudではスムーズに読み込み処理ができて、回答もばっちりでした。

追加質問にもばっちりと回答してくれました。

Claudは画像読み込みと日本語OCR対応にも対応しているということですね。感心しました。

あらためてChatGPTに回答を求めてみましたがだめでした

無料版のClaudができることなのに、有料版のChatGPTができないとは悔しいですね。そこで、追加の質問をして回答を促しました。

うーん、どうやら日本語OCRの学習データが不足しているようで、回答はできませんでした。

ChatGPTさんには課金しているのでもっとがんばってもらいたいですね。今後に期待しましょう。

ちなみにこのイラストはChatGPTのdall-e3がうまく生成してくれました。この画像生成はナイスですね。

プロンプト
Photo of a robot sitting at a desk with a computer screen displaying a PDF error message. The robot’s face displays a humorous expression of confusion and desperation.
生成プロンプトの英語は上記のとおりでした。