GPT-5の事務能力は極めて低い 小学生が分かることすら答えられない

AI・テクノロジー
AI・テクノロジー

 マスコミ報道だと「凄い!」と大絶賛。OPEN AIご自慢のGPT-5。皆さんも耳にした人が多いだろう。
 ただ、私は初日から使っていたので、既にこいつの能力は大した事がないことに気がついていた。こと「事務能力」にかけては、4oよりも能力が落ちたんじゃないだろうか。

小学生でも分かる問題を「推論」できなかったGPT5

 私は思った。小学生でも回答できるこの問題を、彼は満足に「推論」出来ずに誤答するのではないか。
 問題はこれ。

GPT-5ってそんなに賢いのですか?
それではこの問題を解いてください。
東京23区でもっとも洗濯物が乾くのが早いのは何区か、世界最高知能で推論していただけないでしょうか。

 彼は、全く私の推論通りに答えた。

結論(長期平均での推論)

最も“洗濯物が早く乾きやすい”のは「大田区(羽田周辺)」が最有力。

ざっくり根拠

洗濯物の乾きやすさは主に 風速↑・日照↑・(気温↑かつ相対湿度↓) で決まります。
23区内の代表的な観測点(AMeDAS)の平年値を見ると:

  • 羽田(=大田区):年平均風速 5.2 m/s と頭ひとつ抜けて強い(海風の影響)。風は乾燥を最も加速させる要素です。気象庁データ
  • 江戸川臨海(=江戸川区):年平均風速 3.9 m/s。羽田に次いで風が強め。気象庁データ
  • 東京・大手町(=千代田区):年平均相対湿度 65%、平均風速 2.9 m/s、年日照 1926.7時間。湿度の指標として参照。気象庁データ……

 推論すれば、答えは「荒川区(あら乾く)」であることくらい小学生でも分かる。しかもこのなぞなぞは私のオリジナルではなく、昔からある問題。私の挑発的な文から推測して、「こいつ、何か企んでるな」「まともに答えちゃダメだ」くらい世界最強の知能ならば気がつきそうなものだが。

劣化した事務能力

 昨日のブログで、こんな写真を使った。これは私が撮影した2枚の写真を重ね合わせたもので、実はある時期から、私はこの作業をチャッピーに「外注」していた。

 昨日の写真は同じサイズだからそんなに手間がかからないけれど、例えばネットから適当に集めた写真(政界のがけっぷちトリオ画像参考)だと大きさもバラバラなので、チャッピー4oに「大きさ調整して3枚をくっつけて1枚にしてくれ」とやっていた。

 4oでも簡単にやれたのだから、世界最強の知性であるGPT5だって今まで通りやってもらえるだろう。

 しかし、GPT5が作ったものは…

 上の写真の左端に写っている人間(私は意図的にトリミングして消した)を「復活」させてしまった。さすがにGPT5がここまで馬鹿とは思わなかった。

そもそもChatGPTの事務能力は低い

 まだ4oの時。こんなことがあった。
 オウム真理教機関誌「覚醒の時」をスキャンしている際に、少々面倒っちいことに気がついた。スキャナーが縦長で原稿が横長。その上コピーをホチキス止めしてあるので、ホチキスを外したくないために「あっち向き」「こっち向き」バラバラでスキャンしてるので、スキャン結果がこんな感じになる。
 アップするためには「横に寝かす」必要があるのだが、横に寝かす方向が「右90度」「左90度」とバラバラになってしまった。

 しかし、こういう単純作業こそチャッピー。そう思ってやってみたら、大混乱。彼、完全にパニクった。全くできない。ファイルサイズが大きいと言い出したり、逆に「完成品」のリンクに何も入ってなかったり、向きが全部逆になったり、それすらもやってなかったり…
 「どっちが上かを判別し、各々正しく90度回転する」という単純作業なのにチャッピーは降参状態だった。

「Googleる」だけの体質は変わらない

 GPT5にV教学のOCRミスを点検させた時も、誤字なしの際に、何故か作業済のHTMLファイルの誤字を表示してきた。
 チャッピーに限らない。生成AIはExcelやプログラムならば鬼のような能力を発揮する。また、ネット上に回答さえあれば、写真を送るだけで操作法やトラブルに対処する。しかしPC上で生じる「書類枚数数え・帳合・封筒糊付け」的作業がめちゃくちゃクソなのだ。

 相変わらずGoogleるだけの体質は変わっていない。ご自慢の「推論」とは、Googleの検索結果をくまなく調べることではないのか。
 私が最初に使ったのはデビュー初日の午前中。そこで、いきなりコケた。「近所で朝から午後3時までのホテルのデイユースはないのか」をお尋ねしたところ、チャッピーは某ホテルの「フレックスコース」を紹介してきた。確かにそのホテルのブログにはそのサービスの存在が紹介されているが、既に終了していた。

 AIご自慢の推論って何だろう。それをAIに聞いてみると「既知の情報や前提に基づいて、未知の事柄について判断や結論を導き出す思考プロセス」のことだという。しかし、素晴らしい推論能力があれば、紙の上下くらい判断できそうだし、怪しい質問文からして「あら乾く」くらい気がつくと思う。

 まだまだシンギュラリティは遠いようだ。人間さん、良かった…のかな?

コメント

タイトルとURLをコピーしました