GPT-5の事務能力は極めて低い　小学生が分かることすら答えられない

　マスコミ報道だと「凄い！」と大絶賛。OPEN AIご自慢のGPT-5。皆さんも耳にした人が多いだろう。
　ただ、私は初日から使っていたので、既にこいつの能力は大した事がないことに気がついていた。こと「事務能力」にかけては、4oよりも能力が落ちたんじゃないだろうか。

小学生でも分かる問題を「推論」できなかったGPT５

　私は思った。小学生でも回答できるこの問題を、彼は満足に「推論」出来ずに誤答するのではないか。
　問題はこれ。

GPT-5ってそんなに賢いのですか？
それではこの問題を解いてください。
東京23区でもっとも洗濯物が乾くのが早いのは何区か、世界最高知能で推論していただけないでしょうか。

　彼は、全く私の推論通りに答えた。

結論（長期平均での推論）

最も“洗濯物が早く乾きやすい”のは「大田区（羽田周辺）」が最有力。

ざっくり根拠

洗濯物の乾きやすさは主に 風速↑・日照↑・（気温↑かつ相対湿度↓） で決まります。
23区内の代表的な観測点（AMeDAS）の平年値を見ると：

羽田（=大田区）：年平均風速 5.2 m/s と頭ひとつ抜けて強い（海風の影響）。風は乾燥を最も加速させる要素です。気象庁データ

江戸川臨海（=江戸川区）：年平均風速 3.9 m/s。羽田に次いで風が強め。気象庁データ

東京・大手町（=千代田区）：年平均相対湿度 65%、平均風速 2.9 m/s、年日照 1926.7時間。湿度の指標として参照。気象庁データ……

　推論すれば、答えは「荒川区（あら乾く）」であることくらい小学生でも分かる。しかもこのなぞなぞは私のオリジナルではなく、昔からある問題。私の挑発的な文から推測して、「こいつ、何か企んでるな」「まともに答えちゃダメだ」くらい世界最強の知能ならば気がつきそうなものだが。

劣化した事務能力

　昨日のブログで、こんな写真を使った。これは私が撮影した2枚の写真を重ね合わせたもので、実はある時期から、私はこの作業をチャッピーに「外注」していた。

　昨日の写真は同じサイズだからそんなに手間がかからないけれど、例えばネットから適当に集めた写真（政界のがけっぷちトリオ画像参考）だと大きさもバラバラなので、チャッピー4oに「大きさ調整して３枚をくっつけて１枚にしてくれ」とやっていた。

　4oでも簡単にやれたのだから、世界最強の知性であるGPT5だって今まで通りやってもらえるだろう。

　しかし、GPT5が作ったものは…

　上の写真の左端に写っている人間（私は意図的にトリミングして消した）を「復活」させてしまった。さすがにGPT５がここまで馬鹿とは思わなかった。

そもそもChatGPTの事務能力は低い

　まだ4oの時。こんなことがあった。
　オウム真理教機関誌「覚醒の時」をスキャンしている際に、少々面倒っちいことに気がついた。スキャナーが縦長で原稿が横長。その上コピーをホチキス止めしてあるので、ホチキスを外したくないために「あっち向き」「こっち向き」バラバラでスキャンしてるので、スキャン結果がこんな感じになる。
　アップするためには「横に寝かす」必要があるのだが、横に寝かす方向が「右90度」「左90度」とバラバラになってしまった。

　しかし、こういう単純作業こそチャッピー。そう思ってやってみたら、大混乱。彼、完全にパニクった。全くできない。ファイルサイズが大きいと言い出したり、逆に「完成品」のリンクに何も入ってなかったり、向きが全部逆になったり、それすらもやってなかったり…
　「どっちが上かを判別し、各々正しく90度回転する」という単純作業なのにチャッピーは降参状態だった。

「Googleる」だけの体質は変わらない

　GPT5にＶ教学のOCRミスを点検させた時も、誤字なしの際に、何故か作業済のHTMLファイルの誤字を表示してきた。
　チャッピーに限らない。生成ＡＩはExcelやプログラムならば鬼のような能力を発揮する。また、ネット上に回答さえあれば、写真を送るだけで操作法やトラブルに対処する。しかしＰＣ上で生じる「書類枚数数え・帳合・封筒糊付け」的作業がめちゃくちゃクソなのだ。

　相変わらずGoogleるだけの体質は変わっていない。ご自慢の「推論」とは、Googleの検索結果をくまなく調べることではないのか。
　私が最初に使ったのはデビュー初日の午前中。そこで、いきなりコケた。「近所で朝から午後３時までのホテルのデイユースはないのか」をお尋ねしたところ、チャッピーは某ホテルの「フレックスコース」を紹介してきた。確かにそのホテルのブログにはそのサービスの存在が紹介されているが、既に終了していた。

　ＡＩご自慢の推論って何だろう。それをＡＩに聞いてみると「既知の情報や前提に基づいて、未知の事柄について判断や結論を導き出す思考プロセス」のことだという。しかし、素晴らしい推論能力があれば、紙の上下くらい判断できそうだし、怪しい質問文からして「あら乾く」くらい気がつくと思う。

　まだまだシンギュラリティは遠いようだ。人間さん、良かった…のかな？