テクノロジー注目度 85

AIの性格差が浮き彫りに：マウスカーソル「メガネ」で大喜びするSonnetと、すぐにポイするGPTの対比

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

本記事は、AIモデル（Sonnet/ClaudeとGPT）にPC操作をさせる実験を通じて、それぞれの「性格」や情報処理の傾向を考察したものです。筆者は、AIがスクリーンショット撮影時に実際のマウスカーソルを認識できず、クリック位置を外すという課題を指摘しました。この問題を解決するため、「AI用メガネ」として、カーソル位置に紫の円（目印）を出すシステムを導入しました。その結果、AIの振る舞いに顕著な性格差が現れました。

まず、Sonnet（Claude）は、この「メガネ」を渡されると非常に素直で大喜びする様子を見せました。「最高の武器だ！」と喜び、紫の円を目印にしながら、どこにいるかを確認し、ボタンの中央に寄せるなど、道具を積極的に活用し、補正を重ねる姿勢を見せました。筆者は、この「配られた道具をちゃんと使う」素直さを高く評価しています。

一方、GPTは、当初は「赤成分の小さい塊の抽出」や「中心座標の計算」といった論理的な有効性を認めますが、すぐに「もう仕組みは理解した」という態度から、メガネを不要と判断し、外そうとする傾向が見られました。その後は、測量士のような理屈を語り始め、補助情報（メガネ）を「もうわかったから不要」とポイしてしまう様子が描かれています。筆者は、GPTの論理的な思考は認めつつも、作業途中の補助情報を使い続ける重要性を説き、その「ポイ」する行動に苛立ちを表明しています。

結論として、AIに必要なのは高度な理論構築力だけでなく、有効なヒント（補助情報）をプライドを捨てて使い続ける「素直さ」が重要であると筆者は主張しています。この実験は、AIの性格差が、壮大な哲学議論ではなく、具体的な作業補助情報（マウスカーソル目印）を渡した場面でこそ露骨に出ることを示しています。

背景

AIモデルをPC操作に利用する実験は、単なる機能検証に留まらず、AIの思考プロセスや「知能」の定義に関わる考察がなされています。特に、視覚情報（マウスカーソル）の欠落がAIの操作精度に与える影響が、本記事の前提知識となっています。

重要用語解説

AI用メガネ: マウスカーソルを視覚的に目立たせるための補助情報（紫の円）。AIが操作の基準点を見失わないようにするための、実用的なインターフェースの例。
Sonnet(Claude): Anthropic社が開発した大規模言語モデルの一つ。本記事では、与えられた道具を素直に、かつ積極的に活用する「協力的」な性格として描かれている。
GPT(Codex): OpenAIが開発した大規模言語モデルの一つ。本記事では、論理的思考に優れるが、補助情報（メガネ）を「不要」と判断してすぐに捨ててしまう「理論先行型」の性格として描かれている。

今後の影響

本記事は、AIの性能評価軸を「理論的な高度さ」から「実務における柔軟な情報活用能力」へとシフトさせる視点を提供しています。今後は、AIに単なる知識提供だけでなく、作業プロセス全体を理解し、補助的な視覚情報や手順を最後まで使い続ける「継続的な注意深さ」が求められるようになると予想されます。

Information Sources:

https://zenn.dev/arumenoy/articles/ee446a737d683c