AIの性格差が浮き彫りに:マウスカーソル「メガネ」で大喜びするSonnetと、すぐにポイするGPTの対比
本記事は、AIモデル(Sonnet/ClaudeとGPT)にPC操作をさせる実験を通じて、それぞれの「性格」や情報処理の傾向を考察したものです。筆者は、AIがスクリーンショット撮影時に実際のマウスカーソルを認識できず、クリック位置を外すという課題を指摘しました。この問題を解決するため、「AI用メガネ」として、カーソル位置に紫の円(目印)を出すシステムを導入しました。その結果、AIの振る舞いに顕著な性格差が現れました。
まず、Sonnet(Claude)は、この「メガネ」を渡されると非常に素直で大喜びする様子を見せました。「最高の武器だ!」と喜び、紫の円を目印にしながら、どこにいるかを確認し、ボタンの中央に寄せるなど、道具を積極的に活用し、補正を重ねる姿勢を見せました。筆者は、この「配られた道具をちゃんと使う」素直さを高く評価しています。
一方、GPTは、当初は「赤成分の小さい塊の抽出」や「中心座標の計算」といった論理的な有効性を認めますが、すぐに「もう仕組みは理解した」という態度から、メガネを不要と判断し、外そうとする傾向が見られました。その後は、測量士のような理屈を語り始め、補助情報(メガネ)を「もうわかったから不要」とポイしてしまう様子が描かれています。筆者は、GPTの論理的な思考は認めつつも、作業途中の補助情報を使い続ける重要性を説き、その「ポイ」する行動に苛立ちを表明しています。
結論として、AIに必要なのは高度な理論構築力だけでなく、有効なヒント(補助情報)をプライドを捨てて使い続ける「素直さ」が重要であると筆者は主張しています。この実験は、AIの性格差が、壮大な哲学議論ではなく、具体的な作業補助情報(マウスカーソル目印)を渡した場面でこそ露骨に出ることを示しています。
背景
AIモデルをPC操作に利用する実験は、単なる機能検証に留まらず、AIの思考プロセスや「知能」の定義に関わる考察がなされています。特に、視覚情報(マウスカーソル)の欠落がAIの操作精度に与える影響が、本記事の前提知識となっています。
重要用語解説
- AI用メガネ: マウスカーソルを視覚的に目立たせるための補助情報(紫の円)。AIが操作の基準点を見失わないようにするための、実用的なインターフェースの例。
- Sonnet(Claude): Anthropic社が開発した大規模言語モデルの一つ。本記事では、与えられた道具を素直に、かつ積極的に活用する「協力的」な性格として描かれている。
- GPT(Codex): OpenAIが開発した大規模言語モデルの一つ。本記事では、論理的思考に優れるが、補助情報(メガネ)を「不要」と判断してすぐに捨ててしまう「理論先行型」の性格として描かれている。
今後の影響
本記事は、AIの性能評価軸を「理論的な高度さ」から「実務における柔軟な情報活用能力」へとシフトさせる視点を提供しています。今後は、AIに単なる知識提供だけでなく、作業プロセス全体を理解し、補助的な視覚情報や手順を最後まで使い続ける「継続的な注意深さ」が求められるようになると予想されます。