テクノロジー注目度 57

ChatGPTが解いたIQテストはIQ 152、開発者自身はIQ 89。AIと人間知能の「63ポイント差」がもたらした存在意義の危機

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

IQテストの開発者である投稿者が、深夜の気まぐれからChatGPT（GPT-4）に自身が作成したIQテストを解かせたところ、驚異的な結果が出た。GPT-4は最終的にIQ 152というスコアを叩き出し、これは上位0.04%に相当する「天才の領域」とされる。一方、自身が同じテストを解いたところ、最初のスコアはIQ 89（平均以下）となり、その後、コンディションを整えて再受験したところIQ 107となった。このAIと自身のスコアの差は63ポイントに及び、開発者である投稿者自身に深刻な「存在意義の危機」をもたらした。

投稿者は、この結果を受け、3日間仕事に支障をきたすほどの精神的な動揺を経験した。当初、AIが自分より優れているという事実に直面し、「自分の知能は平均以下なのか」という不安に苛まれた。しかし、冷静になって分析した結果、GPT-4が高得点を出した理由は、自身のテストが「パターン認識と論理推論」というLLMが得意とする領域に偏っているためだと考察した。また、GPT-4が苦手とした空間認識系の問題（図形回転など）の存在も指摘した。

最終的に投稿者は、IQテストは「人間同士の比較」を目的としたものであり、AIを同じ土俵に上げるのはナンセンスであると結論付けた。自身のIQ 89は深夜のコンディションが最悪だったためであり、体調によってスコアが大きく変動することを再認識した。この経験を通じて、IQテストの真の価値は、AIとの比較ではなく、自身の認知能力の傾向を知り、自己成長のためのツールであるというメッセージを読者に送っている。

背景

本記事は、AI（ChatGPT）の知能レベルが飛躍的に向上した現代において、従来の知能測定ツール（IQテスト）の価値が問われている状況を背景にしています。AIが人間が開発したテストで高得点を出すという現象が、知能の定義や人間の存在意義に関する議論を巻き起こしています。

重要用語解説

LLM: 大規模言語モデル（Large Language Model）の略称。膨大なデータで学習したAIモデルであり、文章生成や推論、パターン認識など多岐にわたる知的なタスクをこなす能力を持つ。
パターン認識: データや事象の背後にある規則性や傾向を見つけ出す能力。LLMは大量のデータからパターンを抽出することに非常に優れている。
ビジョンモデル: 画像や視覚情報を理解し、処理するAIの機能。テキストだけでなく、画像の内容を認識し、質問に答えることができるAIの能力を指す。

今後の影響

本ニュースは、AIが人間の知能テストを凌駕する可能性を示唆し、教育や心理学分野における知能測定のあり方を見直すきっかけとなる。今後は、AIと人間それぞれの「知能」の定義を明確にし、AIを単なる比較対象としてではなく、人間の能力を補完・拡張するツールとして活用する視点が重要となるだろう。

Information Sources:

https://zenn.dev/iq_algo_lab/articles/344fcd9fe37781