AI画像生成の進化を検証:「ウォーリーを探せ!」風イラスト再現にChatGPT Images 2.0が優位か
ソフトウェアエンジニアのサイモン・ウィリソン氏が、最新の画像生成AIの性能比較として、世界的な人気絵本『ウォーリーをさがせ!』風のイラスト生成に挑んだ結果を報告した。この検証は、OpenAIが日本時間2026年4月22日(水)に正式リリースした「ChatGPT Images 2.0」の能力を試す目的で行われた。ウィリソン氏は、「アマチュア無線機を持ったアライグマを探す」というプロンプトを使用し、複数のAIモデル(gpt-image-1、Claude Opus 4.7、Nano Banana 2、Nano Banana Pro、ChatGPT Images 2.0)に画像を生成させた。初期の「gpt-image-1」では、細かい部分の描写の崩れや、アライグマの発見が困難であった。Claude Opus 4.7は、アライグマの存在は認めたものの、明確な発見は困難と回答した。一方、Googleの「Nano Banana 2」や「Nano Banana Pro」は、アライグマを描写したが、群衆の中に隠れているという『ウォーリーをさがせ!』の形式からは逸脱し、目立ちすぎる描写となった。最も高い評価を得たのは、新バージョンの「ChatGPT Images 2.0」による画像であった。このモデルは、指定した3840×2160ピクセルという高解像度で、左下に「アマチュア無線機を持ったアライグマ」を周囲から目立ちすぎない形で描出することに成功した。ウィリソン氏は、この結果から、ChatGPT Images 2.0が少なくとも現時点ではGeminiなどの競合モデルから優位に立っていると結論づけている。この検証は、テキストと詳細な指示を組み合わせた複雑なイラスト生成能力の向上を示すものと述べられている。
背景
『ウォーリーをさがせ!』は、群衆の中から特定のキャラクターを探し出すという、視覚的な集中力と発見能力を試す人気の絵本シリーズです。本記事では、この古典的なゲーム形式をAI画像生成のテストケースとして利用し、最新モデルの描写精度と複雑な指示への対応力を検証しています。
重要用語解説
- ChatGPT Images 2.0: OpenAIが2026年4月22日にリリースした最新の画像生成機能。高解像度や複雑なプロンプトに対応し、描写精度が向上した点が特徴です。
- プロンプト: AI画像生成モデルに入力するテキスト指示のこと。本記事では「アマチュア無線機を持ったアライグマを探す」という具体的な指示が用いられました。
- アライグマ: 記事内で『ウォーリー』の代わりとして設定されたキャラクター。赤と白のしま模様の服を着ており、探す対象として描かれています。
今後の影響
AI画像生成モデルの競争が激化し、より高解像度かつ複雑なシーン描写が求められる傾向が強まります。ChatGPT Images 2.0の成功は、AIが単なる画像生成から、特定のコンセプトに基づいた高度なビジュアルコンテンツ制作へと進化していることを示唆しています。