AI初期の画期的な成果:SHRDLUが実現した自然言語理解の可能性
本記事は、1968年から1970年にかけてMITのテリー・ウィノグラッドによって開発された初期の自然言語理解(NLU)プログラム「SHRDLU」について詳細に解説している。SHRDLUは、ユーザーが「ブロックの世界」と呼ばれる仮想的な箱の中の物体(ブロック、円錐、ボールなど)を操作し、それについて会話を行うことで、コンピューターが自然言語による指示を理解する様子を実演した画期的なシステムである。このプログラムは、Micro PlannerとLisp言語を用いてDEC PDP-6コンピューター上で動作した。
SHRDLUの機能性の核心は、単なる言語解析に留まらない点にある。それは、以下の複数の要素を組み合わせることで「理解」のシミュレーションをより説得的に実現している。第一に、その「世界」が非常に単純であるため、名詞、動詞、形容詞といった基本的な言語要素(約50語)だけで全ての物体と場所を記述できる点。第二に、基本的な記憶機能(コンテキスト)を備えており、「緑の円錐を赤いブロックの上に置く」といった指示の後に「円錐を取って」と尋ねた場合、「円錐」が直前に話題に上がった「緑の円錐」を指すことを理解できる。第三に、物理的な法則(ブロックが倒れるなど)や、物体間の関係性(積み重ねの可能性)に関する質問に答えられる。第四に、物体に与えられた名前や配置を記憶し、それに基づいて新しい質問に答える能力を持つ。
記事に掲載された対話例からもわかるように、SHRDLUは「ピラミッドはブロックに支えられているか?」「箱の中には何が入っているか?」といった、複雑な質問や、物体の操作履歴に基づいた質問に対して、論理的に応答することが可能であった。しかし、ウィノグラッド自身は、このシステムが「デモ」映えするものであり、実際の汎用的な利用に向けた過度なプレッシャーがAI研究全体に「ポテンキン村」のような状況(見た目は良いが、構造が不十分)を引き起こしたと警鐘を鳴らしている。SHRDLUは、対話型フィクションの先駆けとも見なされるが、その成功はAI研究における過度な楽観論を招き、後のより複雑な曖昧性を持つ状況への対応が課題となった経緯がある。
背景
SHRDLUは、1960年代後半から1970年代にかけてのAI研究の黎明期に開発された。当時のAI研究は、自然言語処理(NLP)の可能性を大きく示し、大きな期待を集めた。しかし、その成功が過度な楽観論を招き、現実の複雑な曖昧性や文脈理解に対応できず、一時的な停滞期(AIの冬)を招いたという歴史的背景がある。
重要用語解説
- 自然言語理解(NLU): コンピューターが人間が話す自然な言葉の意味や意図を解析し、理解する技術。SHRDLUが最も初期の成功例として示した分野である。
- ブロックの世界: SHRDLUがシミュレーションを行う仮想的な環境。ブロック、円錐、ボールなど、単純な物体のみで構成され、複雑な物理法則や関係性を検証するための限定された空間。
- コンテキスト(文脈): 会話の流れや直前のやり取りを記憶し、単語や指示の曖昧な意味を特定する能力。SHRDLUが「the cone」という指示を指す物体を特定する際に利用した機能。
- 影響: SHRDLUは、AIが自然言語を通じて世界を理解できる可能性を世界に示した画期的な成果であった。しかし、その成功は、AI研究が「デモ」に偏り、現実の複雑な曖昧性や汎用的な応用への移行に苦しむ原因ともなった。現代のAIは、この初期の成功を基盤としつつ、より高度な文脈理解と実用性を目指している。