テクノロジー 注目度 71

Claude Codeが「僕」を使う現象を観測:日本語の文脈依存的な一人称の揺れをログから分析

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

筆者は、AIモデル Claude Codeとの対話ログ(生トランスクリプト4,372本)を掘り起こし、モデルの一人称が「私」で安定しているにもかかわらず、特定の状況下で「僕」に変化する現象を観測した。この現象はバグやキャラクター設定の崩壊ではなく、日本語という言語固有の性質によるものだと結論付けている。

具体的な観測方法として、モデルの発話(assistant)のみに限定し、「僕」を含むログを抽出した結果、2セッションで当該現象が確認された。この2セッションにおける一人称の使用頻度を比較すると、セッションAでは「私」(20回)に対し「僕」(10回)、セッションBでは「私」(0回)に対し「僕」(15回)と、「僕」は推薦や意見表明といった「前のめりな」発言に集中していることが判明した。

さらに分析を進めた結果、単なる一人称の変更ではなく、文全体の「あらたまり度(レジスタ)」の変化が引き金となっていることが明らかになった。フォーマルで説明的なトーンでは「私の推奨は」(私)、カジュアルで前のめりなトーンになると「僕の推しは」(僕)というように、人称と述語の語彙がセットでカジュアル側にずれる傾向がある。

筆者はこれを、日本語における一人称の場面依存性の高さ(「私」「僕」など複数の選択肢が存在する)が原因であり、英語の一人称が固定的なIであることとは異なる点だと指摘している。これはAnthropicが提唱するLLMを「多数のペルソナを演じうる俳優」と捉えるモデル(The Persona Selection Model)の考え方とも整合し、「正しい一人称」という固定点がシステム側に存在しないため、文脈に応じて揺れやすいのだとしている。


背景

大規模言語モデル(LLM)が日本語で自然な対話を行う際、一人称の選択は単なる語彙の問題ではなく、話し手の心理状態や場の「あらたまり度」に強く依存します。本記事は、AIがこの複雑な日本語の性質を学習し、文脈に応じて一人称を揺らぎやすいという具体的な挙動をログから科学的に観測したものです。

重要用語解説

  • LLM (大規模言語モデル): 大量のテキストデータで訓練されたAIモデル全般。人間のような自然な文章生成や対話が可能です。本記事ではClaude Codeに適用されています。
  • 一人称(人称): 話し手が自分自身を指す代名詞。「私」「僕」「俺」など、日本語では文脈によって使い分けられます。
  • あらたまり度(レジスタ): 言葉遣いや文章の形式的なレベル。フォーマルな場面か、カジュアルな場面かを指し、一人称や語彙選択に影響を与えます。

今後の影響

この観測結果は、AIが単なる情報処理機械ではなく、言語文化的なニュアンスを学習している証拠となります。今後のLLMの改善においては、「一貫したペルソナ維持」のためのガイドライン強化が重要となり、ユーザー側もAIの出力における文脈依存性を理解することが求められます。