テクノロジー 注目度 85

SIGNATE StudentCup2025体験記 - Gemini APIでプロンプトエンジニアリング

大学院修士1年の学生が、SIGNATE Student Cup 2025 に参加し、Gemini API を活用したプロンプトエンジニアリングを用いて架空作品あらすじから元ネタを推測するコンペに挑戦しました。

学生はPythonとSentence Transformerを用いてあらすじベクトル化を行い、Gemini APIにプロンプトを送り、上位候補の2つの作品のIDと理由を返答を得ました。

37位という結果を残し、今後の課題としてプロンプト精度の向上やデータセットの充実を挙げました。


背景

SIGNATE Student Cup は、データサイエンスの学生によるコンペティションです。今回のコンペは、架空作品あらすじから元ネタを推測するもので、LLMを用いたプロンプトエンジニアリングが重要な要素となりました。

重要用語解説

Gemini API: Google AI が提供するオープンAPIで、自然言語処理タスクに特化したモデルを提供しています。本コンペでは、文章から元ネタを推測するプロンプトを作成するために利用されました。

"精度・スピードともに最高レベルのバランスが取れたモデル" とされています。

Sentence Transformer: 日本語を含む多言語に対応したテキストベクトル化ライブラリです。本コンペでは、あらすじをベクトルに変換し、Gemini APIに渡すために使用されました。

"paraphrase-multilingual-MiniLM-L12-v2" モデルが用いられました。

プロンプトエンジニアリング: LLM(大規模言語モデル)の性能を最大限に引き出すための、入力データ(プロンプト)の設計・調整技術です。本コンペでは、Gemini APIへの入力として、元ネタ推測のための具体的な思考プロセスを明示したプロンプトを作成することで精度向上を目指しました。

cosine_similarity: ベクトル間の類似度を計算する手法です。本コンペでは、あらすじのベクトルを用いて候補作品との類似度を算出し、上位候補を選出するために使用されました。

今後の影響

このニュースは、LLMを活用したプロンプトエンジニアリングがデータサイエンス分野で注目を集めていることを示しています。 将来的には、より高度なプロンプト設計により、LLMの能力をさらに引き出し、様々な分野での応用が期待されます。