LLM が抱える課題と RAG 技術の登場 LLM は大量のデータを使って学習しますが、学習データに含まれない情報を含む質問にはうまく回答できません。例えば、「最新の科学論文に基づいて、この病気の新しい治療法を提案してください」といった質問に対して、LLM は学習データに含まれていない最新の科学論文の内容を理解することができません。 この問題を解決するために、Retrieval-Augmented Generation (RAG) 技術が登場しました。RAG は、ユーザーの質問に基づいて関連情報を検索し、その結果を LLM への入力として使用することで、より正確な回答を生成します。 従来の RAG では、検索にベクトル類似度が用いられてきました。しかし、Microsoft Research の最新の研究では、非公開データの分析において、プロンプト拡張が有効であることが示唆されました。 Gr