検索拡張生成（RAG）とは

RAG（検索拡張生成）は、従来の情報検索システム（検索やデータベースなど）の長所と、生成大規模言語モデル（LLM）の機能を組み合わせた AI フレームワークです。独自のデータと世界に関する知識を LLM の言語スキルと組み合わせることで、根拠のある生成はより精度が高く最新の、特定のニーズに関連したものとなります。この電子書籍をチェックして、企業の実体を明らかにしましょう。

無料で開始

35:30

Vertex AI Search と DIY RAG による Gemini の根拠づけ

検索拡張生成の仕組み

RAG は、生成 AI の出力を強化するために、いくつかの主要な手順で動作します。

取得と前処理: RAG は、強力な検索アルゴリズムを活用して、ウェブページ、ナレッジベース、データベースなどの外部データをクエリします。関連情報が取得されると、トークン化、ステミング、ストップワードの削除などの前処理が行われます。
根拠に基づく生成: 取得された情報の前処理が終わると、事前トレーニング済みの LLM にシームレスに組み込まれます。この統合により、LLM のコンテキストが強化され、トピックをより包括的に理解できるようになります。この補強されたコンテキストにより、LLM はより正確で有益な、魅力的な回答を生成できるようになります。

RAG を使用する理由

RAG には、従来のテキスト生成方法を補完するいくつかの利点があります。特に、事実情報やデータドリブンな回答を扱う場合にその利点が生かされます。RAG を使用するとメリットがあることには、次のような主な理由があります。

新しい情報へのアクセス

LLM は、事前トレーニング済みデータに限定されます。そのため、情報が古く、不正確であることが考えられるレスポンスを生成する場合があります。RAG は、LLM に最新の情報を提供することによってこれを克服します。

事実に基づく根拠付け

LLM は、創造的で魅力的なテキストを生成するための優れたツールですが、事実の正確性については苦慮することになる場合があります。これは、LLM が大量のテキストデータでトレーニングされていて、そのテキストデータに不正確さやバイアスが含まれている可能性があるためです。

入力プロンプトの一部として LLM に「事実」を提示することで、「生成 AI のハルシネーション」を軽減できます。このアプローチの要点は、ユーザーの質問に答え、システムの指示と安全上の制約を遵守しつつ、最も関連性の高い事実が LLM に提示され、LLM の出力が完全にそれらの事実に基づいている状態を確保することです。

Gemini の長いコンテキストウィンドウ（LCW）を使用すると、LLM にソースマテリアルを提供できます。LCW に収まる量を超える情報を提供する必要がある場合や、パフォーマンスをスケールアップする必要がある場合は、トークンの数を減らし、時間と費用を節約できる RAG アプローチを使用します。

ベクトルデータベースと関連性についての re-ranker を使用して検索する

RAG は通常、検索によって事実を取得します。最新の検索エンジンは、ベクトルデータベースを活用して関連ドキュメントを効率的に取得するようになりました。ベクトルデータベースは、ドキュメントをエンベディングとして高次元空間に保存し、セマンティックな類似性に基づいて高速かつ正確に検索できるようにします。マルチモーダルエンベディングは画像、音声、動画などに使用でき、これらのメディアエンベディングはテキストエンベディングやマルチランゲージエンベディングとともに取得できます。

Vertex AI Search などの高度な検索エンジンでは、セマンティック検索とキーワード検索を組み合わせて使用します（ハイブリッド検索と呼ばれます）。また、検索結果にスコアを付け、上位に返される結果が最も関連性が高い状態にする re-ranker も使用します。また、検索結果は、誤字のない明確で的を絞ったクエリで検索した方が向上します。そのため、高度な検索エンジンは、検索前にクエリを変換してスペルミスを修正します。

RAG、エージェント、chatbot

RAG とグラウンディングは、最新のデータ、プライベートなデータ、または特殊なデータへのアクセスを必要とする LLM アプリケーションやエージェントに統合できます。外部の情報にアクセスすることで、RAG を利用した chatbot と会話エージェントが外部の知識を活用し、より包括的で情報に富み、コンテキストアウェアな回答を提供できるようにし、全体的なユーザーエクスペリエンスを向上させます。

生成 AI で構築する内容を差別化する要因は、データとユースケースです。RAG とグラウンディングにより、データを LLM に効率的かつスケーラブルに適用できます。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

無料で開始

開始にあたりサポートが必要な場合
お問い合わせ
信頼できるパートナーと連携する
パートナーを探す
もっと見る
すべてのプロダクトを見る

検索拡張生成（RAG）とは

検索拡張生成の仕組み