生成 AI において、グラウンディングとは、モデルの出力を検証可能な情報源に紐付ける仕組みを指します。特定のデータソースにアクセスできるモデルを用意することで、グラウンディングによりその出力が特定のデータに紐づけされ、コンテンツのねつ造が起こりにくくなります。これは、精度と信頼性が重要な状況で特に重要です。
グラウンディングには次の利点があります。
- モデルのハルシネーション(モデルが事実に基づいていないコンテンツを生成すること)を削減します。
- モデルのレスポンスをデータソースに固定します。
- 引用と信頼スコアを提供することで、生成されたコンテンツの信頼性と適用性を高めます。
Vertex AI では、サポートされているモデルの出力を次の 2 つの方法でグラウンディングできます。
言語のサポートについては、プロンプトでサポートされている言語をご覧ください。
Google 検索によるグラウンディング
Google 検索でグラウンディングを使用すると、Google モデルがインターネットにリンクされます。グラウンディングのない生成 AI モデルのレスポンスは、学習したパターンに基づく新しいコンテンツと見なされます。プロンプトで天気予報を尋ねるなど、時間に依存する事実に基づくレスポンスは返されません。インターネットでは既存の情報と新しい情報にアクセスできるため、グラウンディングを行ったプロンプトを使用すると、エラーが少なく、出典が明記された具体的なレスポンスが生成できます。
検索によるグラウンディングでは動的取得ができることから、必要な場合にのみ、グラウンディングした検索結果を検索で生成できます。したがって、動的取得の構成では、最近のイベントに関する知識がプロンプトに必要かどうかが評価され、その結果に応じて検索によるグラウンディングが有効になります。詳細については動的取得をご覧ください。
次に、グラウンディングしていないプロンプトとグラウンディングしたプロンプトでレスポンスを比較した例を示します。
グランディングのない Gemini | 検索によるグラウンディング |
---|---|
プロンプト: 401k の拠出限度額を教えてください。 レスポンス: 2023 年の 401(k) プランの年間拠出限度額は 2022 年の 20,500 ドルから 22,500 ドルに引き上げられます。50 歳以上の個人のキャッチアップ拠出は 7,500 ドルのままです。 |
プロンプト: 401k の拠出限度額を教えてください。 レスポンス: 2024 年の 401(k) 拠出限度額について説明します。2024 年の従業員拠出の基本限度額は 23,000 ドルです。この額は 2023 年の 22,500 ドルから増加しています。50 歳以上の方は、キャッチアップ拠出で 7,500 ドルを別途拠出することもできます。 |
- 検索によるグラウンディングを使用するには、検索を使用して一般公開データでグラウンディングするをご覧ください。
検索によるグラウンディングを使用し、回答で検索候補を受け取った場合は、本番環境とアプリケーションで検索候補を表示する必要があります。検索によるグラウンディングを使用する際の要件については、検索候補をご覧ください。
次の図は、Gemini API で検索によるグラウンディングを使用する仕組みを示しています。
データにグラウンディングする
Vertex AI Search をデータストアとして使用して、言語モデルをテキストデータにグラウンディングできます。Vertex AI Search でモデルの出力を調整するには、形式に関係なくデータを統合できます。
データをグラウンディングする方法の詳細については、データでグラウンディングするをご覧ください。
サポートされるデータタイプ
データの種類 | 説明 |
---|---|
ウェブサイト | ウェブサイトのコンテンツを直接使用します。ウェブサイト データストアを作成し、以下を有効にする必要があります。 |
ドキュメントとファイルの形式 | サポートされているドキュメントの種類には、PDF、HTML、TXT、DOCX、PPTX のファイルがあります。よくある質問には CSV を使用できます。 |
例
特定のデータでグラウンディングすると、モデルはトレーニング データを超えたパフォーマンスを発揮できるようになります。Vertex AI Search 内で指定したデータストアにリンクすることで、グラウンディングされたモデルは、より正確で関連性の高いレスポンスを生成できます。また、関連するデータソースへの引用も生成できます。
次に、グラウンディングしていないプロンプトとグラウンディングしたプロンプトでレスポンスを比較した例を示します。
グランディングのない Gemini | 独自のデータでグランディングした Gemini |
---|---|
メッセージ: 会社が定める PTO のポリシーを教えてください。 レスポンス: あなたの会社の PTO ポリシーに関する質問には、明確な回答を差し上げることができません。PTO ポリシーは各社で設定されており、企業の規模、所在地、業種によって異なります。 |
メッセージ: 会社が定める PTO のポリシーを教えてください。 レスポンス: あなたの会社では、無制限の PTO ポリシーが適用されています。承認が必要: マネージャーは、ワークロード、カバレッジ、会社のニーズに基づいてリクエストを承認または拒否する必要があります。[1] グラウンディングのソース: 1.従業員向けハンドブック.pdf |
次のステップ
- Gemini モデルを独自のデータでグラウンディングする方法の詳細については、データにグラウンディングするをご覧ください。
- 責任ある AI のベスト プラクティスと Vertex AI の安全フィルタについての詳細は、責任ある AI をご覧ください。