生成 AI におけるグラウンディングとは、モデルの出力を、検証可能な情報源に紐付ける仕組みを指します。特定のデータソースにアクセスできるモデルを用意することで、グラウンディングによってその出力を特定のデータに紐づけ、コンテンツの創作の余地を減らすことができます。これは、精度と信頼性が重要な状況で特に重要です。
グラウンディングには次の利点があります。
- モデルのハルシネーション(モデルが事実に基づいていないコンテンツを生成すること)を削減します。
- モデルのレスポンスを特定の情報と関連付けます。
- 生成されたコンテンツの信頼性と適用可能性が高まります。
Vertex AI では、サポートされているモデルの出力を次の 2 つの方法でグラウンディングできます。
Google 検索によるグラウンディング
Google 検索でグラウンディングを使用すると、Google モデルがインターネットにリンクされます。グラウンディングのない生成 AI モデルのレスポンスは、学習したパターンに基づく新しいコンテンツと見なされます。プロンプトで天気予報を尋ねるなど、時間に依存する事実に基づくレスポンスは返されません。インターネットでは既存の情報と新しい情報にアクセスできるため、グラウンディングを行ったプロンプトを使用すると、エラーが少なく、出典が明記された具体的なレスポンスを生成できます。
Google 検索によるグラウンディングでは動的取得ができることから、必要な場合にのみ、グラウンディングした検索結果を Google 検索で生成できます。したがって、動的取得の構成では、最近のイベントに関する知識がプロンプトに必要かどうかが評価され、その結果に応じて Google 検索によるグラウンディングが有効になります。詳細については動的取得をご覧ください。
次に、グラウンディングしていないプロンプトとグラウンディングしたプロンプトでレスポンスを比較した例を示します。
グランディングのない Gemini | Google 検索によるグラウンディング |
---|---|
プロンプト: 401k の拠出限度額を教えてください。 レスポンス: 2023 年の 401(k) プランの年間拠出限度額は 2022 年の 20,500 ドルから 22,500 ドルに引き上げられます。50 歳以上の個人のキャッチアップ拠出は 7,500 ドルのままです。 |
プロンプト: 401k の拠出限度額を教えてください。 レスポンス: 2024 年の 401(k) 拠出限度額について説明します。2024 年の従業員拠出の基本限度額は 23,000 ドルです。この額は 2023 年の 22,500 ドルから増加しています。50 歳以上の方は、キャッチアップ拠出で 7,500 ドルを別途拠出することもできます。 |
- Google 検索でグラウンディングを使用するには、Google 検索を使用して一般公開データでグラウンディングするをご覧ください。
Google 検索でグラウンディングを使用し、レスポンスで Google 検索の候補を受け取った場合は、本番環境とアプリで検索候補を表示する必要があります。Google 検索を使用したグラウンディングに対する要件については、検索候補をご覧ください。
次の図は、Gemini API で Google 検索とグラウンディングを連携させる仕組みを示しています。
独自のデータへのグラウンディング
Vertex AI Search をデータストアとして使用して、言語モデルを独自のテキストデータでグラウンディングできます。Vertex AI Search を使用すると、独自のデータを形式に関係なく統合して、モデルの出力を調整できます。サポートされているデータの種類は次のとおりです。
- ウェブサイトのデータ: ウェブサイトのコンテンツを直接使用します。
- 非構造化データ: 未加工で形式のないデータを活用します。
特定のデータでグラウンディングすると、モデルはトレーニング データを超えたパフォーマンスを発揮できるようになります。Vertex AI Search 内で指定したデータストアにリンクすることで、グラウンディングされたモデルは、より正確で関連性の高いレスポンスを生成できます。また、ユースケースに直接関連するレスポンスを生成することもできます。
次に、独自のデータによるグラウンディングのないプロンプトとあるプロンプトのレスポンスの例を示します。
グランディングのない Gemini | 独自のデータでグランディングした Gemini |
---|---|
メッセージ: 会社が定める PTO のポリシーを教えてください。 レスポンス: あなたの会社の PTO ポリシーに関する質問には、明確な回答を差し上げることができません。PTO ポリシーは各社で設定されており、企業の規模、所在地、業種によって異なります。 |
メッセージ: 会社が定める PTO のポリシーを教えてください。 レスポンス: あなたの会社では、無制限の PTO ポリシーが適用されています。承認が必要: マネージャーは、ワークロード、カバレッジ、会社のニーズに基づいてリクエストを承認または拒否する必要があります。 |
- Gemini モデルを独自のデータでグラウンディングするには、独自のデータでグラウンディングするをご覧ください。