取得とランキングについて

このページでは、検索とランキングが連携して Vertex AI Search アプリで関連性の高い検索結果を返す仕組みについて説明します。

概要

つまり、検索は関連性の高いドキュメントを見つけることであり、ランキングは検索されたドキュメントを並べ替えることです。利用可能なすべてのドキュメントをランク付けすると、計算コストが高くなる可能性があります。そのため、取得とランキングは順番に行われます。

まず、検索モデルがクエリを理解して書き換えます。次に、使用可能なデータソースとデータストア内のインデックス付きドキュメントの数に応じて、モデルは数千件のドキュメントを取得します。取得されたドキュメントに関連性スコアが割り当てられます。

ランキング モデルは、取得したドキュメントを並べ替え、上位 400 件のランク付けされた結果を提供します。次の図は、これらの 2 つのプロセスが検索ワークフローにどのように適合するかを示しています。

検索における取得とランキング
図 1. 検索ワークフローでの取得とランキング

取得方法

検索とは、ユーザーのクエリに関連するドキュメントのサブセットをデータストアから選択するプロセスです。Vertex AI Search モデルは、次のようなさまざまなシグナルに基づいて検索アプリの検索を管理し、関連性スコアを割り当てます。

  • トピック性: キーワードのマッチング、ナレッジグラフ、ウェブ シグナルが含まれます。

  • エンベディング: 概念的に類似したコンテンツを見つけるためのエンベディングが含まれます。

  • クロス アテンション: モデルがクエリとドキュメントの関係を考慮して、ドキュメントに関連性スコアを割り当てることができます。

  • 鮮度: データストア内のドキュメントの経過時間を特定します。

  • ユーザー イベント: パーソナライズに使用されるコンバージョン シグナルが含まれます。

また、検索リクエストで、ウェブサイト データ構造化データまたは非構造化データ関連性フィルタとメタデータ フィルタを指定して、関連するドキュメントのリストを絞り込むこともできます。

ランキング方法

ランキングでは、検索フェーズで選択されたドキュメントを取得し、次の条件に従って新しい関連性スコアを割り当てて、並べ替えます。

  • ブースト: カスタム属性または鮮度に基づいて、特定の結果を上位に表示したり、下位に表示したりします。これは、取得された最初の 1,000 件のドキュメントに影響し、上位 400 件をランク付けします。詳細については、検索結果をブーストするをご覧ください。
  • カスタム ランキング: 特定の要件に合わせて、数式ベースのランキング アルゴリズムを使用してデフォルトのランキング ロジックを制御、調整、オーバーライドします。結果の提供時に、カスタム ランキングで割り当てられた関連性スコアが優先されます。詳細については、検索結果のランキングをカスタマイズするをご覧ください。
  • 検索チューニング: モデルがドキュメントのセマンティック関連性をどのように認識するかに影響し、エンベディングの関連性スコアを変更します。詳細については、検索チューニングで検索結果を改善するをご覧ください。
  • イベントベースの再ランキング: ユーザー イベントベースのパーソナライズ モデルを使用して、サービング時に結果を更新します。