ドキュメント レベルの関連性で検索をフィルタする
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Vertex AI Search アプリで検索するときに、関連性しきい値を適用して、このしきい値を満たすドキュメントのみが結果として返されるようにすることができます。このページでは、クエリで返されるドキュメントの数を減らすために、関連性しきい値を指定する方法について説明します。
ドキュメント レベルの関連性でフィルタする
検索クエリによって返される各ドキュメントには、関連性レベルが割り当てられます。これは、返されたドキュメントとクエリの関連性を示します。API 呼び出しでクエリを実行するときに、関連性のしきい値を設定できます。関連性のしきい値を高く設定すると、クエリで返されるドキュメントの数を減らすことができます。
たとえば、検索でユーザーにとって関連性の低いドキュメントが多すぎる場合は、関連性のしきい値を高に設定して、最も関連性の高い少数の結果のみに絞り込みます。高設定で過剰に制限される場合は、中設定をお試しください。
ドキュメント レベルの関連性フィルタでサポートされているデータ型とアプリ
ドキュメント レベルの関連性フィルタは、次の種類のデータを含むデータストアに適用できます。
- ウェブサイトの高度なインデックス登録を使用したウェブサイト データ
- カスタム非構造化データ
- カスタム構造化データ
ドキュメント レベルの関連性フィルタは、ウェブサイトの基本的なインデックス登録、メディアデータ、医療データを含むデータストアでは機能しません。
また、ドキュメント レベルの関連性フィルタは統合検索アプリでは使用できません。ブレンド検索アプリは、複数のデータストアに接続されているアプリです。
その他の種類のフィルタ
ドキュメント レベルの関連性フィルタは、クエリで返されるデータをフィルタする唯一の方法ではありません。フィルタ式を使用して、メタデータ(ウェブサイトの高度なインデックス登録とメタデータ データストアを使用した非構造化データ)とフィールド値(構造化データストア)に基づいて結果をフィルタすることもできます。
詳細については、以下をご覧ください。
フィルタ式とドキュメント レベルの関連性フィルタの両方を使用すると、最初にフィルタ式が結果に適用され、次にドキュメント レベルの関連性フィルタが適用されます。
始める前に
アプリとデータストアを作成し、データストアにデータを取り込んだことを確認します。詳細については、検索アプリを作成するをご覧ください。ドキュメント レベルの関連性フィルタでサポートされているデータ型とアプリもご覧ください。
ドキュメント レベルの関連性に基づいて結果を検索、フィルタする
関連性でフィルタするには、次の手順を行います。
アプリ ID を確認します。アプリ ID がすでにある場合は、次のステップに進みます。
Google Cloud コンソールで、[AI アプリケーション] ページに移動します。
[アプリ] に移動
[アプリ] ページで、アプリの名前を見つけ、[ID] 列からアプリの ID を取得します。
ドキュメント レベルの関連性で検索をフィルタするには、engines.servingConfigs.search
メソッドで relevanceThreshold
フィールドを使用します。
curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
-d '{
"servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
"query": "QUERY",
"relevanceThreshold": "RELEVANCE_THRESHOLD"
}'
次のように置き換えます。
PROJECT_ID
: 実際の Google Cloud プロジェクト ID。
APP_ID
: クエリする Vertex AI Search アプリの ID。
QUERY
: 検索するクエリテキスト。
RELEVANCE_THRESHOLD
: 次のいずれかになります。
HIGH
、MEDIUM
、LOW
、LOWEST
。
コマンドの例と結果
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/my-project-123/locations/global/collections/default_collection/engines/my-search-app/servingConfigs/default_search:search" \
-d '{
"servingConfig": "projects/my-project-123/locations/global/collections/default_collection/engines/my-search-app/servingConfigs/default_search",
"query": "What is the check grounding API",
"relevanceThreshold": "HIGH"
}'
{
"results": [
{
"id": "a082e70352c073a4443502477255bd2a",
"document": {
"name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/branches/0/documents/a082e70352c073a4443502477255bd2a",
"id": "a082e70352c073a4443502477255bd2a",
"derivedStructData": {
"displayLink": "cloud.google.com",
"link": "https://cloud.google.com/generative-ai-app-builder/docs/check-grounding",
"htmlTitle": "Check grounding",
"title": "Check grounding"
}
}
}
],
"totalSize": 1,
"attributionToken": "f_B-CgwIidzwswYQyue15gESJDY2N2M1NmJkLTAwMDAtMjk3Ni1iMGI4LTg4M2QyNGZmNTZhOCIHR0VORVJJQypAjr6dFavEii3b7Ygt3o-aIoCymiLC8J4Vo4CXIra3jC3Usp0V24-aIt7tiC3n7YgtrsSKLeTtiC2DspoixsvzFw",
"guidedSearchResult": {},
"summary": {}
}
ここでは、関連性のしきい値が高に設定されているため、最も関連性の高い結果のみが返されます。この例では、関連性が高いと判断されたドキュメントは 1 つだけです。
さまざまなしきい値で複数のクエリをテストして、データとアプリケーションに最適なきい値設定を特定します。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-09-11 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-09-11 UTC。"],[],[],null,[]]