문서 수준 관련성으로 검색 필터링

Vertex AI Search 앱에서 검색할 때 관련성 기준을 적용하면 이 기준을 충족하는 문서만 결과로 반환됩니다. 이 페이지에서는 쿼리에 반환되는 문서 수를 줄이기 위해 관련성 기준을 지정하는 방법을 설명합니다.

문서 수준 관련성별 필터링 정보

검색어에 의해 반환된 각 문서에는 반환된 문서와 검색어의 관련성을 나타내는 관련성 수준이 지정됩니다. API 호출을 통해 쿼리할 때 관련성 기준을 설정할 수 있습니다. 관련성 기준을 높게 설정하면 검색어에 의해 반환되는 문서 수가 줄어들 수 있습니다.

예를 들어 검색 시 사용자와 관련성이 낮은 문서가 너무 많이 반환되는 경우 관련성 기준을 높음으로 설정하여 가장 관련성이 높은 문서 몇 개만 표시되도록 결과 범위를 좁힐 수 있습니다. 높음으로 설정하는 것이 너무 제한적이면 중간으로 설정해 보세요.

문서 수준 관련성 필터에 지원되는 데이터 유형 및 앱

문서 수준 관련성 필터는 다음과 같은 유형의 데이터가 있는 데이터 스토어에 적용할 수 있습니다.

  • 고급 웹사이트 색인 생성을 사용하는 웹사이트 데이터
  • 일반적인 비정형 데이터
  • 일반적인 정형 데이터

문서 수준 관련성 필터는 기본 웹사이트 색인 생성, 미디어 데이터 또는 의료 데이터가 있는 데이터 스토어에는 작동하지 않습니다.

또한 문서 수준 관련성 필터는 혼합 검색 앱에서 사용할 수 없습니다. 혼합 검색 앱은 여러 데이터 스토어에 연결된 앱입니다.

기타 필터 종류

문서 수준 관련성 필터가 검색어에 의해 반환된 데이터를 필터링할 수 있는 유일한 방법이 아닙니다. 필터 표현식을 사용하여 메타데이터(메타데이터 데이터 스토어가 있는 고급 웹사이트 색인 생성 및 비정형 데이터) 및 필드 값(정형 데이터 스토어)을 기반으로 결과를 필터링할 수도 있습니다.

자세한 내용은 다음을 참조하세요.

필터 표현식과 문서 수준 관련성 필터를 모두 사용하는 경우 필터 표현식이 먼저 결과에 적용된 후 문서 수준 관련성 필터가 적용됩니다.

시작하기 전에

앱과 데이터 스토어를 만들고 데이터를 데이터 스토어에 수집했는지 확인합니다. 자세한 내용은 검색 앱 만들기를 참조하세요. 문서 수준 관련성 필터에 지원되는 데이터 유형 및 앱도 참조하세요.

관련성으로 필터링하려면 다음 단계를 따르세요.

  1. 앱 ID를 찾습니다. 앱 ID를 이미 알고 있는 경우 다음 단계로 건너뜁니다.

    1. Google Cloud 콘솔에서 Agent Builder 페이지로 이동합니다.

      앱으로 이동

    2. 페이지에서 앱 이름을 찾고 ID 열에서 앱 ID를 가져옵니다.

  2. 문서 수준 관련성을 기준으로 검색을 필터링하려면 engines.servingConfigs.search 메서드와 함께 relevanceThreshold 필드를 사용합니다.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID: Google Cloud 프로젝트의 ID입니다.
    • APP_ID: 쿼리할 Vertex AI Search 앱의 ID입니다.
    • QUERY: 검색할 쿼리 텍스트입니다.
    • RELEVANCE_THRESHOLD: HIGH, MEDIUM, LOW, LOWEST 중 하나입니다.
  3. 다양한 기준으로 여러 검색어를 테스트하여 데이터와 애플리케이션에 가장 적합한 기준 설정을 결정합니다.