이 페이지는 Cloud Translation API를 통해 번역되었습니다.

자동 완성 구성

이 페이지에서는 Vertex AI Search의 기본 자동 완성 기능을 설명합니다. 자동 완성은 쿼리에 입력된 첫 몇 글자를 기반으로 검색어 추천을 생성합니다.

자동 완성에서 생성하는 추천 용어는 검색 앱에서 사용하는 데이터 유형에 따라 다릅니다.

정형 데이터와 비정형 데이터. 기본적으로 자동 완성은 데이터 스토어의 문서 콘텐츠를 기반으로 추천 용어를 생성합니다. 기본적으로 문서를 가져온 후에는 자동 완성은 충분한 품질 데이터가 있을 때까지(일반적으로 며칠) 추천 용어를 생성하지 않습니다. API를 통해 자동 완성 요청을 수행하면 자동 완성에서 검색 기록이나 사용자 이벤트를 기반으로 추천 용어를 생성할 수 있습니다.
웹사이트 데이터. 기본적으로 자동 완성은 검색 기록에서 추천 용어를 생성합니다. 자동 완성을 사용하려면 실제 검색 트래픽이 필요합니다. 검색 트래픽이 시작된 후 자동 완성에서 추천 용어를 생성하는 데 하루나 이틀이 걸립니다. 실험용 고급 문서 데이터 모델을 사용하여 공개 사이트의 웹 크롤링한 데이터에서 추천 용어를 생성할 수 있습니다.
의료 데이터. 기본적으로 표준 의료 데이터 소스는 의료 데이터 스토어의 자동 완성 추천 용어를 생성하는 데 사용됩니다.

쿼리 추천 모델은 자동 완성이 추천 용어를 생성하는 데 사용하는 데이터 유형을 결정합니다. 쿼리 추천 모델에는 다음과 같이 4가지가 있습니다.

문서. 문서 모델은 사용자가 가져온 문서에서 추천 용어를 생성합니다. 웹사이트 데이터나 의료 데이터에는 이 모델을 사용할 수 없습니다.
완성 가능 필드. 완성 가능 필드 모델은 정형 데이터 필드에서 직접 가져온 텍스트를 제안합니다. completable로 주석이 달린 필드만 자동 완성 추천 용어에 사용됩니다. 이 모델은 정형 데이터에만 사용 가능합니다.
검색 기록. 검색 기록 모델은 SearchService.search API 호출 기록에서 추천 용어를 생성합니다. servingConfigs.search 메서드에 사용할 수 있는 트래픽이 없는 경우에는 이 모델을 사용하지 마세요. 의료 데이터에는 이 모델을 사용할 수 없습니다.
사용자 이벤트. 사용자 이벤트 모델은 사용자가 가져온 search 유형의 이벤트에서 추천 용어를 생성합니다. 의료 데이터에는 이 모델을 사용할 수 없습니다.

자동 완성 요청은 dataStores.completeQuery 메서드를 통해 전송됩니다.

또는 쿼리 추천 모델을 사용하지 않으려면 가져온 추천 목록을 기반으로 자동 완성 추천을 제공하는 가져온 추천을 사용하면 됩니다. 자세한 내용은 가져온 자동 완성 추천 목록 사용하기를 참고하세요.

데이터 유형에 따라 사용 가능한 모델 유형

다음 표에는 각 데이터 유형에 사용할 수 있는 질문 제안 모델 유형이 나와 있습니다.

검색어 추천 모델	데이터 소스	웹사이트 데이터	정형 데이터	비정형 데이터
문서	가져옴		✔*(기본값)	✔(기본값)
완성 가능 필드	가져옴		✔
검색 기록	자동 수집	✔(기본값)	✔	✔
사용자 이벤트	위젯에서 가져오거나 자동으로 수집	✔	✔	✔
웹에서 크롤링되는 콘텐츠	사용자가 지정한 공개 웹사이트의 콘텐츠에서 크롤링됨	✔^†

*: 문서 스키마에 title 또는 description 필드가 포함되어 있거나 title 또는 description 키 속성으로 지정된 필드가 있어야 합니다. 정형 데이터 스키마 업데이트를 참조하세요.

^†: 웹 크롤링 콘텐츠는 자동 완성을 위한 실험용 고급 문서 데이터 모델이 사용 설정된 경우에만 데이터 소스로 사용될 수 있습니다. 고급 문서 데이터 모델을 참조하세요.

데이터 유형에 기본 모델을 사용하지 않으려면 자동 완성 요청을 보낼 때 다른 모델을 지정하면 됩니다. 자동 완성 요청은 dataStores.completeQuery 메서드를 통해 전송됩니다. 자세한 내용은 API 안내: 자동 완성 요청을 전송하여 다른 모델 선택을 참조하세요.

자동 완성 기능

Vertex AI Search는 검색 시 가장 유용한 예측이 표시되도록 다음과 같은 자동 완성 기능을 지원합니다.

기능	설명	예시 또는 자세한 정보
오타 수정	오타인 단어 철자를 수정합니다.	`Milc` → `Milk`.
안전하지 않은 검색어 삭제	Google 세이프서치에서 제공합니다. 부적절한 검색어를 삭제합니다. 영어 (`en`), 프랑스어 (`fr`), 독일어 (`de`), 이탈리아어 (`it`), 폴란드어(`pl`), 포르투갈어 (`pt`), 러시아어 (`ru`), 스페인어 (`es`), 우크라이나어 (`uk`)를 지원합니다.	불쾌감을 주는 텍스트(예: 포르노, 선정적, 저속함, 폭력)
기본 개인 식별 정보 (PII)의 표시 방지	Sensitive Data Protection을 기반으로 하는 Vertex AI Search는 전화번호, 이메일 주소와 같은 기본 유형의 PII가 표시되지 않도록 합당한 노력을 기울입니다.	데이터 스토어에 이메일 주소 `jeffersonloveshiking@gmail.com`가 있는 경우 사용자가 검색창에 `jef`를 입력하면 Vertex AI Search에서 이메일 주소를 자동 완성 추천으로 반환하지 않습니다. PII 유출을 더욱 철저하게 방지하려면 Vertex AI Search에서 제공하는 디텍터 외에도 자체 데이터 손실 방지 (DLP) 솔루션을 적용하는 것이 좋습니다. 자세한 내용은 PII 유출 방지를 참고하세요.
차단 목록	차단 목록에 나열된 검색어를 삭제합니다.	자세한 내용은 자동 완성 차단 목록 사용을 참조하세요.
검색어 중복 삭제	AI 기반 시맨틱 이해를 제공합니다. 거의 동일한 검색어의 경우 두 검색어 모두 일치하지만 더 인기 있는 검색어만 추천됩니다.	`Shoes for Women`, `Womens Shoes`, `Womans Shoes`는 중복 삭제되며 가장 인기 있는 검색어만 추천됩니다.
꼬리말 일치 추천 용어	미국 및 EU 멀티 리전에서는 사용할 수 없습니다. 선택적 설정입니다. 전체 검색어에 대한 자동 완성 일치 항목이 없는 경우 검색어의 마지막 단어에 대한 일치 항목만 제안합니다. 의료 검색에는 사용할 수 없습니다.	자세한 내용은 꼬리말 일치 추천 용어를 참조하세요.

꼬리말 일치 추천 용어

꼬리말 일치 추천 용어는 쿼리 문자열의 마지막 단어와 정확하게 일치하는 프리픽스를 통해 생성됩니다.

예를 들어 'songs with he'라는 검색어가 자동 완성 요청에 전송되었다고 가정해 보겠습니다. 꼬리말 일치가 사용 설정되면 자동 완성에서 전체 프리픽스 'songs with he'에 일치 항목이 없는 것으로 확인할 수 있습니다. 하지만 검색어의 마지막 단어인 'he'에는 'hello world' 및 'hello kitty'와 정확하게 일치하는 프리픽스가 있습니다. 이 경우 전체 일치 추천 용어가 없으므로 반환된 추천 용어는 'songs with hello world' 및 'songs with hello kitty'입니다.

이 기능을 사용하면 빈 추천 결과를 줄이고 추천 다양성을 높일 수 있습니다. 이는 데이터 소스(사용자 이벤트 수, 검색 기록, 문서 주제 적용 범위)가 제한된 경우에 특히 유용합니다. 하지만 꼬리말 일치 추천 용어를 사용 설정하면 전반적인 추천 용어 품질이 저하될 수 있습니다. 꼬리말 일치는 프리픽스의 끝부분 단어와 일치하므로 반환된 일부 추천 용어가 적절하지 않을 수 있습니다. 예를 들어 'songs with he'와 같은 검색어에 'songs with helpers guide'와 같은 꼬리말 일치 추천 용어가 표시될 수 있습니다.

꼬리말 일치 추천 용어는 다음과 같은 경우에만 반환됩니다.

include_tail_suggestions는 dataStores.completeQuery 요청에서 true로 설정되어 있습니다.
검색어에 대한 전체 프리픽스 일치 추천 용어가 없습니다.

개인 식별 정보 유출 방지

PII의 정의는 광범위하며 PII를 감지하기 어려울 수 있습니다. 따라서 Vertex AI Search는 자동 완성 추천에 PII가 반환되지 않는다고 보장할 수 없습니다.

Vertex AI Search는 Sensitive Data Protection 검사 서비스를 적용하여 일반적인 유형의 PII가 추천으로 표시되지 않도록 찾고 차단합니다. 하지만 데이터 스토어에 PII가 포함되어 있거나 검색 기록 또는 사용자 이벤트 쿼리 제안 모델을 사용하는 경우 다음을 검토하고 적절한 조치를 취하세요.

보호하려는 PII 유형이 전화번호, 이메일 주소와 같이 비교적 표준인 경우 앱의 자동 완성 추천을 광범위하게 테스트하는 것부터 시작하세요. Vertex AI Search는 자동 완성 추천에 PII가 반환되지 않는다고 보장할 수 없습니다.
자동 완성 테스트 중에 PII 유출이 발견되거나 보호해야 하는 비표준 PII (예: 독점 사용자 ID)가 이미 있는 경우 자동 완성 기준점과 콘텐츠 제공 매개변수를 조정해 보세요. 자세한 내용은 개인 식별 정보가 포함된 추천 반환 위험 줄이기를 참고하세요.
매개변수를 조정해도 개인 식별 정보 유출을 방지할 수 없는 경우 자체 DLP 솔루션을 구현하세요. 데이터 스토어, 사용자 이벤트 또는 사용자의 검색어에서 발견될 가능성이 가장 높은 개인 식별 정보 유형에 맞게 DLP 솔루션을 맞춤설정합니다. 민감한 정보 보호 또는 서드 파티 DLP 서비스를 사용할 수 있습니다. 다음 방법 중 하나를 선택합니다.
- 데이터 스토어에 문서와 사용자 이벤트를 가져오기 전에 PII를 필터링합니다.
- 서빙 시점에 사용자에게 추천을 표시하기 전에 자동 완성 추천을 검토하고 개인 식별 정보가 포함된 추천을 차단합니다.
검색 기록 또는 사용자 이벤트 모델을 사용하는 경우 검색창에 사용자에게 검색어에 개인 식별 정보를 입력하지 말라고 안내하는 정보 텍스트를 추가합니다.
PII 차단에 관해 궁금한 점이 있거나 특정 문제가 있는 경우 고객 엔지니어 (CE) 또는 Google 계정팀에 문의하세요.

위젯의 자동 완성을 사용 설정하거나 중지하려면 다음 단계를 수행합니다.

콘솔

Google Cloud 콘솔에서 AI 애플리케이션 페이지로 이동합니다.

AI Applications
수정하려는 앱의 이름을 클릭합니다.
구성을 클릭합니다.
UI 탭을 클릭합니다.
자동 완성 추천 용어 표시 옵션을 전환하여 위젯의 자동 완성 추천 용어를 사용 설정하거나 중지합니다. 자동 완성을 사용 설정하면 추천이 시작되는 데 1~2일 정도 걸립니다.

자동 완성 설정 업데이트

UI에서 자동 완성 설정을 구성하려면 다음 단계를 따르세요.

콘솔

Google Cloud 콘솔에서 AI 애플리케이션 페이지로 이동합니다.

AI Applications
수정하려는 앱의 이름을 클릭합니다.
구성을 클릭합니다.
자동 완성 탭을 클릭합니다.
업데이트하려는 자동 완성 설정의 새 값을 입력하거나 선택합니다.
- 최대 추천 용어 수: 검색어에 제공할 수 있는 최대 자동 완성 추천 용어 수입니다.
- 트리거하는 최소 길이: 자동 완성 추천 용어가 제공되기 전에 입력할 수 있는 최소 문자 수입니다.
- 일치 순서: 자동 완성에서 추천 용어와 일치시킬 수 있는 쿼리 문자열의 위치입니다.
- 질문 추천 모델: 검색된 추천 용어를 생성하는 데 사용되는 질문 추천 모델입니다. dataStores.completeQuery에서 queryModel 파라미터를 사용하여 이 옵션을 재정의할 수 있습니다.
- 자동 완성 사용 설정: 기본적으로 자동 완성은 충분한 품질 데이터(일반적으로 며칠)가 있을 때까지 추천 용어를 생성하지 않습니다. 이 기본값을 재정의하고 일부 자동 완성 추천 용어를 더 일찍 받으려면 지금을 선택합니다.
  
  지금을 선택해도 추천 용어가 생성되는 데 하루가 걸릴 수 있으며 양질의 데이터가 충분히 있을 때까지 일부 자동 완성 추천 용어가 누락되거나 품질이 나쁠 수 있습니다.
- 차단 목록: Cloud Storage 버킷에 차단 목록을 JSON 파일로 가져옵니다. 차단 목록 제약 조건 및 사양에 관한 자세한 내용은 자동 완성 차단 목록 사용을 참고하세요.
저장 및 게시를 클릭합니다. 자동 완성이 이미 사용 설정된 엔진의 경우 변경사항이 몇 분 이내에 적용됩니다.

개인 식별 정보가 포함된 추천이 반환될 위험 감소

최종 사용자는 운전면허증, 전화번호 등 비공개로 유지해야 하는 모든 종류의 PII 정보를 보유하고 있습니다. 하지만 이러한 개인 식별 정보는 자신과 관련된 결과를 찾는 사용자가 검색창에 입력할 수 있습니다.

검색 기록 또는 사용자 이벤트 모델을 사용하고 사용자가 검색창에 PII를 입력할 가능성이 있는 경우 다음 매개변수를 조정하여 PII 유출을 줄일 수 있습니다.

queryFrequencyThreshold: 쿼리가 자동 완성 추천으로 반환되려면 이 횟수만큼 입력되어야 합니다.
numUniqueUsersThreshold: 쿼리가 자동 완성 추천으로 반환되려면 이만큼의 순 사용자가 입력해야 합니다. 검색 사용자 이벤트의 userPseudoId 필드 값은 사용자가 고유한지 여부를 결정합니다.

사용 사례 예시

예를 들어 사용자가 비공개로 유지해야 하는 계정 번호를 가지고 있는 경우를 생각해 보세요.

검색 기록 또는 사용자 이벤트 추천 모델을 사용하는 경우 이러한 계정 번호는 최종 사용자가 검색하는 다른 모든 용어와 함께 추천을 생성하는 데 사용됩니다. 따라서 사용자 A의 계정 번호 YZ-46789A가 검색창에 반복적으로 입력되었고 사용자 B의 계정 번호가 YZ-42345B인 경우 사용자 B가 검색창에 YZ-4를 입력하면 반환되는 자동 완성 제안이 사용자 A의 계정 번호일 수 있습니다.

이러한 유출이 발생할 가능성을 줄이기 위해 Vertex AI Search 관리자는 다음을 결정합니다.

queryFrequencyThreshold 매개변수의 값을 30로 늘립니다. 이 경우 한 계정 번호가 너무 자주 입력될 가능성은 매우 낮습니다. 하지만 인기 검색어는 최소한 그만큼 자주 입력됩니다.
numUniqueUsersThreshold 매개변수의 값을 6로 늘립니다. 관리자는 서로 다른 userPseudoId와 연결된 6개의 검색 이벤트에서 동일한 계정 번호가 검색창에 입력될 가능성이 낮다고 생각합니다.

절차

자동 완성에는 두 가지 임계값 매개변수가 있습니다. 이러한 매개변수는 Google Cloud 콘솔에서는 사용할 수 없지만 updateCompletionConfig 메서드에 대한 REST API 호출로 설정할 수 있습니다.

자동 완성 기준점 설정을 구성하려면 다음 단계를 따르세요. 각 단계는 변경하려는 매개변수에 따라 선택사항입니다.

REST

CompletionConfig.queryFrequencyThreshold 필드를 업데이트합니다.

curl -X PATCH \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  -H "X-Goog-User-Project: PROJECT_ID" \
  https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig?updateMask=queryFrequencyThreshold \
  -d '{
    "name": "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig",
    "queryFrequencyThreshold": QUERY_FREQUENCY_THRESHOLD
  }'

다음을 바꿉니다.

PROJECT_ID: Google Cloud 프로젝트의 번호 또는 ID입니다.
DATA_STORE_ID: 앱과 연결된 데이터 스토어의 ID입니다.
QUERY_FREQUENCY_THRESHOLD: 검색어가 자동 완성 추천으로 반환되기 전에 입력해야 하는 최소 횟수를 나타내는 정수 값입니다. 이 수는 몇 개월에 걸친 연속 기간 동안 합산됩니다. 기본값은 8입니다.

명령어 및 결과 예시

curl -X PATCH \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \$ curl -X PATCH \
  -H "X-Goog-User-Project: my-project-123" \t-access-token)" \
  https://discoveryengine.googleapis.com/v1alpha/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig?updateMask=queryFrequencyThreshold \
  -d '{
  "name": "projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig",
  "queryFrequencyThreshold": 30
  }'
  
{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig",
  "matchingOrder": "exact-prefix",
  "maxSuggestions": 20,
  "minPrefixLength": 1,
  "queryModel": "automatic",
  "enableMode": "AUTOMATIC",
  "queryFrequencyThreshold": 30
}

CompletionConfig.numUniqueUsersThreshold 필드를 업데이트합니다.

curl -X PATCH \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  -H "X-Goog-User-Project: PROJECT_ID" \
  https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig?updateMask=numUniqueUsersThreshold \
  -d '{
    "name": "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig",
    "numUniqueUsersThreshold": UNIQUE_USERS
  }'

UNIQUE_USERS를 자동 완성 추천으로 반환되기 전에 특정 검색어를 입력해야 하는 고유 사용자의 최소 수를 나타내는 정수 값으로 바꿉니다. 이 수는 몇 달에 걸친 연속 시간 범위에서 합산됩니다. 기본값은 3입니다.

명령어 및 결과 예시

curl -X PATCH \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  -H "X-Goog-User-Project: my-project-123" \
  https://discoveryengine.googleapis.com/v1alpha/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig?updateMask=numUniqueUsersThreshold \
  -d '{
  "name": "projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig",
    "numUniqueUsersThreshold": 6
  }'
  
{
"name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/completionConfig",
  "matchingOrder": "exact-prefix",
  "maxSuggestions": 20,
  "minPrefixLength": 1,
  "queryModel": "automatic",
  "enableMode": "AUTOMATIC",
  "numUniqueUsersThreshold": 6,
  "queryFrequencyThreshold": 30
}

스키마에서 완성 가능 필드 주석 업데이트

정형 데이터 스키마의 필드에 자동 완성을 사용 설정하려면 다음 단계를 수행합니다.

콘솔

Google Cloud 콘솔에서 AI 애플리케이션 페이지로 이동합니다.

AI Applications
수정하려는 앱의 이름을 클릭합니다. 정형 데이터를 사용해야 합니다.
데이터를 클릭합니다.
스키마 탭을 클릭합니다.
수정을 클릭하여 completable로 표시할 스키마 필드를 선택합니다.
저장을 클릭하여 업데이트된 필드 구성을 저장합니다. 이러한 추천 용어가 생성되고 반환되는 데 약 하루가 걸립니다.

자동 완성 요청 보내기

다음 샘플에서는 자동 완성 요청을 보내는 방법을 보여줍니다.

REST

API를 사용하여 자동 완성 요청을 보내려면 다음 단계를 수행합니다.

데이터 스토어 ID를 찾습니다. 데이터 스토어 ID를 이미 알고 있는 경우 다음 단계로 건너뜁니다.
1. Google Cloud 콘솔에서 AI 애플리케이션 페이지로 이동하고 탐색 메뉴에서 데이터 스토어를 클릭합니다.
  
  데이터 스토어 페이지로 이동
2. 데이터 스토어 이름을 클릭합니다.
3. 데이터 스토어의 데이터 페이지에서 데이터 스토어 ID를 가져옵니다.
dataStores.completeQuery 메서드를 호출합니다.
```
curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING"
```
다음을 바꿉니다.
- PROJECT_ID: Google Cloud 프로젝트의 번호 또는 ID입니다.
- DATA_STORE_ID: 앱과 연결된 데이터 스토어의 ID입니다.
- QUERY_STRING: 추천 용어를 가져오는 데 사용되는 typeahead 입력입니다.

다른 모델에 자동 완성 요청 보내기

다른 쿼리 추천 모델을 사용하여 자동 완성 요청을 보내려면 다음 단계를 따르세요.

데이터 스토어 ID를 찾습니다. 데이터 스토어 ID를 이미 알고 있는 경우 다음 단계로 건너뜁니다.
1. Google Cloud 콘솔에서 AI 애플리케이션 페이지로 이동하고 탐색 메뉴에서 데이터 스토어를 클릭합니다.
  
  데이터 스토어 페이지로 이동
2. 데이터 스토어 이름을 클릭합니다.
3. 데이터 스토어의 데이터 페이지에서 데이터 스토어 ID를 가져옵니다.
dataStores.completeQuery 메서드를 호출합니다.
```
curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING&query_model=QUERY_SUGGESTIONS_MODEL"
```
다음을 바꿉니다.
- PROJECT_ID: Google Cloud 프로젝트의 번호 또는 ID입니다.
- DATA_STORE_ID: 앱과 연결된 데이터 스토어의 고유 ID입니다.
- QUERY_STRING: 추천 용어를 가져오는 데 사용되는 typeahead 입력입니다.
- AUTOCOMPLETE_MODEL: 자동 완성 데이터
- QUERY_SUGGESTIONS_MODEL: 요청에 사용할 쿼리 제안 모델입니다(document, document-completable, search-history 또는 user-event). 의료 데이터에는 healthcare-default를 사용합니다.