이 페이지는 Cloud Translation API를 통해 번역되었습니다.

앱 및 데이터 스토어 정보

이 페이지에서는 Vertex AI Search 앱 및 데이터 스토어를 설명합니다.

Vertex AI Search를 사용하면 검색 또는 추천 앱을 만들고 데이터 스토어에 연결할 수 있습니다. 프로젝트에는 Google Cloud 여러 앱이 포함될 수 있습니다.

앱 및 데이터 스토어 간 관계

앱과 데이터 스토어 간의 관계는 앱 유형에 따라 달라집니다.

맞춤 검색 앱은 데이터 스토어와 다대다 관계입니다. 여러 데이터 스토어를 단일 맞춤 검색 앱에 연결하는 것을 혼합 검색이라고 합니다. 검색 앱을 두 개 이상의 데이터 스토어에 연결할 때의 제한사항에 대한 자세한 내용은 혼합 검색 정보를 참조하세요.
맞춤 추천 앱은 데이터 스토어와 일대일로 연결됩니다.
미디어 앱은 데이터 스토어와 다대일 관계입니다. 앱은 하나의 데이터 스토어에만 연결할 수 있지만 특정 데이터 스토어는 여러 앱에 연결할 수 있습니다. 예를 들어 미디어 검색 앱과 미디어 추천 앱은 데이터 스토어를 공유할 수 있습니다.
의료 검색 앱은 데이터 스토어와 다대일 관계를 갖습니다. 앱은 하나의 데이터 스토어에만 연결할 수 있지만 특정 데이터 스토어는 여러 앱에 연결할 수 있습니다. 예를 들어 환자용 앱과 공급자용 앱을 동일한 데이터 스토어에 연결할 수 있습니다.

의료 데이터의 일괄 데이터 가져오기의 경우 데이터가 앱 내에 있는 데이터 스토어로 가져옵니다. 의료 데이터의 스트리밍 데이터 가져오기(미리보기)의 경우 데이터가 데이터 커넥터 내에 있는 데이터 스토어 유형인 항목으로 가져옵니다. 데이터 커넥터는 앱 내에 있는 데이터 스토어의 한 유형이기도 합니다.

데이터 스토어가 앱에 연결된 후에는 연결을 해제할 수 없습니다.

앱 생성 및 데이터 수집 방법

앱을 만들고 데이터를 수집하는 방법은 보유한 데이터 유형에 따라 달라집니다.

웹사이트 데이터의 경우 Google Cloud 콘솔 또는 API를 사용할 수 있습니다. API로 만든 웹사이트 데이터를 사용하려면 Google Cloud 콘솔에서 Enterprise 기능이 사용 설정된 앱에 연결해야 합니다.
정형 또는 비정형 데이터의 경우Google Cloud 콘솔 또는 API를 사용할 수 있습니다.
의료 데이터의 경우 Google Cloud 콘솔 또는 API를 사용할 수 있습니다.

문서

각 데이터 스토어에는 문서라고 하는 하나 이상의 데이터 레코드가 있습니다. 문서가 나타내는 내용은 데이터 스토어의 데이터 유형에 따라 달라집니다.

웹사이트. 문서는 웹페이지입니다.
정형 데이터. 문서는 특정 스키마를 따르는 테이블의 행 또는 JSON 레코드입니다. 이 스키마를 직접 제공하거나 Vertex AI Search가 수집된 데이터에서 스키마를 도출하도록 할 수 있습니다.
미디어용 정형 데이터. 문서는 미디어와 관련된 스키마를 따르는 테이블의 행 또는 JSON 레코드입니다. 문서는 동영상, 뉴스 기사, 음악 파일, 팟캐스트와 같은 미디어 콘텐츠와 관련된 레코드입니다. 문서에는 최소한 제목, 콘텐츠 위치에 대한 URI, 카테고리, 길이, 제공 예정 날짜 등 미디어 항목을 설명하는 정보가 포함됩니다.
비정형 데이터. 문서는 HTML, 텍스트가 삽입된 PDF, TXT 형식의 파일입니다. PPTX 및 DOCX 형식은 미리보기 버전으로 제공됩니다.
의료 FHIR 데이터. 문서는 지원되는 FHIR R4 리소스입니다. Vertex AI Search에서 지원하는 FHIR R4 리소스 목록은 의료 FHIR R4 데이터 스키마 참조에서 확인할 수 있습니다.

데이터 스토어 및 앱

Vertex AI Search에는 다양한 종류의 데이터 스토어가 있습니다. 데이터 스토어는 한 가지 유형의 데이터만 포함할 수 있습니다.

웹사이트 데이터
정형 데이터
정형 콘텐츠(미디어)
비정형 데이터
의료 FHIR 데이터

웹사이트 데이터

웹사이트 데이터가 있는 데이터 스토어는 공개 웹사이트에서 색인이 생성된 데이터를 사용합니다. 데이터 스토어에 포함할 URL 패턴 집합을 제공할 수 있습니다. URL 패턴에 맞는 웹페이지를 포함된 웹페이지라고 합니다. 그런 다음 포함된 웹페이지에서 크롤링된 데이터에 대해 검색을 설정할 수 있습니다.

예를 들어 example.com/faq/*, example.com/events/*과 같은 URL 패턴을 제공하고 패턴에 맞는 웹페이지에서 크롤링된 데이터에 대해 검색을 사용 설정할 수 있습니다. 이 데이터에는 텍스트, 메타데이터로 태그된 이미지, meta 태그, PageMap 속성, schema.org 데이터와 같은 기타 구조화된 데이터가 포함됩니다.

제외하려는 웹사이트 부분의 URL 패턴을 제공할 수도 있습니다(예: example.com/events/members-only/* 또는 example.com/events/past-*). 포함된 URL보다 제외된 URL이 우선 적용됩니다.

웹사이트 데이터 스토어에는 두 가지 유형이 있습니다.

기본 웹사이트 검색:
- 포함된 웹사이트에 대해 기존 Google 검색 색인에 대한 검색 기능을 제공합니다.
- 도메인 확인이 필요하지 않습니다.
고급 웹사이트 색인 생성:
- 다음 중 하나를 기반으로 생성된 색인에 대한 고급 검색 기능을 제공합니다.
  - Vertex AI Search 앱 소유자는 사이트맵을 제출하고 유지관리하여 색인이 생성되는 웹페이지를 관리할 수 있습니다. 자세한 내용은 사이트맵을 사용하여 웹페이지 색인 생성 및 새로고침을 참고하세요. 이 프로세스를 통해 수동 개입 없이 색인을 최신 상태로 유지할 수 있습니다.
  - Vertex AI Search 앱 소유자는 Google 검색 색인을 미러링하는 초기 색인 생성을 수행한 후 필요할 때마다 웹사이트를 다시 크롤링하여 색인의 범위를 확장하고 최신 상태로 유지할 수 있습니다. 자세한 내용은 웹페이지 새로고침을 참조하세요. 고급 웹사이트 색인 생성의 고급 기능은 고급 웹사이트 색인 생성에 나와 있습니다.
- 포함된 웹사이트가 속한 도메인을 Vertex AI Search 데이터 스토어 소유자가 인증해야 합니다. 자세한 내용은 웹사이트 도메인 확인을 참고하세요.
- 데이터 스토어 스키마에 정형 데이터를 추가하는 기능을 제공합니다. 웹사이트에는 비정형 데이터가 포함되어 있지만 meta 태그, PageMap 속성, schema.org 데이터 형식의 정형 데이터를 웹페이지에 추가할 수 있습니다. 그런 다음 이 정형 데이터를 사용하여 고급 웹사이트 색인 생성에 정형 데이터 사용에 설명된 대로 데이터 스토어 스키마를 수정할 수 있습니다.

다음 단계

웹사이트 검색:

색인 생성 기본 요건을 알아보려면 웹사이트 검색을 위한 데이터 준비 방법 참조하기
웹사이트 콘텐츠를 사용하여 데이터 스토어 만들기
검색 앱 만들기

구조화된 데이터

정형 데이터가 있는 데이터 스토어는 정형 데이터에 대해 시맨틱 검색 또는 추천을 사용 설정합니다. BigQuery 또는 Cloud Storage에서 데이터를 가져올 수 있습니다. API를 통해 정형 JSON 데이터를 수동으로 업로드할 수도 있습니다.

예를 들어 전자상거래 환경의 제품 카탈로그, 공급업체 검색 또는 추천을 위한 의사 디렉터리에서 검색 또는 추천을 사용 설정할 수 있습니다.

Vertex AI Search는 가져온 데이터에서 스키마를 자동으로 감지합니다. 원하는 경우 데이터의 스키마를 제공할 수 있습니다. 데이터의 스키마를 제공하면 일반적으로 결과의 품질이 개선됩니다.

다음 단계

맞춤 검색:

맞춤 추천:

미디어용 정형 데이터

미디어 앱은 미디어 데이터 스토어에만 연결할 수 있습니다. 미디어 데이터 스토어는 Google에서 정의한 스키마 또는 미디어 관련 필드 5개로 구성된 특정 집합이 포함된 자체 커스텀 스키마가 있는 정형 데이터 스토어입니다. 스키마에 대한 자세한 내용은 미디어 문서 및 데이터 스토어 정보를 참조하세요.

예를 들어 영화 카탈로그 또는 뉴스 사이트용 미디어 추천 앱을 만들어 추천을 사용 설정하면 사용자에게 적합한 맞춤설정된 추천을 제공할 수 있습니다.

미디어 데이터 스토어에는 미디어 문서 외에도 Vertex AI Search에서 추천을 맞춤설정하고 사용자를 검색할 수 있는 사용자 이벤트 정보가 포함되어 있습니다. 미디어 앱에는 사용자 이벤트가 필요합니다. 사용자 이벤트에 대한 자세한 내용은 실시간 사용자 이벤트 기록을 참고하세요.

다음 단계

비정형 데이터

비정형 데이터 스토어는 문서 및 이미지와 같은 데이터에 대해 시맨틱 검색을 사용 설정합니다.

비정형 데이터 스토어는 HTML, 텍스트가 삽입된 PDF, TXT 형식의 문서를 지원합니다. PPTX 및 DOCX 형식은 미리보기 버전으로 제공됩니다.

검색은 자연어 쿼리에 대해 10개 URL과 요약된 답변 형태로 결과를 제공합니다. 문서는 적절한 액세스 권한으로 Cloud Storage 버킷에 업로드해야 합니다. 예를 들어 금융 기관은 금융 연구 출판물의 비공개 자료에 대해 검색을 사용 설정할 수 있고, 바이오테크 회사는 의학 연구의 비공개 저장소에 대해 검색 또는 추천을 사용 설정할 수 있습니다.

다음 단계

검색:

의료 FHIR 데이터

의료 검색 앱은 Cloud Healthcare API FHIR 스토어에서 가져온 FHIR R4 데이터를 사용합니다. Vertex AI Search에서 지원하는 FHIR R4 리소스 목록은 의료 FHIR R4 데이터 스키마 참조에서 확인할 수 있습니다. FHIR R4 데이터 스토어를 Vertex AI Search 데이터 스토어의 데이터 소스로 사용하려면 몇 가지 요구사항을 충족해야 합니다. 자세한 내용은 수집을 위한 의료 FHIR 데이터 준비 방법을 참조하세요.

다음 단계

혼합 검색 정보

여러 데이터 스토어를 단일 맞춤 검색 앱에 연결할 수 있는 혼합 검색 앱을 만들 수 있습니다. 이 기능을 사용하면 하나의 앱으로 여러 소스와 데이터 유형을 검색할 수 있습니다.

혼합 검색 앱을 만들려면 새 맞춤 검색 앱을 만들 때 여러 데이터 스토어를 선택합니다. 앱을 만드는 동안 여러 데이터 스토어를 선택하지 않으면 나중에 데이터 스토어를 추가할 수 없습니다.

검색 결과를 가져올 때 모든 데이터 스토어를 검색하거나 단일 데이터 스토어의 결과를 필터링할 수 있습니다.

다음과 같은 제한사항이 적용됩니다.

데이터 스토어 추가 및 삭제:
- 앱에 혼합 검색을 사용 설정하려면 앱을 만드는 동안 앱에 데이터 스토어를 2개 이상 연결해야 합니다.
- 혼합 검색 앱에서 데이터 스토어를 추가하거나 삭제할 수 있지만 앱에는 언제든지 두 개 미만의 데이터 스토어를 연결할 수 없습니다.
- 앱을 만드는 동안 단일 데이터 스토어를 검색 앱에 연결하면 해당 데이터 스토어를 추가하거나 삭제할 수 없습니다.
웹사이트 데이터 스토어를 혼합 검색에 사용하려면 고급 웹사이트 색인 생성을 사용 설정해야 합니다. 자세한 내용은 고급 웹사이트 색인 생성을 참조하세요.
BigQuery를 사용하여 가져온 비정형 데이터가 포함된 데이터 스토어는 지원되지 않습니다.
혼합 검색에서는 검색 요청에 다음 필드를 사용할 수 있습니다.
- boostSpec
- contentSearchSpec
- dataStoreSpecs
- facetSpecs
- filter
- languageCode
- offset
- oneBoxPageSize
- orderBy
- query
- pageSize
- pageToken
- relevanceScoreSpec
- relevanceThreshold
- session
- sessionSpec
- spellCorrectionSpec
- userInfo
- userPseudoId
혼합 검색에서는 dataStoreSpecs에 다음 필드를 사용할 수 있습니다.
- dataStore
- boostSpec: SearchRequest 및 dataStoreSpecs 모두에 지정된 부스트 사양이 있는 경우 두 부스트 사양 모두 검색 결과에 적용됩니다.
- filter: SearchRequest 및 dataStoreSpecs 모두에 지정된 필터가 있는 경우 두 필터 모두 검색 결과에 적용됩니다.
혼합 앱의 경우 서빙 구성에 대한 만들기, 읽기, 업데이트, 삭제(CRUD) 작업이 지원됩니다. 다음 필드만 서빙 구성에서 추가하거나 업데이트할 수 있습니다.
- boostControlIds
- displayName
- filterControlIds
- genericConfig:
  - contentSearchSpec
- name
- solutionType
- synonymsControlIds
혼합 검색 앱에는 다음 컨트롤의 CRUD 작업이 지원됩니다.
- boostAction
- synonymAction
- filterAction
검색 앱당 데이터 스토어는 50개로 제한됩니다.
한 데이터 스토어에서 CMEK 구성을 사용하는 경우 다른 모든 데이터 스토어도 동일한 CMEK 구성을 사용해야 합니다.