앱 및 데이터 스토어 정보

이 페이지에서는 Vertex AI Search 앱 및 데이터 스토어를 설명합니다. Vertex AI Agents 데이터 스토어에 관한 자세한 내용은 Vertex AI Agents 데이터 스토어를 참고하세요.

Vertex AI Search를 사용하면 검색 또는 추천 앱을 만들고 데이터 스토어에 연결할 수 있습니다. Google Cloud 프로젝트에는 여러 앱이 포함될 수 있습니다.

앱과 데이터 스토어 간 관계

앱과 데이터 스토어 간의 관계는 앱 유형에 따라 다릅니다.

  • 일반 검색 앱은 데이터 스토어와 다대다 관계입니다. 여러 데이터 스토어를 단일 일반 검색 앱에 연결하는 것을 혼합 검색이라고 합니다. 검색 앱을 두 개 이상의 데이터 스토어에 연결하는 제한사항에 관한 자세한 내용은 혼합 검색 정보를 참고하세요.

  • 일반 추천 앱은 데이터 스토어와 일대일로 연결됩니다.

  • 미디어 앱은 데이터 스토어와 다대일 관계입니다. 앱은 하나의 데이터 스토어에만 연결할 수 있지만 특정 데이터 스토어는 여러 앱에 연결할 수 있습니다. 예를 들어 미디어 검색 앱과 미디어 추천 앱은 데이터 스토어를 공유할 수 있습니다.

  • 의료 검색 앱은 데이터 스토어와 다대일 관계입니다. 앱은 하나의 데이터 스토어에만 연결할 수 있지만 특정 데이터 스토어는 여러 앱에 연결할 수 있습니다. 예를 들어 환자용 앱과 공급자용 앱을 동일한 데이터 스토어에 연결할 수 있습니다.

    의료 데이터의 일괄 데이터 가져오기의 경우 데이터가 앱 내에 있는 데이터 스토어로 가져옵니다. 의료 데이터의 스트리밍 데이터 가져오기(미리보기)의 경우 데이터가 데이터 커넥터 내에 있는 데이터 스토어 유형인 항목으로 가져옵니다. 데이터 커넥터는 앱 내에 있는 데이터 스토어의 한 유형이기도 합니다.

데이터 스토어가 앱에 연결된 후에는 연결을 해제할 수 없습니다.

앱 생성 및 데이터 수집 방법

앱을 만들고 데이터를 수집하는 방법은 보유한 데이터 유형에 따라 달라집니다.

  • 웹사이트 데이터의 경우 API가 아닌 Google Cloud 콘솔을 사용하여 앱을 만들고 데이터를 수집합니다.

  • 구조화된 또는 구조화되지 않은 데이터의 경우 Google Cloud 콘솔 또는 API를 사용할 수 있습니다.

  • 의료 데이터의 경우 Google Cloud 콘솔 또는 API를 사용할 수 있습니다.

문서

각 데이터 스토어에는 문서라고 하는 하나 이상의 데이터 레코드가 있습니다. 문서가 나타내는 내용은 데이터 스토어의 데이터 유형에 따라 다릅니다.

  • 웹사이트. 문서는 웹페이지입니다.

  • 구조화된 데이터. 문서는 테이블의 행 또는 특정 스키마를 따르는 JSON 레코드입니다. 이 스키마를 직접 제공하거나 Vertex AI Agent Builder가 수집된 데이터에서 스키마를 파생하도록 할 수 있습니다.

  • 미디어용 구조화된 데이터. 문서는 미디어별 스키마를 따르는 테이블의 행 또는 JSON 레코드입니다. 문서는 동영상, 뉴스 기사, 음악 파일, 팟캐스트와 같은 미디어 콘텐츠와 관련된 레코드입니다. 문서에는 최소한 미디어 항목을 설명하는 정보(제목, 콘텐츠 위치의 URI, 카테고리, 길이, 사용 가능 날짜)가 포함됩니다.

  • 서드 파티 데이터 소스의 구조화된 데이터(허용 목록이 있는 미리보기) 문서는 서드 파티 데이터 소스(예: Jira 문제 또는 Confluence 스페이스)에 고유한 항목입니다.

  • 구조화되지 않은 데이터. 문서는 HTML, 텍스트가 삽입된 PDF 또는 TXT 형식의 파일입니다. 미리보기에서 PPTX 및 DOCX 형식을 사용할 수 있습니다.

  • 의료 FHIR 데이터. 문서는 지원되는 FHIR R4 리소스입니다. Vertex AI Search에서 지원하는 FHIR R4 리소스 목록은 의료 FHIR R4 데이터 스키마 참조를 참고하세요.

데이터 스토어 및 앱

Vertex AI Agent Builder에는 다양한 종류의 데이터 스토어가 있습니다. 데이터 스토어에는 한 가지 유형의 데이터만 포함할 수 있습니다.

웹사이트 데이터

웹사이트 데이터가 있는 데이터 스토어는 공개 웹사이트에서 색인이 생성된 데이터를 사용합니다. 일련의 도메인을 제공하고 해당 도메인에서 크롤링된 데이터에 대한 검색 또는 추천을 설정할 수 있습니다. 이 데이터에는 텍스트, 메타데이터로 태그된 이미지, 구조화된 데이터가 포함됩니다.

예를 들어, yourexamplewebsite.com/faq, yourexamplewebsite.com/events 같은 도메인을 제공하고 해당 도메인의 콘텐츠에 대한 검색 또는 추천을 사용 설정할 수 있습니다.

웹사이트 데이터 스토어에는 두 가지 유형이 있습니다.

  • 기본 웹사이트 검색:

    • 포함된 웹사이트의 기존 Google 검색 색인을 통해 검색 기능을 제공합니다.
    • 도메인 확인이 필요하지 않습니다.
  • 고급 웹사이트 색인 생성:

    • 포함된 웹사이트의 기존 Google 검색 색인을 기반으로 생성된 색인에 대해 고급 검색 기능을 제공합니다. 그러면 Vertex AI Agent Builder 앱 소유자는 필요할 때마다 웹사이트를 다시 크롤링하여 색인의 적용 범위를 확장하고 최신 상태로 유지할 수 있습니다. 자세한 내용은 웹페이지 새로고침을 참고하세요. 고급 웹사이트 색인 생성의 고급 기능은 고급 웹사이트 색인 생성에 나와 있습니다.
    • 도메인 확인이 필요합니다. 자세한 내용은 웹사이트 도메인 확인을 참조하세요.
    • 데이터 스토어 스키마에 구조화된 데이터를 추가하는 기능을 제공합니다. 웹사이트에는 구조화되지 않은 데이터가 포함되어 있지만 meta 태그, PageMap 속성, schema.org 데이터 형식의 구조화된 데이터를 웹페이지에 추가할 수 있습니다. 그런 다음 이 구조화된 데이터를 사용하여 고급 웹사이트 색인 생성에 구조화된 데이터 사용에 설명된 대로 데이터 스토어 스키마를 수정할 수 있습니다.

다음 단계

웹사이트 검색의 경우:

추천의 경우:

구조화된 데이터

구조화된 데이터가 있는 데이터 스토어를 사용하면 구조화된 데이터에 대해 시맨틱 검색 또는 추천을 사용할 수 있습니다. BigQuery 또는 Cloud Storage에서 데이터를 가져올 수 있습니다. API를 통해 구조화된 JSON 데이터를 수동으로 업로드할 수도 있습니다.

예를 들어 전자상거래 환경의 제품 카탈로그, 공급업체 검색 또는 추천을 위한 의사 디렉터리에서 검색 또는 추천을 사용 설정할 수 있습니다.

Vertex AI Agent Builder는 가져온 데이터에서 스키마를 자동으로 감지합니다. 원하는 경우 데이터의 스키마를 제공할 수 있습니다. 데이터에 스키마를 제공하면 일반적으로 결과 품질이 개선됩니다.

다음 단계

일반 검색의 경우:

일반 추천의 경우:

미디어용 구조화된 데이터

미디어 앱은 미디어 데이터 스토어에만 연결할 수 있습니다. 미디어 데이터 스토어는 Google에서 정의한 스키마 또는 미디어 관련 필드 5개로 구성된 특정 집합이 포함된 자체 커스텀 스키마가 있는 구조화된 데이터 스토어입니다. 스키마에 관한 자세한 내용은 미디어 문서 및 데이터 스토어 정보를 참고하세요.

예를 들어 영화 카탈로그 또는 뉴스 사이트용 미디어 추천 앱을 만들어 추천을 사용 설정하면 사용자에게 적합하고 맞춤설정된 추천을 제공할 수 있습니다.

미디어 데이터 스토어에는 미디어 문서 외에도 Vertex AI Search에서 맞춤 추천을 제공하고 사용자를 검색할 수 있는 사용자 이벤트 정보가 포함되어 있습니다. 미디어 추천 앱에는 사용자 이벤트가 필요하며 미디어 검색 앱에는 권장됩니다. 사용자 이벤트에 관한 자세한 내용은 실시간 사용자 이벤트 기록을 참고하세요.

다음 단계

서드 파티 데이터 스토어용 구조화된 데이터

다음 서드 파티 데이터 소스 커넥터는 허용 목록을 사용하여 미리보기에서 사용할 수 있습니다.

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

이러한 서드 파티의 데이터는 구조화된 데이터로 간주됩니다.

새 커넥터를 설정할 때 동기화 빈도를 선택합니다. 동기화할 항목도 선택합니다. 항목은 소스에 따라 다릅니다(예: Jira의 문제, Confluence의 콘텐츠 및 스페이스). 각 항목에 고유한 데이터 스토어가 생성됩니다. 항목 데이터 스토어는 커넥터 인스턴스별로 그룹화됩니다.

다음 단계

검색의 경우:

추천의 경우:

구조화되지 않은 데이터

구조화되지 않은 데이터 스토어는 문서 및 이미지와 같은 데이터에 대한 시맨틱 검색 또는 추천을 지원합니다.

구조화되지 않은 데이터 스토어는 HTML, 텍스트가 삽입된 PDF, TXT 형식의 문서를 지원합니다. 미리보기에서 PPTX 및 DOCX 형식을 사용할 수 있습니다.

검색은 자연어 검색어에 대한 10개의 URL과 요약된 답변 형식의 결과를 제공합니다. 문서는 적절한 액세스 권한으로 Cloud Storage 버킷에 업로드되어야 합니다. 예를 들어 금융 기관은 금융 연구 출판물의 비공개 자료에 대해 검색 또는 추천을 사용 설정할 수 있고, 바이오테크 회사는 의학 연구의 비공개 저장소에 대해 검색 또는 추천을 사용 설정할 수 있습니다.

다음 단계

검색의 경우:

일반 추천의 경우:

의료 FHIR 데이터

의료 검색 앱은 Cloud Healthcare API FHIR 저장소에서 가져온 FHIR R4 데이터를 사용합니다. Vertex AI Search에서 지원하는 FHIR R4 리소스 목록은 의료 FHIR R4 데이터 스키마 참조를 참고하세요. FHIR R4 데이터 스토어를 Vertex AI Search 데이터 스토어의 데이터 소스로 사용하려면 몇 가지 요구사항을 충족해야 합니다. 자세한 내용은 수집을 위해 의료 FHIR 데이터를 준비하는 방법을 참고하세요.

다음 단계

혼합 검색 정보

여러 데이터 스토어를 단일 일반 검색 앱에 연결할 수 있는 혼합 검색 앱을 만들 수 있습니다. 이 기능을 사용하면 하나의 앱으로 여러 소스와 데이터 유형을 검색할 수 있습니다.

혼합 검색 앱을 만들려면 새 일반 검색 앱을 만들 때 여러 데이터 스토어를 선택합니다. 만들 때 여러 데이터 스토어를 선택하지 않으면 나중에 데이터 스토어를 추가할 수 없습니다.

검색 결과를 가져올 때 모든 데이터 스토어를 검색하거나 단일 데이터 스토어의 결과를 필터링할 수 있습니다.

다음과 같은 제한사항이 적용됩니다.

  • 데이터 스토어 추가 및 삭제:
    • 앱에 혼합 검색을 사용 설정하려면 앱을 만들 때 앱에 데이터 스토어를 2개 이상 연결해야 합니다.
    • 혼합 검색 앱에서 데이터 스토어를 추가하거나 삭제할 수 있지만 앱에는 항상 두 개 이상의 데이터 스토어가 연결되어 있어야 합니다.
    • 앱을 만들 때 단일 데이터 스토어를 검색 앱에 연결하면 해당 데이터 스토어를 추가하거나 삭제할 수 없습니다.
  • 웹사이트 데이터 스토어를 혼합 검색에 사용하려면 고급 웹사이트 색인 생성을 사용 설정해야 합니다. 자세한 내용은 고급 웹사이트 색인 생성을 참조하세요.
  • BigQuery를 사용하여 가져온 구조화되지 않은 데이터가 포함된 데이터 스토어는 지원되지 않습니다.
  • 혼합 검색에서는 검색 요청에 다음 필드를 사용할 수 있습니다.
    • query
    • pageSize
    • offset
    • dataStoreSpec
    • pageToken
    • filter
    • spellCorrectionSpec
    • session
    • contentSearchSpec:
      • summarySpec
      • extractiveContentSpec
      • searchResultMode
      • chunkSpec
  • 앞서 나열된 필드 외에도 단일 데이터 스토어에서 결과를 가져오도록 검색 요청이 필터링되는 경우에만 혼합 검색 앱에서 다음 필드가 지원됩니다. 두 개 이상의 데이터 스토어에서 결과를 가져올 때는 지원되지 않습니다.
    • facetSpec
  • 혼합 검색을 사용하면 dataStoreSpec에서 다음 필드를 사용할 수 있습니다.
    • filter: SearchRequestdataStoreSpec에 모두 지정된 필터가 있는 경우 두 필터가 모두 검색 결과에 적용됩니다.
  • 혼합 앱의 경우 서빙 구성에 대한 만들기, 읽기, 업데이트, 삭제(CRUD) 작업이 지원됩니다. 다음 필드만 서빙 구성에서 추가하거나 업데이트할 수 있습니다.
    • name
    • displayName
    • solutionType
    • genericConfig:
      • contentSearchSpec:
        • summarySpec
        • extractiveContentSpec
        • searchResultMode
        • chunkSpec
    • boostControlIds
    • synonymsControlIds
    • onewaySynonymsControlIds
  • 혼합 검색 앱에서는 다음 컨트롤의 CRUD 작업이 지원됩니다.
    • boostAction
    • synonymACtion
  • 혼합 검색 앱은 다음 기능을 지원하지 않습니다.
    • 서빙 컨트롤 필터링, 리디렉션, 무시, 대체, 연결 해제
    • 검색 요청 또는 서빙 구성에서 contentSearchSpec.snippetSpec를 사용하는 스니펫
    • 질문으로 검색