此页面由 Cloud Translation API 翻译。

创建医疗保健搜索数据存储区

注意：

针对医疗保健行业的限制：作为客户，您不得自行以及允许最终用户将生成式 AI 服务用于临床目的（为清晰起见，非临床研究、时间安排或其他管理任务，不仅限于此），也不得将其用作专业医疗建议的替代品，也不得以任何受任何适用监管机构监督或需要其许可或批准的方式使用这些服务。如需了解详情，请参阅服务专用条款。
为清楚起见，对于使用 Vertex AI Search 检索和总结现有医疗信息的情况，限制用于临床目的意味着限制用于直接诊断或治疗目的，而未经获得执照的专业人士审核，且符合适用法律法规。
生成的输出并不总是完全可靠的。由于 LLM 和生成式 AI 的性质，输出可能包含不正确或有偏见（例如刻板印象或其他有害内容）的信息，因此应进行审核。所有摘要或回答都应被视为草稿，而非最终结果。
本产品的预期用途并非提供与预防、诊断或治疗疾病相关的信息。本产品不针对与诊断或治疗建议相关的问题提供解答。此产品的预期用途是检索和总结用户提供的现有医疗信息。
由于测试数据有限，此产品可能或可能不适用于 0-18 岁和 85 岁及以上的年龄段。因此，在查看生成的输出时，客户必须考虑其源数据中子群体的代表性。

如需在 Vertex AI Search 中搜索临床数据，您可以按照以下任一工作流程操作：

创建一个医疗保健数据存储区，将 FHIR R4 数据导入该数据存储区，将其连接到医疗保健搜索应用，然后查询临床数据。
在应用创建过程中，创建一个医疗保健搜索应用、创建一个医疗保健数据存储区，并将 FHIR R4 数据导入该数据存储区，然后查询临床数据。如需了解详情，请参阅创建医疗保健搜索应用。

本页介绍了第一种方法。

数据导入频率简介

您可以通过以下方式将 FHIR R4 数据导入数据存储区：

批量导入：一次性导入。数据会批量导入数据存储区。如需进一步增量导入，请参阅刷新健康数据。
流式导入：近乎实时的流式数据导入。来源 FHIR 存储区中的任何增量更改都会同步到 Vertex AI Search 数据存储区。流式传输需要使用数据连接器，这是一种数据存储区。如需创建数据连接器，您必须设置集合。数据连接器包含一个实体，该实体也是数据存储区实例。

您还可以暂停和恢复流式传输，并根据需要执行手动同步。如需了解详情，请参阅管理医疗保健搜索数据存储空间。

给定 Google Cloud 项目的数据流式传输速率取决于以下配额。如果超出配额，您可能会遇到流式传输延迟。
- 每分钟待处理的 FHIR 或 BigQuery 流式写入操作的数量。如需了解详情，请参阅配额和限制。
- 每个区域每分钟的 FHIR 读取操作数。如需了解详情，请参阅 Cloud Healthcare API FHIR 配额。

您可以在创建数据存储区时选择数据导入频率，之后便无法更改此配置。

准备工作

在创建医疗保健数据存储区并向其中导入数据之前，请了解以下事项：

医疗保健搜索应用与数据存储区之间的关系。如需了解详情，请参阅应用和数据存储区简介。
准备 FHIR 数据以供提取。
Vertex AI Search for Healthcare 仅在美国多区域 (us) 提供搜索服务。因此，您的医疗保健搜索应用和数据存储区必须位于 us 多区域。
如果您要将某个 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区中的医疗保健数据导入另一个 Google Cloud 项目中的 Vertex AI Search 数据存储区，并且您使用的是 VPC Service Controls，则这两个项目必须位于同一边界内。

创建数据存储区并导入数据

您可以通过以下方法在 Google Cloud 控制台中或使用 API 创建数据存储区并导入 FHIR R4 数据：

您可以通过一次性批量导入创建静态数据存储区。如需了解详情，请参阅创建静态数据存储区并执行一次性批量导入。
您可以创建一个流式数据存储区，让 Cloud Healthcare API FHIR 存储区中的更改持续流式传输到 Vertex AI Search 数据存储区。如需了解详情，请参阅创建流式数据存储空间并设置流式导入。

执行此任务所需的权限

在包含 Vertex AI Agent Builder 数据存储区的项目中，向 service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management (IAM) 角色：

用途	角色
从 Cloud Healthcare API 中的 FHIR 存储区一次性批量导入 FHIR 数据。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`)
在同一 Google Cloud 项目中从 Cloud Healthcare API 的 FHIR 存储区对 FHIR 数据执行流式导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)
如需在其他项目中从 Cloud Healthcare API 的 FHIR 存储区对 FHIR 数据执行流式导入，请执行以下操作 Google Cloud 。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)
导入引用 Cloud Storage 中文件的 FHIR 数据。如果引用的文件与 Vertex AI Agent Builder 应用位于同一项目中，则系统会默认授予这些权限。 Google Cloud	Storage Object Admin (`roles/storage.objectAdmin`)
在创建数据存储区时自定义架构，以配置 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。	Storage Object Admin (`roles/storage.objectAdmin`)

在包含 Cloud Healthcare API FHIR R4 数据存储区的项目中，向 service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management 角色：

用途	角色
如需在其他项目中从 Cloud Healthcare API 中的 FHIR 存储区对 FHIR 数据执行流式导入，请执行以下操作 Google Cloud 。	Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)

在包含 Cloud Healthcare API FHIR R4 数据存储区的项目中，向 service-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management 角色：

用途	角色
在同一 Google Cloud 项目中从 Cloud Healthcare API 的 FHIR 存储区对 FHIR 数据执行流式导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`)
在创建数据存储区时自定义架构，以配置 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。	Storage Object Admin (`roles/storage.objectAdmin`)

创建静态数据存储区并执行一次性批量导入

本部分介绍了如何创建只能执行批量导入的 Vertex AI Search 数据存储区。您可以在首次创建数据存储区时导入批量数据，并在必要时执行增量批量导入。

控制台

在 Google Cloud 控制台中，前往 Agent Builder 页面。

Agent Builder
在导航菜单中，点击数据存储空间。
点击 Create data store（创建数据存储区）。
在选择数据源窗格中，选择 Healthcare API (FHIR) 作为数据源。
如需从 FHIR 存储区导入数据，请执行以下操作之一：
- 从可用 FHIR 存储区列表中选择 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 在此列表中，选择位于允许的位置中的数据集，然后选择使用 FHIR 版本 R4 的 FHIR 存储区。
- 手动进入 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 点击手动输入 FHIR 存储区。
  3. 在 FHIR 存储区名称对话框中，按以下格式输入 FHIR 存储区的全名：
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. 点击保存。
在同步部分，选择以下选项之一。数据存储区创建后，此选择将无法更改。
- 一次性：执行一次性批量数据导入。如需进一步增量导入，请参阅刷新健康数据。
- 流式传输：用于执行近乎实时的流式数据导入。如需流式传输数据，您必须创建数据连接器，这是一种数据存储类型。如需使用 REST API 设置流式数据存储，请与您的客户工程师联系。
在此数据采用什么架构？部分，选择以下选项之一：
- Google 预定义架构：用于保留 Google 为受支持的 FHIR 资源和元素定义的架构配置，例如可编入索引性、可搜索性和可检索性。选择此选项后，您将无法在创建数据存储区后更新架构。如果您希望能够在创建数据存储区后更改架构，请选择自定义架构选项。
  1. 点击继续。
  2. 在数据存储区名称字段中，输入数据存储区的名称。
  3. 点击创建。
- 自定义架构：用于为受支持的 FHIR 资源和元素定义自己的架构配置，例如可索引性、可搜索性和可检索性。如需设置可配置的架构，请与您的客户工程师联系。
  1. 点击继续。
  2. 查看架构、展开每个字段，然后修改字段设置。
  3. 点击添加新字段，在受支持的 FHIR 资源中添加新字段。您无法移除 Google 定义的架构中提供的字段。
  4. 点击继续。
  5. 在您的数据连接器名称字段中，为数据连接器输入名称。
  6. 点击创建。
点击继续。

REST

创建数据存储区。

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
DATA_STORE_ID：您要创建的 Vertex AI Search 数据存储区的 ID。此 ID 只能包含小写字母、数字、下划线和连字符。
DATA_STORE_DISPLAY_NAME：您要创建的 Vertex AI Search 数据存储区的显示名称。
CONFIGURABLE_SCHEMA_TRUE|FALSE：一个布尔值，如果设置为 true，则表示您可以使用 schema.update 方法配置数据存储架构。

响应

您应该收到类似以下内容的 JSON 响应。如果 done 键的值为 true，则表示创建数据存储区的操作已完成。否则，数据存储空间创建操作将失败。

{
  "name": "OPERATION_ID",
  "done": true
}

如果源 FHIR 存储区和目标 Vertex AI Search 数据存储区位于同一 Google Cloud 项目中，请调用以下方法以执行一次性批量导入。如果它们不在同一项目中，请执行下一步。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
响应

您应该收到类似以下内容的 JSON 响应。响应包含长时间运行的操作的标识符。当方法调用可能需要大量时间才能完成时，会返回长时间运行的操作。记下 IMPORT_OPERATION_ID 的值。您需要此值才能验证导入状态或取消正在进行的批量导入。
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
如果源 FHIR 存储区和目标 Vertex AI Search 数据存储区位于不同的 Google Cloud 项目中，请调用以下方法以执行一次性批量导入。如果它们位于同一项目中，请返回上一步。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
替换以下内容：
- PROJECT_ID：包含 Vertex AI Search 数据存储区的项目的 ID。 Google Cloud
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- SOURCE_PROJECT_ID：包含 Cloud Healthcare API 数据集和 FHIR 存储区的 Google Cloud项目的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
响应

您应该收到类似以下内容的 JSON 响应。响应包含长时间运行的操作的标识符。当方法调用可能需要大量时间才能完成时，会返回长时间运行的操作。记下 IMPORT_OPERATION_ID 的值。您需要此值来验证导入的状态。
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

如需了解详情，请参阅 Vertex AI Agent Builder Python API 参考文档。

如需向 Vertex AI Agent Builder 进行身份验证，请设置应用默认凭据。如需了解详情，请参阅为本地开发环境设置身份验证。

创建数据存储区


from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "global"
# data_store_id = "YOUR_DATA_STORE_ID"


def create_data_store_sample(
    project_id: str,
    location: str,
    data_store_id: str,
) -> str:
    #  For more information, refer to:
    # https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
    client_options = (
        ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
        if location != "global"
        else None
    )

    # Create a client
    client = discoveryengine.DataStoreServiceClient(client_options=client_options)

    # The full resource name of the collection
    # e.g. projects/{project}/locations/{location}/collections/default_collection
    parent = client.collection_path(
        project=project_id,
        location=location,
        collection="default_collection",
    )

    data_store = discoveryengine.DataStore(
        display_name="My Data Store",
        # Options: GENERIC, MEDIA, HEALTHCARE_FHIR
        industry_vertical=discoveryengine.IndustryVertical.GENERIC,
        # Options: SOLUTION_TYPE_RECOMMENDATION, SOLUTION_TYPE_SEARCH, SOLUTION_TYPE_CHAT, SOLUTION_TYPE_GENERATIVE_CHAT
        solution_types=[discoveryengine.SolutionType.SOLUTION_TYPE_SEARCH],
        # TODO(developer): Update content_config based on data store type.
        # Options: NO_CONTENT, CONTENT_REQUIRED, PUBLIC_WEBSITE
        content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
    )

    request = discoveryengine.CreateDataStoreRequest(
        parent=parent,
        data_store_id=data_store_id,
        data_store=data_store,
        # Optional: For Advanced Site Search Only
        # create_advanced_site_search=True,
    )

    # Make the request
    operation = client.create_data_store(request=request)

    print(f"Waiting for operation to complete: {operation.operation.name}")
    response = operation.result()

    # After the operation is complete,
    # get information from operation metadata
    metadata = discoveryengine.CreateDataStoreMetadata(operation.metadata)

    # Handle the response
    print(response)
    print(metadata)

    return operation.operation.name

导入文档

from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "us"
# data_store_id = "YOUR_DATA_STORE_ID"
# healthcare_project_id = "YOUR_HEALTHCARE_PROJECT_ID"
# healthcare_location = "YOUR_HEALTHCARE_LOCATION"
# healthcare_dataset_id = "YOUR_HEALTHCARE_DATASET_ID"
# healthcare_fihr_store_id = "YOUR_HEALTHCARE_FHIR_STORE_ID"

#  For more information, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
client_options = (
    ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
    if location != "global"
    else None
)

# Create a client
client = discoveryengine.DocumentServiceClient(client_options=client_options)

# The full resource name of the search engine branch.
# e.g. projects/{project}/locations/{location}/dataStores/{data_store_id}/branches/{branch}
parent = client.branch_path(
    project=project_id,
    location=location,
    data_store=data_store_id,
    branch="default_branch",
)

request = discoveryengine.ImportDocumentsRequest(
    parent=parent,
    fhir_store_source=discoveryengine.FhirStoreSource(
        fhir_store=client.fhir_store_path(
            healthcare_project_id,
            healthcare_location,
            healthcare_dataset_id,
            healthcare_fihr_store_id,
        ),
    ),
    # Options: `FULL`, `INCREMENTAL`
    reconciliation_mode=discoveryengine.ImportDocumentsRequest.ReconciliationMode.INCREMENTAL,
)

# Make the request
operation = client.import_documents(request=request)

print(f"Waiting for operation to complete: {operation.operation.name}")
response = operation.result()

# After the operation is complete,
# get information from operation metadata
metadata = discoveryengine.ImportDocumentsMetadata(operation.metadata)

# Handle the response
print(response)
print(metadata)

后续步骤

创建流式数据存储区并设置流式导入

本部分介绍了如何创建一个流式 Vertex AI Search 数据存储区，以便持续流式传输 Cloud Healthcare API FHIR 存储区中的更改。

控制台

在 Google Cloud 控制台中，前往 Agent Builder 页面。

Agent Builder
在导航菜单中，点击数据存储空间。
点击 Create data store（创建数据存储区）。
在选择数据源窗格中，选择 Healthcare API (FHIR) 作为数据源。
如需从 FHIR 存储区导入数据，请执行以下操作之一：
- 从可用 FHIR 存储区列表中选择 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 在此列表中，选择位于允许的位置中的数据集，然后选择使用 FHIR 版本 R4 的 FHIR 存储区。
- 手动进入 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 点击手动输入 FHIR 存储区。
  3. 在 FHIR 存储区名称对话框中，按以下格式输入 FHIR 存储区的全名：
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. 点击保存。
在同步部分，选择以下选项之一。数据存储区创建后，此选择将无法更改。
- 一次性：执行一次性批量数据导入。如需进一步增量导入，请参阅刷新健康数据。
- 流式传输：用于执行近乎实时的流式数据导入。如需流式传输数据，您必须创建数据连接器，这是一种数据存储类型。如需使用 REST API 设置流式数据存储，请与您的客户工程师联系。
在此数据采用什么架构？部分，选择以下选项之一：
- Google 预定义架构：用于保留 Google 为受支持的 FHIR 资源和元素定义的架构配置，例如可编入索引性、可搜索性和可检索性。选择此选项后，您将无法在创建数据存储区后更新架构。如果您希望能够在创建数据存储区后更改架构，请选择自定义架构选项。
  1. 点击继续。
  2. 在数据存储区名称字段中，输入数据存储区的名称。
  3. 点击创建。
- 自定义架构：用于为受支持的 FHIR 资源和元素定义自己的架构配置，例如可索引性、可搜索性和可检索性。如需设置可配置的架构，请与您的客户工程师联系。
  1. 点击继续。
  2. 查看架构、展开每个字段，然后修改字段设置。
  3. 点击添加新字段，在受支持的 FHIR 资源中添加新字段。您无法移除 Google 定义的架构中提供的字段。
  4. 点击继续。
  5. 在您的数据连接器名称字段中，为数据连接器输入名称。
  6. 点击创建。
点击继续。

REST

创建数据连接器以设置流式传输。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \
-d ' {
  "collectionId": "COLLECTION_ID",
  "collectionDisplayName": "COLLECTION_NAME",
  "dataConnector": {
  "dataSource": "gcp_fhir",
  "params": {
      "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID"
    },
    "entities": [
      {
        "entityName": "FHIR_STORE_NAME"
        "healthcareFhirConfig": {
          "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE,
          "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE
        }
      }
    ],
    "syncMode": "STREAMING"
  }
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- COLLECTION_ID：您要将 FHIR R4 数据流式传输到的集合的 ID。
- COLLECTION_NAME：您要将 FHIR R4 数据流式传输到的集合的名称。
- SOURCE_PROJECT_ID：包含 Cloud Healthcare API 数据集和 FHIR 存储区的 Google Cloud项目的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
- CONFIGURABLE_SCHEMA_TRUE|FALSE：一个布尔值，如果设置为 true，则表示您可以使用 schema.update 方法配置数据存储架构。
- STATIC_INDEXING_TRUE|FALSE：一个布尔值，如果设为 true，则表示您可以使用更高的索引配额导入历史数据。如果您预计搜索应用会遇到更大的数据量，此功能会很有用。不过，编入索引的单个记录需要更长时间。Google 强烈建议您将此字段设置为 true。
响应

您应该收到类似以下内容的 JSON 响应。如果 done 键的值为 true，则表示创建数据存储区的操作已完成。否则，数据存储空间创建操作将失败。
```
{
  "name": "OPERATION_ID",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1main.DataConnector"
  }
}
```
- 如果集合成功创建，系统会在 Google Cloud 控制台中的数据存储区页面上将数据连接器添加到数据存储区列表中。
- 创建的数据连接器包含一个实体，该实体的名称与您要从中流式传输数据的 FHIR R4 存储区相同。

后续步骤

验证数据存储区创建和 FHIR 数据导入

本任务将向您展示如何验证数据存储区是否已成功创建，以及 FHIR 数据是否已成功导入数据存储区。

在 Google Cloud 控制台中：选择数据存储空间并验证其详细信息。
通过 REST API：
1. 使用 dataStores.get 方法获取医疗保健数据存储区详细信息。
2. 使用 operations.get 方法获取导入操作的详细信息。

如需验证数据存储区创建和数据导入，请完成以下步骤。

控制台

在 Google Cloud 控制台中，前往 Agent Builder 页面。

Agent Builder
在导航菜单中，点击数据存储空间。

数据存储区页面会显示项目中的数据存储区及其详细信息的列表。 Google Cloud
验证您创建的数据存储区或数据连接器是否在数据存储区列表中。在数据存储区列表中，用于流式传输数据的数据连接器包含一个与 Cloud Healthcare API FHIR 存储区同名的存储区。
选择数据存储区或数据连接器，然后验证其详细信息。
- 对于数据存储区：
  - 摘要表会列出以下详细信息：
    - 数据存储区 ID、类型和区域。
    - 文档数量，表示导入的 FHIR 资源数量。
    - 上次导入文档的时间戳。
    - （可选）点击查看详情可查看文档导入详情，例如导入成功、部分成功或失败的详细信息。
  - 文档标签页会在分页表格中列出导入的 FHIR 资源的资源 ID 及其资源类型。您可以过滤此表格，以验证是否导入了特定资源。
  - 活动标签页会列出文档导入详情，例如有关导入成功、部分成功或失败的详细信息。
- 对于数据连接器：
  - 摘要表会列出以下详细信息：
    - 合集 ID、类型和地区。
    - 关联的应用的名称。
    - 连接器的状态，可以是“有效”或“已暂停”。
  - 实体表会显示数据连接器中的实体。实体的名称是来源 FHIR 存储区的名称。实体的 ID 是数据连接器的 ID 后附源 FHIR 存储区名称。
    - 点击实体名称可查看其详细信息。由于实体是数据连接器中的数据存储区实例，因此实体详情与数据存储区详情相同。
在架构标签页中，查看受支持的 FHIR 资源和元素的属性。点击修改以配置架构。这是“不公开预览”功能。如需设置可配置的架构，请与您的客户工程师联系。

REST

验证数据存储区是否已创建。

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
 "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。

响应

您应该收到类似以下内容的 JSON 响应。响应包含所创建数据存储区的详细信息。

{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID",
  "displayName": "DATA_STORE_DISPLAY_NAME",
  "industryVertical": "HEALTHCARE_FHIR",
  "createTime": "DATA_STORE_CREATION_TIMESTAMP",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "defaultParsingConfig": {
      "ocrParsingConfig": {}
    }
  }
}

验证 FHIR 数据导入操作是否已完成。
```
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- IMPORT_OPERATION_ID：调用 import 方法时返回的长时间运行的操作的操作 ID
响应

您应该收到类似以下内容的 JSON 响应。导入操作是一项长时间运行的操作。操作运行期间，响应包含以下字段：
- successCount：表示到目前为止成功导入的 FHIR 资源的数量。
- failureCount：表示到目前为止未能导入的 FHIR 资源的数量。只有在有 FHIR 资源导入失败时，才会显示此字段。
操作完成后，响应将包含以下字段：
- successCount：表示成功导入的 FHIR 资源的数量。
- failureCount：表示无法导入的 FHIR 资源的数量。只有在有任何 FHIR 资源导入失败时，才会显示此字段。
- totalCount：表示源 FHIR 存储区中存在的 FHIR 资源数量。只有在有任何 FHIR 资源导入失败时，才会显示此字段。
- done：值为 true，表示导入操作已完成。
- errorSamples：提供有关未能导入的资源的信息。只有在有任何 FHIR 资源导入失败时，才会显示此字段。
- errorConfig：提供包含错误摘要日志文件的 Cloud Storage 位置的路径。
```
{
 "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata",
   "createTime": "START_TIMESTAMP",
   "updateTime": "END_TIMESTAMP",
   "successCount": "SUCCESS_COUNT",
   "failureCount": "FAILURE_COUNT",
   "totalCount": "TOTAL_COUNT",
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsResponse",
  "errorSamples": [ERROR_SAMPLE],
  "errorConfig": {
     "gcsPrefix": "LOG_FILE_LOCATION"
   }
 }
}
```

后续步骤

创建医疗保健搜索应用，并将数据存储区连接到该应用。
在医疗保健搜索应用中搜索医疗保健数据。
刷新健康数据。