此页面由 Cloud Translation API 翻译。

创建医疗保健搜索数据存储区

注意：

医疗保健方面的限制：作为客户，您不得将生成式 AI 服务用于临床目的（为清晰起见，非临床研究、时间安排或其他管理任务，不仅限于此），不得将其用作专业医疗建议的替代方案，也不得以任何受适用监管机构监督或需要其许可或批准的方式使用生成式 AI 服务。如需了解详情，请参阅服务专用条款。
为明确起见，对于使用 Vertex AI Search 检索和总结现有医疗信息的行为，禁止用于临床目的意味着禁止在未经许可的专业人员根据适用法律法规进行审核的情况下，将 Vertex AI Search 用于直接诊断或治疗目的。
生成的输出并不总是完全可靠的。由于 LLM 和生成式 AI 的性质，输出可能包含不正确或有偏见（例如刻板印象或其他有害内容）的信息，因此应进行审核。所有摘要或答案都应被视为草稿，而非最终结果。
本产品的预期用途并非提供与疾病预防、诊断或治疗相关的信息。本产品不适用于解答有关诊断或治疗建议的问题。本产品的预期用途是检索和总结用户提供的现有医疗信息。
由于测试数据有限，此产品可能适用于或不适用于 0-18 岁年龄段和 85 岁及以上年龄段。因此，在查看生成的输出时，客户必须考虑其源数据中子人口的代表性。

如需在 Vertex AI Search 中搜索临床数据，您可以按照以下任一工作流程操作：

创建医疗保健数据存储区，将 FHIR R4 数据导入该数据存储区，将其连接到医疗保健搜索应用，然后查询临床数据。
创建医疗保健搜索应用，创建医疗保健数据存储区，并在应用创建过程中将 FHIR R4 数据导入数据存储区，然后查询临床数据。如需了解详情，请参阅创建医疗保健搜索应用。

本页介绍了第一种方法。

关于数据导入频率

您可以通过以下方式将 FHIR R4 数据导入数据存储区：

批量导入：一次性导入。数据会分批导入数据存储区。如需了解有关后续增量导入的更多信息，请参阅刷新医疗保健数据。
流式导入：近乎实时的流式数据导入。源 FHIR 存储区中的任何增量更改都会在 Vertex AI Search 数据存储区中同步。流式传输需要数据连接器，这是一种数据存储区。如需创建数据连接器，您必须设置集合。数据连接器包含一个实体，该实体也是一个数据存储区实例。

您还可以根据需要随时暂停和恢复数据流，以及执行手动同步。如需了解详情，请参阅管理医疗保健搜索数据存储区。

给定 Google Cloud 项目的数据流式传输速率取决于以下配额。如果超出配额，您可能会遇到流式播放延迟。
- 每分钟待处理的 FHIR 或 BigQuery 流式写入操作的数量。如需了解详情，请参阅配额和限制。
- 每个区域每分钟的 FHIR 读取操作次数。如需了解详情，请参阅 Cloud Healthcare API FHIR 配额。

您可以在创建数据存储区时选择数据导入频率，但之后无法更改此配置。

准备工作

在创建医疗保健数据存储区并将数据导入其中之前，请了解以下信息：

医疗保健搜索应用与数据存储区之间的关系。如需了解详情，请参阅应用和数据存储区简介。
准备 FHIR 数据以进行提取。
Vertex AI Search for Healthcare 仅在美国多区域 (us) 提供搜索服务。因此，您的医疗保健搜索应用和数据存储区必须位于 us 多区域。
如果您要将医疗保健数据从一个 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区导入到另一个 Google Cloud 项目中的 Vertex AI Search 数据存储区，并且您使用的是 VPC Service Controls，则这两个项目必须位于同一边界内。

创建数据存储区并导入数据

您可以在Google Cloud 控制台中或使用 API 通过以下方法创建数据存储区并导入 FHIR R4 数据：

您可以通过一次性批量导入来创建静态数据存储区。如需了解详情，请参阅创建静态数据存储区并执行一次性批量导入。
您可以创建一个流式数据存储区，将 Cloud Healthcare API FHIR 存储区中的更改持续流式传输到 Vertex AI Search 数据存储区。如需了解详情，请参阅创建流式数据存储区并设置流式导入。

执行此任务所需的权限

向包含 AI 应用数据存储区的项目中的 service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management (IAM) 角色：

用途	角色
用于从 Cloud Healthcare API 中的 FHIR 存储区执行 FHIR 数据的一次性批量导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`)
从同一 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区执行 FHIR 数据的流式导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)
从不同 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区执行 FHIR 数据流式导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`) Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)
用于导入引用 Cloud Storage 中文件的 FHIR 数据。如果引用的文件与 AI Applications 应用位于同一 Google Cloud 项目中，则系统会默认授予这些权限。	Storage Object Admin (`roles/storage.objectAdmin`)
在创建数据存储区时自定义架构，以配置 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。	Storage Object Admin (`roles/storage.objectAdmin`)

在包含 Cloud Healthcare API FHIR R4 数据存储区的项目中，向 service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management 角色：

用途	角色
从不同 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区执行 FHIR 数据流式导入。	Healthcare FHIR Store Administrator (`roles/healthcare.fhirStoreAdmin`) Healthcare FHIR Resource Reader (`roles/healthcare.fhirResourceReader`)

在包含 Cloud Healthcare API FHIR R4 数据存储区的项目中，向 service-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.com 服务账号授予以下 Identity and Access Management 角色：

用途	角色
从同一 Google Cloud 项目中的 Cloud Healthcare API FHIR 存储区执行 FHIR 数据的流式导入。	BigQuery Job User (`roles/bigquery.jobUser`) BigQuery Data Editor (`roles/bigquery.dataEditor`)
在创建数据存储区时自定义架构，以配置 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。	Storage Object Admin (`roles/storage.objectAdmin`)

创建静态数据存储区并执行一次性批量导入

本部分介绍了如何创建只能执行批量导入的 Vertex AI Search 数据存储区。您可以在首次创建数据存储区时导入批量数据，并根据需要执行增量批量导入。

控制台

在 Google Cloud 控制台中，前往 AI Applications 页面。

AI 应用
在导航菜单中，点击数据存储区。
点击 创建数据存储区。
在选择数据源窗格中，选择 Healthcare API (FHIR) 作为数据源。
如需从 FHIR 存储区导入数据，请执行以下操作之一：
- 从可用 FHIR 存储区的列表中选择 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 在此列表中，选择位于允许的位置的数据集，然后选择使用 FHIR 版本 R4 的 FHIR 存储区。
- 手动输入 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 点击手动输入 FHIR 存储区。
  3. 在 FHIR 存储区名称对话框中，输入 FHIR 存储区的全名，格式如下：
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. 点击保存。
在同步部分，选择以下选项之一。数据存储区创建后，您将无法更改此选择。
- 一次性：执行一次性批量数据导入。如需了解有关后续增量导入的更多信息，请参阅刷新医疗保健数据。
- 流式传输：用于执行近乎实时的流式数据导入。如需流式传输数据，您必须创建数据连接器，这是一种数据存储区。如需使用 REST API 设置流式数据存储区，请与您的客户工程师联系。
在此数据采用什么架构？部分，选择以下选项之一：
- Google 预定义架构：保留 Google 定义的架构配置，例如受支持的 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。选择此选项后，您将无法在创建数据存储区后更新架构。如果您希望能够在创建数据存储区后更改架构，请选择自定义架构选项。
  1. 点击继续。
  2. 在数据存储区名称字段中，输入数据存储区的名称。
  3. 点击创建。
- 自定义架构：用于为受支持的 FHIR 资源和元素定义您自己的架构配置，例如可编入索引性、可搜索性和可检索性。如需设置可配置的架构，请与您的客户工程师联系。
  1. 点击继续。
  2. 查看架构，展开每个字段，然后修改字段设置。
  3. 点击添加新字段，以在受支持的 FHIR 资源中添加新字段。您无法移除 Google 定义的架构中提供的字段。
  4. 点击继续。
  5. 在数据连接器名称字段中，输入数据连接器的名称。
  6. 点击创建。
点击继续。

REST

创建数据存储区。

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
DATA_STORE_ID：要创建的 Vertex AI Search 数据存储区的 ID。此 ID 只能包含小写字母、数字、下划线和连字符。
DATA_STORE_DISPLAY_NAME：您要创建的 Vertex AI Search 数据存储区的显示名称。
CONFIGURABLE_SCHEMA_TRUE|FALSE：一个布尔值，设置为 true 时，您可以使用 schema.update 方法配置数据存储区架构。

响应

您应该收到类似以下内容的 JSON 响应。如果 done 键的值为 true，则表示创建数据存储区的操作已完成。否则，数据存储区创建操作失败。

{
  "name": "OPERATION_ID",
  "done": true
}

如果源 FHIR 存储区和目标 Vertex AI Search 数据存储区位于同一 Google Cloud 项目中，请调用以下方法来执行一次性批量导入。如果它们不在同一项目中，请前往下一步。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
响应

您应该收到类似以下内容的 JSON 响应。响应包含长时间运行的操作的标识符。当方法调用可能需要大量时间才能完成时，会返回长时间运行的操作。记下 IMPORT_OPERATION_ID 的值。您需要此值来验证导入的状态或取消正在进行的批量导入。
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
如果源 FHIR 存储区和目标 Vertex AI Search 数据存储区位于不同的 Google Cloud 项目中，请调用以下方法来执行一次性批量导入。如果它们位于同一项目中，请返回上一步。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
替换以下内容：
- PROJECT_ID：包含 Vertex AI Search 数据存储区的 Google Cloud项目的 ID。
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- SOURCE_PROJECT_ID：包含 Cloud Healthcare API 数据集和 FHIR 存储区的 Google Cloud项目的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
响应

您应该收到类似以下内容的 JSON 响应。响应包含长时间运行的操作的标识符。当方法调用可能需要大量时间才能完成时，会返回长时间运行的操作。记下 IMPORT_OPERATION_ID 的值。您需要此值来验证导入的状态。
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

如需了解详情，请参阅 AI Applications Python API 参考文档。

如需向 AI 应用进行身份验证，请设置应用默认凭据。如需了解详情，请参阅为本地开发环境设置身份验证。

创建数据存储区


from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "global"
# data_store_id = "YOUR_DATA_STORE_ID"


def create_data_store_sample(
    project_id: str,
    location: str,
    data_store_id: str,
) -> str:
    #  For more information, refer to:
    # https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
    client_options = (
        ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
        if location != "global"
        else None
    )

    # Create a client
    client = discoveryengine.DataStoreServiceClient(client_options=client_options)

    # The full resource name of the collection
    # e.g. projects/{project}/locations/{location}/collections/default_collection
    parent = client.collection_path(
        project=project_id,
        location=location,
        collection="default_collection",
    )

    data_store = discoveryengine.DataStore(
        display_name="My Data Store",
        # Options: GENERIC, MEDIA, HEALTHCARE_FHIR
        industry_vertical=discoveryengine.IndustryVertical.GENERIC,
        # Options: SOLUTION_TYPE_RECOMMENDATION, SOLUTION_TYPE_SEARCH, SOLUTION_TYPE_CHAT, SOLUTION_TYPE_GENERATIVE_CHAT
        solution_types=[discoveryengine.SolutionType.SOLUTION_TYPE_SEARCH],
        # TODO(developer): Update content_config based on data store type.
        # Options: NO_CONTENT, CONTENT_REQUIRED, PUBLIC_WEBSITE
        content_config=discoveryengine.DataStore.ContentConfig.CONTENT_REQUIRED,
    )

    request = discoveryengine.CreateDataStoreRequest(
        parent=parent,
        data_store_id=data_store_id,
        data_store=data_store,
        # Optional: For Advanced Site Search Only
        # create_advanced_site_search=True,
    )

    # Make the request
    operation = client.create_data_store(request=request)

    print(f"Waiting for operation to complete: {operation.operation.name}")
    response = operation.result()

    # After the operation is complete,
    # get information from operation metadata
    metadata = discoveryengine.CreateDataStoreMetadata(operation.metadata)

    # Handle the response
    print(response)
    print(metadata)

    return operation.operation.name

导入文档

from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"
# location = "YOUR_LOCATION" # Values: "us"
# data_store_id = "YOUR_DATA_STORE_ID"
# healthcare_project_id = "YOUR_HEALTHCARE_PROJECT_ID"
# healthcare_location = "YOUR_HEALTHCARE_LOCATION"
# healthcare_dataset_id = "YOUR_HEALTHCARE_DATASET_ID"
# healthcare_fihr_store_id = "YOUR_HEALTHCARE_FHIR_STORE_ID"

#  For more information, refer to:
# https://cloud.google.com/generative-ai-app-builder/docs/locations#specify_a_multi-region_for_your_data_store
client_options = (
    ClientOptions(api_endpoint=f"{location}-discoveryengine.googleapis.com")
    if location != "global"
    else None
)

# Create a client
client = discoveryengine.DocumentServiceClient(client_options=client_options)

# The full resource name of the search engine branch.
# e.g. projects/{project}/locations/{location}/dataStores/{data_store_id}/branches/{branch}
parent = client.branch_path(
    project=project_id,
    location=location,
    data_store=data_store_id,
    branch="default_branch",
)

request = discoveryengine.ImportDocumentsRequest(
    parent=parent,
    fhir_store_source=discoveryengine.FhirStoreSource(
        fhir_store=client.fhir_store_path(
            healthcare_project_id,
            healthcare_location,
            healthcare_dataset_id,
            healthcare_fihr_store_id,
        ),
    ),
    # Options: `FULL`, `INCREMENTAL`
    reconciliation_mode=discoveryengine.ImportDocumentsRequest.ReconciliationMode.INCREMENTAL,
)

# Make the request
operation = client.import_documents(request=request)

print(f"Waiting for operation to complete: {operation.operation.name}")
response = operation.result()

# After the operation is complete,
# get information from operation metadata
metadata = discoveryengine.ImportDocumentsMetadata(operation.metadata)

# Handle the response
print(response)
print(metadata)

后续步骤

创建流式数据存储区并设置流式导入

本部分介绍了如何创建流式 Vertex AI Search 数据存储区，该存储区可从 Cloud Healthcare API FHIR 存储区持续流式传输更改。

控制台

在 Google Cloud 控制台中，前往 AI Applications 页面。

AI 应用
在导航菜单中，点击数据存储区。
点击 创建数据存储区。
在选择数据源窗格中，选择 Healthcare API (FHIR) 作为数据源。
如需从 FHIR 存储区导入数据，请执行以下操作之一：
- 从可用 FHIR 存储区的列表中选择 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 在此列表中，选择位于允许的位置的数据集，然后选择使用 FHIR 版本 R4 的 FHIR 存储区。
- 手动输入 FHIR 存储区：
  1. 展开 FHIR 存储区字段。
  2. 点击手动输入 FHIR 存储区。
  3. 在 FHIR 存储区名称对话框中，输入 FHIR 存储区的全名，格式如下：
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. 点击保存。
在同步部分，选择以下选项之一。数据存储区创建后，您将无法更改此选择。
- 一次性：执行一次性批量数据导入。如需了解有关后续增量导入的更多信息，请参阅刷新医疗保健数据。
- 流式传输：用于执行近乎实时的流式数据导入。如需流式传输数据，您必须创建数据连接器，这是一种数据存储区。如需使用 REST API 设置流式数据存储区，请与您的客户工程师联系。
在此数据采用什么架构？部分，选择以下选项之一：
- Google 预定义架构：保留 Google 定义的架构配置，例如受支持的 FHIR 资源和元素的可编入索引性、可搜索性和可检索性。选择此选项后，您将无法在创建数据存储区后更新架构。如果您希望能够在创建数据存储区后更改架构，请选择自定义架构选项。
  1. 点击继续。
  2. 在数据存储区名称字段中，输入数据存储区的名称。
  3. 点击创建。
- 自定义架构：用于为受支持的 FHIR 资源和元素定义您自己的架构配置，例如可编入索引性、可搜索性和可检索性。如需设置可配置的架构，请与您的客户工程师联系。
  1. 点击继续。
  2. 查看架构，展开每个字段，然后修改字段设置。
  3. 点击添加新字段，以在受支持的 FHIR 资源中添加新字段。您无法移除 Google 定义的架构中提供的字段。
  4. 点击继续。
  5. 在数据连接器名称字段中，输入数据连接器的名称。
  6. 点击创建。
点击继续。

REST

创建数据连接器以设置流式传输。
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \
-d ' {
  "collectionId": "COLLECTION_ID",
  "collectionDisplayName": "COLLECTION_NAME",
  "dataConnector": {
  "dataSource": "gcp_fhir",
  "params": {
      "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID"
    },
    "entities": [
      {
        "entityName": "FHIR_STORE_NAME"
        "healthcareFhirConfig": {
          "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE,
          "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE
        }
      }
    ],
    "syncMode": "STREAMING"
  }
}'
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- COLLECTION_ID：要将 FHIR R4 数据流式传输到的集合的 ID。
- COLLECTION_NAME：您要将 FHIR R4 数据流式传输到的集合的名称。
- SOURCE_PROJECT_ID：包含 Cloud Healthcare API 数据集和 FHIR 存储区的 Google Cloud项目的 ID。
- CLOUD_HEALTHCARE_DATASET_ID：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的 ID。
- CLOUD_HEALTHCARE_DATASET_LOCATION：包含源 FHIR 存储区的 Cloud Healthcare API 数据集的位置。
- FHIR_STORE_ID：Cloud Healthcare API FHIR R4 存储区的 ID。
- CONFIGURABLE_SCHEMA_TRUE|FALSE：一个布尔值，设置为 true 时，您可以使用 schema.update 方法配置数据存储区架构。
- STATIC_INDEXING_TRUE|FALSE：一个布尔值，设置为 true 时，可让您以更高的索引配额导入历史数据。如果您预计搜索应用会遇到更高的数据量，则此功能非常有用。不过，单个记录需要更长时间才能编入索引。Google 强烈建议您将此字段设置为 true。
响应

您应该收到类似以下内容的 JSON 响应。如果 done 键的值为 true，则表示创建数据存储区的操作已完成。否则，数据存储区创建操作失败。
```
{
  "name": "OPERATION_ID",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1main.DataConnector"
  }
}
```
- 如果成功创建集合，则会在 Google Cloud 控制台的数据存储区页面上的数据存储区列表中添加一个数据连接器。
- 创建的数据连接器包含一个实体，该实体的名称与您从中流式传输数据的 FHIR R4 存储区相同。

后续步骤

验证数据存储区创建和 FHIR 数据导入

此任务将向您展示如何验证数据存储区是否已成功创建，以及 FHIR 数据是否已成功导入到数据存储区中。

在 Google Cloud 控制台中：选择数据存储区并验证其详细信息。
通过 REST API：
1. 使用 dataStores.get 方法可获取医疗保健数据存储区的详细信息。
2. 使用 operations.get 方法获取导入操作的详细信息。

如需验证数据存储区创建和数据导入，请完成以下步骤。

控制台

在 Google Cloud 控制台中，前往 AI Applications 页面。

AI 应用
在导航菜单中，点击数据存储区。

数据存储区页面会显示 Google Cloud项目中的数据存储区列表及其详细信息。
验证您创建的数据存储区或数据连接器是否位于数据存储区列表中。在数据存储区列表中，用于流式传输数据的数据连接器包含一个与 Cloud Healthcare API FHIR 存储区同名的数据存储区。
选择数据存储区或数据连接器，然后验证其详细信息。
- 对于数据存储区：
  - 摘要表格会列出以下详细信息：
    - 数据存储区 ID、类型和区域。
    - 表示导入的 FHIR 资源数量的文档数量。
    - 上次导入文档时的时间戳。
    - （可选）点击查看详情可查看文档导入详情，例如成功、部分成功或失败的导入的相关详情。
  - 文档标签页会在分页表格中列出已导入的 FHIR 资源的资源 ID 及其资源类型。您可以过滤此表，以验证是否已导入特定资源。
  - 活动标签页会列出文档导入详细信息，例如成功、部分成功或失败的导入的相关详细信息。
- 对于数据连接器：
  - 摘要表格会列出以下详细信息：
    - 集合 ID、类型和区域。
    - 关联应用的名称。
    - 连接器的状态，可以是“有效”或“已暂停”。
  - 实体表显示数据连接器中的实体。实体的名称是源 FHIR 存储区的名称。实体的 ID 是数据连接器的 ID 附加源 FHIR 存储区名称。
    - 点击实体名称可查看其详细信息。由于实体是数据连接器中的数据存储区实例，因此实体详细信息与数据存储区详细信息相同。
在架构标签页中，查看受支持的 FHIR 资源和元素的属性。点击修改以配置架构。

REST

验证数据存储区是否已创建。

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
 "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"

替换以下内容：

PROJECT_ID：您的 Google Cloud 项目的 ID。
DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。

响应

您应该收到类似以下内容的 JSON 响应。响应包含所创建数据存储区的详细信息。

{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID",
  "displayName": "DATA_STORE_DISPLAY_NAME",
  "industryVertical": "HEALTHCARE_FHIR",
  "createTime": "DATA_STORE_CREATION_TIMESTAMP",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "defaultParsingConfig": {
      "ocrParsingConfig": {}
    }
  }
}

验证 FHIR 数据导入操作是否已完成。
```
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
```
替换以下内容：
- PROJECT_ID：您的 Google Cloud 项目的 ID。
- DATA_STORE_ID：Vertex AI Search 数据存储区的 ID。
- IMPORT_OPERATION_ID：调用 import 方法时返回的长时间运行的操作的操作 ID
响应

您应该收到类似以下内容的 JSON 响应。导入操作是一项长时间运行的操作。在操作运行期间，响应包含以下字段：
- successCount：表示目前已成功导入的 FHIR 资源数量。
- failureCount：表示目前导入失败的 FHIR 资源数量。仅当有 FHIR 资源未能成功导入时，此字段才会显示。
操作完成后，响应将包含以下字段：
- successCount：表示成功导入的 FHIR 资源数量。
- failureCount：表示导入失败的 FHIR 资源数量。仅当有任何 FHIR 资源未能成功导入时，此字段才会显示。
- totalCount：表示源 FHIR 存储区中存在的 FHIR 资源数量。仅当有任何 FHIR 资源未能成功导入时，此字段才会显示。
- done：值为 true，表示导入操作已完成。
- errorSamples：提供有关未能成功导入的资源的信息。仅当有任何 FHIR 资源未能成功导入时，此字段才会显示。
- errorConfig：提供包含错误摘要日志文件的 Cloud Storage 位置的路径。
```
{
 "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
 "metadata": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata",
   "createTime": "START_TIMESTAMP",
   "updateTime": "END_TIMESTAMP",
   "successCount": "SUCCESS_COUNT",
   "failureCount": "FAILURE_COUNT",
   "totalCount": "TOTAL_COUNT",
 },
 "done": true,
 "response": {
   "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsResponse",
  "errorSamples": [ERROR_SAMPLE],
  "errorConfig": {
     "gcsPrefix": "LOG_FILE_LOCATION"
   }
 }
}
```

后续步骤

创建医疗保健搜索应用，并将数据存储区连接到该应用。
在医疗保健搜索应用中搜索医疗保健数据。
刷新健康数据。

创建医疗保健搜索数据存储区 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

关于数据导入频率

准备工作

创建数据存储区并导入数据

执行此任务所需的权限

创建静态数据存储区并执行一次性批量导入

控制台

REST

响应

响应

响应

Python

创建数据存储区

导入文档

后续步骤

创建流式数据存储区并设置流式导入

控制台

REST

响应

后续步骤

验证数据存储区创建和 FHIR 数据导入

控制台

REST

响应

响应

后续步骤

创建医疗保健搜索数据存储区