本页面介绍了如何创建、修改、查看、列出和删除数据集。 创建数据集后,您可以创建数据存储区,以保存电子健康记录和医学成像数据、对数据集进行去标识化处理,等等。
准备工作
请参阅 Cloud Healthcare API 数据模型。
创建数据集
以下示例展示了如何创建数据集。
控制台
在 Google Cloud 控制台中,前往浏览器页面。
点击 add_box 创建数据集。系统随即会显示数据集属性页面。
在名称字段中,输入数据集的标识符,具体取决于数据集允许的字符和大小要求。
选择以下地理位置类型之一:
Region 绑定将多选选项设置为所有记录中 Region 的所有值。数据集会永久驻留在一个 Google Cloud 区域内。 选择此选项后,在区域字段中输入或选择位置。
多区域。该数据集永久驻留在跨多个 Google Cloud 区域的位置。选择此选项后,在多区域字段中输入或选择多区域位置。
点击创建。系统会显示浏览器页面。新数据集将显示在数据集列表中。
gcloud
运行 gcloud healthcare datasets create
命令。
在使用下面的命令数据之前,请先进行以下替换:
LOCATION
:数据集的支持位置DATASET_ID
:此标识符遵循数据集允许的字符和大小要求。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud healthcare datasets create DATASET_ID \ --location=LOCATION
Windows (PowerShell)
gcloud healthcare datasets create DATASET_ID ` --location=LOCATION
Windows (cmd.exe)
gcloud healthcare datasets create DATASET_ID ^ --location=LOCATION
您应该会收到类似如下所示的响应:
Create request issued for: [DATASET_ID] Created dataset [DATASET_ID].
REST
使用 projects.locations.datasets.create
方法。
创建数据集。
在使用任何请求数据之前,请先进行以下替换:
PROJECT_ID
:您的 Google Cloud 项目的 IDLOCATION
:数据集的支持位置DATASET_ID
:此标识符遵循数据集允许的字符和大小要求。
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d "" \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets?datasetId=DATASET_ID"PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets?datasetId=DATASET_ID" | Select-Object -Expand ContentAPI Explorer
打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。填写所有必填字段,然后点击执行。
OPERATION_ID
的值。在下一步中,您需要使用此值。使用
projects.locations.datasets.operations.get
方法可获取长时间运行的操作的状态。在使用任何请求数据之前,请先进行以下替换:
- PROJECT_ID:您的 Google Cloud 项目的 ID
- LOCATION:数据集位置
- DATASET_ID:要创建的数据集的 ID
- OPERATION_ID:长时间运行的操作的 ID
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/operations/OPERATION_ID"PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/operations/OPERATION_ID" | Select-Object -Expand ContentAPI Explorer
打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。填写所有必填字段,然后点击执行。
"done": true
,表示已成功创建数据集。
Go
Java
Node.js
Python
编辑数据集
以下示例展示了如何修改数据集。
控制台
Google Cloud 控制台不支持修改数据集。而应使用 Google Cloud CLI 或 REST API。
gcloud
运行 gcloud healthcare datasets update
命令。
在使用下面的命令数据之前,请先进行以下替换:
LOCATION
:数据集位置DATASET_ID
:数据集 IDTIME_ZONE
:受支持的时区,例如UTC
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud healthcare datasets update DATASET_ID \ --location=LOCATION \ --time-zone=TIME_ZONE
Windows (PowerShell)
gcloud healthcare datasets update DATASET_ID ` --location=LOCATION ` --time-zone=TIME_ZONE
Windows (cmd.exe)
gcloud healthcare datasets update DATASET_ID ^ --location=LOCATION ^ --time-zone=TIME_ZONE
您应该会收到类似如下所示的响应:
Updated dataset [DATASET_ID]. name: projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID timeZone: TIME_ZONE
REST
使用 projects.locations.datasets.patch
方法。
在使用任何请求数据之前,请先进行以下替换:
PROJECT_ID
:您的 Google Cloud 项目的 IDLOCATION
:数据集位置DATASET_ID
:数据集 IDTIME_ZONE
:受支持的时区,例如UTC
请求 JSON 正文:
{ "timeZone": "TIME_ZONE" }
如需发送请求,请选择以下方式之一:
curl
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID?updateMask=timeZone"
PowerShell
将请求正文保存在名为 request.json
的文件中,然后执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID?updateMask=timeZone" | Select-Object -Expand Content
API Explorer
复制请求正文并打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。将请求正文粘贴到此工具中,填写任何其他必填字段,然后点击执行。
您应该收到类似以下内容的 JSON 响应:
Go
Java
Node.js
Python
获取数据集详情
以下示例展示了如何获取数据集的相关详细信息。
控制台
在 Google Cloud 控制台中,前往浏览器页面。
选择数据集。系统随即会显示数据集页面以及数据集中的数据存储区。
gcloud
运行 gcloud healthcare datasets describe
命令。
在使用下面的命令数据之前,请先进行以下替换:
LOCATION
:数据集位置DATASET_ID
:数据集 ID
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud healthcare datasets describe DATASET_ID \ --location=LOCATION
Windows (PowerShell)
gcloud healthcare datasets describe DATASET_ID ` --location=LOCATION
Windows (cmd.exe)
gcloud healthcare datasets describe DATASET_ID ^ --location=LOCATION
您应该会收到类似如下所示的响应:
name: projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID timeZone: TIME_ZONE
REST
使用 projects.locations.datasets.get
方法。
在使用任何请求数据之前,请先进行以下替换:
PROJECT_ID
:您的 Google Cloud 项目的 IDLOCATION
:数据集位置DATASET_ID
:数据集 ID
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID" | Select-Object -Expand Content
API Explorer
打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。填写所有必填字段,然后点击执行。
您应该收到类似以下内容的 JSON 响应:
Go
Java
Node.js
Python
列出数据集
以下示例展示了如何列出项目中的数据集。
控制台
在 Google Cloud 控制台中,前往浏览器页面。
gcloud
运行 gcloud healthcare datasets list
命令。
在使用下面的命令数据之前,请先进行以下替换:
LOCATION
:数据集位置
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud healthcare datasets list --location=LOCATION
Windows (PowerShell)
gcloud healthcare datasets list --location=LOCATION
Windows (cmd.exe)
gcloud healthcare datasets list --location=LOCATION
您应该会收到类似如下所示的响应:
ID LOCATION TIMEZONE DATASET_ID LOCATION TIME_ZONE
REST
使用 projects.locations.datasets.list
方法。
在使用任何请求数据之前,请先进行以下替换:
PROJECT_ID
:您的 Google Cloud 项目的 IDLOCATION
:数据集位置
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets" | Select-Object -Expand Content
API Explorer
打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。填写所有必填字段,然后点击执行。
您应该收到类似以下内容的 JSON 响应:
Go
Java
Node.js
Python
删除数据集
以下示例展示了如何删除数据集。
控制台
在 Google Cloud 控制台中,前往浏览器页面。
在数据集所在的行中,点击
操作选项,然后选择删除。在确认对话框中,输入数据集 ID,然后点击删除。
gcloud
运行 gcloud healthcare datasets delete
命令。
在使用下面的命令数据之前,请先进行以下替换:
LOCATION
:数据集位置DATASET_ID
:数据集 ID
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud healthcare datasets delete DATASET_ID \ --location=LOCATION
Windows (PowerShell)
gcloud healthcare datasets delete DATASET_ID ` --location=LOCATION
Windows (cmd.exe)
gcloud healthcare datasets delete DATASET_ID ^ --location=LOCATION
要确认,请键入 Y。
输出如下所示:
Deleted dataset [DATASET_ID]
REST
使用 projects.locations.datasets.delete
方法。
在使用任何请求数据之前,请先进行以下替换:
PROJECT_ID
:您的 Google Cloud 项目的 IDLOCATION
:数据集位置DATASET_ID
:数据集 ID
如需发送请求,请选择以下方式之一:
curl
执行以下命令:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID"
PowerShell
执行以下命令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://healthcare.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID" | Select-Object -Expand Content
API Explorer
打开方法参考页面。API Explorer 面板会在页面右侧打开。您可以与此工具进行交互以发送请求。填写所有必填字段,然后点击执行 (Execute)。
您应该会收到一个成功的状态代码 (2xx) 和一个空响应。