使用 Data Boost 导出数据

本页介绍如何使用 Spanner Data Boost 导出 Spanner 对已预配网站上的现有工作负载几乎零影响的数据 Spanner 实例。

如需了解 Data Boost, 请参阅 Data Boost 概览

您可以使用导出数据页面来导出数据, 或者使用 Dataflow 模板。

准备工作

确保您已拥有 spanner.databases.useDataBoost Identity and Access Management (IAM) 权限。如需了解详情,请参阅使用 IAM 进行访问权限控制

使用 Spanner 控制台导出数据

如需使用 Spanner 控制台以 Avro 格式导出数据,请执行以下操作:

  1. 请按照 将数据库从 Spanner 导出到 Avro

  2. 选中使用 Spanner Data Boost 复选框。

要以 CSV 格式导出数据,请执行以下操作:

使用 Dataflow 模板导出数据

如需使用 Data Boost 运行 Dataflow 导出,请执行以下操作: 从下列选项中选择一项:

控制台

  1. 转到以下某个页面:

  2. 按照运行模板下的控制台说明进行操作。

  3. 基于模板创建作业页面的可选参数下, 在true 使用 Spanner Data Boost 字段。

gcloud CLI

  1. 转到以下某个页面:

  2. 按照运行模板下的 gloud 说明进行操作。

  3. 将以下参数添加到命令中:

    dataBoostEnabled=true
    

    以下示例将 Spanner 运行到 Cloud Storage Avro 模板,并指定了 Data Boost 的使用。

    gcloud dataflow jobs run my_export_job \
    --gcs-location gs://dataflow-templates/latest/Cloud_Spanner_to_GCS_Avro \
    --region us-central1 \
    --staging-location gs://mybucket/temp \
    --parameters \
    instanceId=my_instance,\
    databaseId=my_database,\
    outputDir=gs://mybucket/export \
    dataBoostEnabled=true
    

后续步骤