使用 Data Boost 导出数据

本页面介绍了如何使用 Spanner Data Boost 导出 Spanner 数据,这些数据对所预配的 Spanner 实例上的现有工作负载几乎没有影响。

如需了解 Data Boost,请参阅 Data Boost 概览

您可以使用 Spanner 控制台中的导出数据页面或使用 Dataflow 模板来导出数据。

准备工作

确保您具有 spanner.databases.useDataBoost Identity and Access Management (IAM) 权限。如需了解详情,请参阅使用 IAM 进行访问权限控制

使用 Spanner 控制台导出数据

如需使用 Spanner 控制台以 Avro 格式导出数据,请执行以下操作:

  1. 按照将数据库从 Spanner 导出到 Avro 中的说明操作。

  2. 选中使用 Spanner Data Boost 复选框。

如要以 CSV 格式导出数据,请执行以下操作:

使用 Dataflow 模板导出数据

如需使用 Data Boost 运行 Dataflow 导出,请选择以下选项之一:

控制台

  1. 前往以下某个页面:

  2. 按照运行模板下的控制台说明进行操作。

  3. 基于模板创建作业页面的可选参数下的使用 Spanner Data Boost 字段中输入 true

gcloud CLI

  1. 前往以下某个页面:

  2. 按照运行模板下的 gloud 说明进行操作。

  3. 将以下参数添加到命令中:

    dataBoostEnabled=true
    

    以下示例运行 Spanner to Cloud Storage Avro 模板,并指定使用 Data Boost。

    gcloud dataflow jobs run my_export_job \
    --gcs-location gs://dataflow-templates/latest/Cloud_Spanner_to_GCS_Avro \
    --region us-central1 \
    --staging-location gs://mybucket/temp \
    --parameters \
    instanceId=my_instance,\
    databaseId=my_database,\
    outputDir=gs://mybucket/export \
    dataBoostEnabled=true
    

后续步骤