使用 Data Boost 导出数据

本页介绍了如何使用 Spanner Data Boost 导出 Spanner 数据,且对预配的 Spanner 实例上的现有工作负载几乎没有影响。

如需了解 Data Boost, 请参阅 Data Boost 概览

您可以使用 Spanner 控制台中的导出数据页面或 Dataflow 模板导出数据。

准备工作

确保您拥有 spanner.databases.useDataBoost Identity and Access Management (IAM) 权限。如需了解详情,请参阅使用 IAM 进行访问权限控制

使用 Spanner 控制台导出数据

如需使用 Spanner 控制台以 Avro 格式导出数据,请执行以下操作:

  1. 按照将数据库从 Spanner 导出到 Avro 中的说明操作。

  2. 选中使用 Spanner Data Boost 复选框。

如需以 CSV 格式导出数据,请执行以下操作:

使用 Dataflow 模板导出数据

如需使用 Data Boost 运行 Dataflow 导出,请执行以下操作: 从下列选项中选择一项:

控制台

  1. 转到以下某个页面:

  2. 按照运行模板下的控制台说明进行操作。

  3. 基于模板创建作业页面的可选参数下,在使用 Spanner Data Boost 字段中输入 true

gcloud CLI

  1. 前往以下任一页面:

  2. 按照运行模板下的 gloud 说明进行操作。

  3. 将以下参数添加到该命令:

    dataBoostEnabled=true
    

    以下示例运行了 Spanner 到 Cloud Storage Avro 模板,并指定了 Data Boost 的使用方式。

    gcloud dataflow jobs run my_export_job \
    --gcs-location gs://dataflow-templates/latest/Cloud_Spanner_to_GCS_Avro \
    --region us-central1 \
    --staging-location gs://mybucket/temp \
    --parameters \
    instanceId=my_instance,\
    databaseId=my_database,\
    outputDir=gs://mybucket/export \
    dataBoostEnabled=true

后续步骤