从 SQL Server 表中读取


本页面介绍了如何设置数据流水线,以从 Microsoft SQL Server 表中读取数据。

准备工作

  1. 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. 确保您的 Google Cloud 项目已启用结算功能

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. 确保您的 Google Cloud 项目已启用结算功能

  6. 启用 Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc API。

    启用 API

  7. 创建 Cloud Data Fusion 实例
  8. 您的 SQL Server 数据库必须接受来自 Cloud Data Fusion 的连接。出于安全考虑,请使用私有 Cloud Data Fusion 实例

打开您的 Cloud Data Fusion 实例

  1. 在 Google Cloud 控制台中,转到 Cloud Data Fusion 实例页面。

    打开“实例”

  2. 在实例的操作列中,点击查看实例以在 Cloud Data Fusion 中打开该实例。

将 SQL Server 密码存储为安全密钥

将您的 SQL Server 密码作为安全密钥添加到 Cloud Data Fusion 实例中。

  1. 在 Cloud Data Fusion 中,点击系统管理员

  2. 点击配置标签页。

  3. 点击进行 HTTP 调用

    配置。

  4. 选择 PUT

  5. 在路径字段中,输入 namespaces/NAMESPACE_ID/securekeys/password

  6. 正文字段中,输入 {"data":"password"}。 将 password 替换为您的 SQL Server 密码。

  7. 点击发送

    密码。

响应必须有状态代码 200 才能继续。

获取适用于 SQL Server 的 JDBC 驱动程序

您可以从中心或在 Cloud Data Fusion 的 Pipeline Studio 中获取驱动程序。

Hub

  1. 在 Cloud Data Fusion 界面中,点击 Hub

  2. 在搜索栏中,输入 SQL Server JDBC Driver 并选择驱动程序。

  3. 点击下载。按照所示的下载步骤操作。

  4. 点击部署。上传上一步中的 JAR 文件。

  5. 点击完成

Pipeline Studio

  1. 前往 Microsoft.com

  2. 选择下载的内容,然后点击下载

  3. 在 Cloud Data Fusion 中,点击 菜单,然后转到 Pipeline Studio 页面。

  4. 点击 添加

  5. 对于驱动程序,请点击上传

  6. 选择位于 jre7 文件夹中的 JAR 文件。

  7. 点击下一步

  8. 如需配置驱动程序,请输入 NameClass name

  9. 点击完成

部署 SQL Server 插件

  1. 在 Cloud Data Fusion 中,点击 Hub

  2. 在搜索栏中,输入 SQL Server Plugins

  3. 点击 SQL Server plugins

  4. 点击部署

  5. 点击完成

  6. 点击创建流水线

连接到 SQL Server

您可以在 Wrangler 或 Pipeline Studio 中从 Cloud Data Fusion 连接到 SQL Server。

Wrangler

  1. 在 Cloud Data Fusion 中,点击 菜单并转到 Wrangler 页面。

  2. 点击添加连接

    系统会打开添加连接窗口。

  3. 点击 SQL Server 以验证是否已安装驱动程序。

    JAR 文件已上传。

  4. 在必需的连接字段中输入详细信息。在密码字段中,选择您之前存储的安全密钥。 它可确保使用 Cloud KMS 检索您的密码。

    设置密码。

  5. 如需检查是否可以与数据库建立连接,请点击测试连接

  6. 点击添加连接

连接 SQL Server 数据库并创建从 SQL Server 表读取数据的流水线后,您可以应用转换并将输出写入接收器。

Pipeline Studio

  1. 打开 Cloud Data Fusion 实例并转到 Pipeline Studio 页面。

  2. 展开来源菜单,然后点击 SQL Server

    SQL Server。

  3. SQL Server 节点上,点击属性

    属性。
  4. 引用名称字段中,输入用于标识 SQL Server 来源的名称。

  5. 数据库字段中,输入要连接的数据库的名称。

  6. 导入查询字段中,输入要运行的查询。例如 SELECT * FROM table WHERE $CONDITIONS

  7. 点击验证

  8. 点击“关闭”图标

连接 SQL Server 数据库并创建从 SQL Server 表读取数据的流水线后,添加任何所需的转换并将输出写入接收器。

后续步骤