从 Microsoft SQL Server 表中读取数据

本指南介绍了如何从 Microsoft SQL Server 表中读取数据。

准备工作

  1. 登录您的 Google Cloud 帐号。如果您是 Google Cloud 新手,请创建一个帐号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 的项目选择器页面上,选择或创建一个 Google Cloud 项目。

    转到“项目选择器”

  3. 确保您的 Cloud 项目已启用结算功能。 了解如何确认您的项目是否已启用结算功能

  4. 启用 Cloud Data Fusion, Cloud Storage, BigQuery, and Cloud Dataproc API。

    启用 API

  5. 创建 Cloud Data Fusion 实例
  6. 确保您的 SQL Server 数据库可以接受来自 Cloud Data Fusion 的连接。为了安全地执行此操作,我们建议您创建一个专用 Cloud Data Fusion 实例

使用 Cloud Data Fusion 时,您将同时使用 Cloud Console 和单独的 Cloud Data Fusion 界面。在 Cloud Console 中,您可以创建 Google Cloud 项目,以及创建和删除 Cloud Data Fusion 实例。在 Cloud Data Fusion 界面中,您可以通过各种页面(例如 StudioWrangler)来使用 Cloud Data Fusion 功能。

  1. 在 Cloud Console 中,打开实例页面。

    打开“实例”页面

  2. 在实例的操作列中,点击查看实例链接。

  3. 在 Cloud Data Fusion 界面中,使用左侧导航面板导航到所需的页面。

将 SQL Server 密码存储为安全密钥

将 SQL Server 密码添加为安全密钥,以在 Cloud Data Fusion 实例上加密。在本指南的后面部分,您将确保使用 Cloud KMS 检索密码。

  1. 在任意 Cloud Data Fusion 页面的右上角,点击系统管理员

  2. 点击配置标签页。

  3. 点击进行 HTTP 调用

    配置。

  4. 在下拉菜单中,选择 PUT

  5. 在路径字段中,输入 namespaces/namespace-id/securekeys/password

  6. 正文字段中,输入 {"data":"your_password"}。 将 your_password 替换为您的 SQL Server 密码。

  7. 点击发送

    密码。

确保您收到的响应是状态代码 200

获取适用于 Microsoft SQL Server 的 JDBC 驱动程序

使用 Hub

  1. 在 Cloud Data Fusion 界面的右上角,点击 Hub

  2. 在搜索栏中,输入“Microsoft SQL Server JDBC 驱动程序”(Microsoft SQL Server JDBC Driver)。

  3. 点击Microsoft SQL Server JDBC 驱动程序 (Microsoft SQL Server JDBC Driver)。

  4. 点击 Download。按照所示的下载步骤操作。

  5. 点击部署。上传上一步中的 Jar 文件。

  6. 点击 Finish(完成)。

使用 Studio

  1. 访问 Microsoft.com

  2. 选择下载的内容,然后点击下载

  3. 在 Cloud Data Fusion 界面中,点击菜单并转到 Studio 页面。

  4. 点击 + 按钮。

  5. 驱动程序下,点击上传

  6. 点击以选择位于“jre7”文件夹中的 JAR 文件。

  7. 点击下一步

  8. 输入名称类名称来配置驱动程序。

  9. 点击 Finish(完成)。

部署 Microsoft SQL Server 插件

  1. 在 Cloud Data Fusion 网页界面的右上角,点击 Hub

  2. 在搜索栏中输入“Microsoft SQL Server 插件”(Microsoft SQL Server Plugins)。

  3. 点击 Microsoft SQL Server 插件 (Microsoft SQL Server Plugins)。

  4. 点击部署

  5. 点击 Finish(完成)。

  6. 点击创建流水线 (Create a Pipeline)。

连接到 SQL Server

使用 Wrangler

  1. 在 Cloud Data Fusion 界面中,点击菜单并转到 Wrangler 页面。

  2. 点击左下角的添加连接

  3. 在打开的添加连接窗口中,点击 Microsoft SQL Server。如果您已成功安装驱动程序,在 Microsoft SQL Server 下,您将看到“已安装驱动程序”。

    JAR 文件已上传。

  4. 填写必填的连接字段。在密码字段中,选择您之前存储的安全密钥。 这可确保使用 Cloud KMS 检索您的密码。

    设置密码。

  5. 点击测试连接以确保可以与数据库建立连接。

  6. 点击添加连接

在 SQL Server 数据库连接并且已创建一个从 SQL Server 表读取数据的流水线后,您可以应用转换,并将输出写入接收器。

使用 Studio

  1. 在 Cloud Data Fusion 界面中,点击菜单并转到 Studio 页面。

  2. Studio 中,点击以展开来源菜单。

  3. 点击 SQL Server

    SQL Server。

  4. 将指针悬停在 SQL Server 节点上,然后点击属性

    属性。
  5. 引用名称 (Reference name) 下,提供用于标识 SQL Server 来源的引用名称。

  6. 数据库下,提供要连接到的数据库的名称。

  7. 导入查询 (Import query) 下,提供要运行的查询。例如 SELECT * FROM table WHERE $CONDITIONS

  8. 点击验证

  9. 点击 X 按钮。

在 SQL Server 数据库连接并且已创建一个从 SQL Server 表读取数据的流水线后,您可以应用转换,并将输出写入接收器。

后续步骤