本页面介绍了如何设置数据流水线,以从 Microsoft SQL Server 表中读取数据。
准备工作
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc APIs.
- 创建 Cloud Data Fusion 实例。
- 您的 SQL Server 数据库必须接受来自 Cloud Data Fusion 的连接。出于安全考虑,请使用私有 Cloud Data Fusion 实例。
打开您的 Cloud Data Fusion 实例
在 Google Cloud 控制台中,转到 Cloud Data Fusion 实例页面。
在实例的操作列中,点击查看实例以在 Cloud Data Fusion 中打开该实例。
将 SQL Server 密码存储为安全密钥
将您的 SQL Server 密码作为安全密钥添加到 Cloud Data Fusion 实例中。
在 Cloud Data Fusion 中,点击系统管理员。
点击配置标签页。
点击进行 HTTP 调用。
选择 PUT。
在路径字段中,输入
namespaces/NAMESPACE_ID/securekeys/password
。在正文字段中,输入
{"data":"password"}
。 将 password 替换为您的 SQL Server 密码。点击发送。
响应必须有状态代码 200
才能继续。
获取适用于 SQL Server 的 JDBC 驱动程序
您可以从中心或在 Cloud Data Fusion 的 Pipeline Studio 中获取驱动程序。
Hub
在 Cloud Data Fusion 界面中,点击 Hub。
在搜索栏中,输入
SQL Server JDBC Driver
并选择驱动程序。点击下载。按照所示的下载步骤操作。
点击部署。上传上一步中的 JAR 文件。
点击完成。
Pipeline Studio
前往 Microsoft.com。
选择下载的内容,然后点击下载。
在 Cloud Data Fusion 中,点击 menu 菜单,然后转到 Pipeline Studio 页面。
点击
添加。对于驱动程序,请点击上传。
选择位于
jre7
文件夹中的 JAR 文件。点击下一步。
如需配置驱动程序,请输入 Name 和 Class name。
点击完成。
部署 SQL Server 插件
在 Cloud Data Fusion 中,点击 Hub。
在搜索栏中,输入
SQL Server Plugins
。点击 SQL Server plugins。
点击部署。
点击完成。
点击创建流水线。
连接到 SQL Server
您可以在 Wrangler 或 Pipeline Studio 中从 Cloud Data Fusion 连接到 SQL Server。
Wrangler
在 Cloud Data Fusion 中,点击 menu 菜单并转到 Wrangler 页面。
点击添加连接。
系统会打开添加连接窗口。
点击 SQL Server 以验证是否已安装驱动程序。
在必需的连接字段中输入详细信息。在密码字段中,选择您之前存储的安全密钥。 它可确保使用 Cloud KMS 检索您的密码。
如需检查是否可以与数据库建立连接,请点击测试连接。
点击添加连接。
连接 SQL Server 数据库并创建从 SQL Server 表读取数据的流水线后,您可以应用转换并将输出写入接收器。
Pipeline Studio
打开 Cloud Data Fusion 实例并转到 Pipeline Studio 页面。
展开来源菜单,然后点击 SQL Server。
在 SQL Server 节点上,点击属性。
在引用名称字段中,输入用于标识 SQL Server 来源的名称。
在数据库字段中,输入要连接的数据库的名称。
在导入查询字段中,输入要运行的查询。例如
SELECT * FROM table WHERE $CONDITIONS
。点击验证。
点击“关闭”图标
。
连接 SQL Server 数据库并创建从 SQL Server 表读取数据的流水线后,添加任何所需的转换并将输出写入接收器。
后续步骤
- 了解如何从多个 SQL Server 表读取数据。
- 详细了解 Cloud Data Fusion。
- 按照其中一个教程操作。