このページでは、マルチテーブルのソースを使用して、Microsoft SQL Server データベースから複数のテーブルを読み取る方法について説明します。パイプラインで複数のテーブルから読み取る場合は、マルチテーブル ソースを使用します。パイプラインを単一のテーブルから読み取る場合は、SQL Server テーブルからの読み取りをご覧ください。
マルチテーブル ソースは、複数のスキーマを使用してデータを出力し、データの取得元のテーブルを示すテーブル名フィールドを含みます。マルチテーブル ソースを使用する場合は、マルチテーブル シンク、BigQuery マルチテーブル、GCS マルチファイルのいずれかを使用します。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.
- Cloud Data Fusion インスタンスを作成します。
- SQL Server データベースが Cloud Data Fusion からの接続を受け入れられることを確認します。安全に接続するためには、プライベート Cloud Data Fusion インスタンスを作成することをおすすめします。
Cloud Data Fusion インスタンスを表示する
Cloud Data Fusion を使用する際は、Google Cloud コンソールと個別の Cloud Data Fusion UI の両方を使用します。Google Cloud コンソールでは、Google Cloud プロジェクトの作成、Cloud Data Fusion インスタンスの作成と削除を行うことができます。Cloud Data Fusion UI では、Studio や Wrangler などのさまざまなページを使用して Cloud Data Fusion の機能を使用できます。
Google Cloud コンソールで、Cloud Data Fusion のページに移動します。
Cloud Data Fusion ウェブ インターフェースでインスタンスを開くには、[Instances] をクリックしてから、[View instance] をクリックします。
SQL Server のパスワードをセキュリティ キーとして保存する
SQL Server のパスワードを Cloud Data Fusion インスタンスでの暗号化に使用するセキュリティ キーとして追加します。このガイドの後の部分で、Cloud KMS を使用してパスワードを取得されるようにします。
Cloud Data Fusion ページの右上隅にある [SYSTEM ADMIN] をクリックします。
[Configuration] タブをクリックします。
[Make HTTP Calls] をクリックします。
プルダウン メニューで [PUT] を選択します。
[Path] フィールドに「
namespaces/NAMESPACE_ID/securekeys/PASSWORD
」と入力します。[Body] フィールドに「
{"data":"SQL_SERVER_PASSWORD"}
」と入力します。[送信] をクリックします。
レスポンスとしてステータス コード「200
」が返されることを確認します。
SQL Server の JDBC ドライバを取得する
Hub の使用
Cloud Data Fusion UI で [Hub] をクリックします。
検索バーに「
Microsoft SQL Server JDBC Driver
」と入力します。[Microsoft SQL Server JDBC Driver] をクリックします。
[ダウンロード] をクリックします。表示されたダウンロード手順に沿って操作します。
[Deploy] をクリックします。前の手順で作成した Jar ファイルをアップロードします。
[完了] をクリックします。
Studio の使用
Microsoft.com にアクセスします。
ダウンロードするファイルを選択して、[ダウンロード] をクリックします。
Cloud Data Fusion UI で、
メニューをクリックし、[Studio] ページに移動します。[
追加] をクリックします。[ドライバ] で [アップロード] をクリックします。
手順 2 でダウンロードした JAR ファイルをアップロードします。
[Next(次へ)] をクリックします。
名前を入力してドライバを構成します。
[Class Name] フィールドに「
com.microsoft.sqlserver.jdbc.SQLServerDriver
」と入力します。[完了] をクリックします。
Multiple Table Plugins をデプロイする
Cloud Data Fusion ウェブ UI で [HUB] をクリックします。
検索バーに「
Multiple table plugins
」と入力します。[Multiple Table Plugins] をクリックします。
[デプロイ] をクリックします。
[Finish] をクリックします。
[Create a Pipeline] をクリックします。
SQL Server に接続する
Cloud Data Fusion UI で、
メニューをクリックし、[Studio] ページに移動します。「スタジオ]で、[ソース] メニューを展開します。
[Multiple Database Tables] をクリックします。
[Multiple Database Tables] ノードの上にポインタを置き、[プロパティ] をクリックします。
[参照名] フィールドに、SQL Server ソースの識別に使用する参照名を指定します。
[JDBC Connection String] フィールドに JDBC 接続文字列を入力します。例:
jdbc:sqlserver://mydbhost:1433
詳細については、接続 URL の作成をご覧ください。JDBC プラグイン名、データベース ユーザー名、データベース ユーザー パスワードを入力します。
[検証] をクリックします。
[閉じる] をクリックします。
BigQuery または Cloud Storage に接続する
Cloud Data Fusion UI で、
メニューをクリックし、[Studio] ページに移動します。[シンク] を展開します。
[BigQuery マルチテーブル] または [GCS マルチファイル] をクリックします。
[Multiple Database Tables] ノードを [BigQuery Multi Table] または [GCS Multi File] に接続します。
[BigQuery Multi Table] または [GCS Multi File] ノードの上にポインタを置き、[プロパティ] をクリックしてシンクを構成します。
詳細については、Google BigQuery のマルチテーブル シンクと Google Cloud Storage のマルチファイル シンクをご覧ください。
[検証] をクリックします。
[閉じる] をクリックします。
パイプラインのプレビューを実行する
Cloud Data Fusion UI で、
メニューをクリックし、[Studio] ページに移動します。[プレビュー] をクリックします。
[実行] をクリックします。プレビューが正常に終了するまで待ちます。
パイプラインをデプロイする
Cloud Data Fusion UI で、
メニューをクリックし、[Studio] ページに移動します。[デプロイ] をクリックします。
パイプラインを実行する
Cloud Data Fusion UI で
[メニュー] をクリックします。[リスト] をクリックします。
パイプラインをクリックします。
パイプラインの詳細ページで、[実行] をクリックします。
次のステップ
- Cloud Data Fusion について学ぶ。
- チュートリアルのいずれかに取り組む。