複数の Microsoft SQL Server テーブルから読み取る


このページでは、マルチテーブルソースを使用して、Microsoft SQL Server データベースから複数のテーブルを読み取る方法について説明します。パイプラインで複数のテーブルから読み取る場合は、マルチテーブル ソースを使用します。パイプラインを単一のテーブルから読み取る場合は、SQL Server テーブルからの読み取りをご覧ください。

マルチテーブル ソースは、複数のスキーマを使用してデータを出力し、データの取得元のテーブルを示すテーブル名フィールドを含みます。マルチテーブル ソースを使用する場合は、マルチテーブル シンクBigQuery マルチテーブルGCS マルチファイルのいずれかを使用します。

始める前に

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.

    Enable the APIs

  7. Cloud Data Fusion インスタンスを作成します
  8. SQL Server データベースが Cloud Data Fusion からの接続を受け入れられることを確認します。安全に接続するためには、プライベート Cloud Data Fusion インスタンスを作成することをおすすめします。

Cloud Data Fusion インスタンスを表示する

Cloud Data Fusion を使用する際は、Google Cloud コンソールと個別の Cloud Data Fusion UI の両方を使用します。Google Cloud コンソールでは、Google Cloud プロジェクトの作成、Cloud Data Fusion インスタンスの作成と削除を行うことができます。Cloud Data Fusion UI では、StudioWrangler などのさまざまなページを使用して Cloud Data Fusion の機能を使用できます。

  1. Google Cloud コンソールで、Cloud Data Fusion のページに移動します。

  2. Cloud Data Fusion ウェブ インターフェースでインスタンスを開くには、[Instances] をクリックしてから、[View instance] をクリックします。

    [インスタンス] に移動

SQL Server のパスワードをセキュリティ キーとして保存する

SQL Server のパスワードを Cloud Data Fusion インスタンスでの暗号化に使用するセキュリティ キーとして追加します。このガイドの後の部分で、Cloud KMS を使用してパスワードを取得されるようにします。

  1. Cloud Data Fusion ページの右上隅にある [SYSTEM ADMIN] をクリックします。

  2. [Configuration] タブをクリックします。

  3. [Make HTTP Calls] をクリックします。

    [Configuration] タブ。

  4. プルダウン メニューで [PUT] を選択します。

  5. [Path] フィールドに「namespaces/NAMESPACE_ID/securekeys/PASSWORD」と入力します。

  6. [Body] フィールドに「{"data":"SQL_SERVER_PASSWORD"}」と入力します。

  7. [送信] をクリックします。

    パスワード。

レスポンスとしてステータス コード「200」が返されることを確認します。

SQL Server の JDBC ドライバを取得する

Hub の使用

  1. Cloud Data Fusion UI で [Hub] をクリックします。

  2. 検索バーに「Microsoft SQL Server JDBC Driver」と入力します。

  3. [Microsoft SQL Server JDBC Driver] をクリックします。

  4. [ダウンロード] をクリックします。表示されたダウンロード手順に沿って操作します。

  5. [Deploy] をクリックします。前の手順で作成した Jar ファイルをアップロードします。

  6. [完了] をクリックします。

Studio の使用

  1. Microsoft.com にアクセスします。

  2. ダウンロードするファイルを選択して、[ダウンロード] をクリックします。

  3. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  4. [追加] をクリックします。

  5. [ドライバ] で [アップロード] をクリックします。

  6. 手順 2 でダウンロードした JAR ファイルをアップロードします。

  7. [Next(次へ)] をクリックします。

  8. 名前を入力してドライバを構成します。

  9. [Class Name] フィールドに「com.microsoft.sqlserver.jdbc.SQLServerDriver」と入力します。

  10. [完了] をクリックします。

Multiple Table Plugins をデプロイする

  1. Cloud Data Fusion ウェブ UI で [HUB] をクリックします。

  2. 検索バーに「Multiple table plugins」と入力します。

  3. [Multiple Table Plugins] をクリックします。

    パスワード。
  4. [デプロイ] をクリックします。

  5. [Finish] をクリックします。

  6. [Create a Pipeline] をクリックします。

SQL Server に接続する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. スタジオ]で、[ソース] メニューを展開します。

  3. [Multiple Database Tables] をクリックします。

    複数のテーブル。
  4. [Multiple Database Tables] ノードの上にポインタを置き、[プロパティ] をクリックします。

    プロパティ
  5. [参照名] フィールドに、SQL Server ソースの識別に使用する参照名を指定します。

  6. [JDBC Connection String] フィールドに JDBC 接続文字列を入力します。例: jdbc:sqlserver://mydbhost:1433詳細については、接続 URL の作成をご覧ください。

  7. JDBC プラグイン名データベース ユーザー名データベース ユーザー パスワードを入力します。

  8. [検証] をクリックします。

  9. [閉じる] をクリックします。

BigQuery または Cloud Storage に接続する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [シンク] を展開します。

  3. [BigQuery マルチテーブル] または [GCS マルチファイル] をクリックします。

  4. [Multiple Database Tables] ノードを [BigQuery Multi Table] または [GCS Multi File] に接続します。

    シンクに接続します。
  5. [BigQuery Multi Table] または [GCS Multi File] ノードの上にポインタを置き、[プロパティ] をクリックしてシンクを構成します。

    詳細については、Google BigQuery のマルチテーブル シンクGoogle Cloud Storage のマルチファイル シンクをご覧ください。

  6. [検証] をクリックします。

  7. [閉じる] をクリックします。

パイプラインのプレビューを実行する

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [プレビュー] をクリックします。

  3. [実行] をクリックします。プレビューが正常に終了するまで待ちます。

パイプラインをデプロイする

  1. Cloud Data Fusion UI で、 メニューをクリックし、[Studio] ページに移動します。

  2. [デプロイ] をクリックします。

パイプラインを実行する

  1. Cloud Data Fusion UI で [メニュー] をクリックします。

  2. [リスト] をクリックします。

  3. パイプラインをクリックします。

  4. パイプラインの詳細ページで、[実行] をクリックします。

次のステップ