バッチ SQL トランスレータを使用してコードを移行する

このドキュメントでは、BigQuery のバッチ SQL トランスレータを使用して、他の SQL 言語で作成されたスクリプトを GoogleSQL のクエリに変換する方法について説明します。このドキュメントは、Google Cloud コンソールに慣れている方を対象としています。

始める前に

変換ジョブを送信する前に、次の手順を行います。

必要な権限がすべて付与されていることを確認します。
BigQuery Migration API を有効にします。
変換対象の SQL スクリプトとクエリが含まれるソースファイルを収集します。
省略可。変換の精度を改善するために、メタデータファイルを作成します。
省略可。ソースファイル内の SQL オブジェクト名を BigQuery の新しい名前にマッピングする必要があるかどうかを判断します。必要に応じて、使用する名前マッピングルールを決定します。
変換ジョブの送信方法を決定します。
ソースファイルを Cloud Storage にアップロードします。

必要な権限

BigQuery Migration Service を有効にするには、プロジェクトに対する次の権限が必要です。

resourcemanager.projects.get
serviceusage.services.enable
serviceusage.services.get

BigQuery Migration Service にアクセスして使用するには、プロジェクトに関する次の権限が必要です。

bigquerymigration.workflows.create
bigquerymigration.workflows.get
bigquerymigration.workflows.list
bigquerymigration.workflows.delete
bigquerymigration.subtasks.get
bigquerymigration.subtasks.list

または、次のロールを使用して同じ権限を取得することもできます。
- bigquerymigration.viewer - 読み取り専用アクセス。
- bigquerymigration.editor - 読み取り / 書き込みアクセス。

入出力ファイル用の Cloud Storage バケットにアクセスするには:

ソース Cloud Storage バケットに対する storage.objects.get。
ソース Cloud Storage バケットに対する storage.objects.list。
転送先の Cloud Storage バケットに対する storage.objects.create。

次のロールには、上記の必要な Cloud Storage の権限がすべて含まれています。

roles/storage.objectAdmin
roles/storage.admin

BigQuery Migration API を有効にする

2022 年 2 月 15 日より前に Google Cloud CLI プロジェクトを作成した場合、次のように BigQuery Migration API を有効にします。

Google Cloud コンソールで、BigQuery Migration API のページに移動します。

BigQuery Migration API に移動
[有効にする] をクリックします。

ソースファイルを収集する

ソースファイルは、ソース言語の有効な SQL を含むテキストファイルである必要があります。ソースファイルにはコメントを含めることもできます。利用可能な方法で、SQL が有効であることを確認してください。

メタデータファイルを作成する

サービスでより正確な変換結果を生成できるように、メタデータファイルを指定することをおすすめします。ただし、これは必須ではありません。

dwh-migration-dumper コマンドライン抽出ツールを使用して、メタデータ情報を生成できます。または、独自のメタデータファイルを指定できます。メタデータファイルが準備できたら、ソースファイルとともに変換ソースフォルダに追加できます。トランスレータはメタデータファイルを自動的に検出し、それを利用してソースファイルを変換します。このために特別な設定は必要ありません。

dwh-migration-dumper ツールを使用してメタデータ情報を生成するには、変換用のメタデータを生成するをご覧ください。

独自のメタデータを提供するには、移行元システムの SQL オブジェクトのデータ定義言語（DDL）ステートメントを、個別のテキストファイルに収集します。

変換ジョブの送信方法を決定する

バッチ変換ジョブを送信するには、次の 3 つの方法があります。

バッチ変換クライアント: 構成ファイル内の設定を変更してジョブを構成し、コマンドラインを使用してジョブを送信します。この方法を使用する場合は、ソースファイルを Cloud Storage に手動でアップロードする必要はありません。クライアントは、変換ジョブの処理中は引き続き Cloud Storage を使用してファイルを保存します。

従来のバッチ変換クライアントはオープンソースの Python クライアントであり、ローカルマシンにあるソースファイルを変換し、変換されたファイルをローカルディレクトリに出力できます。このクライアントを基本的な用途のために構成するには、構成ファイルのいくつかの設定を変更します。必要であれば、マクロの置換や、変換入出力の前処理や後処理などの複雑なタスクに対応するようにクライアントを構成することもできます。詳細については、バッチ変換クライアントの readme をご覧ください。
Google Cloud コンソール: ユーザーインターフェースを使用してジョブの構成と送信を行います。この方法を使用する場合は、ソースファイルを Cloud Storage にアップロードする必要があります。

YAML 構成ファイルを作成する

必要に応じて、構成 YAML ファイルを作成して使用し、一括変換をカスタマイズできます。これらのファイルは、変換出力をさまざまな方法で変換するために使用できます。たとえば、変換中に SQL オブジェクトの大文字 / 小文字を変更する構成 YAML ファイルを作成できます。

バッチ変換ジョブに Google Cloud コンソールまたは BigQuery Migration API を使用する場合は、ソースファイルを含む Cloud Storage バケットに構成 YAML ファイルをアップロードできます。

一括変換クライアントを使用する場合は、構成 YAML ファイルをローカル変換入力フォルダに配置します。

入力ファイルを Cloud Storage にアップロードする

Google Cloud コンソールまたは BigQuery Migration API を使用して変換ジョブを実行する場合は、変換するクエリとスクリプトを含むソースファイルを Cloud Storage にアップロードする必要があります。任意のメタデータファイルまたは構成 YAML ファイルを、ソースファイルが含まれている同じ Cloud Storage バケットおよびディレクトリにアップロードすることもできます。バケットの作成と Cloud Storage へのファイルのアップロードの詳細については、バケットの作成とファイルシステムからオブジェクトをアップロードするをご覧ください。

サポートされている SQL 言語

バッチ SQL トランスレータは、BigQuery Migration Service の一部です。バッチ SQL トランスレータでは、次の SQL 言語を GoogleSQL に変換できます。

Amazon Redshift SQL
Apache HiveQL と Beeline CLI
IBM Netezza SQL と NZPLSQL
Teradata と Teradata Vantage
- SQL
- 基本的な Teradata Query（BTEQ）
- Teradata Parallel Transport（TPT）

さらに、プレビューでは次の SQL 言語の変換がサポートされています。

Apache Spark SQL
Azure Synapse T-SQL
Greenplum SQL
IBM DB2 SQL
MySQL SQL
Oracle SQL、PL/SQL、Exadata
PostgreSQL SQL
Trino または PrestoSQL
Snowflake SQL
SQL Server T-SQL
SQLite
Vertica SQL

ヘルパー UDF を使用してサポートされていない SQL 関数を処理する

ソース言語から BigQuery に SQL を変換する場合、一部の関数には直接対応するものがないことがあります。この問題に対処するために、BigQuery Migration Service（およびより広い BigQuery コミュニティ）では、サポートされていない元のソース言語の関数の動作を再現する補助的なユーザー定義関数（UDF）を提供しています。

これらの UDF は bqutil 一般公開データセットに存在することが多く、変換されたクエリは最初に bqutil.<dataset>.<function>() 形式を使用して参照できます。例: bqutil.fn.cw_count()

本番環境に関する重要な考慮事項:

bqutil は、初期の変換とテストにこれらのヘルパー UDF への便利なアクセスを提供しますが、本番環境のワークロードで bqutil に直接依存することは、いくつかの理由から推奨されません。

バージョン管理: bqutil プロジェクトにはこれらの UDF の最新バージョンがホストされているため、定義は時間の経過とともに変化する可能性があります。bqutil に直接依存すると、UDF のロジックが更新された場合に、本番環境のクエリで予期しない動作や破壊的変更が発生する可能性があります。
依存関係の分離: UDF を独自のプロジェクトにデプロイすると、本番環境が外部の変更から分離されます。
カスタマイズ: 特定のビジネスロジックやパフォーマンス要件に合わせて、これらの UDF を変更または最適化する必要が生じる場合があります。これは、ユーザーが自分のプロジェクト内にいる場合にのみ可能です。
セキュリティとガバナンス: 組織のセキュリティポリシーにより、本番環境のデータ処理で bqutil などの一般公開データセットへの直接アクセスが制限されることがあります。UDF を制御された環境にコピーすることは、このようなポリシーに沿ったものです。

ヘルパー UDF をプロジェクトにデプロイする:

信頼性が高く安定した本番環境で使用するには、これらのヘルパー UDF を独自のプロジェクトとデータセットにデプロイする必要があります。これにより、バージョン、カスタマイズ、アクセスを完全に制御できます。これらの UDF をデプロイする手順については、GitHub の UDF デプロイガイドをご覧ください。このガイドでは、UDF を環境にコピーするために必要なスクリプトと手順について説明します。

ロケーション

バッチ SQL トランスレータは、処理を行う次のロケーションで使用できます。

	リージョンの説明	リージョン名	詳細
アジア太平洋
	デリー	`asia-south2`
	香港	`asia-east2`
	ジャカルタ	`asia-southeast2`
	メルボルン	`australia-southeast2`
	ムンバイ	`asia-south1`
	大阪	`asia-northeast2`
	ソウル	`asia-northeast3`
	シンガポール	`asia-southeast1`
	シドニー	`australia-southeast1`
	台湾	`asia-east1`
	東京	`asia-northeast1`
ヨーロッパ
	ベルギー	`europe-west1`	低 CO₂
	ベルリン	`europe-west10`	低 CO₂
	EU（マルチリージョン）	`eu`
	フィンランド	`europe-north1`	低 CO₂
	フランクフルト	`europe-west3`
	ロンドン	`europe-west2`	低 CO₂
	マドリード	`europe-southwest1`	低 CO₂
	ミラノ	`europe-west8`
	オランダ	`europe-west4`	低 CO₂
	パリ	`europe-west9`	低 CO₂
	ストックホルム	`europe-north2`	低 CO₂
	トリノ	`europe-west12`
	ワルシャワ	`europe-central2`
	チューリッヒ	`europe-west6`	低 CO₂
南北アメリカ
	コロンバス（オハイオ州）	`us-east5`
	ダラス	`us-south1`	低 CO₂
	アイオワ	`us-central1`	低 CO₂
	ラスベガス	`us-west4`
	ロサンゼルス	`us-west2`
	メキシコ	`northamerica-south1`
	バージニア州北部	`us-east4`
	オレゴン	`us-west1`	低 CO₂
	ケベック	`northamerica-northeast1`	低 CO₂
	サンパウロ	`southamerica-east1`	低 CO₂
	ソルトレイクシティ	`us-west3`
	サンティアゴ	`southamerica-west1`	低 CO₂
	サウスカロライナ州	`us-east1`
	トロント	`northamerica-northeast2`	低 CO₂
	米国（マルチリージョン）	`us`
アフリカ
	ヨハネスブルグ	`africa-south1`
中東
	ダンマーム	`me-central2`
	ドーハ	`me-central1`
	イスラエル	`me-west1`

変換ジョブを送信する

変換ジョブを開始して進行状況を表示し、結果を確認する手順は次のとおりです。

コンソール

以下の手順は、ソースファイルが Cloud Storage バケットにすでにアップロードされていることを前提としています。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで、[ツールとガイド] をクリックします。
[SQL の変換] パネルで、[変換] > [バッチ変換] をクリックします。
変換の構成ページが開きます。次の詳細情報を入力します。
1. [表示名] に、変換ジョブの名前を入力します。名前には文字、数字、アンダースコアを使用できます。
2. [処理を行うロケーション] で、変換ジョブを実行するロケーションを選択します。たとえば、ヨーロッパにあり、データがロケーションの境界を越えることを望まない場合は、eu リージョンを選択します。変換ジョブは、ソースファイルバケットと同じロケーションを選択すると最も効率的に処理されます。
3. [ソース言語] で、変換する SQL 言語を選択します。
4. [ターゲット言語] で、[BigQuery] を選択します。
[次へ] をクリックします。
[ソースのロケーション] には、変換するファイルを含む Cloud Storage フォルダへのパスを指定します。パスを bucket_name/folder_name/ の形式で入力するか、[参照] オプションを使用します。
[次へ] をクリックします。
[ターゲットロケーション] には、変換されたファイルの宛先 Cloud Storage フォルダへのパスを指定します。パスを bucket_name/folder_name/ の形式で入力するか、[参照] オプションを使用します。
デフォルトのオブジェクト名や、ソースからターゲットへの名前マッピングを指定する必要がない変換を行う場合は、ステップ 11 に進みます。それ以外の場合は、[次へ] をクリックします。
必要なオプション設定を入力します。
1. 省略可。[デフォルトのデータベース] に、ソースファイルで使用するデフォルトのデータベース名を入力します。トランスレータはデータベース名がない SQL オブジェクトの完全修飾名を解決するときに、このデフォルトのデータベース名を使用します。
2. 省略可。[メタデータのキャッシュ保存] で [メタデータのキャッシュ保存を有効にする] チェックボックスをオンにして、dwh-migration-dumper ツールによって生成されたメタデータ ZIP ファイルの情報を BigQuery バックエンドに保存します。大きなメタデータファイルがあるジョブでは、このプロセスにより、後続のリクエストの変換レイテンシが大幅に短縮されます。キャッシュに保存されたメタデータは、最長で 7 日間有効です。この機能はプレビュー版です。この機能に関するサポートのリクエストやフィードバックを行う場合は、bq-edw-migration-support@google.com にお問い合わせください。
3. 省略可。[スキーマの検索パス] には、スキーマ名がないソースファイルの SQL オブジェクトの完全修飾名をトランスレータが解決する必要がある場合に、検索するスキーマを指定します。ソースファイルで複数の異なるスキーマ名が使用されている場合は、[スキーマ名を追加] をクリックして、参照される各スキーマ名の値を追加します。
  
  トランスレータは指定されたメタデータファイル内を検索し、そのスキーマ名でテーブルを検証します。メタデータから明確なオプションを特定できない場合は、最初に入力したスキーマ名がデフォルトとして使用されます。デフォルトのスキーマ名の使用方法について詳しくは、デフォルトのスキーマをご覧ください。
4. 省略可。名前マッピングルールを指定して、変換中にソースシステムと BigQuery 間で SQL オブジェクトの名前を変更する場合は、名前マッピングのペアが設定された JSON ファイルを指定するか、Google Cloud コンソールを使用してマッピングする値を指定します。
  
  JSON ファイルを使用するには:
  1. [名前マッピング用の JSON ファイルのアップロード] をクリックします。
  2. 適切な形式の名前マッピングファイルの場所を参照して選択し、[開く] をクリックします。
    
    ファイルサイズは 5 MB 未満である必要があります。
  Google Cloud コンソールを使用するには:
  1. [名前のマッピングペアを追加] をクリックします。
  2. ソースオブジェクト名の適切な部分を、[ソース] 列の [データベース]、[スキーマ]、[リレーション]、[属性] フィールドに追加します。
  3. BigQuery のターゲットオブジェクト名の部分を [ターゲット] 列のフィールドに追加します。
  4. [Type] で、マッピングするオブジェクトを表すオブジェクトタイプを選択します。
  5. 必要な名前マッピングペアをすべて指定するまで、ステップ 1～4 を繰り返します。 Google Cloud コンソールを使用する際は、名前マッピングペアは 25 個までしか指定できません。
5. 省略可。Gemini モデルを使用して AI による変換の提案を生成する場合は、[Gemini AI の提案] チェックボックスをオンにします。提案は Cloud Storage ディレクトリにある .ai_config.yaml で終わる構成 YAML ファイルに基づきます。候補の出力の各タイプは、出力フォルダ内の独自のサブディレクトリに保存されます。命名パターンは REWRITETARGETSUGGESTION_TYPE_suggestion です。たとえば、Gemini 拡張ターゲット SQL カスタマイズの候補は target_sql_query_customization_suggestion に保存され、Gemini によって生成された変換の説明は translation_explanation_suggestion に保存されます。AI の候補の YAML 構成ファイルを作成する方法については、Gemini ベースの構成 YAML ファイルを作成するをご覧ください。
[作成] をクリックして変換ジョブを開始します。

変換ジョブが作成されると、ジョブのステータスを変換ジョブのリストで確認できます。

バッチ変換クライアント

バッチ変換クライアントと Google Cloud CLI をインストールします。
gcloud CLI 認証情報ファイルを生成します。
バッチ変換クライアントのインストールディレクトリで、任意のテキストエディタを使用して config.yaml ファイルを開き、次の設定を変更します。
- project_number: 一括変換ジョブに使用するプロジェクトのプロジェクト番号を入力します。これは、プロジェクトの Google Cloud コンソールの [ようこそ] ページの [プロジェクト情報] ペインで確認できます。
- gcs_bucket: 変換ジョブの処理中にファイルを保存するためにバッチ変換クライアントが使用する Cloud Storage バケットの名前を入力します。
- input_directory: ソースファイルとメタデータファイルを含むディレクトリの絶対パスまたは相対パスを入力します。
- output_directory: 変換されたファイルのターゲットディレクトリの絶対パスまたは相対パスを入力します。
変更を保存し、config.yaml ファイルを閉じます。
ソースファイルとメタデータファイルを入力ディレクトリに配置します。
次のコマンドを使用して、バッチ変換クライアントを実行します。
```
bin/dwh-migration-client
```
変換ジョブが作成されたら、ジョブのステータスを Google Cloud コンソールの変換ジョブリストで確認できます。
省略可。ストレージ費用の発生を回避するには、変換ジョブが完了したら、指定した Cloud Storage バケットでジョブによって作成されたファイルを削除します。

変換出力を確認する

変換ジョブの実行後、 Google Cloud コンソールでジョブに関する情報を確認できます。 Google Cloud コンソールを使用してジョブを実行すると、指定した宛先 Cloud Storage バケットでジョブの結果を確認できます。一括変換クライアントを使用してジョブを実行すると、指定した出力ディレクトリでジョブの結果を確認できます。バッチ SQL トランスレータは、指定された宛先に次のファイルを出力します。

変換されたファイル。
CSV 形式の変換概要レポート。
使用された出力名マッピング（JSON 形式）。
AI 提案ファイル。

Google Cloud コンソールの出力

変換ジョブの詳細を表示する手順は次のとおりです。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで、変換の詳細を表示するジョブを見つけ、変換ジョブ名をクリックします。ジョブの全体的な品質、入力コード行数（空白行とコメントを除く）、変換プロセス中に発生した問題のリストを示すサンキービジュアリゼーションが表示されます。修正は左から右の順に進めていく必要があります。初期段階の問題は、その後の段階でさらに問題を引き起こす可能性があります。
エラーまたは警告のバーにポインタを合わせて提案を確認し、変換ジョブをデバッグする次のステップを決めます。
[ログのサマリー] タブを選択すると、問題のカテゴリ、推奨されるアクション、各問題の発生頻度など、変換に関する問題のサマリーが表示されます。サンキービジュアリゼーションのバーをクリックして問題をフィルタできます。問題のカテゴリを選択して、その問題のカテゴリに関連付けられたログメッセージを表示することもできます。
[ログメッセージ] タブを選択すると、問題のカテゴリ、具体的な問題のメッセージ、問題が発生したファイルへのリンクなど、変換に関する各問題の詳細が表示されます。サンキービジュアリゼーションのバーをクリックすると問題をフィルタできます。[ログメッセージ] タブで問題を選択すると、該当する場合に入力および出力ファイルを表示する [コードタブ] が開きます。
[ジョブの詳細] タブをクリックして、変換ジョブの構成の詳細を確認します。

概要レポート

概要レポートは、変換ジョブで発生したすべての警告メッセージとエラーメッセージのテーブルが含まれる CSV ファイルです。

Google Cloud コンソールで概要ファイルを表示するには、次の操作を行います。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで目的のジョブを見つけ、ジョブ名をクリックするか、[その他のオプション] > [詳細を表示] をクリックします。
[ジョブの詳細] タブの [変換レポート] セクションで [translation_report.csv] をクリックします。
[オブジェクトの詳細] ページで、[認証済み URL] 行の値をクリックして、ブラウザにファイルを表示します。

次の表に、概要ファイルの列を示します。

列	説明
Timestamp	問題が発生した時点のタイムスタンプ。
FilePath	問題が関連付けられているソースファイルへのパス。
FileName	問題が関連付けられているソースファイルの名前。
ScriptLine	問題が発生した行番号。
ScriptColumn	問題が発生した列番号。
TranspilerComponent	警告またはエラーが発生した変換エンジンの内部コンポーネント。この列は空の場合があります。
Environment	警告またはエラーに関連する変換言語環境。この列は空の場合があります。
ObjectName	警告またはエラーに関連付けられているソースファイル内の SQL オブジェクト。この列は空の場合があります。
Severity	問題の重大度（警告またはエラー）。
Category	変換に関する問題のカテゴリ。
SourceType	この問題の原因。この列の値は、入力 SQL ファイルの問題を示す `SQL` か、メタデータパッケージの問題を示す `METADATA` のいずれかです。
Message	変換に関する問題の警告またはエラーメッセージ。
ScriptContext	問題に関連付けられているソースファイルの SQL スニペット。
Action	この問題を解決するために推奨されるアクション。

コードタブ

コードタブでは、特定の変換ジョブの入力ファイルと出力ファイルに関する詳細情報を確認できます。コードタブでは、変換ジョブで使用されているファイルを調べ、入力ファイルとその変換を並べて比較して誤りがないか確認し、ジョブ内の特定のファイルのログサマリーとメッセージを表示できます。

コードタブにアクセスする手順は次のとおりです。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで目的のジョブを見つけ、ジョブ名をクリックするか、[その他のオプション] > [詳細を表示] をクリックします。
[コードタブ] を選択します。[コード] タブは、次のパネルで構成されています。
- ファイルエクスプローラ: 変換に使用されるすべての SQL ファイルが含まれています。ファイルをクリックすると、その変換の入力と出力、変換の問題が表示されます。
- Gemini 拡張入力: 変換エンジンによって変換された入力 SQL。Gemini の構成でソース SQL の Gemini カスタマイズルールを指定している場合、トランスレータはまず元の入力を変換し、次に Gemini 拡張入力を変換します。元の入力を表示するには、[元の入力を表示] をクリックします。
- 変換出力: 変換結果。Gemini の構成でターゲット SQL の Gemini カスタマイズルールを指定している場合、変換は Gemini 拡張出力として変換結果に適用されます。Gemini で強化された出力が利用可能な場合は、[Gemini の提案] ボタンをクリックして、Gemini で強化された出力を確認できます。
省略可: 入力ファイルとその出力ファイルを BigQuery のインタラクティブ SQL トランスレータで表示するには、[編集] をクリックします。ファイルを編集して、出力ファイルを Cloud Storage に保存できます。

構成タブ

[構成] タブで、構成 YAML ファイルの追加、名前変更、表示、編集を行うことができます。スキーマエクスプローラには、サポートされている構成タイプの構成 YAML ファイルの作成に役立つドキュメントが表示されます。構成 YAML ファイルを編集した後は、ジョブを再実行して新しい構成を使用できます。

[構成] タブにアクセスする手順は次のとおりです。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで目的のジョブを見つけ、ジョブ名をクリックするか、[その他のオプション] > [詳細を表示] をクリックします。
[変換の詳細] ウィンドウで [構成] タブをクリックします。

SQL 変換ページの [構成] タブを表示します。

新しい構成ファイルを追加するには:

more_vert（その他のオプション）> [Yaml 構成ファイルを作成] をクリックします。
新しい YAML 構成ファイルのタイプ、場所、名前を選択できるパネルが表示されます。
[作成] をクリックします。

既存の構成ファイルを編集するには:

YAML 構成ファイルをクリックします。
ファイルを編集して、[保存] をクリックします。
[再実行] をクリックして、編集した YAML 構成ファイルを使用する新しい変換ジョブを実行します。

既存の構成ファイルの名前を変更するには、more_vert（その他のオプション） > [名前を変更] をクリックします。

使用された出力名マッピングファイル

この JSON ファイルには、変換ジョブで使用された出力名マッピングルールが含まれています。このファイルのルールは、変換ジョブに指定した出力名マッピングルールとは異なる場合があります。これは、名前マッピングルールで競合しているか、変換中に識別された SQL オブジェクトの名前マッピングルールが欠落しているためです。このファイルを確認して、名前マッピングルールを修正する必要があるかどうかを判断します。修正する必要がある場合は、特定した問題に対処する新しい出力名マッピングルールを作成し、新しい変換ジョブを実行します。

変換されたファイル

入力ファイルごとに、対応する出力ファイルが宛先パスに生成されます。出力ファイルには、変換されたクエリが含まれます。

インタラクティブ SQL トランスレータを使用してバッチ変換された一括 SQL クエリをデバッグする

BigQuery のインタラクティブ SQL トランスレータを使用すると、ソースデータベースと同じメタデータまたはオブジェクトマッピング情報を使用して SQL クエリを確認またはデバッグできます。バッチ変換ジョブが完了すると、BigQuery は、クエリに該当するジョブのメタデータ、オブジェクトマッピング、スキーマの検索パスに関する情報を含む変換構成 ID を生成します。バッチ変換の構成 ID とインタラクティブ SQL トランスレータを使用して、指定した構成で SQL クエリを実行します。

一括変換構成 ID を使用してインタラクティブ SQL 変換を開始する手順は、次のとおりです。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで目的のジョブを見つけて、（その他のオプション）> [インタラクティブ変換を開きます] をクリックします。

BigQuery のインタラクティブ SQL トランスレータが開き、対応する一括変換の構成 ID が表示されます。インタラクティブ変換の変換構成 ID を表示するには、インタラクティブ SQL トランスレータで [その他] > [変換設定] をクリックします。

インタラクティブ SQL トランスレータでバッチ変換ファイルをデバッグする手順は次のとおりです。

Google Cloud コンソールで、[BigQuery] ページに移動します。

[BigQuery] に移動
ナビゲーションメニューで [SQL 変換] をクリックします。
変換ジョブのリストで目的のジョブを見つけ、ジョブ名をクリックするか、[その他のオプション] > [詳細を表示] をクリックします。
[変換の詳細] ウィンドウで [コード] タブをクリックします。
ファイルエクスプローラでファイル名をクリックしてファイルを開きます。
出力ファイル名の横にある [編集] をクリックして、インタラクティブ SQL トランスレータでファイルを開きます（プレビュー）。

インタラクティブ SQL トランスレータに入力ファイルと出力ファイルが入力され、対応するバッチ変換構成 ID が使用されます。
編集した出力ファイルを Cloud Storage に保存するには、インタラクティブ SQL トランスレータで [保存] > [GCS に保存] をクリックします。

制限事項

トランスレータは SQL 以外の言語のユーザー定義関数（UDF）を変換できません。これは、SQL 以外の言語を解析して入力データ型と出力データ型を判断することができないためです。このため、このような UDF を参照する SQL ステートメントの変換は不正確になります。変換時に SQL 以外の UDF が適切に参照されるようにするには、有効な SQL を使用して同じ署名を持つプレースホルダ UDF を作成します。

たとえば、2 つの整数の合計を計算する C で記述された UDF があるとします。この UDF を参照する SQL ステートメントが正しく変換されるようにするには、次の例に示すように、C UDF と同じシグネチャを共有するプレースホルダ SQL UDF を作成します。

CREATE FUNCTION Test.MySum (a INT, b INT)
  RETURNS INT
  LANGUAGE SQL
  RETURN a + b;

このプレースホルダ UDF をテキストファイルに保存し、そのファイルを変換ジョブのソースファイルの 1 つとして含めます。これにより、トランスレータは UDF 定義を学習し、想定される入力と出力のデータ型を特定できます。

割り当てと上限

BigQuery Migration API の割り当てが適用されます。
各プロジェクトには、最大 10 個のアクティブな変換タスクを含めることができます。
ソースファイルとメタデータファイルの合計数にハードリミットはありませんが、パフォーマンス向上のためにファイル数を 1,000 未満に抑えておくことをおすすめします。

変換エラーのトラブルシューティング

変換の問題: `RelationNotFound` または `AttributeNotFound`

変換はメタデータ DDL で最適に動作します。SQL オブジェクト定義が見つからない場合は、変換エンジンで RelationNotFound または AttributeNotFound の問題が発生します。メタデータ抽出を使用してメタデータパッケージを生成し、すべてのオブジェクト定義が存在するようにすることをおすすめします。メタデータの不足によって間接的に発生する他のエラーの多くはたいてい修正可能であるため、ほとんどの変換エラーを解決するための最初の手順として、メタデータの追加をおすすめします。

詳細については、変換と評価のためのメタデータを生成するをご覧ください。

料金

バッチ SQL トランスレータは無料で使用できます。ただし、入出力ファイルの保存に使用されるストレージには料金が発生します。詳細については、ストレージの料金をご覧ください。

次のステップ

データウェアハウス移行の次のステップの詳細を確認する。