このページは Cloud Translation API によって翻訳されました。

仮想テープライブラリを使用して、Google Cloud に移動したメインフレームデータをコード変換する

メインフレーム上でローカルにデータのコード変換を行うのは CPU 使用率の高いプロセスであり、100 万命令/秒（MIPS）の高い消費につながります。これを回避するには、Cloud Run を使用して Google Cloud でメインフレームデータをリモートで移動してコード変換します。これにより、ビジネスクリティカルなタスクにメインフレームを解放し、MIPS の消費を削減できます。

非常に大量のデータ（1 日あたり約 500 GB 以上）をメインフレームから Google Cloud に移動し、この作業にメインフレームを使用したくない場合は、クラウド対応の Virtual Tape Library（VTL）ソリューションを使用して、データを Cloud Storage バケットに転送できます。その後、Cloud Run を使用してバケット内のデータをコード変換し、BigQuery に移動できます。

このページでは、Cloud Storage バケットにコピーされたメインフレームデータを読み取り、拡張バイナリコーディング 10 進交換コード（EBCDIC）データセットから UTF-8 の ORC 形式にコード変換し、そのデータセットを BigQuery テーブルに読み込む方法について説明します。

次の図は、VTL ソリューションを使用してメインフレームデータを Cloud Storage バケットに移動し、Cloud Run を使用してデータを ORC 形式にコード変換してから、コンテンツを BigQuery に移動する方法を示しています。

始める前に

要件に合った VTL ソリューションを選択し、メインフレームデータを Cloud Storage バケットに移動して .dat として保存します。アップロードした .dat ファイルに x-goog-meta-lrecl という名前のメタデータキーを追加していること、およびメタデータの鍵長が元のファイルのレコードの長さ（例: 80）と等しいことを確認してください。
Mainframe Connector を Cloud Run にデプロイする。
メインフレームで、GCSDSNURI 環境変数を、Cloud Storage バケットのメインフレームデータに使用した接頭辞に設定します。
```
export GCSDSNURI="gs://BUCKET/PREFIX"
```
次のように置き換えます。
- BUCKET: Cloud Storage バケットの名前。
- PREFIX: バケットで使用する接頭辞。
Mainframe Connector で使用するサービスアカウントを作成するか、既存のサービスアカウントを特定します。このサービスアカウントには、Cloud Storage バケット、BigQuery データセット、使用するその他の Google Cloud リソースにアクセスするための権限が必要です。
作成したサービスアカウントに Cloud Run 起動元のロールが割り当てられていることを確認します。

Cloud Storage バケットにアップロードされたメインフレームデータをコード変換する

VTL を使用してメインフレームデータを Google Cloud に移動し、リモートでコード変換するには、次の作業を行う必要があります。

Cloud Storage バケットにあるデータを読み取り、ORC 形式にコード変換します。コード変換オペレーションは、メインフレームの EBCDIC データセットを UTF-8 の ORC 形式に変換します。
データセットを BigQuery テーブルに読み込みます。
（省略可）BigQuery テーブルに対して SQL クエリを実行します。
（省略可）BigQuery から Cloud Storage のバイナリファイルにデータをエクスポートします。

これらのタスクを実行する手順は次のとおりです。

メインフレームで、Cloud Storage バケットの .dat ファイルからデータを読み取り、ORC 形式にコード変換するジョブを作成します。
注
- すべての Google Cloud コマンドがリモートトランスコーディングをサポートしているわけではありません。詳細については、Mainframe Connector API リファレンスをご覧ください。
- インポート処理中に、接尾辞 FILLER のある変数は無視されます。
- バージョン 5.12.0 以降、Mainframe Connector は変数名のハイフン（-）をアンダースコア（_）に置き換えます。変数名にハイフンを保持する場合は、データベース変数 BQSH_FEATURE_CONVERT_UNDERSCORE_IN_FIELDS_NAME を false に設定して、この自動変換を無効にします。
Mainframe Connector でサポートされている環境変数の一覧については、環境変数をご覧ください。
```
//STEP01 EXEC BQSH
//COPYBOOK DD DISP=SHR,DSN=<HLQ>.COPYBOOK.FILENAME
//STDIN DD *
gsutil cp --replace gs://mybucket/tablename.orc \
--inDsn INPUT_FILENAME \
--remoteHost <mainframe-connector-url>.a.run.app \
--remotePort 443 \
--project_id PROJECT_NAME
/*
```
以下を置き換えます。
- PROJECT_NAME: クエリを実行するプロジェクトの名前。
- INPUT_FILENAME: Cloud Storage バケットにアップロードした .dat ファイルの名前。
このプロセスで実行されたコマンドをログに記録するには、負荷統計情報を有効にすることができます。
（省略可）QUERY DD ファイルから SQL 読み取りを実行する BigQuery クエリジョブを作成して送信します。通常、クエリは MERGE または SELECT INTO DML ステートメントであり、BigQuery テーブルが変換されます。Mainframe Connector は、ジョブ指標に記録しますが、クエリ結果をファイルに書き込みません。

BigQuery にはさまざまな方法でクエリできます。インラインでクエリすることも、DD を使用して別のデータセットを使用してクエリすることもできます。DSN を使用して別のデータセットを使用してクエリすることもできます。
```
Example JCL
//STEP03 EXEC BQSH
//QUERY DD DSN=<HLQ>.QUERY.FILENAME,DISP=SHR
//STDIN DD *
PROJECT=PROJECT_NAME
LOCATION=LOCATION
bq query --project_id=$PROJECT \
--location=$LOCATION/*
/*
```
以下を置き換えます。
- PROJECT_NAME: クエリを実行するプロジェクトの名前。
- LOCATION: クエリを実行するロケーション。データに近いロケーションでクエリを実行することをおすすめします。
（省略可）QUERY DD ファイルから SQL 読み取りを実行し、結果のデータセットをバイナリファイルとして Cloud Storage にエクスポートするエクスポートジョブを作成して送信します。
```
Example JCL
//STEP04 EXEC BQSH
//OUTFILE DD DSN=<HLQ>.DATA.FILENAME,DISP=SHR
//COPYBOOK DD DISP=SHR,DSN=<HLQ>.COPYBOOK.FILENAME
//QUERY DD DSN=<HLQ>.QUERY.FILENAME,DISP=SHR
//STDIN DD *
PROJECT=PROJECT_NAME
DATASET_ID=DATASET_ID
DESTINATION_TABLE=DESTINATION_TABLE
BUCKET=BUCKET
bq export --project_id=$PROJECT \
  --dataset_id=$DATASET_ID \
  --destination_table=$DESTINATION_TABLE \
  --location="US" \
  --bucket=$BUCKET \
  --remoteHost <mainframe-connector-url>.a.run.app \
  --remotePort 443
/*
```
以下を置き換えます。
- PROJECT_NAME: クエリを実行するプロジェクトの名前。
- DATASET_ID: エクスポートするテーブルを含む BigQuery データセット ID。
- DESTINATION_TABLE: エクスポートする BigQuery テーブル。
- BUCKET: 出力バイナリファイルを含む Cloud Storage バケット。

仮想テープ ライブラリを使用して、Google Cloud に移動したメインフレーム データをコード変換する

始める前に

Cloud Storage バケットにアップロードされたメインフレーム データをコード変換する

仮想テープライブラリを使用して、Google Cloud に移動したメインフレームデータをコード変換する

Cloud Storage バケットにアップロードされたメインフレームデータをコード変換する