データのインポートとエクスポートに関するベストプラクティス

MySQL | PostgreSQL | SQL Server

このページでは、Cloud SQL でデータをインポートおよびエクスポートする際のベストプラクティスを示します。Cloud SQL にデータをインポートする詳細な手順については、データのインポートをご覧ください。

ご自身が管理する MySQL インスタンスで使用する Cloud SQL からデータをエクスポートするには、SQL ダンプファイルを使用したエクスポートとインポートまたは CSV ファイルを使用したエクスポートとインポートをご覧ください。

インポートとエクスポートのベストプラクティス

データをインポートおよびエクスポートする際に考慮すべきベストプラクティスは次のとおりです。

インポートとエクスポートに同じ SQL モードを使用する
Cloud Storage リクエスト元による支払いバケットを使用しない
エクスポートのパフォーマンスへの影響を最小限に抑える
SQL ダンプファイルの作成時に正しいフラグを使用する
コスト削減のため、データを圧縮する
長時間にわたるインポートおよびエクスポートプロセスを削減する
InnoDB を使用する
DEFINER 句で定義したメタデータを含む MySQL インポートジョブと移行ジョブ
インポートしたデータベースを確認する

インポートとエクスポートに同じ SQL モードを使用する

SQL モード設定は、Cloud SQL で SQL クエリをどのように解釈するかに影響します。たとえば、[Strict SQL] を有効にせずにデータベースからエクスポートし、Cloud SQL （デフォルトで [Strict SQL] を有効にします）にインポートしようとすると、インポートが失敗することがあります。ベストプラクティスは、エクスポートで使用したのと同じ SQL モードをインポートで使用することです。

互換性のために、ソースデータベースとターゲットデータベースの両方で SQL モードを確認します。Strict SQL モードを有効にするフラグに特に注意してください。Strict SQL がデータベースで設定されていない場合は、Cloud SQL で削除することをおすすめします。Strict SQL を削除する場合は、別のフラグを設定する必要があります。

Cloud SQL インスタンスで目的のモードが設定されていることを確認するには、SELECT @@GLOBAL.sql_mode; を実行します。

Cloud Storage リクエスト元による支払いバケットを使用しない

Cloud SQL からのインポートとエクスポートに、リクエスト元による支払いが有効になっている Cloud Storage バケットは使用できません。

エクスポートのパフォーマンスへの影響を最小限に抑える

Cloud SQL からの標準エクスポートの場合、データベースがオンラインであるときにエクスポートが実行されます。エクスポートされるデータが小さい場合、影響は最小限であると考えられます。しかし、大きなデータベースがある場合や、BLOB などの大きいオブジェクトがデータベースにある場合、エクスポートによってデータベースのパフォーマンスが低下する可能性があります。これは、データベースに対するデータベースクエリとオペレーションの実行にかかる時間に影響します。エクスポートの開始後は、データベースのレスポンスが遅くなっても停止することはできません。

エクスポート中にレスポンスが低速になるのを回避するには、次のようにします。

リードレプリカからエクスポートを取得します。エクスポートを頻繁に（毎日またはそれを超える頻度で）行う場合については、エクスポートされるデータ量が少なければ、これが適切な選択肢になります。リードレプリカからエクスポートするには、 Google Cloud コンソール、gcloud、または REST API を使用して、リードレプリカインスタンスに対してエクスポート機能を実行します。リードレプリカの作成と管理の方法については、リードレプリカの作成をご覧ください。

サーバーレスエクスポートを使用します。サーバーレスエクスポートを使用すると、エクスポートオペレーションをオフロードするために、個別の一時的なインスタンスが Cloud SQL によって作成されます。エクスポートオペレーションをオフロードすると、プライマリインスタンスのデータベースでクエリの送信を継続するので、通常のパフォーマンス速度でオペレーションを実行できます。データのエクスポートが完了すると、一時的なインスタンスは自動的に削除されます。大規模なデータベースの 1 回限りのエクスポートを作成する場合は、これが適切な選択肢になります。サーバーレスエクスポートオペレーションを実行するには、 Google Cloud コンソールまたは gcloud を使用するか、offload フラグを使用して REST API のエクスポート関数を実行します。

サーバーレスエクスポートオペレーションの最中は、インスタンスの編集、インポート、フェイルオーバーなどの他の一部のオペレーションを行えます。ただし、delete を選択すると、インスタンスを削除した後、エクスポートオペレーションはしばらく停止し、その間、データはエクスポートされません。

サーバーレスエクスポートオペレーションの実行中にブロックされる可能性があるオペレーションについては、次の表をご覧ください。

現在のオペレーション	新しいオペレーション	ブロックの有無
任意のオペレーション	サーバーレスエクスポート	あり
サーバーレスエクスポート	サーバーレスエクスポートを除くオペレーション	なし
サーバーレスエクスポートを除くオペレーション	サーバーレスエクスポートを除くオペレーション	あり

サーバーレスエクスポートでは、一時インスタンスの作成に時間がかかるため、標準エクスポートよりも時間がかかります。最短でも 5 分以上かかりますが、大規模なデータベースの場合は、さらに時間がかかることもあります。使用するエクスポート方法を決定する前に、時間、パフォーマンス、費用への影響を検討してください。

SQL ダンプファイルの作成時に正しいフラグを使用する

データを SQL ダンプファイルにエクスポートするときに正しいフラグを使用しなかった場合、インポートが失敗する可能性があります。Cloud SQL にインポートする SQL ダンプファイルの作成については、SQL ダンプファイルの作成をご覧ください。

コスト削減のためデータを圧縮する

Cloud SQL では、圧縮ファイルと非圧縮ファイルの両方のインポートとエクスポートがサポートされています。特に大きいインスタンスをエクスポートするときは、圧縮すると Cloud Storage の保存容量を大幅に節約でき、ストレージコストの削減にもなります。

SQL ダンプファイルや CSV ファイルをエクスポートする場合は、ファイル拡張子 .gz を使用してデータを圧縮します。ファイル拡張子 .gz のファイルは、インポートすると自動的に解凍されます。

長時間にわたるインポートおよびエクスポートプロセスの削減

処理対象のデータのサイズによっては、Cloud SQL へのインポートと Cloud SQL からのエクスポートが長時間にわたる可能性があります。その結果、次の影響があります。

長時間実行されている Cloud SQL インスタンスオペレーションを停止できません。
各インスタンスに対して実行できるインポートまたはエクスポートオペレーションは、一度に 1 つのみです。長時間にわたるインポートまたはエクスポートにより、毎日の自動バックアップなど、他のオペレーションがブロックされます。サーバーレスエクスポートの場合は、インスタンスの編集、インポート、フェイルオーバー、毎日の自動バックアップのブロック解除など、他のオペレーションを実行できます。

Cloud SQL のインポートまたはエクスポート機能をバッチサイズのより小さいデータで使用して、各オペレーションの完了に要する時間を短縮できます。

エクスポートの場合は、リードレプリカからエクスポートを行うか、サーバーレスエクスポートを使用してデータベースのパフォーマンスへの影響を最小限に抑えつつ、エクスポートの実行中にインスタンスで他のオペレーションを実行できます。

その他のヒントについては、Cloud SQL インスタンスでの問題を診断するをご覧ください。

InnoDB を使用する

InnoDB は、MySQL インスタンスでサポートされている唯一のストレージエンジンです。

次のように sed スクリプトを使って mysqldump の出力をパイプでつなぐことで、MyISAM から InnoDB にテーブルを変換できます。

mysqldump --databases [DATABASE_NAME] \
-h [INSTANCE_IP] -u [USERNAME] -p [PASSWORD] \
--hex-blob --default-character-set=utf8mb4 | sed 's/ENGINE=MyISAM/ENGINE=InnoDB/g' > [DATABASE_FILE].sql

DEFINER 句で定義したメタデータを含む MySQL インポートジョブと移行ジョブ

MySQL のインポートジョブまたは移行ジョブでは、ソース、ユーザーデータ、ユーザーが DEFINER 句で定義したメタデータを含むダンプファイルが移行されません。ユーザーがまだ存在しないため、このインポートまたは移行は失敗します。

メタデータに存在する DEFINER 値を確認するには、次のクエリを使用するか、ダンプファイル内を検索して、root%localhost またはターゲットインスタンスが存在しないユーザーのエントリがあるかどうかを確認します。

SELECT DISTINCT DEFINER FROM INFORMATION_SCHEMA.EVENTS;
SELECT DISTINCT DEFINER FROM INFORMATION_SCHEMA.ROUTINES;
SELECT DISTINCT DEFINER FROM INFORMATION_SCHEMA.TRIGGERS;
SELECT DISTINCT DEFINER FROM INFORMATION_SCHEMA.VIEWS;

このようなメタデータを含むソースからインポートジョブまたは移行ジョブを実行するには、次のいずれかの操作を行います。

インポートジョブまたは移行ジョブを開始する前に、ターゲット Cloud SQL インスタンスにユーザーを作成します。
インポートジョブまたは移行ジョブを開始する前に、ソースの MySQL インスタンスまたはダンプファイルで DEFINER 句を INVOKER に更新します。

インポートしたデータベースを確認する

インポートが完了したら、データベースに接続し、該当するデータベースコマンドを実行して内容が正しいことを確認します。たとえば接続して、データベース、テーブル、特定のエントリを一覧表示します。

既知の制限事項

既知の制限事項のリストについては、データのインポートとエクスポートに関する問題をご覧ください。

エクスポートオペレーションの自動化

Cloud SQL にはデータベースのエクスポートを自動化するための組み込み機能はありませんが、いくつかの Google Cloudコンポーネントを使用して、独自の自動化ツールを構築できます。詳細については、こちらのチュートリアルをご覧ください。

トラブルシューティング

インポートオペレーションのトラブルシューティング

問題	トラブルシューティング
`HTTP Error 409: Operation failed because another operation was already in progress`.	保留中のオペレーションがインスタンスにすでに存在しています。一度に実行できるオペレーションは 1 つだけです。現在のオペレーションが完了してからリクエストを試してください。
インポートオペレーションに時間がかかりすぎる。	アクティブな接続が多すぎると、インポートオペレーションが妨げられる可能性があります。未使用のオペレーションを終了します。Cloud SQL インスタンスの CPU とメモリ使用量をチェックして、十分なリソースがあることを確認します。インポートに最大限のリソースを確保するため、オペレーションを開始する前にインスタンスを再起動することをおすすめします。再起動により、次の処理が行われます。すべての接続を終了します。リソースを消費している可能性のあるタスクをすべて終了します。
ダンプファイルで参照しているユーザーが存在しない場合、インポートオペレーションが失敗することがある。	ダンプファイルをインポートする前に、オブジェクトを所有しているデータベースユーザーか、ダンプされたデータベース内のオブジェクトに対する権限が付与されているデータベースユーザーがターゲットデータベース内に存在している必要があります。そうでない場合、インポートオペレーションを実行すると、元の所有権または権限でのオブジェクトの再作成に失敗します。インポートする前に、データベースユーザーを作成します。
インポートオペレーションが失敗し、テーブルが存在しないというエラーが表示される。	テーブルに他のテーブルの外部キーと依存関係が存在する場合があります。このため、オペレーションの順序によっては、インポートオペレーション中に 1 つ以上のテーブルがまだ存在しない可能性があります。次の方法をお試しください。次の行をダンプファイルの先頭に追加します。 SET FOREIGN_KEY_CHECKS=0; また、次の行をダンプファイルの末尾に追加します。 SET FOREIGN_KEY_CHECKS=1; これらの設定により、インポートオペレーション中のデータの整合性チェックが無効になり、データの読み込み後に再び有効になります。ダンプファイルの作成時にデータがすでに検証されているため、この設定はデータベース上のデータの整合性には影響しません。

エクスポートオペレーションのトラブルシューティング

問題	トラブルシューティング
`HTTP Error 409: Operation failed because another operation was already in progress.`	保留中のオペレーションがインスタンスにすでに存在しています。一度に実行できるオペレーションは 1 つだけです。現在のオペレーションが完了してからリクエストを試してください。
`HTTP Error 403: The service account does not have the required permissions for the bucket.`	バケットが存在し、バケットへのエクスポートを許可する `Storage Object Creator` ロール（`roles/storage.objectCreator`）が Cloud SQL インスタンス用のサービスアカウント（エクスポートを行っているアカウント）に付与されていることを確認します。Cloud Storage に適用される IAM ロールをご覧ください。
CSV のエクスポートは機能したが、SQL エクスポートに失敗した。	CSV 形式と SQL 形式ではエクスポート方法が異なります。SQL 形式ではデータベース全体がエクスポートされるため、完了までに時間がかかります。CSV 形式ではエクスポートに含めるデータベースの要素を定義できます。 CSV エクスポートを使用して必要なものだけをエクスポートします。
エクスポートに時間がかかりすぎる。	Cloud SQL では同時実行オペレーションの同期がサポートされません。エクスポートをオフロードします。エクスポートをオフロードするときに、Cloud SQL はソースインスタンスでエクスポートを発行するのではなく、オフロードインスタンスを起動してエクスポートを実行します。エクスポートオフロードには、ソースインスタンスでのパフォーマンス向上、エクスポート実行中の管理オペレーションのブロック解除などの利点があります。エクスポートオフロードでは、合計レイテンシがオフロードインスタンスの起動時間まで増加する可能性があります。一般に、適当なサイズのエクスポートでは、レイテンシは重要ではありません。ただし、エクスポートが小さい場合、レイテンシが増加することがあります。
エクスポートを自動化したい。	Cloud SQL には、エクスポートを自動化する方法がありません。バックアップの自動化に関する記事のように、 Google Cloudプロダクト（Cloud Scheduler、Pub/Sub、Cloud Run functions）を使用して、独自の自動エクスポートシステムを構築できます。

データのインポートとエクスポートに関するベスト プラクティス コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

インポートとエクスポートのベスト プラクティス