このページは Cloud Translation API によって翻訳されました。

マネージドインポートを使用して外部データベースからのレプリケーションを設定する

MySQL | PostgreSQL | SQL Server

このページでは、外部サーバーから Cloud SQL にレプリケーションを行う際に、データのマネージドインポートを設定し、使用する方法について説明します。

このページで説明する手順はすべて完了する必要があります。完了したら、他の Cloud SQL インスタンスと同じ方法でソース表現インスタンスを管理し、監視できます。

始める前に

始める前に、次の手順を完了してください。

レプリケーションの設定の確認

設定が完了したら、外部サーバーから Cloud SQL レプリカが複製できることを確認します。

以下の外部同期設定が正しいことを確認します。

Cloud SQL レプリカと外部サーバーとの間の接続
レプリケーションユーザーの権限
バージョンの互換性
Cloud SQL レプリカはまだレプリケートされていない

これらの設定を確認するには、Cloud Shell ターミナルを開いて次のコマンドを入力します。

curl

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data '{
         "syncMode": "SYNC_MODE",
         "syncParallelLevel": "SYNC_PARALLEL_LEVEL",
         "selectedObjects": "SELECTED_OBJECTS"
       }' \
     -X POST \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_INSTANCE_ID/verifyExternalSyncSettings

例

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data '{
         "syncMode": "online",
         "syncParallelLevel": "optimal",
         "selectedObjects":[{"database":"db1"}, {"database":"db2"}]
       }' \
     -X POST \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/myproject/instances/myreplica/verifyExternalSyncSettings

これらの呼び出しは、sql#externalSyncSettingErrorList 型のリストを返します。

リストが空の場合は、エラーはありません。エラーのないレスポンスは、次のようになります。

  {
    "kind": "sql#externalSyncSettingErrorList"
  }

プロパティ	説明
`SYNC_MODE`	レプリケーションの設定後に、Cloud SQL レプリカと外部サーバーの同期を確実に維持できるようになります。同期モードには `EXTERNAL_SYNC_MODE_UNSPECIFIED`、`ONLINE`、`OFFLINE` があります。
`SYNC_PARALLEL_LEVEL`	データベースのテーブルからのデータ転送速度を制御する設定を確認します。指定できる値は次のとおりです。 `min:`: 最小量のコンピューティングリソースがデータベースに対して使用されます。これは、データ転送速度が最も遅くなる設定です。 `optimal:`: バランスの取れたパフォーマンスが実現し、データベースへの負荷が最適な状態になります。 `max:`: データ転送速度が最も速くなりますが、その結果としてデータベースの負荷が増加する可能性があります。注: このパラメータのデフォルト値は `optimal` です。この設定では良好な速度でデータが転送され、データベースへの影響も妥当であるためです。この値を使用することをおすすめします。
`SELECTED_OBJECTS`	移行元の表現インスタンスから移行先の Cloud SQL インスタンスに移行するデータベースを指定するオブジェクトのカンマ区切りリスト。このパラメータを使用しない場合、またはパラメータの値として空のリストを指定する場合は、すべてのデータベースがソースから宛先に移行されます。
`PROJECT_ID`	Google Cloud プロジェクトの ID。
`REPLICA_INSTANCE_ID`	Cloud SQL レプリカの ID。

レプリケーション元表現インスタンスを更新する

ソース表現インスタンスから移行先の Cloud SQL インスタンスに移行するデータベースを更新するには、selectedObjects パラメータに関連付けられているデータベース名のリストを更新します。このパラメータを使用しない場合、またはパラメータの値として空のリストを指定する場合は、すべてのデータベースがソースから宛先に移行されます。

source.json

    {
      "name": "SOURCE_NAME",
      "region": "REGION",
      "databaseVersion": "DATABASE_VERSION",
      "onPremisesConfiguration": {
        "selectedObjects": "SELECTED_OBJECTS",
        "username": "USERNAME",
        "password": "PASSWORD"
      }
    }

例

// example of source.json for external server that
// - initiates replication from a Cloud SQL managed import
// - doesn't use SSL/TLS

{
  "name": "cloudsql-source-instance",
  "region": "us-central1",
  "databaseVersion": "POSTGRES_9_6",
  "onPremisesConfiguration": {
    "selectedObjects":[{"database":"db1"}, {"database":"db3"}],
    "username": "newReplicationUser",
    "password": "525#@%*@"
  }
}

プロパティ	説明
`SOURCE_NAME`	ソース表現インスタンスの名前。
`REGION`	レプリケーション元表現インスタンスが存在するリージョン。
`DATABASE_VERSION`	外部サーバーで実行されているデータベースのバージョン。選択肢は `POSTGRES_9_6`、`POSTGRES_10`、`POSTGRES_11`、`POSTGRES_12`、`POSTGRES_13`、`POSTGRES_14`、`POSTGRES_15`、`POSTGRES_16`、`POSTGRES_17` です。
`SELECTED_OBJECTS`	ソース表現インスタンスから宛先 Cloud SQL インスタンスに移行するデータベースを指定する、オブジェクトの更新されたカンマ区切りリスト。
`USERNAME`	外部サーバー上のレプリケーションユーザーアカウント。
`PASSWORD`	アカウントのパスワード。

次に、Cloud SQL でレプリケーション元表現インスタンスを変更するために、Cloud Shell ターミナルを開いて次のコマンドを入力します。

curl

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data @JSON_PATH \
     -X PATCH \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/SOURCE_NAME

例

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data @./source.json \
     -X PATCH \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/MyProject/instances/cloudsql-source-instance

プロパティ	説明
`JSON_PATH`	外部サーバーのリクエストデータを含む `JSON` ファイルのパス。
`PROJECT_ID`	Google Cloud プロジェクトの ID。
`SOURCE_NAME`	ソース表現インスタンスの名前。

外部サーバーでレプリケーションを開始する

外部サーバーから複製できることを確認したら、レプリケーションを開始します。最初のインポートプロセスのためのレプリケーション実行速度は、1 時間あたり最大 500 GB です。ただし、この速度は、マシンのティア、データディスクサイズ、ネットワークスループット、データベースの性質によって異なる可能性があります。

curl

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data '{
         "syncMode": "SYNC_MODE",
         "skipVerification": "SKIP_VERIFICATION",
         "syncParallelLevel": "SYNC_PARALLEL_LEVEL"
       }' \
     -X POST \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_INSTANCE_ID/startExternalSync

例

gcloud auth login
ACCESS_TOKEN="$(gcloud auth print-access-token)"
curl --header "Authorization: Bearer ${ACCESS_TOKEN}" \
     --header 'Content-Type: application/json' \
     --data '{
         "syncMode": "online",
         "syncParallelLevel": "optimal"
       }' \
     -X POST \
     https://sqladmin.googleapis.com/sql/v1beta4/projects/MyProject/instances/replica-instance/startExternalSync

プロパティ	説明
`SYNC_MODE`	レプリケーションの設定後に、Cloud SQL レプリカと外部サーバーの同期を維持できることを確認します。
`SKIP_VERIFICATION`	データを同期する前に、組み込みの検証ステップをスキップするかどうか。このパラメータは、レプリケーションの設定を確認済みの場合にのみ使用することをおすすめします。
`SYNC_PARALLEL_LEVEL`	データベースのテーブルからのデータ転送速度を制御する設定を指定します。指定できる値は次のとおりです。 `min:`: 最小量のコンピューティングリソースがデータベースに対して使用されます。これは、データ転送速度が最も遅くなる設定です。 `optimal:`: バランスの取れたパフォーマンスが実現し、データベースへの負荷が最適な状態になります。 `max:`: データ転送速度が最も速くなりますが、その結果としてデータベースの負荷が増加する可能性があります。注: このパラメータのデフォルト値は `optimal` です。この設定では良好な速度でデータが転送され、データベースへの影響も妥当であるためです。この値を使用することをおすすめします。
`PROJECT_ID`	Google Cloud プロジェクトの ID。
`REPLICA_INSTANCE_ID`	Cloud SQL レプリカの ID。

移行をモニタリングする

外部サーバーからのレプリケーションを開始したら、レプリケーションをモニタリングする必要があります。詳細については、レプリケーションのモニタリングをご覧ください。その後、移行を完了できます。

トラブルシューティング

次のトラブルシューティングオプションを検討してください。

問題	トラブルシューティング
作成時にリードレプリカがレプリケーションを開始しなかった。	ログファイルに、より具体的なエラーが記録されている可能性があります。Cloud Logging のログを調べて、実際のエラーを確認します。
リードレプリカを作成できない - invalidFlagValue エラー。	リクエスト内のフラグのいずれかが無効です。これは、明示的に指定されたフラグか、デフォルト値に設定されたフラグである可能性があります。まず、`max_connections` フラグの値がプライマリの値以上であることを確認します。 `max_connections` フラグが適切に設定されている場合、Cloud Logging のログを調べて、実際のエラーを確認します。
リードレプリカを作成できない - 不明なエラー。	ログファイルに、より具体的なエラーが記録されている可能性があります。Cloud Logging のログを調べて、実際のエラーを確認します。エラーが `set Service Networking service account as servicenetworking.serviceAgent role on consumer project` の場合は、`Service Networking API` を無効にしてから再度有効にします。この措置で、プロセスを続行するために必要なサービスアカウントが作成されます。
ディスクに空きがない。	レプリカの作成中にプライマリインスタンスのディスクの空きがなくなる可能性があります。プライマリインスタンスを編集して、より大きなディスクサイズにアップグレードします。
ディスク容量が大幅に増加します。	データの追跡に使用されていないスロットでは、PostgreSQL が WAL セグメントに無期限に維持するため、ディスク容量は無期限に増加します。Cloud SQL で論理レプリケーションと論理デコーディング機能を使用すると、レプリケーションスロットが自動的に作成、削除されます。`pg_replication_slots` システムビューにクエリを実行し、`active` 列でフィルタリングすると、未使用のレプリケーションスロットを検出できます。未使用のスロットを削除することで、`pg_drop_replication_slot` コマンドで WAL セグメントを削除できます。
レプリカインスタンスのメモリ使用量が多すぎる。	レプリカは一時メモリを使用して頻繁にリクエストされる読み取りオペレーションをキャッシュに保存するため、プライマリインスタンスより多くのメモリを使用する可能性があります。レプリカインスタンスを再起動して、一時メモリ領域を再利用します。
レプリケーションが停止した。	ストレージの上限に達しており、ストレージの自動増量が有効になっていません。インスタンスを編集して `automatic storage increase` を有効にします。
レプリケーションラグが常に大きい。	書き込みの負荷が大きすぎてレプリカで処理できません。レプリケーションラグは、レプリカの SQL スレッドで IO スレッドに対応できない場合に発生します。クエリやワークロードによっては、特定のスキーマで一時的または永続的に高いレプリケーションラグが発生することがあります。レプリケーションラグの一般的な原因は次のとおりです。レプリカのクエリが遅い。遅いクエリを見つけて修正します。すべてのテーブルに一意キーまたは主キーが必要です。一意のキーまたは主キーのないテーブルを更新するたびに、レプリカでテーブル全体がスキャンされます。 `DELETE ... WHERE field < 50000000` などのクエリでは、レプリカに膨大な数の更新が蓄積されるため、行ベースのレプリケーションでレプリケーションラグが発生します。考えられる解決策は次のとおりです。インスタンスを編集してレプリカのサイズを増やします。データベースの負荷を軽減します。リードレプリカにリードトラフィックを送信します。テーブルをインデックスに登録します。遅い書き込みクエリを特定して修正します。レプリカを再作成します。
PostgreSQL 9.6 でインデックスを再構築する際のエラー。	特定のインデックスを再構築する必要があることを示す PostgreSQL のエラーが発生します。これは、プライマリインスタンスでのみ行うことができます。新しいレプリカインスタンスを作成すると、すぐに同じエラーが発生します。バージョン 10 より前の PostgreSQL ではハッシュインデックスはレプリカに伝播されません。ハッシュインデックスを使用する必要がある場合は、PostgreSQL 10 以降にアップグレードしてください。レプリカも使用する場合は、PostgreSQL 9.6 でハッシュインデックスを使用しないでください。
プライマリインスタンスでのクエリは常に実行中です。	レプリカの作成後、クエリ `SELECT * from pg_stat_activity where state = 'active' and pid = XXXX and username = 'cloudsqlreplica'` はプライマリインスタンスで継続的に実行されます。
レプリカの作成がタイムアウトで失敗する。	プライマリインスタンスで長時間 commit されていないトランザクションが実行されると、リードレプリカの作成に失敗することがあります。実行中のクエリをすべて停止してからレプリカを再作成します。
プライマリインスタンスとレプリカの vCPU サイズが異なる場合、クエリオプティマイザーは vCPU サイズを考慮するため、クエリのパフォーマンスに問題が生じる可能性があります。	この問題を解決するには、次の操作を行います。 log_duration フラグをオンにして、`log_statement` パラメータを `ddl` に設定します。これにより、データベースのクエリと実行時間の両方を確認できます。ただし、ワークロードによっては、パフォーマンスの問題が発生する可能性があります。プライマリインスタンスとリードレプリカの両方で、クエリに対して `explain analyze` を実行します。クエリプランを比較して違いを確認します。特定のクエリの場合は、クエリを変更します。たとえば、結合の順序を変更して、パフォーマンスが向上するかどうかを確認できます。

レプリケーションログを確認する

レプリケーションの設定を確認したときに、ログが生成されています。

これらのログは次の手順で確認できます。

Google Cloud コンソールでログビューアに移動します。

ログビューアに移動
[インスタンス] プルダウンから Cloud SQL レプリカを選択します。
replication-setup.log ログファイルを選択します。

Cloud SQL レプリカが外部サーバーに接続できない場合は、次の点を確認してください。

外部サーバー上のすべてのファイアウォールが、Cloud SQL レプリカの送信 IP アドレスからの接続を受け入れるように構成されている。
SSL / TLS 構成が正しく行われている。
正しいレプリケーションユーザー、ホスト、パスワードを使用している。

次のステップ

インスタンスの更新の詳細を確認する。
レプリカの管理について学習する。
インスタンスのモニタリングについて確認する。
Cloud SQL レプリカの昇格について確認する。

マネージド インポートを使用して外部データベースからのレプリケーションを設定する

始める前に

レプリケーションの設定の確認

curl

例

レプリケーション元表現インスタンスを更新する

source.json

例

curl

例

外部サーバーでレプリケーションを開始する

curl

例

移行をモニタリングする

トラブルシューティング

レプリケーション ログを確認する

次のステップ

マネージドインポートを使用して外部データベースからのレプリケーションを設定する

レプリケーションログを確認する