レプリカの管理

このページでは、リードレプリカの操作について説明します。特に、レプリケーションの無効化と有効化について説明します。また、次の方法についても説明します。

  • レプリカをスタンドアロン インスタンスに昇格する
  • 並列レプリケーションを構成する

リードレプリカの操作の詳細については、Cloud SQL でのレプリケーションをご覧ください。

レプリケーションの無効化

デフォルトでは、レプリカのレプリケーションは有効に設定されています。ただし、レプリケーションを無効にできます。たとえば、デバッグの実行時や、インスタンスの状態を分析する場合などです。準備が完了したら、レプリケーションを明示的に再び有効にします。レプリケーションを無効または再び有効にすると、レプリカが再起動されます。

レプリケーションを無効にしてもレプリカのインスタンスは停止されませんが、読み取り専用のインスタンスになり、プライマリ インスタンスからのレプリケーションは実行されなくなります。このインスタンスは引き続き課金されます。無効にしたレプリカでレプリケーションを再度有効にできます。また、レプリカの削除や、レプリカのスタンドアロン インスタンスへの昇格を行うこともできます。レプリカを停止することはできません。

レプリケーションを無効にするには:

Console

  1. Google Cloud Console の [Cloud SQL インスタンス] ページに移動します。

    [Cloud SQL インスタンス] ページに移動

  2. レプリカ インスタンスの名前をクリックして開きます。
  3. ボタンバーの [レプリケーションを無効にする] をクリックします。
  4. [OK] をクリックします。

gcloud

gcloud sql instances patch [REPLICA_NAME] --no-enable-database-replication

REST API v1beta4

この cURL コマンドをコマンドライン プロンプトで実行するには、gcloud auth print-access-token コマンドを使用してアクセス トークンを取得します。インスタンス: patch ページの API Explorer を使用して REST API リクエストを送信することもできます。

後述のリクエストのデータを使用する前に、次のように置き換えます。

  • project-id: プロジェクト ID
  • replica-name: レプリカ インスタンスの名前

HTTP メソッドと URL:

PATCH https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name

JSON 本文のリクエスト:

{
  "settings":
  {
    "databaseReplicationEnabled": "False"
  }
}

リクエストを送信するには、次のいずれかのオプションを展開します。

次のような JSON レスポンスが返されます。

レプリケーションの有効化

レプリカが長期間レプリケーションされていないと、プライマリ インスタンスとの同期に長時間かかります。この場合は、レプリカを削除し、新しいレプリカを作成します。

レプリケーションを有効にするには:

Console

  1. Google Cloud Console の [Cloud SQL インスタンス] ページに移動します。

    [Cloud SQL インスタンス] ページに移動

  2. レプリカ インスタンスの名前をクリックして選択します。
  3. ボタンバーの [レプリケーションを有効にする] をクリックします。
  4. [OK] をクリックします。

gcloud

gcloud sql instances patch [REPLICA_NAME] --enable-database-replication

REST API v1beta4

この cURL コマンドをコマンドライン プロンプトで実行するには、gcloud auth print-access-token コマンドを使用してアクセス トークンを取得します。インスタンス: patch ページの API Explorer を使用して REST API リクエストを送信することもできます。

後述のリクエストのデータを使用する前に、次のように置き換えます。

  • project-id: プロジェクト ID
  • replica-name: レプリカ インスタンスの名前

HTTP メソッドと URL:

PATCH https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name

JSON 本文のリクエスト:

{
  "settings":
  {
    "databaseReplicationEnabled": "True"
  }
}

リクエストを送信するには、次のいずれかのオプションを展開します。

次のような JSON レスポンスが返されます。

レプリカの昇格

リードレプリカを昇格させると、レプリケーションが停止し、インスタンスは読み取りと書き込みが可能なスタンドアロン Cloud SQL プライマリ インスタンスに変換されます。この操作は元に戻せません。

プライマリ インスタンスがまだ使用可能で、クライアントにサービスを提供している場合は、リードレプリカを昇格させる前に、プライマリ インスタンスへの書き込みをすべて停止し、レプリカのレプリケーションのステータスを確認する必要があります([MySQL クライアント] タブの手順を行ってください)。レプリカがレプリケーションされていることを確認し、Seconds_Behind_Master 指標によってレポートされるレプリケーション ラグが 0 になるまで待つ必要があります。それ以外の場合は、新しく昇格したインスタンスに、プライマリ インスタンスに commit されたトランザクションの一部が存在しない可能性があります。

スタンドアロンのインスタンスにレプリカを昇格させる手順は次のとおりです。

Console

  1. Google Cloud Console の [Cloud SQL インスタンス] ページに移動します。

    [Cloud SQL インスタンス] ページに移動

  2. レプリカ インスタンスの名前をクリックして選択します。
  3. ボタンバーの [レプリカをプロモート] をクリックします。
  4. [OK] をクリックします。

gcloud

gcloud sql instances promote-replica [REPLICA_NAME]
  

REST API v1beta4

この cURL コマンドをコマンドライン プロンプトで実行するには、gcloud auth print-access-token コマンドを使用してアクセス トークンを取得します。Instances:promoteReplica ページの API Explorer を使用して REST API リクエストを送信することもできます。

後述のリクエストのデータを使用する前に、次のように置き換えます。

  • project-id: プロジェクト ID
  • replica-name: レプリカ インスタンスの名前

HTTP メソッドと URL:

POST https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name/promoteReplica

リクエストを送信するには、次のいずれかのオプションを展開します。

次のような JSON レスポンスが返されます。

昇格したインスタンスが正しく構成されていることを確認します。具体的には、必要に応じて高可用性対応のインスタンスを構成することを検討してください。

並列レプリケーションの構成

レプリケーション ラグを減らすことは、レプリケーションのパフォーマンスを管理するうえで重要になります。レプリケーション ラグは、リードレプリカの更新がプライマリ インスタンスの更新よりも遅れた場合に発生します。このセクションでは、ユーザーが並列レプリケーションを有効にして、レプリケーション ラグを減らす方法について説明します。

MySQL レプリケーションでは、レプリケーション SQL スレッドを使用して、リードレプリカのリレーログで収集されたトランザクションを実行します。並列レプリケーションでは、これらのトランザクションを実行する SQL スレッドの数を増やすことで、レプリケーション ラグを減らします。並列レプリケーションが有効になっているリードレプリカは、マルチスレッド レプリカと呼ばれることもあります。

Cloud SQL for MySQL では、次の 3 つのシナリオで並列レプリケーションを利用できます。

わかりやすくするために、このページではプライマリ インスタンスとリードレプリカという用語を使用します。

並列レプリケーション フラグを変更する基本的な手順

並列レプリケーションを有効にする手順は次のとおりです。

  1. リードレプリカで、レプリケーションを無効にします
  2. リードレプリカで、並列レプリケーションのフラグを設定します。gcloud コマンドを使用してフラグを設定します。レプリカを無効にすると、Google Cloud Console オプションは無効になります。
  3. リードレプリカで、レプリケーションを有効にします
  4. 必要に応じて、プライマリ インスタンスでフラグを設定して、並列レプリケーションのパフォーマンスを最適化します

リードレプリカ: 並列レプリケーションのフラグ

Cloud SQL for MySQL は、リードレプリカの並列レプリケーションで複数のフラグをサポートしています。フラグの詳細については、次のリンクをクリックして MySQL 8.0 のドキュメントをご覧ください。

これらのフラグを変更しても、リードレプリカは再起動されません。

次の表に、これらのフラグに使用可能な値とデフォルト値を示します。

リードレプリカ フラグ 使用できる値 MySQL 5.7 のデフォルト値 MySQL 8.0 のデフォルト値
slave_parallel_workers 0~1,024 0 0
slave_parallel_type DATABASE, LOGICAL_CLOCK DATABASE DATABASE
slave_preserve_commit_order 0、1 0 1
slave_pending_jobs_size_max 1,024~1GB 16 MB 128 MB

slave_preserve_commit_order フラグを指定すると、レプリカのリレーログから実行されるトランザクション シーケンスのギャップを回避できます。

slave_preserve_commit_order=1 の設定を使用するには、次のことを行う必要があります。

slave_pending_jobs_size_max フラグには、未適用イベントを格納するアプリケーション キューで利用できる最大メモリをバイト単位で設定します。

プライマリ インスタンス: 並列レプリケーションのフラグ

Cloud SQL for MySQL では、プライマリ インスタンスで使用できるフラグがいくつかあります。これらのフラグを使用して、並列レプリケーションが有効になっている関連レプリカのレプリケーション パフォーマンスを調整できます。フラグの詳細については、次のリンクをクリックして MySQL 8.0 のドキュメントをご覧ください。

これらのフラグを変更しても、プライマリ インスタンスは再起動されません。

次の表に、これらのフラグに使用可能な値とデフォルト値を示します。

プライマリ インスタンス フラグ 使用できる値 MySQL 5.7 のデフォルト値 MySQL 8.0 のデフォルト値
binlog_transaction_dependency_history_size 1~1,000,000 25000 25000
binlog_transaction_dependency_tracking COMMIT_ORDER, WRITESET, WRITESET_SESSION COMMIT_ORDER COMMIT_ORDER
transaction_write_set_extraction OFF, MURMUR32, XXHASH64 OFF XXHASH64

MySQL 5.7 で、binlog_transaction_dependency_trackingWRITESET または WRITESET_SESSION に設定されている場合、transaction_write_set_extractionOFF 以外の値(XXHASH64 または MURMUR32)に設定する必要があります。

レプリケーションのステータスの確認

Google Cloud Console でレプリカ インスタンスを表示するか、管理クライアントからインスタンスにログインすると、ステータスや指標などのレプリケーションの詳細を取得できます。gcloud コマンドライン ツールを使用すると、レプリケーション構成の概要を取得できます。

レプリカ インスタンスで使用できる指標は次のとおりです(レプリカ以外のインスタンスを含む、すべてのインスタンスで使用可能な他の指標については、こちらをご覧ください)。

指標説明
レプリケーション状態
cloudsql.googleapis.com/database/replication/state

レプリケーションでプライマリからレプリカにログがストリーミングされているどうかを示します。次の値があります。

  • Running
  • Stopped
  • Error

この指標は、レプリカの I/O と SQL スレッドが実行中の場合に Running を報告します。詳しくは、スレーブ I/O スレッドの実行状態スレーブ SQL スレッドの実行状態をご覧ください。または、MySQL リファレンス マニュアルでレプリケーションのステータスを確認するをご覧ください。

レプリケーション ラグ
cloudsql.googleapis.com/database/replication/replica_lag

プライマリ インスタンスの状態に対するレプリカの状態の遅れ(時間)。(1)現在の時刻と(2)現在レプリカに適用されているトランザクションをプライマリが commit したときのタイムスタンプの差です。特に、レプリカが書き込みを受信していても、レプリカがデータベースへの書き込みをまだ適用していない場合、書き込みは遅延として記録される可能性があります。

この指標は、レプリカで SHOW SLAVE STATUS が実行されたときに Seconds_Behind_Master の値をレポートします。詳細については、MySQL リファレンス マニュアルのレプリケーション ステータスの確認をご覧ください。

スレーブ I/O スレッド実行状態
cloudsql.googleapis.com/database/mysql/replication/slave_io_running_state

プライマリ インスタンスのバイナリログを読み取るために、I/O スレッドがレプリカで実行されているかどうかを示します。次の値があります。

  • Yes
  • No
  • Connecting

この指標は、レプリカで SHOW SLAVE STATUS が実行されたときの Slave_IO_Running 値をレポートします。詳細については、MySQL リファレンス マニュアルのレプリケーション ステータスの確認をご覧ください。

スレーブ SQL スレッドの実行状態
cloudsql.googleapis.com/database/mysql/replication/slave_sql_running_state

リレーログのイベントを実行するために SQL スレッドがレプリカ上で実行されているかどうかを示します。次の値があります。

  • Yes
  • No
  • Connecting

この指標は、レプリカで SHOW SLAVE STATUS が実行されたときの Slave_SQL_Running 値をレポートします。詳細については、MySQL リファレンス マニュアルのレプリケーション ステータスの確認をご覧ください。

レプリケーションのステータスを確認するには:

Console

Cloud SQL は、デフォルトの Cloud SQL モニタリング ダッシュボードReplication State 指標と Replication Lag 指標を表示します。

リージョン内のレプリカ、クロスリージョン レプリカ、外部サーバー レプリカの他の指標を表示するには、カスタム ダッシュボードを作成して、モニタリングする指標を追加します。

  1. [Monitoring] ページに移動します。
  2. [ダッシュボード] タブを選択します。
  3. ページの上部にあるボタンバーの [+ ダッシュボードの作成] をクリックします。
  4. ダッシュボードに名前を付けて [OK] をクリックします。
  5. ページの右上にある [グラフを追加] をクリックします。
  6. [リソースの種類] には、[Cloud SQL データベース] を選択します。
  7. 以下のいずれかの操作を行います。
    1. レプリケーション状態の指標をモニタリングする: [指標の選択] フィールドに「Replication state」と入力します。次に、state = "Running" のフィルタを追加します。レプリケーションが実行中の場合は 1、それ以外の場合は 0 が表示されます。
    2. レプリケーション ラグの指標をモニタリングする: [指標の選択] フィールドに「replica_lag」と入力します。グラフには、プライマリに対するレプリカの状態の遅れが時間単位で表示されます。
    3. レプリカの I/O スレッドのステータスをモニタリングする: [指標の選択] フィールドに「Slave I/O thread running state」と入力します。続いて、state = "Yes" のフィルタを追加します。スレッドが実行中の場合は 1、それ以外の場合は 0 が表示されます。
    4. レプリカの SQL スレッドのステータスをモニタリングする: [指標の選択] フィールドに「Slave SQL thread running state」と入力します。続いて、state = "Yes" のフィルタを追加します。スレッドが実行中の場合は 1、それ以外の場合は 0 が表示されます。

gcloud

レプリカ インスタンスの場合、以下のようにしてレプリケーションのステータスを確認します。

gcloud sql instances describe [REPLICA_NAME]

出力内で、databaseReplicationEnabledmasterInstanceName プロパティを見つけます。

プライマリ インスタンスの場合、以下のようにしてレプリカがあるかどうかを確認します。

gcloud sql instances describe [PRIMARY_INSTANCE_NAME]

出力内で、replicaNames プロパティを見つけます。

MySQL クライアント

  1. MySQL クライアントを使用してレプリカに接続します。

    詳しくは、外部アプリケーションのための接続オプションをご覧ください。

  2. レプリカのステータスを確認します。
    SHOW SLAVE STATUS \G

    コマンドの出力で、次の指標を見つけます。

    • Master_Host: プライマリ インスタンスの名前。
    • Slave_IO_RunningSlave_SQL_Running: I/O スレッドと SQL スレッドが実行されているかどうかを示します。これらのスレッドは、イベントをプライマリからレプリカのリレーログに転送し、それらのイベントをリレーログから実行します。スレッドが実行されている場合、指標の値は Yes になります。レプリケーションを有効にするには、両方のスレッドが実行されている必要があります。
    • Seconds_Behind_Master: レプリカがプライマリ トランザクションの処理にかかる秒数。たとえば、(1)現在の時刻と(2)元のタイムスタンプの差です。元のタイムスタンプとは、現在レプリカに適用されているトランザクションをプライマリが commit した時刻です。レプリケーションが壊れた場合、値は NULL になります。
    • Master_Log_fileRead_Master_Log_PosRelay_Master_Log_FileExec_Master_Log_Pos: これらの指標は座標(ファイル名とオフセット)を示し、I/O スレッドが読み取った直近のイベント(Master_Log_fileRead_Master_Log_Pos)と、SQL スレッドが実行した直近のイベント(Relay_Master_Log_FileExec_Master_Log_Pos)です。これらが同一(Master_Log_file = Relay_Master_Log_FileRead_Master_Log_Pos = Exec_Master_Log_Pos)の場合、レプリカはプライマリから受信したイベントすべての処理を完了しています。

このコマンドの出力の詳細については、MySQL ドキュメントのレプリケーション ステータスの確認をご覧ください。

トラブルシューティング

表内のリンクをクリックすると、詳細が表示されます。

この問題については... 次のような問題が考えられます... 次のことを試します...
リードレプリカの作成時にレプリケーションが開始されなかった。 多くの根本原因が考えられます。 ログで詳細を確認します
リードレプリカを作成できない - invalidFlagValue エラー。 明示的に指定されたフラグか、デフォルトのフラグのいずれかが無効です。 フラグの値とログを調べて詳細を確認します
リードレプリカを作成できない - 不明なエラー。 多くの根本原因が考えられます。 ログで詳細を確認します
ディスクに空きがない。 レプリカの作成中にプライマリ インスタンスのディスクの空きがなくなる可能性があります。 プライマリ インスタンスをより大きなディスクサイズにアップグレードします
レプリカ インスタンスのメモリ使用量が多すぎる。 レプリカは、頻繁にリクエストされる読み取りオペレーションをキャッシュに保存できます。 レプリカ インスタンスを再起動して、一時メモリ領域を再利用します。
レプリケーションが停止しました。 保存容量の上限に達しましたが、保存容量の自動増加が有効になっていません。 ストレージの自動増量を有効にします
レプリケーション ラグが常に大きい。 多くの根本原因が考えられます。 こちらをご確認ください。

リードレプリカの作成時にレプリケーションが開始されなかった

リードレプリカの作成時にレプリケーションが開始されませんでした。

次のような問題が考えられます

ログファイルに、より具体的なエラーが表示される可能性があります。

次の方法をお試しください

Cloud Logging のログを調べて、実際のエラーを確認します。


リードレプリカを作成できない - invalidFlagValue エラー

リードレプリカを作成できません - invalidFlagValue

次のような問題が考えられます

リクエスト内のフラグのいずれかが無効です。これは、明示的に指定されたフラグか、デフォルト値に設定されたフラグである可能性があります。

次の方法をお試しください

まず、max_connections フラグの値がプライマリの値以上であることを確認します。

max_connections フラグが適切に設定されている場合、Cloud Logging のログを調べて、実際のエラーを確認します。


リードレプリカを作成できない - 不明なエラー

リードレプリカを作成できません - unknown error

次のような問題が考えられます

ログファイルに、より具体的なエラーが表示される可能性があります。

次の方法をお試しください

Cloud Logging のログを調べて、実際のエラーを確認します。

エラーが set Service Networking service account as servicenetworking.serviceAgent role on consumer project の場合は、Service Networking API を無効にしてから再度有効にします。これにより、プロセスの続行に必要なサービス アカウントが作成されます。


ディスクに空きがない

UPDATE_DISK_SIZE エラーまたは mysqld: disk is full エラー。

次のような問題が考えられます

レプリカの作成中にプライマリ インスタンスのディスクの空きがなくなる可能性があります。

次の方法をお試しください

プライマリ インスタンスを編集して、より大きなディスクサイズにアップグレードします。


レプリカ インスタンスのメモリ使用量が多すぎる

レプリカ インスタンスのメモリ使用量が多すぎます。

次のような問題が考えられます

レプリカは一時メモリを使用して頻繁にリクエストされる読み取りオペレーションをキャッシュするため、プライマリ インスタンスより多くのメモリを使用する可能性があります。

次の方法をお試しください

レプリカ インスタンスを再起動して、一時メモリ領域を再利用します。


レプリケーションが停止した

レプリケーションが停止しました。

次のような問題が考えられます

保存容量の上限(>automatic storage increase is disabled)に達しました。

次の方法をお試しください

インスタンスを編集して automatic storage increase を有効にします。


レプリケーション ラグが常に大きい

レプリケーション ラグが常に大きい。

次のような問題が考えられます

書き込みの負荷が大きすぎてレプリカで処理できません。レプリケーション ラグは、レプリカの SQL スレッドで IO スレッドに対応できない場合に発生します。クエリやワークロードによっては、特定のスキーマで一時的または永続的に高いレプリケーション ラグが発生することがあります。レプリケーション ラグの一般的な原因は次のとおりです。

  • レプリカのクエリが遅い。遅いクエリを見つけて修正します。
  • すべてのテーブルに一意キーまたは主キーが必要です。一意のキーまたは主キーのないテーブルを更新するたびに、レプリカでテーブル全体がスキャンされます。
  • DELETE ... WHERE field < 50000000 などのクエリでは、レプリカに膨大な数の更新が蓄積されるため、行ベースのレプリケーションでレプリケーション ラグが発生します。

次の方法をお試しください

考えられるソリューションは次のとおりです。

次のステップ