デベロッパー

あらゆる場所に存在するデータを Cloud SQL for SQL Server からレプリケートする

2022年7月21日

https://storage.googleapis.com/gweb-cloudblog-publish/images/image14.max-2000x2000.jpg

Google Cloud Japan Team

※この投稿は米国時間 2022 年 7 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。

Cloud SQL for SQL Server に保存しているデータの最新コピーが必要ですか？Cloud SQL では、トランザクションレプリケーションと呼ばれる SQL Server の機能を使用して、Cloud SQL インスタンスから外部サブスクライバー（または別の Cloud SQL インスタンス）へのレプリケーションを設定できるようになりました。これにより、SQL Server データのコピーを継続的に別のインスタンスに作成する新たな方法が提供され、データ保護やデータ分析など、さまざまなシナリオで活用できます。このブログでは、他の Cloud SQL インスタンスのパブリッシャーとして機能する Cloud SQL for SQL Server インスタンスの設定方法についてご説明します。

設定に必要な準備

まず、2 つの Cloud SQL インスタンスを作成します。どちらのインスタンスもプライベート IP を有効にして、同じ VPC に配置します。パブリック IP が有効な Cloud SQL インスタンスは、静的送信 IP を持たないため、パブリッシャーとして機能する Cloud SQL インスタンスではプライベート IP を有効にする必要があります。トランザクションレプリケーションには、どのインスタンスをパブリッシャーとして、またはサブスクライバーとして使用できるかについて、エディションやバージョンに対するいくつかの制限があるため、それらの制限と適合性を確認してください。このブログでは、パブリッシャーとサブスクライバーの両方に SQL Server 2019 Standard インスタンスを使用します。

また、Compute Engine VM を作成し、そこで SQL Server Management Studio を実行して、両方のインスタンスに接続します。

まず、Cloud SQL インスタンスを作成します。この例では、us-central1 にパブリッシャーとなるインスタンス、us-west3 にサブスクライバーとなるインスタンスを、それぞれ 1 つずつ作成します。どちらのインスタンスもプライベート IP が有効になっていて、同じ VPC に接続されています。

また、パブリッシャーとサブスクライバーの両方に接続するために、SQL Server Management Studio（SSMS）を実行する Compute Engine VM も作成しました。この VM も、プライマリおよびセカンダリと同じ VPC に接続されています。このブログで説明されている手順に沿って、SSMS がインストールされた VM を作成し、Cloud SQL インスタンスに接続します。

データベースの作成とパブリケーションの設定

まず、パブリッシャーとして機能するインスタンスに新しいデータベースとテーブルを追加します。

読み込んでいます...

テーブルにデータを挿入します。

読み込んでいます...

これで、サブスクライバーにレプリケーションを開始するテーブルが作成されました。

レプリケーションの設定

トランザクションレプリケーションを設定する 10 の手順に従い、パブリッシャーとサブスクライバーを準備します。まず、この 10 の手順について説明します。次に、パブリッシャーとサブスクライバーを準備するために実行するストアドプロシージャの例を詳しく説明していきます。

パブリッシャーと同じインスタンスに配置されたディストリビューションデータベースを作成します。ディストリビューションデータベースには、メタデータ、データ、過去のトランザクションが格納されます。

パブリケーションに含めるすべてのデータベースでパブリケーションを有効にします。こうすることで、データベースのパブリッシュをサポートするのに必要な内部オブジェクトが作成されます。

各データベースに、パブリッシュに際しデータベースに加えられた変更を追跡するログリーダーエージェントを追加します。こうした変更は、トランザクションログファイルから読み取られます。

パブリケーションを作成します。

パブリケーションのスナップショットエージェントを作成します。このエージェントは、スキーマとデータを含むスナップショットファイルを生成します。

アーティクルを作成してパブリケーションに追加します。アーティクルとは、サブスクライバーにレプリケートする特定のオブジェクトのことです。

サブスクライバーデータベースをサブスクライバーに作成します。

パブリッシャーにサブスクリプション情報を追加します。

push サブスクリプションを同期するスケジュール設定されたエージェントジョブをパブリッシャーに追加します。

エージェントジョブを開始します。

実行するコマンドの詳細については、こちらでも説明しています。

1. 次のコマンドを実行して、ディストリビューションデータベースを設定します。

EXEC msdb.dbo.gcloudsql_transrepl_setup_distribution @login='sqlserver', @password='<password>'

2. 次のコマンドを実行することで、パブリケーション用の新しいテストデータベースを有効にします。

EXEC msdb.dbo.gcloudsql_transrepl_addpublication @db='to_publish', @publication='pub1

3. 次のコマンドを実行して、データベースのログリーダーエージェントを追加します。

EXEC msdb.dbo.gcloudsql_transrepl_addlogreader_agent @db='to_publish', @login='sqlserver', @password='<password>'

4. 次のコマンドを実行して、パブリケーションを作成します。

EXEC msdb.dbo.gcloudsql_transrepl_addpublication @db='to_publish', @publication='pub1'

5. パブリケーションのスナップショットエージェントを作成します。

EXEC msdb.dbo.gcloudsql_transrepl_addpublication_snapshot @db='to_publish', @publication='pub1', @login='sqlserver', @password='<password>'

6. パブリッシュする特定のアーティクルを追加します。この例では、1 つのアーティクル（INTERESTING_DATA というテーブル）のみをパブリッシュしていますが、追加のテーブル、関数、またはストアドプロシージャをレプリケートするよう指定できます。

読み込んでいます...

7. サブスクライバーにデータベースを作成します。Compute Engine VM 上で動作している SSMS 経由でパブリッシャーに接続し、Cloud SQL Auth Proxy を実行している場合は、指定したインスタンスをプロキシの起動時に切り替えるだけです。

このガイドでは、ソースデータベースは「to_publish」と呼ばれているため、サブスクライバーのデータベースを「published」と呼びます。

CREATE DATABASE published;

GO

8. パブリッシャーにサブスクリプション情報を追加します。

読み込んでいます...

9. push サブスクリプションを同期する新しいスケジュール設定されたエージェントジョブを追加します。

読み込んでいます...

10. パブリケーションスナップショットのエージェントジョブを開始します。

読み込んでいます...

これで、レプリケーションが設定されました。サブスクライバーインスタンスに接続すると、テーブルが作成され、テストテーブルのデータがコピーされていることが確認できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_1_0HoiIdw.max-700x700.jpg

パブリッシャーでテーブルに新しい行を挿入して、そのデータがレプリケートされていることも確認できます。

既存のパブリッシャーの設定にアーティクルを追加する

これで正常にパブリッシャーの設定が作成されましたが、レプリケーションの設定にテーブルなどのアーティクルを追加する必要があるかもしれません。以下の手順では、完全なデータベーススナップショットを生成することなく、アーティクルを追加する方法を説明しています。これは、とりわけ非常に大規模なデータベースの場合、とても便利です。

パブリケーション設定の allow_anonymous と immediate_sync のプロパティを「false」に変更します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image9_Ri7JKY4.max-400x400.jpg

https://storage.googleapis.com/gweb-cloudblog-publish/images/image16_1.max-600x600.jpg

この例で使用するいくつかのテーブルを作成します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image8_Gkm8MOU.max-500x500.jpg

パブリケーションを右クリックし、プロパティを選択します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image6_XvInZPi.max-500x500.jpg

パブリッシュするすべてのアーティクルの横のチェックボックスをオンにして、[OK] をクリックします。すべてのアーティクルを表示するには、「チェックボックスがオンのアーティクルのみ一覧に表示する」のチェックボックスをオフにする必要がある場合があります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image18_AM6C48X.max-700x700.jpg

新たにスナップショットエージェントを開始します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image7_b4T1EO4.max-500x500.jpg

以下のように、追加した 2 つのアーティクルについてのみ、新しいスナップショットが生成されているのが確認できるはずです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image2_Z0RIYbe.max-700x700.jpg

問題のトラブルシューティング

レプリケーションの設定中に、「レプリケートされる LOB データ（65754）の長さが、構成した最大長 65536 を超えています」というエラーが表示される場合があります。このエラーを解決するには、「max text repl」の設定を、上限なしを示す「-1」に調整します。Cloud SQL データベースフラグを使用すると簡単に調整できます。

このコマンドの例を以下に示します

gcloud sql instances patch [INSTANCE_NAME] \

--database-flags="max text repl size (b)"=-1

レプリケーションモニターは、レプリケーションに関する問題のトラブルシューティング、またはレプリケーションの進捗状況の全体像を確認するために活用できます。

パブリッシャーとしての Cloud SQL の設定例では、各ラッパーで Cloud SQL インスタンス IP アドレスを使用してレプリケーションを構成しました。これには、レプリケーションモニターがパブリッシャーを検出できないという副作用があります。これは使用されたホスト名と IP アドレスのマッピングをレプリケーションモニターが認識していないために起こります。

レプリケーションモニターを起動すると、[パブリケーション] タブが空で、[エージェント] タブにだけデータがあることがわかります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image12_qjf4Qnx.max-900x900.jpg

SSMS でこの問題を回避するには、構成マネージャーで、パブリッシャーの SQL Server ホスト名と、SSMS で接続に使用する IP アドレスの間に、別名を作成します。Windows で SQL 構成マネージャーが使用できない場合、SQL クライアント構成ユーティリティも利用できます。

cmd プロンプトを管理者として開きます。

C:\Windows\System32\cliconfg.exe または C:\Windows\SysWOW64\cliconfg.exe を開きます。

どちらを開くかは、クライアントが 64 ビット版か 32 ビット版かによって異なります。

[別名] タブ、[追加] の順にクリックします。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image5_hrR1EZE.max-700x700.jpg

[TCP/IP] を選択し、[ポートを動的に決定する] が選択されていないことを確認します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image15.max-700x700.jpg

[サーバー別名] フィールドには、以下の SQL から取得した実際のホストを入力します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image3_5VbyCrp.max-300x300.jpg

[サーバー名] フィールドには実際の IP を入力し、[OK] をクリックします。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image13_Lf5mHuw.max-700x700.jpg

https://storage.googleapis.com/gweb-cloudblog-publish/images/image11_8utUUEY.max-700x700.jpg

Cloud SQL プロキシを使用している場合、[サーバー名] は 127.0.0.1 を使用して別名を追加します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image4_Kk2RbbW.max-800x800.jpg

SSMS で、この新しい別名を使用して接続し、[レプリケーション] ノードを右クリックしてから、[レプリケーションモニターの起動] をクリックします。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image19.max-400x400.jpg

以下のように期待通りのパブリケーションが表示されるはずです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image17_WM3h8mu.max-800x800.jpg

まとめ

Cloud SQL for SQL Server から別の Cloud SQL インスタンスへのトランザクションレプリケーションの設定方法、より多くのアーティクルを含むようにパブリケーションを更新する方法、問題のトラブルシューティングを行うためのレプリケーションモニターの使用方法について説明しました。この構成は、プライマリインスタンスのコピーを別のリージョンまたは環境に保持する場合など、さまざまなシナリオで活用できます。このブログでは 2 つの Cloud SQL インスタンスを使用していますが、オンプレミスまたは Google Compute Engine 上で動作するインスタンスなど、外部インスタンスのパブリッシャーとして動作するように Cloud SQL を設定することもできます。Cloud SQL からのレプリケーションの詳細はこちらをご覧ください。ご利用をお待ちしています。

- プロダクトマネージャー Isabella Lubin
- データベースエンジニア Bryan Hamilton

投稿先