このページは Cloud Translation API によって翻訳されました。

データベースの移行: コンセプトと原則（パート 2）

Last reviewed 2025-04-29 UTC

このドキュメントでは、障害シナリオを含むデータベース移行プロセスの設定と実行について説明します。このドキュメントは 2 部構成の後半です。パート 1 では、オンプレミスまたは他のクラウド環境から Google Cloud にデータベースを移行する必要があるクラウドアーキテクトを対象に、ダウンタイムがほぼゼロのデータベース移行のコンセプト、原則、用語について説明しています。 Google Cloud

データベース移行の設定

このセクションでは、データベース移行のフェーズについて説明します。まず、移行の設定を行います。移行が完了し、クライアントをターゲットデータベースに切り替えたら、ソースデータベースを削除します。必要であれば、移行による問題が切り替え後に発生した場合に備えてフォールバックプランを実装します。フォールバックはビジネスの継続性の確保に役立ちます。

移行中は、導入されるスキーマやデータの変更に特に注意する必要があります。これらの変更による影響については、このドキュメントの後半にある移行時の動的な変更をご覧ください。

ターゲットスキーマの仕様

ターゲットデータベースシステムごとにスキーマを定義し、作成する必要があります。同種のデータベースを移行する場合は、ソースデータベースのスキーマをターゲットデータベースにエクスポートして、ターゲットデータベースのスキーマを作成することで、仕様をより短い時間で作成できます。

スキーマ名の付け方は重要です。たとえば、ソースとターゲットで同じスキーマ名を使用することが考えられます。これによりクライアントの切り替えは簡単になりますが、データを比較する場合など、ツールがソースデータベーススキーマとターゲットデータベーススキーマに同時に接続すると、ユーザー側で混乱の生じることがあります。構成ファイルでスキーマ名を抽象化し、ターゲットデータベーススキーマにソースと異なる名前を付けると、スキーマを区別しやすくなります。

異種のデータベースに移行する場合は、ターゲットデータベースごとにスキーマを作成する必要があります。このエンジニアリングプロセスでは、同じ操作を何回か繰り返すことが必要になる場合があります。たとえば、移行を実施する前に、移行プロセスやデータの変更に合わせてスキーマをさらに変更することが必要になる場合があります。

移行をテストして実行するときは、多くの場合、ターゲットデータベースを複数回作成するため、スキーマの作成プロセスも繰り返すことが必要になります（インストールスクリプトで行うのが理想的です）。コード管理システムを使用すると、スクリプトのバージョンを管理して整合性を維持できます。また、スクリプトの変更履歴にアクセスすることもできます。

クエリの移行と実行のセマンティクス

最終的には、クライアントをソースデータベースシステムからターゲットデータベースシステムに切り替える必要があります。同種のデータベースを統合する場合、スキーマが変更されなければ、クエリも変更されません。クライアントはターゲットデータベースシステムでテストする必要がありますが、クエリに合わせてクライアントを変更する必要はありません。

一般に、異種のデータベースを移行する場合は、ソースデータベースとターゲットデータベースのスキーマが異なるため、クエリの変更が必要になります。ソースデータベースとターゲットデータベースでデータ型が一致していないこともあります。ソースデータベースシステムで使用できるクエリ言語のすべての機能が、ターゲットデータベースシステムで使用できるとは限りません。また、その逆もあり得ます。極端な場合、ソースデータベースシステムのクエリをターゲットシステムの複数のクエリに変換しなければならないこともあります。クエリ言語でできる処理がソースデータベースよりもターゲットデータベースのほうが多い場合は、ソースデータベースの複数のクエリをターゲットデータベースで 1 つにまとめることもあります。

クエリのセマンティクスが異なる場合もあります。たとえば、一部のデータベースシステムでは、トランザクション内で発生した更新をトランザクション内ですぐに具体化されます。この場合、同じデータアイテムが読み取られると、更新された値が取得されます。また、直ちに更新を行わず、トランザクションが commit されるまで待機するシステムも存在します。ソースデータベースシステム上のロジックが、具体化される書き込みに依存している場合、ターゲットデータベース上の同じロジックによって、誤ったデータやエラーが発生する可能性があります。

クエリを移行する場合は、すべての機能をテストし、移行の前後でクライアントの動作が変わらないようにする必要があります。データレベルでのテストも可能ですが、これはクライアントレベルでのテストに代わるものではありません。クライアントはビジネスロジックの観点からクエリを実行するので、クライアントでのテストはビジネスロジックレベルで行う必要があります。

移行プロセス

異種のデータベースを移行する場合、ソースデータベースシステムから抽出されたデータを変更してターゲットデータベースに挿入する方法を移行プロセスで指定します。このドキュメントのデータの変更で説明するように、データアイテムをソースデータベースから抽出してターゲットデータベースに転送する前に、データの変更を定義して実行します。

同種のデータベースを移行する場合は、ソースデータベースとターゲットデータベースのスキーマが同等であれば、データの変更は不要です。データは、ソースデータベースから抽出された状態でターゲットデータベースに挿入されます。

データベース移行システムによっては、いくつかの構成が必要になる場合があります。たとえば、変更および転送するデータをデータベース移行システムに断続的に保存するかどうかを指定する必要があります。データを保存すると移行プロセス全体が遅くなる可能性がありますが、障害発生時に復旧にかかる時間は大幅に短縮されます。検証タイプの指定が必要になることもあります。たとえば、一部のデータベース移行システムでは、ソースシステムとターゲットシステムにクエリを送信し、クエリの実行時点までに移行されたデータセットが同等になるようにします。また、エラー処理で障害復旧時の動作を指定する必要があります。この要件は、使用しているデータベース移行システムによって異なります。

当然のことですが、データの移行は繰り返しテストする必要があります。確認済みのデータアイテムがすべて移行され、データ変更によるエラーがなく、十分なパフォーマンスとスループットが得られることを移行のテストで検証することが理想的です。これにより、時間内での移行が可能になります。

フォールバックプロセス

データベースの移行中、計画的なダウンタイムが発生しない限り、ソースデータベースは稼働を続けます。データベースの移行に失敗すると、最悪の場合、移行を中止してターゲットデータベースを初期状態にリセットする必要があります。エラーを解決したら、データベースの移行を再開できます。この障害と解決作業が稼働中のソースデータベースシステムに影響することはありません。

データベースの移行が完了して、クライアントをターゲットデータベースに切り替えた後に障害が発生すると、クライアントが障害と解決作業の影響を受け、正常に稼働できなくなることもあります。障害が迅速に解決され、クライアントのダウンタイムが短時間で済むこともありますが、最悪の場合、障害が解決されないか、解決に時間がかかるため、クライアントをソースデータベースに戻さなければならないこともあります。

クライアントをソースデータベースに戻す場合、ターゲットデータベースのすべてのデータ変更をソースデータベースに戻す必要があります。このプロセスは、完全な別のデータベース移行として設定し、実行できます。ただし、この時点でクライアントはターゲットデータベース上で動作しなくなっているため、大幅なダウンタイムが発生します。

この状況でクライアントのダウンタイムを回避するには、元のデータベースの移行が完了した直後に移行プロセスを開始する必要があります。ターゲットデータベースシステムに適用されたすべての変更は、ソースデータベースシステムに直ちに反映されます。このアプローチに従うと、ターゲットデータベースシステムとソースデータベースシステムの両方が常に同期されます。

ターゲットデータベースからソースデータベースへのフォールバックを準備するには相当な手間がかかります。そこで、フォールバックプロセスを導入してテストすべきかどうかを検討し、導入しない場合はその結果（重大なダウンタイム）について理解しておくことが重要です。

データベース移行の実行

データベースの移行には 5 つのフェーズがあります。このセクションでは、それぞれのフェーズについて詳しく説明します。6 つ目のフェーズとしてフォールバックがありますが、これは通常のデータベース移行の範囲外で、例外となります。

このセクションで説明するプロセスは、ダウンタイムがほぼゼロの異種データベース間で移行する場合のものです。大幅なダウンタイムが発生する可能性がある場合は、バックアップ / 復元またはエクスポート / インポートのアプローチを使用して、最初の 3 つのフェーズ（初期読み込み、移行の継続、ドレイン）を 1 つにまとめます。

同種のデータベース間での移行は特殊なケースです。このタイプの移行では、ソースデータベースシステムが稼働している状態で、データを移行するデータベース管理システムのレプリケーション機能を使用できます（この機能をシステムでサポートしている場合）。

ここでは、データベース移行プロセスの要件に応じて変更が必要になるアプローチについて説明します。

フェーズ 1: 初期読み込み

移行フェーズは、すべてのソースデータベースから移行対象に指定されたすべてのデータを移行することから始まります。データ移行の開始時は、ソースデータベースが特定の状態で、移行中にその状態が変化していきます。

変更と移行が同時に発生する場合は、最初のデータアイテムが抽出される直前のデータベースシステムの時間を記録しておきます。このタイムスタンプを使用することで、それ以降に発生したデータベースの変更をトランザクションログから取得することが可能になります。初期読み込みでは、すべてのデータを一貫した状態で読み取る必要があります。整合性のないデータセットの読み取りを防ぐため、データベースを短時間ロックする場合もあります。

このフェーズは次のプロセスから構成されます。

データベースの移行を開始する直前にデータベースのシステム時間を記録する。
初期読み込みを行い、移行が必要なソースデータベースからデータセット（完全または一部）をクエリで取得する。リレーショナルデータベースモデルでは、SELECT * などのクエリ、選択付きのクエリ、プロジェクションなどが初期読み込みで実行されます。移行プロセスでは、プロセスの指定に従ってデータを変更します。

通常、クライアントは初期読み込みの実行中にソースデータベースに変更を行います。開始前にデータベースシステムの時間を記録しているので、このような変更を後でトランザクションログから取得できます。

初期読み込みフェーズが完了すると、ソースデータベースシステムからターゲットデータベースシステムへの初期データセットの移行が完了します。ただし、移行中にクライアントがソースデータベースを変更する可能性があるため、ソースデータベースとターゲットデータベースの同期はまだ行いません。これらの変更はフェーズ 2 でキャプチャして移行します。

フェーズ 2: 移行の継続

移行の継続中に次の 2 つのことを行います。まず、初期読み込みの開始後にソースデータベースで発生した変更を読み取ります。その後、これらの変更をキャプチャしてターゲットデータベースに転送します。

このフェーズは次のプロセスから構成されます。

フェーズ 1 で記録したデータベースシステムの時間から移行プロセスを再開する。その時点からのトランザクションログを読み取り、すべての変更をターゲットデータベースシステムに適用します。
データを変更する。移行プロセスでは、指定に基づいてこのステップが行われます。

記録したデータベースシステムの時間の後にログに記録された変更が初期読み込みのフェーズで転送されていることがあります。その場合、こうした変更が移行の継続中に再度適用される可能性があるため、変更が 2 回適用されないように移行プロセスを定義する必要があります。たとえば、識別子を使用します。変更されたデータアイテムが初期読み込みで転送され、その挿入がトランザクションログに記録されたとします。データアイテムに識別子を適用することで、移行システムはデータアイテムがすでに存在し、挿入の必要がないことを認識できます。

移行フェーズが進んでいくと、ターゲットデータベースがソースデータベースと完全に同期された状態か、ほぼ同期された状態になります。ソースデータベースシステムでの変更が移行されていないデータベースは、ほぼ同期された状態になります。

データベース移行システムの構成方法によっては、この相違がわずかな場合もあれば、大きな場合もあります。たとえば、効率性を高めるには、すべての変更をすぐに移行する必要はありません。また、ソースに対する変更が急増すると、ソースに多大な負荷がかかることになります。通常、収集された変更は一括オペレーションでバッチとして移行されます。バッチが小さいと、ソースとターゲットの間で差異が少なくなりますが、変更が頻繁に行われた場合、ソースの負荷が大きくなる可能性があります。

バッチサイズが動的に構成されている場合は、移行フェーズの初期に大きなバッチを同期し、移行の進行状況に合わせてバッチのサイズを段階的に小さくしていくのが最適です。このアプローチにより、処理を効率的に行い、ソースデータベースとターゲットデータベースの差異を少なくすることができます。

フェーズ 3: ドレイン

クライアントをソースデータベースからターゲットデータベースに切り替える準備を行う前に、ソースデータベースとターゲットデータベースが完全に同期されている必要があります。ドレインは、残りの変更をソースデータベースからターゲットデータベースに移行するプロセスです。

このフェーズは次のプロセスから構成されます。

ソースデータベースシステムを静止状態にする。これは、ソースデータベースでデータの変更が発生せず、トランザクションログに追加の変更エントリが記録されない状態を意味します。
すべての変更がターゲットデータベースへの移行を待機している状態にする。このプロセスでは、実際に変更のドレインを行います。
ドレインが完了したら、今後の増分バックアップの開始点を定義するため、ターゲットデータベースをバックアップします。

ドレインフェーズでソースデータベースシステムとターゲットデータベースシステムが同期され、これ以上データの変更は発生しません。

ドレインを確実に完了させるため、最後に挿入されたデータアイテムをソースデータベースに書き込むこともできます。この最終挿入のデータアイテムが対応するターゲットデータベースに転送されると、ドレインフェーズが完了します。

フェーズ 4: 切り替え

ドレインフェーズが完了したら、クライアントをソースデータベースからターゲットデータベースに切り替えることができます。次のベストプラクティスをおすすめします。

本番環境のデータベースに対するアクセスを有効にする前に、クライアントが正常に動作し、意図したとおりに動作することを確認します。テストケースの数によって、本番環境のデータベースの実際のダウンタイムが変わります。
クライアントアクセスを有効にする前に、ターゲットデータベースをバックアップします。これにより、ターゲットデータベースの初期状態を確実に復元できます。

切り替えが完了すると、クライアントは完全に動作し、本番環境のデータベース（この時点までのターゲットデータベース）にアクセスを開始します。

フェーズ 5: ソースデータベースの削除

本番環境のデータベースへの切り替えが完了したら、ソースデータベースを削除できます。ソースデータベースの最終バックアップを作成して、アクセス可能な最終状態を明確にしておくことをおすすめします。データ規制で、コンプライアンス上の理由から最終バックアップの保管が義務付けられている場合もあります。

フェーズ 6: フォールバック

フォールバックの実装は、移行時に発生する問題に対する安全策となります（きわめて重要なデータベースクライアントの場合は、フォールバックの実装は欠かせません）。フォールバックは移行と似ていますが、プロセスは逆になります。つまり、フォールバックではターゲットデータベースからソースデータベースへの移行を設定します。異種データベースの移行では、フォールバックの処理が複雑になります。そのため、データベース移行プロセスとターゲットデータベースに接続されたアプリケーションがサービスレベル契約（SLA）を満たしていることを徹底的にテストした後にのみ、スイッチオーバーを行うことをおすすめします。

ソースデータベースをドレインしてすべてのデータベースをバックアップしたら、ターゲットデータベースの変更を識別し、切り替えを行う前に、これらの変更をソースデータベースに反映させます。

この移行プロセスを構築すると、クライアントがターゲットデータベースに変更を行った後に、ソースデータベースと同期し、データを最新の状態にすることができます。フォールバックは、切り替えの数日後または数週間後に必要になることがあります。たとえば、クライアントが初めて機能にアクセスしたときに、すぐに修正できない機能の不具合でアクセスがブロックされることがあります。この場合、ソースデータベースにアクセスするようにクライアントを切り替えることができます。クライアントを元に戻す前に、ターゲットデータベースで行われたすべての変更をソースデータベースにドレインする必要があります。

このアプローチでは、いくつかの点に注意する必要があります。

逆方向の移行（ターゲットデータベースからソースデータベース）が可能になるように、ターゲットスキーマを設計する必要があります。たとえば、最初の移行プロセス（ソースからターゲット）に結合や集計がある場合、逆方向の移行は簡単ではありません。このような場合は、個々のデータがターゲットデータベースでも使用可能な状態になっている必要があります。
ソースデータベースにトランザクションログがあっても、ターゲットデータベースではそのような機能が使用できない場合があります。その場合は、逆方向の移行（ターゲットからソース）では差分クエリを使用する必要があります。この設定は、ターゲットデータベースのスキーマに設計し、準備する必要があります。
フォールバックで有効にできるように、ソースデータベースで稼働していたクライアントを使用可能な状態にしておく必要があります。機能の同等性を維持するため、ターゲットデータベースにアクセスするクライアントに行った機能上の変更は、ソースデータベースにアクセスするクライアントにも行う必要があります。

フォールバックは最終手段ですが、フォールバックの実装は不可欠であり、テストを含む完全なデータベース移行として扱う必要があります。

移行時の動的な変更

一般に、スキーマとデータ値は変更される可能性があるため、データベースは動的なシステムです。データベーススキーマはビジネス要件などの要因によって変わる可能性があり、データ値はスキーマの変更とともに、または独立して変化します。データ値の変更は、アプリケーションの実装に対応する変更とともに、いつでも動的に発生する可能性があります。以下では、データベースの移行で考えられる変更とその影響について説明します。

スキーマの変更

データベースは、事前に定義されたスキーマを必要とするシステムと、スキーマに依存しないシステムまたはスキーマレスのシステムに分類できます。一般に、事前に定義されたスキーマを必要とするシステムはスキーマの変更に対応しています（たとえば、リレーショナルシステムでの属性や列の追加など）。

このようなシステムでは、チェンジマネジメントプロセスで変更を制御する必要があります。チェンジマネジメントプロセスを使用することで、制御された方法で変更を行うことができます。全体に一貫した変更を行うため、スキーマに依存するオペレーション（クエリやデータ移行プロセスなど）は同時に変更されます。

事前定義のスキーマを必要としないデータベースシステムはいつでも変更できます。スキーマの変更は、承認されたユーザーだけでなく、プログラムによって行うことが可能な場合もあります。その場合、スキーマの変更はいつでも発生する可能性があります。スキーマに依存するオペレーション（クエリやデータ移行プロセスなど）が失敗する可能性があります。これらのデータベースシステムで未承認のスキーマ変更を防ぐには、チェンジマネジメントプロセスをシステムとして導入するのではなく、遵守すべき承認ルールとして導入する必要があります。

データの変更

一般に、スキーマによってデータ属性に使用可能なデータ値が制御されます。スキーマレスシステムの場合、データ値に対する制約はありません。

いずれの場合も、これまで保存されていなかったデータ値が発生する可能性があります。たとえば、列挙型は多くのデータベースシステムで一連の文字列として実装されています。プログラミング言語レベルでは、これらを列挙型としてクライアントに実装できますが、これは必ずしも必須ではありません。あるクライアントで有効な列挙型とみなされる値が別のクライアントではそのように扱われない可能性もあります。また、データ移行プロセスでは、列挙型の値よりも機能が重要になることもあります。新しい値が発生した場合、データ移行プロセスが失敗する可能性があります。

別の例として、JSON 構造のストレージを見てみましょう。多くの場合、JSON 構造は文字列型に格納されますが、アクセス時には JSON 値として解釈されます。JSON 構造が変更されても、データベースシステムはその変更を検出しません。このため、文字列を JSON 値として解釈するデータ移行プロセスは失敗する可能性があります。

移行プロセスの変更

データベースの移行中にチェンジマネジメントを行うのは容易ではなく、複雑な作業になります。結果としてデータの移行に失敗する可能性があります。また、データに不整合が生じる可能性もあります。必要な変更は、ソースとターゲットのデータベースシステムを同期するドレインフェーズが完了するまで遅らせるのが最適です。この時点での変更は、ターゲットデータベースとそのクライアントに限定されます（ただし、フォールバックが実装されている場合は除きます）。

データの移行中に移行プロセスの変更が必要になった場合は、複雑な変更は行わず、最小限の変更にとどめることをおすすめします。また、ソースとターゲットのデータベースのテストインスタンスを使用して、これらの変更をテストすることもできます。テストソースに本番環境のデータを読み込んでテスト対象に移行するのが理想的です。このアプローチを使用すると、進行中の本番環境への移行に影響を与えることなく、変更を確認できます。変更をテストして検証したら、本番環境のシステムに変更を適用します。

進行中のデータ移行プロセスで変更を行う場合は、データ移行システムを停止して再起動する必要があります。また、変更後のデータ移行プロセスの実施が必要になる場合もあります。その場合、初期データの読み込みフェーズから始める必要はありません。データ移行システムがテスト移行の実施に対応している場合は、その機能を使用することもできます。

データの移行中は、スキーマ、データ値、データ移行プロセスを変更しないことをおすすめします。変更を行った場合、明確な開始状態を定義するため、データ移行を最初からやり直さなければならないこともあります。いずれにしても、本番環境のデータでテストを行い、変更を適用する前にデータベースのバックアップを作成することが最も重要です。これにより、必要に応じてシステム全体をリセットし、整合性の取れた状態に戻すことができます。

移行の失敗を回避するための対策

データベースの移行中に予期しない問題が発生することがあります。このような問題に対して事前に対策を行っておく必要があります。計画が必要な領域は次のとおりです。

スループットが十分でない。負荷テストを行っていても、移行テストで十分なスループットが得られないことがあります。この問題の原因としては、ソースデータベースの変更やネットワークスロットリングが想定を上回る速さで増加しているなど、さまざまな要因が考えられます。こうした状況に対応するには、関連するすべてのコンポーネントを動的にスケールアップまたはスケールアウトできるように追加のリソースを準備しておきます。
データベースが不安定。ソースまたはターゲットのデータベースが不安定になり、データ移行プロセスが遅くなることがあります。また、断続的にアクセスできなくなることもあります。データ移行プロセスの復旧が頻繁に必要になることもあります。この場合、HA または DR に意図的に切り替えることで問題が解決することがあります。切り替えにより、機能していない環境（マシンとストレージ）が切り替わり、問題が軽減される可能性があります。この場合、切り替えとデータベース移行の復旧プロセスをテストし、切り替えによってターゲットデータベースのデータに不整合が生じないようにする必要があります。
トランザクションログファイルのサイズ超過。上限のあるファイルにトランザクションログが保存されることがあります。この上限に達し、データベースの移行に失敗する可能性があります。リソースの制限に達したときに、データベースシステムのどの部分を動的に再構成できるのか把握しておく必要があります。動的に構成できない要素がある場合は、初期サイズを慎重に決める必要があります。

事前のテストを現実的で完全なものにするほど、潜在的な問題を事前に解決できる可能性が高くなります。

次のステップ

データベースの移行に関する次のリソースを確認する。
- PostgreSQL から Spanner への移行
- Oracle® OLTP システムから Spanner への移行
データベースの移行で、その他のデータベースへの移行方法を確認する。
Google Cloud に関するリファレンスアーキテクチャ、図、ベストプラクティスを確認する。Cloud アーキテクチャセンターをご覧ください。

データベースの移行: コンセプトと原則（パート 2）

データベース移行の設定

ターゲット スキーマの仕様

クエリの移行と実行のセマンティクス

移行プロセス

フォールバック プロセス

データベース移行の実行

フェーズ 1: 初期読み込み

フェーズ 2: 移行の継続

フェーズ 3: ドレイン

フェーズ 4: 切り替え

フェーズ 5: ソース データベースの削除

フェーズ 6: フォールバック

移行時の動的な変更

スキーマの変更

データの変更

移行プロセスの変更

移行の失敗を回避するための対策

次のステップ

ターゲットスキーマの仕様

フォールバックプロセス

フェーズ 5: ソースデータベースの削除