バックアップの概要

このドキュメントでは、Spanner のバックアップとバックアップスケジュールの概要について説明します。

Spanner では、データベースのフルバックアップをオンデマンドで作成できます。また、バックアップスケジュールを使用してフルバックアップまたは増分バックアップを作成することもできます。フルバックアップはデータベースのデータをすべて保存しますが、増分バックアップには前回のバックアップ以降に変更されたデータのみが含まれます。

オペレーターエラーやアプリケーションエラーが原因で論理データが破損した場合は、バックアップを復元できます。

バックアップは可用性が高く、暗号化され、作成後の最大 1 年間保持できます。バックアップを作成すると、そのバックアップは、ソースデータベースと同じインスタンス、リージョン、プロジェクトに配置されます。コンプライアンス上またはビジネス継続性の理由から、別のリージョンまたはプロジェクトのバックアップから復元する必要がある場合は、別のリージョンまたはプロジェクトのインスタンスにバックアップをコピーできます。

各バックアップには createTime と versionTime が関連付けられています。createTime は、Spanner がバックアップの作成を開始したタイムスタンプです。versionTime は、データベースの内容がバックアップにキャプチャされたときのタイムスタンプです。バックアップには、versionTime 時点でのデータベースの一貫性のあるビューが含まれています。

オンデマンドバックアップの場合、createTime と versionTime はデフォルトで同じです。必要に応じて、オンデマンドバックアップの作成時に、データベースのバージョン保持期間内にある古い versionTime を指定できます。

スケジュール設定されたバックアップの場合、versionTime はバックアップスケジュールの作成時に選択した時間です。Spanner は versionTime から 4 時間以内にバックアップの作成を開始するため、createTime はこの 4 時間の期間内に収まります。これは、Spanner がリクエストを受信したときにバックアップの作成を開始するオンデマンドバックアップとは異なります。

たとえば、頻度が 0 7 * * * UTC または毎日午前 7 時（UTC）のバックアップスケジュールを作成するとします。つまり、バックアップごとに、versionTime は UTC 午前 7 時に設定され、createTime は UTC 午前 7 時から午前 11 時までの 4 時間の期間内のタイムスタンプになります。

API を使用した createTime と versionTime の使用の詳細については、Backup API リファレンスをご覧ください。

主な機能

データの整合性: Spanner データベースのバックアップは、バックアップの versionTime でトランザクションと外部一貫性を備えています。
レプリケーション: バックアップはソースデータベースと同じインスタンスに存在し、同じ地理的な場所に複製されます。リージョンインスタンスの場合、バックアップは 3 つの読み取り / 書き込みゾーンのそれぞれに保存されます。デュアルリージョンインスタンスとマルチリージョンインスタンスの場合、バックアップは読み取り / 書き込みレプリカまたは読み取り専用レプリカが含まれるすべてのゾーンに保存されます。データベースのバックアップを別のリージョンまたはプロジェクトに保存する必要がある場合は、完了したバックアップをソースインスタンスから別のリージョンまたはプロジェクトにある宛先インスタンスにコピーできます。詳細については、バックアップをコピーするをご覧ください。
自動有効期限: すべてのバックアップには、バックアップが自動的に削除される日を定める、ユーザー指定の有効期限があります。期限切れのバックアップは、Spanner により非同期に削除されます。そのため、バックアップの期限が切れてから実際に削除されるまでには、時間差が生じることがあります。

バックアップの作成

バックアップを作成すると、そのバックアップは、ソースデータベースと同じインスタンス、リージョン、プロジェクトに配置されます。

バックアップには、バックアップの versionTime にあるデータベースの次の情報が含まれます。

フルバックアップにはすべてのデータが含まれます。増分バックアップには、前回のバックアップ以降に変更されたデータのみが含まれます。
スキーマ情報（テーブル名、フィールド、データタイプ、セカンダリインデックス、変更ストリーム、これらのエンティティ間の関係など）。
ALTER DATABASE SET OPTIONS コマンドで設定されたすべてのデータベースオプション。

Spanner バックアップには、次の情報が含まれません。

versionTime より後に行われたデータやスキーマの変更。
Identity and Access Management（IAM）ポリシー
変更ストリームデータレコード。変更ストリームスキーマは保存されますが、変更ストリームデータは、それが説明する変更とほぼ同時にストリーミングされ、使用されます。

バックアップの外部整合性を確保するために、Spanner によって、データベースのコンテンツが versionTime に固定されます。これにより、バックアップオペレーションの期間中は、ガベージコレクションシステムによって関連するデータ値が削除されることが回避されます。その後、インスタンス内のすべての読み取り / 書き込みゾーンと読み取り専用ゾーンで同時にデータのコピーが開始されます。ゾーンが一時的に使用不可になっている場合、そのゾーンがオンラインに戻るまでバックアップは完了しません。オペレーションが完了したら、すぐにバックアップを復元できます。マルチリージョンインスタンスの場合、すべてのリージョンのすべての読み取り / 書き込みゾーンと読み取り専用ゾーンは、バックアップが復元可能としてマークされる前にバックアップレプリカを完了する必要があります。

バックアップスケジュール

Spanner では、データベースのフルバックアップまたは増分バックアップをスケジュールできます。増分バックアップには、前回のバックアップ以降に変更されたデータのみが含まれますが、フルバックアップにはデータベースのコンテンツ全体が保存されます。Spanner がバックアップを作成するバックアップスケジュールのタイプ（フルバックアップまたは増分バックアップ）と頻度を指定できます。

フルバックアップスケジュールでは、12 時間以上ごとにバックアップを作成できます。増分バックアップスケジュールでは、4 時間以上ごとにバックアップを作成できます。

Spanner は、バックアップスケジュールを使用してデータベースの増分バックアップを提供します。増分バックアップはオンデマンドで作成できません。

バックアップの作成は、スケジュールされた時刻から 4 時間以内に開始されます。データベースごとに最大 4 つのバックアップスケジュールを設定できます。

増分バックアップ

増分バックアップは、フルバックアップ間のチェーンを形成します。増分バックアップスケジュールによって作成される最初のバックアップはフルバックアップです。チェーンで作成される連続バックアップは増分バックアップであり、チェーン内の前回のバックアップ以降に変更されたデータのみが含まれます。

Spanner では、最初のフルバックアップに加えて、チェーンごとに最大 13 個の増分バックアップを許可します。チェーンは、対応する incrementalBackupChainId 値で識別されます。チェーンが最大長に達すると、Spanner は最初のフルバックアップから新しいチェーンを作成します。

シナリオによっては、チェーンの最大長に達する前に Spanner が新しいチェーンを作成することがあります。シナリオの例を次に示します。

最も古いフルバックアップが 28 日以上前のものである。
チェーン内の最新のバックアップが削除されている。
増分バックアップスケジュールが変更されている。

増分バックアップの使用を決定する際に考慮すべき要素は次のとおりです。

暗号化: 増分バックアップは、データベースが顧客管理の暗号鍵（CMEK）で暗号化されている場合でも、Google-owned and Google-managed encryption keys を使用した暗号化のみをサポートします。
復元: 増分バックアップの復元には、同じデータを含むフルバックアップの復元よりも時間がかかる場合があります。
削除: チェーン内のバックアップを削除するか、期限切れになった場合、Spanner はチェーン内の新しいバックアップ（存在する場合）をサポートするためにバックアップを保持することがあります。増分バックアップを復元するために、Spanner はチェーン内の古いバックアップをすべて必要とします。期限切れまたは削除されたバックアップのデータを含む、バックアップチェーン内のすべてのデータを削除するには、チェーン内のすべてのバックアップを削除します。
保持: 各バックアップスケジュールには、スケジュールに関する情報を提供する次の用語があります。
- creation_interval: バックアップスケジュールに指定されたスケジュール頻度を表します。
- retention_duration: スケジュールによって作成されたバックアップの保持期間。特定のチェーンでは、チェーン内の新しいバックアップのサポートに必要な場合は、最も古いフルバックアップが元の有効期限をすぎても保持されます。フルバックアップの保持期間の合計は、次の値のうち最も小さい値になります。
  - retention_duration + 28 日
  - retention_duration + (creation_interval*14)
バックアップコピー: 増分バックアップをコピーすると、Spanner はコピーされたバックアップの復元に必要なチェーン内の古いバックアップもすべてコピーします。宛先インスタンスに、同じソースチェーンからコピーされた古いバックアップで終わるバックアップチェーンがすでに含まれている場合、Spanner は既存のバックアップの冗長なコピーを作成しません。代わりに、Spanner は増分バックアップと、宛先チェーンに存在しない古いバックアップのみをコピーし、これらのバックアップを既存のチェーンに追加します。Spanner では、使用した合計ストレージに基づいて課金されます。

たとえば、日次増分バックアップスケジュールを設定して、毎日最新のバックアップをコピーすると、宛先インスタンスはソースチェーンをミラーリングするバックアップチェーンを維持します。Spanner は、後続のコピーオペレーション中に、チェーン内で以前にコピーされたバックアップを複製しません。

Spanner は冗長なコピーを回避することを目的としていますが、まれに、以前にコピーされたバックアップが移行先インスタンスにすでに存在する場合でも、チェーン内の古いバックアップをすべてコピーする必要がある場合があります。

増分バックアップの作成の詳細については、バックアップスケジュールを作成、管理するをご覧ください。

デフォルトのバックアップスケジュール

新しい Spanner インスタンスを作成するときに、インスタンス内の新しいデータベースごとに Spanner がデフォルトのバックアップスケジュールを作成するように指定できます。デフォルトのバックアップスケジュールでは、24 時間ごとにフルバックアップが作成されます。これらのバックアップの保持期間は 7 日間です。デフォルトのバックアップスケジュールは、作成後に編集または削除できます。

新しいすべてのインスタンスでは、デフォルトのバックアップスケジュールが自動的に有効になります。インスタンスのデフォルトのバックアップスケジュールは、インスタンスの作成時、または後でインスタンスを編集するときに有効または無効にできます。

既存のインスタンスでデフォルトのバックアップスケジュールを有効にできます。ただし、デフォルトのバックアップスケジュールは、インスタンス内の既存のデータベースには適用されません。デフォルトのバックアップスケジュールは、インスタンス内の新しいデータベースにのみ適用されます。

デフォルトのバックアップスケジュールが有効になってバックアップの作成が開始されるまで、24 時間かかります。

インスタンスを削除する前に、インスタンス内のすべてのバックアップを削除する必要があります。テスト目的でインスタンスを作成して削除する場合は、24 時間以内に新しいインスタンスを削除して、バックアップを手動で削除しないようにできます。

デフォルトのバックアップスケジュールを有効または無効にする手順については、デフォルトのバックアップスケジュールのタイプを編集するをご覧ください。

フルバックアップと増分バックアップのストレージ費用

各 Spanner バックアップには、ストレージ消費量に関する情報を提供する次のフィールドがあります。

exclusiveSizeBytes: バックアップに必要なバイト数が表示されます。このサイズは、バックアップの課金対象となるサイズを表します。
freeableSizeBytes: バックアップを削除した場合に解放されるバイト数が表示されます。
oldestVersionTime: チェーン内の最も古いフルバックアップの versionTime が表示されます（そのバックアップが期限切れの場合でも）。このフィールドを使用して、保存されているデータを確認できます。

増分バックアップを使用すると、ストレージ費用を節約できます。増分バックアップは、チェーン内の前回のバックアップ以降の変更のみを保存する必要があるため、フルバックアップよりも exclusiveSizeBytes フィールドが大幅に小さくなる場合があります。チェーン内の各バックアップにこのフィールド値を追加すると、チェーン内のバックアップで使用された合計バイト数が反映されます。

増分バックアップは、復元のために同じチェーン内のすべての古いバックアップに依存します。つまり、新しい増分バックアップが存在する場合、チェーン内の古いバックアップのデータはシステムから削除できず、同じチェーン内の古いバックアップの freeableSizeBytes フィールドはゼロになります。

サイズが 100 GB で、毎日 10 GB ずつ増加するデータベースにフルバックアップスケジュールと増分バックアップスケジュールを作成したとします。次のテーブルに、これらのバックアップスケジュールで発生するストレージ費用を示します。

日	フルスケジュールバックアップのサイズ	増分スケジュールバックアップのサイズ
1	100 GB	100 GB
2	110 GB	10 GB
3	120 GB	10 GB
4	130 GB	10 GB
5	140 GB	10 GB

5 日間では、フルバックアップスケジュールで 600 GB のストレージが使用され、増分バックアップスケジュールで約 140 GB のストレージが使用されます。増分バックアップスケジュールの場合、フルバックアップのサイズは、そのバックアップまでのチェーン内のすべてのバックアップのサイズの合計となり、sizeBytes フィールドに反映されます。

バックアップのコピーの仕組み

Spanner を使用すると、Spanner データベースのバックアップをあるインスタンスから別のリージョンまたはプロジェクトの別のインスタンスにコピーして、データ保護とコンプライアンス機能を強化できます。

宛先またはソースの Google Cloud リージョンが停止している場合、バックアップをコピーすることはできません。リージョンが停止した場合にデータを保護するには、影響を受けるリージョン外の場所にバックアップを定期的にコピーする必要があります。

コピーされたバックアップには、元のバックアップと同じ主要機能が含まれます。また、コピーしたバックアップと同じインスタンスにコピーしたバックアップを復元して、クロスリージョンとクロスプロジェクトのバックアップと復元のユースケースをサポートできます。

Spanner バックアップが保存される場所

バックアップは Spanner のリソースです。各バックアップリソースは、リソース階層内のソースデータベースと同じインスタンスごとにまとめられ、次の形式のリソースパスを持ちます。

projects/PROJECT_ID/instances/INSTANCE_ID/backups/BACKUP_NAME

次のように置き換えます。

PROJECT_ID: プロジェクト ID。
INSTANCE_ID: インスタンス ID。
BACKUP_NAME: バックアップ名。

ソースデータベースが削除された後もバックアップは存在し続けますが、親インスタンスより長く存続することはできません。バックアップがある場合は、バックアップが誤って削除されないようにするために、Spanner インスタンスを削除できません。インスタンスを削除する場合は、バックアップとインスタンスを削除する前に、バックアップを復元し、復元したデータベースをエクスポートすることをおすすめします。

暗号化

Spanner バックアップ（データベースなど）は、Google-owned and Google-managed encryption keys または顧客管理の暗号鍵（CMEK）によって暗号化されます。バックアップには、デフォルトでデータベースと同じ暗号化構成が使用されますが、バックアップの作成時に別の暗号化構成を指定することで、この動作をオーバーライドできます。バックアップが CMEK 対応の場合は、バックアップの作成時に KMS 鍵のプライマリバージョンを使用して暗号化されます。バックアップを作成すると、KMS 鍵がローテーションされても、その鍵と鍵バージョンを変更することはできません。詳細については、CMEK 対応バックアップの作成をご覧ください。

コピーされたバックアップは、ソースバックアップ暗号化と同じ暗号化構成（Google-owned and Google-managed encryption keys または顧客管理の暗号鍵（CMEK））を使用します。この動作は、バックアップのコピー時に別の暗号化構成を指定することでオーバーライドできます。リージョン間でコピーするときに、コピーしたバックアップが CMEK で暗号化されるようにするには、宛先のリージョンに対応する Cloud KMS 鍵を指定します。

暗号化構成は、バックアップスケジュールの作成または変更時に指定できます。バックアップスケジュールで CMEK 鍵で暗号化されたバックアップを作成する場合は、鍵パスを指定する必要があります。

増分バックアップは、データベースが CMEK 鍵で暗号化されている場合でも、Google-owned and Google-managed encryption keysのみを使用した暗号化をサポートしています。

パフォーマンス

このセクションでは、Spanner で最適なバックアップパフォーマンスを実現する方法について説明します。

バックアップ時のパフォーマンス

バックアップを実行すると、Spanner はデータベースからバックアップストレージにデータを直接コピーするバックアップジョブを作成し、このジョブのサイズをデータベースのサイズに基づいて設定します。このバックアップジョブは、データベースのインスタンスに割り当てられた CPU リソースを使用しないため、インスタンスのパフォーマンスには影響しません。また、データベースのインスタンスのコンピューティング負荷はバックアップオペレーションの速度には影響しません。バックアップオペレーションの進行状況と完了を追跡するには、バックアップの進捗状況の表示をご覧ください。

通常、ほとんどのバックアップには 1～4 時間かかります。バックアップのサイズが大きい場合や、リソースの内部キューがある場合は、バックアップに時間を要する可能性があります。他の要素が変更されていない状態でバックアップの時間が通常よりかかる場合は、ゾーン内のバックアップタスクのスケジューリングが遅れている可能性があります。この処理には、最大で 30 分かかる場合があります。新しいバックアップオペレーションでも同じスケジューリングの遅れが発生する可能性があるため、バックアップのキャンセルと再起動はしないことをおすすめします。

バックアップのコピー時のパフォーマンス

バックアップのコピーにかかる時間は、ソースバックアップのサイズやコピーされたバックアップに選択された宛先のリージョンなどの要因によって異なります。通常、ほとんどのコピーは 1～4 時間で完了します。バックアップのサイズと宛先のリージョンによっては、コピーにもっと時間がかかることがあります。バックアップをコピーしても、ソースインスタンスやデータベースにパフォーマンス上の影響はありません。パフォーマンスに影響を及ぼすことなく、別のリージョンのインスタンスにソースバックアップの複数のコピーを同時に作成できます。

増分バックアップをコピーすると、コピーされたバックアップの復元に必要なチェーン内の古いバックアップもすべてコピーされます。パフォーマンスを向上させるため、Spanner はすべてのバックアップを順番にではなく同時にコピーします。また、Spanner は、可能であれば、同じチェーン内の古いバックアップのコピーを回避しようとします。詳細については、増分バックアップをご覧ください。

バックアップを削除する

増分バックアップを削除するときに、同じチェーンに新しい増分バックアップが存在する場合、ストレージが復元されないことがあります。新しい増分バックアップは、削除された増分バックアップとチェーン内の古いバックアップに存在するデータに依存します。Spanner はデータを保持し、新しい増分バックアップがすべて期限切れになった場合にのみストレージを解放します。freeableSizeBytes フィールドには、バックアップを削除した場合に回復できる保存容量が表示されます。

料金

料金は、単位時間あたりのバックアップで使用されるストレージの量に基づいて課金されます。バックアップオペレーションが完了すると課金が開始され、バックアップが削除されるまで継続されます。作成が完了したバックアップには、最低でも 24 時間分の料金が発生します。バックアップを作成し、完了後すぐに削除した場合でも、24 時間分の料金が請求されます。

バックアップのコピーには、元のバックアップと同じストレージ費用が適用されます。異なるリージョンを占有する 2 つのインスタンス間でコピーを作成すると、アウトバウンドデータ転送の費用が適用されます。

たとえば、ソースのマルチリージョンインスタンス構成 nam7 から宛先のマルチリージョンインスタンス構成 nam-eur-asia3 にデータベースをコピーする場合は、次の料金が適用されます。

us-central1 リージョンの重複は無料
ウィットネス us-central2 リージョンは無料
大陸間データ転送は 2 回適用: 新しい大陸（ヨーロッパとアジア）ごとに 1 回ずつ
同じ大陸内のリージョン間のデータ転送料金は us-east1 に 1 回適用
同じ大陸内のリージョン間のデータ転送料金はヨーロッパで 1 回適用

Spanner は、コピープロセスを最適化して、クロスリージョン転送の数を最小限に抑えます。これにより、データ転送のコストを最小限に抑えながら、高速なコピーバックアップを実現できます。

バックアップは保存され、料金は別途請求されます。バックアップストレージは、データベースストレージの請求やデータベースのストレージ制限には影響しません。詳細については、ストレージ使用率の指標もご覧ください。

バックアップコストの詳細については、Spanner の料金をご覧ください。

次のステップ

バックアップの作成でバックアップの作成について確認する。
バックアップの管理方法については、バックアップを管理をご覧ください。