Spanner でマルチテナンシーを実装する

このドキュメントでは、Spanner でマルチテナンシーを実装するさまざまな方法について説明しています。また、データマネジメントパターンとテナントライフサイクル管理についても説明します。このドキュメントは、マルチテナントアプリケーションをリレーショナルデータベースとして Spanner に実装するデータベースアーキテクト、データアーキテクト、エンジニアを対象としています。このコンテキストを使用して、マルチテナントデータを保存するさまざまな方法を説明します。マルチテナントアプリケーションにアクセスするエンティティを示すため、記事を通して「テナント」、「顧客」、「組織」という用語を一貫して使用します。このページの例は、人事（HR）SaaS プロバイダが Google Cloudにマルチテナントアプリケーションを実装したものです。1 つの要件は、HR SaaS プロバイダの複数の顧客がマルチテナントアプリケーションにアクセスする必要があることです。このような顧客はテナントと呼ばれます。

マルチテナンシー

マルチテナンシーは、ソフトウェアアプリケーションの単一のインスタンス（またはいくつかのインスタンス）で複数のテナントまたはお客様にサービスを提供する場合に使用します。このソフトウェアパターンは、単一のテナントまたは顧客から、数百または数千にまでスケーリングできます。このアプローチはクラウドコンピューティングプラットフォームにとって重要で、基盤となるインフラストラクチャは複数の組織で共有されます。

マルチテナンシーは、データベースなどの共有コンピューティングリソースによるパーティショニングの 1 つの手法であると考えられます。アパートの住人に例えると、住人は水道管や電線などのインフラストラクチャを共有しますが、各住人はアパート内の専用のテナントスペースを持ちます。マルチテナンシーは、Software-as-a-Service（SaaS）アプリケーションの一部です。

Spanner は、リレーショナルデータベースモデルのメリットと非リレーショナルの水平方向のスケーラビリティを備えた、 Google Cloudの整合性のあるエンタープライズクラスの分散型フルマネージドデータベースです。Spanner では、スキーマとのリレーショナルセマンティクス、データ型の強制適用、強整合性、複数ステートメントの ACID トランザクション、ANSI 2011 SQL を実装する SQL クエリ言語を使用できます。 99.999% の可用性 SLA により、計画的なメンテナンスやリージョンの障害が発生した場合にゼロダウンタイムを実現します。また、高可用性とスケーラビリティにより、最新のマルチテナントアプリケーションもサポートします。

テナントデータマッピング基準

マルチテナントアプリケーションでは、各テナントのデータが基盤となる Spanner データベースの複数のアーキテクチャアプローチで分離されます。テナントのデータを Spanner にマッピングするために使用されるさまざまなアーキテクチャアプローチの概要を次に示します。

インスタンス: テナントは 1 つの Spanner インスタンスにのみ存在します。そのテナント用のデータベースは 1 つのみです。
データベース: テナントは、複数のデータベースを含む 1 つの Spanner インスタンスのデータベースに存在します。
テーブル: テナントはデータベース内の排他的なテーブルに存在し、複数のテナントを同じデータベースに配置できます。
行: テナントデータは、データベーステーブルの行です。これらのテーブルは他のテナントと共有されます。

上記の基準はデータマネジメントパターンと呼ばれています。詳細はマルチテナンシーのデータマネジメントパターンセクションをご覧ください。上記の説明は次の基準に基づいています。

データの分離: 複数のテナント間でのデータ分離の度合いは、マルチテナンシーの重要な考慮事項です。たとえば、データを物理的に分離する必要があるかどうか、テナントのデータごとに設定できる独立した ACL（アクセス制御リスト）があるかどうかなどです。分離は、他のカテゴリの条件に対する選択項目によって決まります。たとえば、特定の規制やコンプライアンスの要件が分離の度合いに影響する場合があります。
アジリティ: インスタンス、データベース、テーブル、または行の作成に関する、テナントのオンボーディングとオフボーディング作業の容易性を示します。
運用: 一般的なテナント固有のデータベースオペレーションと管理作業（定期的なメンテナンス、ロギング、バックアップ、障害復旧など）の実装の可用性または複雑性を示します。
スケーリング: 将来の成長に対応できるシームレスな拡張性を示します。各パターンの説明には、そのパターンでサポートできるテナント数が示されています。
パフォーマンス:
- リソース分離: 各テナントへの排他的なリソースの割り当て、ノイジーネイバー現象への対処、各テナントに対する予測可能な読み取りおよび書き込みパフォーマンスを行う機能。
- テナントあたりの最小リソース: テナントあたりの平均最小リソース量。これは、個々のテナントごとにこの金額以上を支払う必要があるという意味ではありません。すべてのテナント（N 個）に対して、少なくとも N 倍の金額を支払う必要があります。
- リソースの効率性: 他のテナントのアイドル状態のリソースを使用して、全体的な費用を節約できます。
- レイテンシの最適化のためのロケーションの選択: 各テナントに対して特定のレプリケーショントポロジを選択できるため、各テナントのデータは、テナントにとって最適なレイテンシを提供するロケーションに配置できます。
規制とコンプライアンス: リソースやメンテナンスオペレーションの完全な分離が必要となる、規制の厳しい業界や国の要件に対応する機能。たとえば、フランスの場合、データ保持要件として、個人識別情報はフランス国内にのみ物理的に保存される必要があります。金融業界では通常、顧客管理の暗号鍵（CMEK）が必要です。各テナントは独自の暗号鍵を使用する場合があります。

これらの基準に関連する各データマネジメントパターンについては、次のセクションで詳しく説明します。特定の一連のテナントに対してデータマネジメントパターンを選択する場合は、同じ基準を使用します。

マルチテナンシーのデータマネジメントパターン

以降のセクションでは、インスタンス、データベース、テーブル、行の 4 つの主要なデータマネジメントパターンについて説明します。

インスタンス

完全な分離を実現するため、インスタンスのデータマネジメントパターンでは、各テナントのデータを固有の Spanner インスタンスとデータベースに保存します。Spanner インスタンスには、1 つ以上のデータベースを含めることができます。このパターンでは、作成されるデータベースは 1 つのみです。前述の HR アプリケーションでは、顧客の組織ごとに異なる 1 つのデータベースを含む個別の Spanner インスタンスが作成されます。

次の図でわかるように、データマネジメントパターンではインスタンスごとに 1 つのテナントが対応しています。

インスタンスのデータマネジメントパターンでは、インスタンスごとに 1 つのテナントを保管します。

テナントごとに個別のインスタンスを用意するため、別々のGoogle Cloud プロジェクトを使用してテナントごとに異なる信頼境界を確立できます。また、各テナントのロケーション（リージョンまたはマルチリージョン）、ロケーションの柔軟性の最適化、パフォーマンスに基づいてインスタンス構成が選択できるというメリットがあります。

このアーキテクチャは、任意の数のテナントにスケーリングできます。SaaS プロバイダは、所定のリージョン内に任意の数のインスタンスを作成し、ハードリミットを設定できます。

次の表に、インスタンスのデータマネジメントパターンがさまざまな基準にどのように影響するかを示します。

条件	インスタンス - インスタンスのデータマネジメントパターンごとに 1 つのテナント
データの分離	データ分離の最高レベルデータストレージが物理的に分離されている ACL はインスタンスごとに個別に付与されます
アジリティ	オンボーディングとオフボーディングには次のセットアップまたはデコミッションが必要です。 Spanner インスタンスインスタンス固有のセキュリティインスタンス固有の接続オンボーディングとオフボーディングは Infrastructure as Code（IaC）によって自動化できます。
オペレーション	テナントごとの独立したバックアップ分離された柔軟なバックアップスケジュール運用上のオーバーヘッドが高い管理および維持のための多数のインスタンス（スケーリング、モニタリング、ロギング、パフォーマンス調整）
規模	スケーラビリティの高いデータベースノードの追加による無制限の拡張テナントの数に制限はありません各テナントで使用可能な Spanner インスタンス
パフォーマンス	リソースの分離: リソース競合なしテナントあたりの最小リソース: 大規模なインスタンスを使用する場合、テナントあたりの最小リソースは 1 ノードです。詳細なインスタンスを使用する場合は、100 PU（10 分の 1 ノード）です。リソースの効率性: 他のテナントのアイドル状態のリソースを使用できません。レイテンシの最適化のためのロケーションの選択: 各テナントを個別のインスタンスに配置し、各テナントのレプリケーショントポロジをカスタマイズします。
規制要件とコンプライアンス要件	特定のリージョンにデータを保存する企業や政府が求める特定のセキュリティ、バックアップ、監査プロセスを実装する

要約すると、重要なポイントは次のとおりです。

アドバンテージ: 最高レベルの分離ができる
デメリット: 運用上のオーバーヘッドが最も大きく、テナントあたり 100 PU の最小要件によりコストが高くなる可能性があります。テナント間でのリソースの共有はサポートされていません。

インスタンスのデータマネジメントパターンは、次のシナリオに最適です。

異なるテナントが幅広いリージョンに分散しており、ローカライズされたソリューションが必要です。
一部のテナントでは、規制やコンプライアンス要件により、非常に高度なセキュリティプロトコルと監査プロトコルが求められます。
テナントのサイズは大きく異なります。大容量でトラフィックの多いテナント間でリソースを共有すると、競合や相互の機能低下が発生する可能性があります。

データベース

データベースのデータマネジメントパターンでは、各テナントは 1 つの Spanner インスタンスのデータベースの中に存在します。1 つのインスタンスに対して複数のデータベースを作成できます。テナント数に対してインスタンスが 1 つでは不十分な場合、複数のインスタンスを作成します。このパターンは、1 つの Spanner インスタンスが複数のテナントにより共有されることを意味します。

Spanner には、インスタンスあたり 100 データベースというハードリミットがあります。この上限により、SaaS プロバイダが 100 人を超えるユーザーにスケーリングする場合、プロバイダは複数の Spanner インスタンスを作成して使用する必要があります。

HR アプリケーションの場合、SaaS プロバイダは各テナントの作成および管理を、Spanner インスタンスの個別のデータベースで行います。

次の図に示すように、データマネジメントパターンではデータベースごとに 1 つのテナントがあります。

データベースのデータマネジメントパターンでは、データベースごとに 1 つのテナントを保管します。

データベースのデータマネジメントパターンでは、異なるテナントデータでデータベースレベルでの論理分離を実現します。ただし、これは単一の Spanner インスタンスであるため、地域別パーティション分割機能が使用されていない限り、すべてのテナントデータベースが同じレプリケーショントポロジと、同一の基盤となるコンピューティングとストレージの設定を共有します。Spanner の地域別パーティション分割機能を使用すると、異なるロケーションにインスタンスパーティションを作成し、同じインスタンス内の異なるデータベースに異なるインスタンスパーティションを使用できます。

次の表で、データベースのデータマネジメントパターンがさまざまな基準にどのように影響するかを示します。

条件	データベース - データベースのデータマネジメントパターンごとに 1 つのテナント
データの分離	データベースレベルでの完全な論理分離データストレージが物理的に分離されている ACL は、インスタンス内のすべてのデータベースに付与することも、各データベースに個別に付与することもできます。
アジリティ	データベースの作成または管理、および特定のセキュリティ管理を必要とするオンボーディングとオフボーディングの自動化は Infrastructure as Code（IaC）によって行われます。
オペレーション	テナントごとの独立したバックアップ分離された柔軟なバックアップスケジュールインスタンスパターンと比較して運用上のオーバーヘッドが少ない最大 100 個のデータベースをモニタリングする 1 つのインスタンス
規模	スケーラビリティの高いデータベースインスタンスあたりのデータベース数は 100 個を上限とする。100 テナントごとに新しい Spanner インスタンスを作成する。無制限のインスタンスインスタンスあたりのノード数に制限なし
パフォーマンス	リソースの分離: 複数のデータベース間の競合データベースが Spanner インスタンスノードに分散データベース共有インフラストラクチャパフォーマンスに影響を与えるノイジーネイバーテナントあたりの最小リソース: インスタンスあたりのデータベース数の上限が 100 個であるため、100 個のデータベース（または 100 個のテナント）の最小コンピューティング容量は 1 ノードです。きめ細かいインスタンスの場合でも、100 テナントあたりの最小コンピューティング容量は 1 ノードです。きめ細かい各インスタンスで使用できる処理ユニットは 100 個未満ですが、Spanner では 100 処理ユニットあたり 10 個のデータベースのみが許可されます。リソースの効率性: テナントは 1 つのインスタンスのリソースを共有します。テナントは、他のテナントのアイドル状態のリソースを使用できます。レイテンシの最適化のためのロケーションの選択: 地域別パーティション分割機能を使用していない場合、データベースのロケーションはインスタンス構成と同じです。各テナントのデータベースのロケーションはカスタマイズできません。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行配置キーを使用してデータを異なるロケーションに配置することもできます。地域別パーティション分割を使用すると、各テナントのレイテンシを最適化できます。
規制要件とコンプライアンス要件	地域別パーティション分割機能を使用していない場合、データベースのロケーションは、データ所在地の規制要件を満たすようにインスタンス構成と同じになります。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行単位の配置キーを使用してデータを異なるロケーションに配置することもできます。各データベースは、データの暗号化に独自の CMEK を使用できます。

要約すると、重要なポイントは次のとおりです。

利点: 中程度のデータ分離とリソース分離、中程度のリソース効率性。各テナントは独自のバックアップと CMEK を設定できます。
デメリット: インスタンスあたりのテナント数に限りがある、地域別パーティション分割機能を使用しない限り、ロケーションの柔軟性に欠ける。

データベースのデータマネジメントパターンは、次のシナリオに最適です。

複数のお客様が同一のデータ所在地内に所在しているか、同じ規制機関に属している場合。
テナントは、システムベースのデータ分離とデータのバックアップと復元の機能を必要としますが、インフラストラクチャのリソース共有に適しています。
テナントには独自の CMEK が必要です。
費用は重要な考慮事項です。テナントごとに必要な最小リソースは、インスタンスの費用よりも少なくなります。テナントは、他のテナントのアイドル状態のリソースを使用することをおすすめします。

テーブル

テーブルのデータマネジメントパターンでは、単一のスキーマを実装する単一のデータベースが複数のテナントに使用され、各テナントのデータに別々のテーブルが使用されます。これらのテーブルを区別するには、テーブル名に tenant ID を接頭辞、接尾辞、または名前付きスキーマとして含めます。

テナントごとに個別のテーブルを使用するデータマネジメントパターンは、前述のオプション（インスタンスとデータベース管理パターン）と比較してはるかに低い分離レベルになります。オンボーディングでは、新しいテーブルおよび関連する参照完全性とインデックスの作成が関係してきます。

データベースあたりのテーブル数には 5,000 という上限があります。一部のお客様は、この制限によってアプリケーションの利用が制限される可能性があります。

さらに、顧客ごとに個別のテーブルを使用すると、スキーマ更新オペレーションのバックログが大きくなる可能性があります。このようなバックログは解決に時間がかかります。

HR アプリケーションの場合、SaaS プロバイダは顧客ごとに一連のテーブルを作成します。その際、テーブル名の接頭辞として tenant ID を使用します。たとえば customer1_employee、customer1_payroll、customer1_department のように指定します。または、テナント ID を名前付きスキーマとして使用し、テーブルに customer1.employee、customer1.payroll、customer1.department という名前を付けることもできます。

次の図に示すように、テーブルのデータマネジメントパターンには、テナントごとに一連のテーブルが 1 つあります。

テーブルのデータマネジメントパターンには、テナントごとに一連のテーブルが 1 つあります。

次の表で、テーブルのデータマネジメントパターンがさまざまな基準にどのように影響するかを示します。

条件	テーブル - テナントのデータマネジメントパターンごとに一連のテーブルが 1 つ
データの分離	中程度のデータ分離。データは論理的には分離されていますが、永続ストレージ上の同じファイルに物理的に保存できます。 ACL はデフォルトで共有されますが、きめ細かいアクセス制御（FGAC）を使用して個別に付与することもできます。
アジリティ	新しいテーブル、関連するインデックス、FGAC で作成されたセキュリティ管理の作成または削除に手間がかかります。顧客のオフボーディングはテーブルの削除を意味するデータベース内の他のテナントに対し、一時的にパフォーマンスに悪影響がある可能性がある
オペレーション	テナントの個別のオペレーションなしバックアップ、モニタリング、ロギングは、個別のアプリケーション関数またはユーティリティスクリプトとして実装する必要がある
規模	1 つのデータベースに含めることができるテーブル数は 5,000 まで各データベースのテナントの 5,000 / <テナントのテーブル数> のみデータベースが 5,000 テーブルを超える場合は、追加テナント用に新しいデータベースを追加
パフォーマンス	リソースの分離: 基盤となる共有インフラストラクチャリソース。高いレベルのリソース競合が可能。パフォーマンスに影響を与えるノイジーネイバー。テナントあたりの最小リソース: インスタンスあたりのデータベース数の上限は 100、データベースあたりのテーブル数の上限は 500,000 であるため、テナントあたりの必要な最小コンピューティング容量は 1 ノードです。リソースの効率性: テナントは 1 つのインスタンスのリソースを共有します。各テナントは、他のテナントのアイドル状態のリソースを使用できます。レイテンシの最適化のためのロケーションの選択: 地域別パーティション分割機能を使用していない場合、データベースのロケーションはインスタンス構成と同じです。各テナントのデータベースのロケーションはカスタマイズできません。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行配置キーを使用してデータを異なるロケーションに配置することもできます。地域別パーティション分割を使用すると、各テナントのレイテンシを最適化できます。
規制要件とコンプライアンス要件	地域別パーティション分割機能を使用していない場合、データベースのロケーションは、データ所在地の規制要件を満たすようにインスタンス構成と同じになります。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行単位の配置キーを使用してデータを異なるロケーションに配置することもできます。同じデータベース内の異なるテーブルは、各リージョンのデータ暗号化に同じ CMEK を使用する必要があります。

要約すると、重要なポイントは次のとおりです。

利点: 中程度の拡張性とリソース効率。
デメリット:
- 中程度のデータ分離とリソース分離。
- 新しい地域別パーティション分割機能を使用しない限り、ロケーションの柔軟性に欠ける。
- テナントを個別にモニタリングできない。テーブルレベルで利用可能なリソース使用量情報は、テーブルサイズの統計情報のみです。
- テナントは独自の CMEK とバックアップを設定できません。

テーブルのデータマネジメントパターンは、次のシナリオに最適です。

データの分離が法的には義務付けられていないものの、論理的な分離とセキュリティ制御が必要なマルチテナントアプリケーション。
費用は重要な考慮事項です。テナントあたりの最小費用は、データベースあたりの費用よりも低くなります。

行

最終的なデータマネジメントパターンでは、共通のテナントセットを持つ複数のテナントにサービスを提供します。各行は特定のテナントに属します。データマネジメントパターンはマルチテナントの究極の姿であり、インフラストラクチャからスキーマ、データモデルまで、すべてが複数のテナント間で共有されます。テーブル内では、主キーに基づいて行が分割され、tenant ID がキーの最初の要素となります。スケーリングの観点から Spanner はこのパターンを最大限にサポートしています。これは、テーブルを無限にスケーリングできるためです。

HR アプリケーションの場合、給与支払テーブルの主キーは customerID と payrollID の組み合わせになります。

次の図に示すように、行のデータマネジメントパターンには複数のテナント用にテーブルが 1 つあります。

テーブルのデータマネジメントパターンでは、複数のテナントに 1 つのテーブルを使用します。

他のすべてのパターンとは異なり、行パターンのデータアクセスをテナントごとに個別に制御することはできません。各テナントが固有のデータベーステーブルを持っている場合、テーブル数を減らすことでスキーマ更新オペレーションを高速化できます。この方法により、オンボーディング、オフボーディング、オペレーションが簡素化されます。

次の表で、行のデータマネジメントパターンがさまざまな基準にどのように影響するかを示します。

条件	行 - テナントのデータマネジメントパターンごとに一連の行が 1 つ
データの分離	データ分離レベルが最も低いテナントレベルのセキュリティなし
アジリティ	オンボーディング時にデータベース側での設定は不要アプリケーションによる既存のテーブルへのデータの直接書き込みが可能オフボーディングはテーブル内の顧客の行を削除することを意味する
オペレーション	バックアップ、モニタリング、ロギングなどのテナントごとの個別のオペレーションはないテナント数の増加に対するオーバーヘッドはほとんど、またはまったくない
規模	あらゆるレベルのテナントの増加に対応可能テナントの数を無制限にサポート
パフォーマンス	リソースの分離: データベースパターンで発生するリソース分離の問題はすべて、このパターンにも適用されます。主キースペースを慎重に設計していない場合、高レベルのリソース競合が起こる可能性がある（ノイジーネイバー）同時実行と分散の防止が可能ベストプラクティスに従うことが重要テナントのデータを削除すると、負荷に一時的な影響が出る可能性があるテナントあたりの最小リソース: テナントあたりの最小リソースなしリソースの効率性: テナントは 1 つのインスタンスのリソースを共有します。各テナントは、他のテナントのアイドル状態のリソースを使用できます。レイテンシの最適化のためのロケーションの選択: 地域別パーティション分割機能を使用していない場合、データベースのロケーションはインスタンス構成と同じです。各テナントのデータベースのロケーションはカスタマイズできません。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行配置キーを使用してデータを異なるロケーションに配置することもできます。地域別パーティション分割を使用すると、各テナントのレイテンシを最適化できます。
規制要件とコンプライアンス要件	地域別パーティション分割機能を使用していない場合、データベースのロケーションは、データ所在地の規制要件を満たすようにインスタンス構成と同じになります。ただし、地域別パーティション分割機能を使用する場合は、異なるロケーションにインスタンスパーティションを作成できます。また、行単位の配置キーを使用してデータを異なるロケーションに配置することもできます。インスタンスまたはデータベースパターンに比べると、システムレベルのパーティショニングを提供できない。特定のセキュリティおよび監査の管理機能の実装がすべてのテナントに影響を与える。

要約すると、重要なポイントは次のとおりです。

メリット: 優れた拡張性、運用上のオーバーヘッドが少ない、スキーマ管理が簡素化されます。
デメリット: リソースの競合が多い、各テナントのセキュリティ制御とモニタリングの欠如。

このパターンは、次のようなシナリオに最適です。

メンテナンスの容易さに比べて、厳格なデータセキュリティ分離が問題にならないさまざまな部門に対応する内部アプリケーション。
リソースのプロビジョニングの最小化を同時に行う場合の、無料枠のアプリケーションを使用するテナント向けの最大リソース共有。

データマネジメントパターンとテナントライフサイクル管理

次の表は、すべての高いレベルの基準を満たすさまざまなデータマネジメントパターンの概要を示しています。

	インスタンス	データベース	テーブル	行
データの分離	完了	高	中	低
アジリティ	低	中	中	最高
運用のしやすさ	高	高	低	低
規模	高	制限あり（上限に達した場合に追加のインスタンスが使用されない限り）	制限あり（上限に達した場合に追加のデータベースを使用しない限り）	最高
パフォーマンス¹ - リソースの分離	高	低	低	低
パフォーマンス¹ - テナントあたりの最小リソース	高	中程度に高い	中	テナントあたりの最小数なし
パフォーマンス¹ - リソースの効率性	低	高	高	高
パフォーマンス¹ - レイテンシの最適化のためのロケーションの選択	高	中	中	中
規制とコンプライアンス	最高	高	中	低

¹ パフォーマンスはスキーマ設計とクエリのベストプラクティスに大きく依存します。この値は、あくまでも平均的な期待値です。

特定のマルチテナントアプリケーションに対する最適なデータマネジメントパターンは、基準に基づいてほとんどの要件を満たしているものです。不要な特定の基準がある場合はその行を無視できます。

統合されたデータマネジメントパターン

多くの場合、マルチテナントアプリケーションの要件を満たすには単一のデータマネジメントパターンで十分です。それが当てはまる場合、設計で単一のデータマネジメントパターンを想定できます。

無料枠、通常の階層、エンタープライズ層をサポートするマルチテナントアプリケーションなど、一部のマルチテナントアプリケーションでは同時に複数のデータマネジメントパターンが必要になります。

無料枠:
- 費用対効果を高める必要がある
- データ量の上限がある
- 通常は機能が限定される
- 無料枠での選択肢としては行のデータマネジメントパターンが適切
  - テナント管理は簡単
  - 特定のテナントリソースまたは排他的なテナントリソースを作成する必要がない
通常の階層:
- 費用を支払っている顧客で、スケーリングや分離に対する強い要件が特にない場合に適している。
- 通常の階層での選択肢としては、テーブルまたはデータベースのデータマネジメントパターンが適切。
  - テーブルとインデックスはテナント専用。
  - データベースのデータマネジメントパターンでのバックアップが容易
  - テーブルのデータマネジメントパターンではバックアップに対するサポートはなし
    - テナントバックアップは、Spanner の外部のユーティリティとして実装する必要がある。
エンタープライズ階層:
- 通常、すべての面で完全な自律性を持つ高級階層。
- テナントは、専用のスケーリングや完全分離などの専用リソースを保有。
- インスタンスのデータマネジメントパターンは、エンタープライズ層に適している。

ベストプラクティスは、データベースごとに異なるデータマネジメントパターンを維持することです。Spanner データベース内で異なるデータマネジメントパターンを組み合わせることは可能ですが、その場合、アプリケーションのアクセスロジックとライフサイクルオペレーションの実装が困難になります。

アプリケーション設計のセクションで、1 つのデータマネジメントパターンまたは複数のデータマネジメントパターンを使用する場合の、マルチテナントアプリケーション設計上の考慮事項について概説します。

テナントライフサイクルを管理する

テナントにはライフサイクルがあります。したがって、マルチテナントアプリケーションに対応する管理オペレーションを実装する必要があります。テナントの作成、更新、削除の基本的なオペレーションに加えて、次のようなデータ関連のオペレーションも検討してください。

テナントデータのエクスポート:
- テナントを削除する場合は、先にデータをエクスポートし、場合によりテナントがデータセットを使用できるようにすることをおすすめします。
- 行またはテーブルのデータマネジメントパターンを使用する場合、マルチテナントアプリケーションシステムはエクスポートを実装するか、データベース機能（データベースのエクスポート）にマッピングする必要があります。また、テナントに対応するデータの一部を取り出すカスタムロジックを実装する必要があります。
テナントデータのバックアップ:
- インスタンスまたはデータベースのデータマネジメントパターンを使用し、個々のテナントのデータのバックアップを行う場合は、データベースのエクスポート関数またはバックアップ関数を使用します。
- テーブルまたは行のデータマネジメントパターンを使用して個々のテナントデータをバックアップする場合、マルチテナントアプリケーションはこのオペレーションを実装する必要があります。Spanner データベースは、どのデータがどのテナントに属するものか特定できません。
テナントデータの移動:
- あるデータマネジメントパターンからテナントを移行する（またはインスタンスまたはデータベース間で同じデータマネジメントパターン内でテナントを移動する）には、1 つのデータマネジメントパターンからデータを抽出し、そのデータを新しいデータマネジメントパターンに挿入する必要があります。
  - アプリケーションのダウンタイムが発生する場合は、エクスポートまたはインポートを行います。
  - ダウンタイムを確保できない場合は、ダウンタイムゼロのデータベース移行を行います。
- ノイジーネイバーの状況の軽減が、テナントを移動するもう 1 つの理由です。

アプリケーション設計

マルチテナントアプリケーションを設計する際は、テナント認識型のビジネスロジックを実装します。つまり、アプリケーションがビジネスロジックを実行するのは、常に既知のテナントのコンテキスト内に限られることになります。

データベースの観点からみると、アプリケーションの設計とはテナントが存在するデータマネジメントパターンに対して各クエリを実行する必要があることを意味しています。以下のセクションでは、マルチテナントアプリケーション設計の中心となるいくつかのコンセプトについて説明します。

テナントの動的接続とクエリ構成

テナントデータからテナントアプリケーションのリクエストへの動的マッピングには、マッピング構成が使用されます。

データベースまたはインスタンスのデータマネジメントパターンでは、接続文字列でテナントデータにアクセスできます。
テーブルのデータマネジメントパターンでは、正しいテーブル名を決定する必要があります。
行のデータマネジメントパターンでは、適切な述語を使用して特定のテナントのデータを取得します。

テナントは、4 つのデータマネジメントパターンのどれにでも配置できます。次のマッピング実装は、すべてのデータマネジメントパターンを同時に使用するマルチテナントアプリケーションの一般的な接続構成に対応するものです。あるテナントが 1 つのパターン内に存在する場合、一部のマルチテナントアプリケーションは、すべてのテナントに対して 1 つのデータマネジメントパターンを使用します。このケースは、次のマッピングで暗黙的にカバーされています。

テナントがビジネスロジック（従業員がテナント ID を使用してログインする場合など）を実行する場合、アプリケーションロジックでテナントのデータ管理パターン、特定のテナント ID のデータの場所、およびオプションでテーブルの命名規則（テーブルパターン用）を決定する必要があります。

このアプリケーションロジックでは、テナントからデータ管理パターンのマッピングを行う必要があります。次のコードサンプルでは、connection string はテナントデータが存在するデータベースを示しています。このサンプルでは、Spanner インスタンスとデータベースを識別します。データマネジメントパターンがインスタンスとデータベースの場合、次のコードを使用するだけで、アプリケーションは接続してクエリを実行します。

tenant id -> (data management pattern,
              database connection string)

テーブルと行のデータマネジメントパターンには追加の設計が必要です。

テーブルのデータマネジメントパターン

テーブルのデータマネジメントパターンの場合、同じデータベース内に複数のテナントがあります。各テナントには固有のテーブルがあります。テーブルは名前で区別されます。どのテーブルがどのテナントのものかを明確にします。

1 つの方法は、各テナントのテーブルをテナントの名前にちなんだ名前空間に配置し、テーブル名を namespace.name で完全修飾することです。たとえば、ID が 356 のテナントの T356 名前空間内に EMPLOYEE テーブルを配置すると、アプリケーションは T356.EMPLOYEE を使用してテーブルへのリクエストに対応できます。

もう 1 つの方法は、テーブル名にテナント ID を付加することです。たとえば、EMPLOYEE テーブルは、ID が 356 のテナントに対して T356_EMPLOYEE といいます。アプリケーションは、マッピングが返されたデータベースにクエリを送信するときに、各テーブルの先頭に tenant ID という接頭辞を付ける必要があります。

テナント ID の代わりに他のテキストを使用する場合は、テナント ID から名前付きスキーマ名前空間またはテーブル接頭辞へのマッピングを維持できます。

アプリケーションロジックを簡素化するために、1 レベルの間接化を導入できます。たとえば、アプリケーションで共通ライブラリを使用して、テナントからの呼び出しの名前空間またはテーブル接頭辞を自動的に接続できます。

行データマネジメントパターン

行のデータマネジメントパターンにも同様の設計が必要です。このパターンでは、スキーマが 1 つあります。テナントデータは行として保存されます。データへのアクセス権を適切に取得するには、各クエリに述語を追加して、適切なテナントを選択してください。

適切なテナントを見つける方法の 1 つは、各テーブルに TENANT という列を用意することです。データの分離を強化するには、この列の値を主キーの一部にする必要があります。列の値は tenant ID です。各クエリは、既存の WHERE 句に述語 AND TENANT = tenant ID を追加するか、述語 AND TENANT = tenant ID を含む WHERE 句を追加する必要があります。

データベースに接続して適切なクエリを作成するには、アプリケーションロジックでテナント ID を使用できる必要があります。パラメータとして渡すことも、スレッドコンテキストとして保存することもできます。

一部のライフサイクルオペレーションでは、テナントからデータマネジメントパターンへのマッピング構成を変更する必要があります。たとえば、データマネジメントパターン間でテナントを移動する場合は、データマネジメントパターンとデータベース接続文字列を更新する必要があります。テーブル接頭辞の更新が必要になることもあります。

クエリの生成とアトリビューション

マルチテナントアプリケーションの基本的な原則は、複数のテナントが単一のクラウドリソースを共有できることです。前述のデータマネジメントパターンは、単一のテナントが単一の Spanner インスタンスに割り当てられる場合を除き、このカテゴリに分類されます。

リソースの共有は、データの共有に限りません。モニタリングとロギングも共有されます。たとえば、テーブルのデータマネジメントパターンと行のデータマネジメントパターンでは、すべてのテナントに対するすべてのクエリが同じ監査ログに記録されます。

クエリがログに記録されると、クエリテキストを調べて、クエリの対象テナントを判別する必要があります。行のデータマネジメントパターンでは、述語を解析する必要があります。テーブルのデータマネジメントパターンでは、テーブル名の 1 つを解析する必要があります。

データベースまたはインスタンスのデータマネジメントパターンでは、クエリテキストにはテナント情報はありません。これらのパターンのテナント情報を取得するには、テナントからデータ管理パターンのマッピングテーブルにクエリを実行する必要があります。

クエリテキストを解析せずに特定のクエリのテナントを決定すると、ログとクエリを簡単に分析できるようになります。すべてのデータマネジメントパターンにわたってクエリのテナントを均一に識別する方法の一つとして、クエリテキストに tenant ID と（必要に応じて）label を含むコメントを追加する方法があります。

次のクエリは、TENANT 356 で識別されたテナントのすべての従業員データを選択するものです。SQL 構文の解析とプレディケートからのテナント ID の抽出を回避するため、コメントとしてテナント ID が追加されています。コメントにより、SQL 構文を解析することなく抽出が可能になります。

SELECT * FROM EMPLOYEE
  -- TENANT 356
  WHERE TENANT = 'T356';

または

SELECT * FROM T356_EMPLOYEE;
  -- TENANT 356

この設計では、テナントに関して実行するすべてのクエリは、データマネジメントパターンに関係なくそのテナントに関連付けられます。テナントが 1 つのデータ管理パターンから別のデータ管理パターンに移動された場合、クエリテキストが変更されることがありますが、クエリテキスト内のアトリビューションは同じままです。

上記のコードサンプルはメソッドの 1 つにすぎません。もう 1 つの方法は、ラベルと値の代わりに JSON オブジェクトをコメントとして挿入することです。

SELECT * FROM T356_EMPLOYEE;
  -- {"TENANT": 356}

タグを使用してクエリをテナントに関連付け、組み込みの spanner_sys テーブルの統計情報を表示することもできます。

テナントアクセスライフサイクルのオペレーション

設計の考え方に応じて、マルチテナントアプリケーションは、前述のデータライフサイクルオペレーションを直接実装することも、別のテナント管理ツールを作成することもできます。

実装戦略に関係なく、ライフサイクルオペレーションはアプリケーションロジックを実行していないときに実行する必要があります。たとえば、テナントのデータマネジメントパターンを別のデータマネジメントパターンに移行している間は、データが単一のデータベースに存在しないため、アプリケーションロジックは実行できません。データが単一のデータベース内にない場合、アプリケーションの観点から、次の 2 つの操作が必要になります。

テナントの停止: アプリケーションロジックによるすべてのアクセスが無効になります。データライフサイクルのオペレーションは可能です。
テナントの開始:アプリケーションロジックによるテナントデータへのアクセスが可能です。アプリケーションロジックに干渉するライフサイクルオペレーションは無効になります。

頻繁には使用されないものの、テナントの緊急シャットダウンが重要なライフサイクルオペレーションとなることがあります。違反が疑われる場合で、アプリケーションロジックだけでなくライフサイクルオペレーションも含めたテナントのデータに対するすべてのアクセスの禁止が必要な場合は、このシャットダウンを使用します。違反はデータベースの内部または外部で発生する可能性があります。

緊急状態を削除するライフサイクルオペレーションも必要です。このようなオペレーションでは、相互制御を実装するために、複数の管理者による同時ログインを必須とするように設定することも可能です。

アプリケーションの分離

さまざまなデータマネジメントパターンによって、テナントデータの分離の度合いが異なります。分離レベル（インスタンス）から最小分離レベル（行）まで、さまざまな分離が可能です。

マルチテナントアプリケーションのコンテキストでは、類似したデプロイメント決定を行う必要があります。つまり、すべてのテナントが同じアプリケーションデプロイメントを使用して、（同じデータ管理パターンで）データにアクセスできるかどうか、が大事です。たとえば、1 つの Kubernetes クラスタがすべてのテナントをサポートしている場合、1 つのテナントがデータにアクセスすると同クラスタがビジネスロジックを実行します。

または、データマネジメントパターンの場合であれば、アプリケーションのデプロイごとに異なるテナントが転送される場合があります。大規模なテナントはそれ専用のアプリケーションデプロイメントにアクセスできますが、小規模または無料枠のテナントはアプリケーションデプロイメントを共有します。

このドキュメントで説明するデータマネジメントパターンを同等のアプリケーションのデータマネジメントパターンと完全に一致させるのではなく、すべてのテナントが単一のアプリケーションデプロイメントを共有できるよう、データベースのデータマネジメントパターンを使用できます。これらのすべてのテナントは、データベースのデータマネジメントパターンを持ち、1 つのアプリケーションデプロイメントを共有することが可能です。

マルチテナンシーは、特にリソースの効率性が重要な役割を果たす場合に、重要なアプリケーション設計データマネジメントパターンです。Spanner は、複数のデータマネジメントパターンをサポートしています。マルチテナントアプリケーションの実装にご利用ください。 99.999% の可用性 SLA により、計画的なメンテナンスやリージョンの障害が発生した場合にゼロダウンタイムを実現します。また、高可用性とスケーラビリティにより、最新のマルチテナントアプリケーションもサポートします。

Spanner でマルチテナンシーを実装する

マルチテナンシー

テナントデータ マッピング基準

マルチテナンシーのデータ マネジメント パターン

インスタンス

データベース

テーブル

行

データ マネジメント パターンとテナント ライフサイクル管理

統合されたデータ マネジメント パターン

テナント ライフサイクルを管理する

アプリケーション設計

テナントの動的接続とクエリ構成

テーブルのデータ マネジメント パターン

行データ マネジメント パターン

クエリの生成とアトリビューション

テナント アクセス ライフサイクルのオペレーション

アプリケーションの分離

テナントデータマッピング基準

マルチテナンシーのデータマネジメントパターン

データマネジメントパターンとテナントライフサイクル管理

統合されたデータマネジメントパターン

テナントライフサイクルを管理する

テーブルのデータマネジメントパターン

行データマネジメントパターン

テナントアクセスライフサイクルのオペレーション