バージョン 1.6。このバージョンは、Anthos バージョンサポートポリシーに記載のとおり、サポートを終了しています。Anthos clusters on VMware (GKE on-prem) に影響するセキュリティの脆弱性、露出、問題に対する最新のパッチとアップデートを適用するには、サポート対象のバージョンにアップグレードしてください。最新バージョンはこちらで確認できます。

利用可能なバージョン

スケーラビリティ

このページでは、Kubernetes のスケーラビリティの上限に近づいているワークロードを調整するように、Anthos clusters on VMware（GKE On-Prem）を作成、構成、運用するためのおすすめの方法について説明します。

スケーラビリティの上限

Anthos clusters on VMware でアプリケーションを設計する際には、次の制限事項を考慮してください。

各管理クラスタは、高可用性（HA）クラスタと非 HA ユーザークラスタの両方を含め、最大 20 のユーザークラスタをサポートします。
各ユーザークラスタがサポートする最大数は次のとおりです。
- 250 個のノード
- 7,500 個の Pod
- バンドル型負荷分散モード（Seesaw）では 500 個の LoadBalancer Service、または統合型負荷分散モード（F5）では 250 個の LoadBalancer Service。
各ノードには、最大 110 個の Pod を作成できます（各 Pod は 1～2 個のコンテナで構成）。これには、アドオンシステムサービスで実行される Pod も含まれます。

上限について

Anthos clusters on VMware は大規模な統合サーフェスを備えた複雑なシステムであるため、クラスタのスケーラビリティには多くの関連ディメンションが含まれます。たとえば、Anthos clusters on VMware は、ノード、Pod、Service の数によってスケーリングできます。同時に複数のディメンションを拡張すると、たとえ小さなクラスタであっても問題を発生させる可能性があります。たとえば、ノード数 250 のクラスタで、ノードあたり 110 個の Pod のスケジュールを設定すると、Pod 数、ノードあたりの Pod 数、ノード数が過剰に増加する可能性があります。

詳細については、Kubernetes スケーラビリティのしきい値をご覧ください。

また、スケーラビリティの上限には、クラスタが実行されている vSphere の構成とハードウェアも影響します。これらの上限が検証された環境は、実際の環境とは異なる可能性が高いといえます。したがって、前提となる環境が制限要因となる場合、正確な数字を再現することはできません。

スケーリングに関する対策

スケーリングに関する対策を講じる際は、vSphere インフラストラクチャ、Kubernetes ネットワーキング、GKE Hub、Cloud Logging と Cloud Monitoring の要件と制限事項を考慮してください。

vSphere インフラストラクチャ

このセクションでは、CPU、メモリ、ストレージ、ディスク、ネットワークの I/O の要件とノード IP アドレスのスケーラビリティに関する検討事項について説明します。

CPU、メモリ、ストレージの要件

コントロールプレーン VM には、次の要件が適用されます。

管理クラスタのコントロールプレーンとアドオンノードでは、HA クラスタと非 HA ユーザークラスタの両方を含め、最大 20 個のユーザークラスタをサポートできます。したがって、管理クラスタでの調整は必要ありません。
デフォルトのユーザークラスタコントロールプレーンの VM 構成（4 CPU、8 GB メモリ、40 GB ストレージ）は、ユーザークラスタで最大 250 個のノードを実行するために必要な最小限の設定です。

各個別の VM については、CPU、RAM、ストレージの要件をご覧ください。

ディスク I/O とネットワーク I/O の要件

データ集約型のワークロードと特定のコントロールプレーンコンポーネントは、ディスクとネットワークの I/O レイテンシから影響を受けます。たとえば、数十個のノードと数千個の Pod を持つクラスタで etcd のパフォーマンスと安定性を確保するには、通常、500 シーケンシャル IOPS（標準的なローカル SSD や高パフォーマンスの仮想ブロックデバイスなど）が必要です。

ノード IP アドレス

各 Anthos clusters on VMware ノードには、DHCP または静的に割り当てられた IP アドレスが必要です。

たとえば、50 ノードの非 HA ユーザークラスタ 1 つと、250 ノードの HA ユーザークラスタ 1 つを設定するには、設定段階で 308 個の IP アドレスが必要です。それらの IP アドレスの内訳を、次の表に示します。

ノードタイプ	IP アドレスの数
管理クラスタのコントロールプレーン VM	1
管理クラスタのアドオンノード VM	3
ユーザークラスタ 1（非 HA）のコントロールプレーン VM	1
ユーザークラスタ 1 のノード VM	50
ユーザークラスタ 2（HA）のコントロールプレーン VM	3
ユーザークラスタ 2 のノード VM	250
合計	308

Kubernetes ネットワーキング

このセクションでは、Pod の CIDR ブロックと Kubernetes Service のスケーラビリティに関する検討事項について説明します。

Pod CIDR ブロック

Pod CIDR ブロックは、ユーザークラスタ内のすべての Pod の CIDR ブロックです。この範囲から、より小さい /24 ブロックが各ノードに割り当てられます。N 個のノードを持つクラスタが必要な場合は、N 個の /24 ブロックをサポートするうえで十分な大きさが、このブロックにあることを確認します。

次の表では、異なる Pod CIDR ブロックサイズごとにサポートされるノードの最大数を示します。

Pod CIDR ブロックサイズ	サポートされるノードの最大数
/19	32
/18	64
/17	128
/16	256

デフォルトの Pod CIDR ブロックは 192.168.0.0/16 です。これは 256 ノードをサポートします。デフォルトの Pod CIDR ブロックを使用すると、250 ノードを持つクラスタを作成できます。これは、Anthos clusters on VMware がユーザークラスタでサポートしているノードの最大数です。

Kubernetes Services

このセクションでは、Service CIDR ブロックとロードバランサのスケーラビリティに関する考慮事項について説明します。

Service CIDR ブロック

Service CIDR ブロックは、ユーザークラスタ内のすべての Service の CIDR ブロックです。このセクションで説明する Service は、LoadBalancer タイプの Kubernetes Service を指します。

次の表では、異なる Service CIDR ブロックサイズごとにサポートされる Service の最大数を示します。

Service CIDR ブロックサイズ	サポートされる Service の最大数
/20	4,096
/19	8,192
/18	16,384

デフォルト値は 10.96.0.0/12 で、1,048,576 Service がサポートされます。デフォルトの Service CIDR ブロックを使用すると、500 Service を持つクラスタを作成できます。これは、Anthos clusters on VMware がユーザークラスタでサポートしている Service の最大数です。

ロードバランサ

クラスタ内のノード数と、ロードバランサで構成できる Service の数には上限があります。

バンドル型負荷分散（Seesaw）の場合は、ヘルスチェックの数にも上限があります。ヘルスチェックの数は、ノード数と、トラフィックローカル Service の数によって異なります。トラフィックローカル Service とは、externalTrafficPolicy が Local に設定された Service です。

次の表では、バンドル型負荷分散（Seesaw）と統合型負荷分散（F5）の Service、ノード、ヘルスチェックの最大数を示します。

	バンドル型負荷分散（Seesaw）	統合型負荷分散（F5）
最大 Service 数	500	250 ²
最大ノード数	250	250 ²
最大ヘルスチェック数	N + (L * N) <= 10,000、ここで、N はノード数、L はトラフィックローカル Service の数 ¹	なし ²

¹ たとえば、100 個のノードと 99 個のトラフィックローカル Service があるとします。この場合、ヘルスチェックの数は 100 + 99 × 100 = 10,000 となります。これは上限 10,000 の範囲内です。

² 詳細については、F5 にお問い合わせください。この数は、F5 ハードウェアのモデル番号、仮想インスタンスの CPU / メモリ、ライセンスなどの要因に左右されます。

GKE Hub

デフォルトでは、最大 15 個のユーザークラスタを登録できます。GKE Hub にさらにクラスタを登録するには、Google Cloud コンソールで割り当てを増やすリクエストを送信できます。

Cloud Logging と Cloud Monitoring

Cloud Logging と Cloud Monitoring は、リソースのトラッキングを行う際に有用です。

1 つのユーザークラスタで多数のノードを実行する

ユーザークラスタにデプロイされているクラスタ内エージェントの CPU とメモリ使用量は、ユーザークラスタ内のノードと Pod の数によって変わります。

prometheus-server、stackdriver-prometheus-sidecar、stackdriver-log-aggregator など Cloud Logging と Monitoring のコンポーネントでは、ノード数と Pod 数に基づいて CPU とメモリリソースの使用量が変わります。クラスタをスケールアップする前に、これらのコンポーネントの推定平均使用量に従ってリソースリクエストと上限を設定してください。次の表に、各コンポーネントの推定平均使用量を示します。

ノード数	コンテナ名	推定 CPU 使用量		推定メモリ使用量
ノード数	コンテナ名	0 Pod / ノード	30 Pod / ノード	0 Pod / ノード	30 Pod / ノード
3～50	stackdriver-log-aggregator	150m	170m	1.6G	1.7G
	prometheus-server	100m	390m	650M	1.3G
	stackdriver-prometheus-sidecar	100m	340m	1.5G	1.6G
51～100	stackdriver-log-aggregator	220m	1100m	1.6G	1.8G
	prometheus-server	160m	500m	1.8G	5.5G
	stackdriver-prometheus-sidecar	200m	500m	1.9G	5.7G
101～250	stackdriver-log-aggregator	450m	1800m	1.7G	1.9G
	prometheus-server	400m	2500m	6.5G	16G
	stackdriver-prometheus-sidecar	400m	1300m	7.5G	12G

Cloud Logging と Cloud Monitoring のコンポーネントのスケジュールを設定するために十分なノード数を確保します。これを行う方法の一つは、まず小さなクラスタを作成し、上の表に従い Cloud Logging と Cloud Monitoring のコンポーネントリソースを編集して、コンポーネントに対応するノードプールを作成することです。その後、クラスタをより大きなサイズに徐々にスケールアップします。

モニタリングとロギングのコンポーネントにちょうどよい大きさのノードプールを維持すると、ノードプールに他の Pod のスケジュールが設定されることを防止できます。これを行うには、次の taints をノードプールに追加する必要があります。

taints:
  - effect: NoSchedule
    key: node-role.gke.io/observability

これにより、他のコンポーネントがノードプールでスケジュール設定されなくなり、モニタリングコンポーネントのリソース消費が原因でユーザーワークロードが強制排除されることを防止します。

1 つの管理クラスタで多数のユーザークラスタを実行する

管理クラスタにデプロイされたロギングとモニタリングのコンポーネントの CPU とメモリ使用量は、ユーザークラスタの数によって決まります。

次の表では、多数のユーザークラスタの実行に必要な管理クラスタノードの CPU とメモリの量を示します。

ユーザークラスタの数	管理クラスタノードの CPU	管理クラスタノードのメモリ
0～10	4 個の CPU	16 GB
11～20	4 個の CPU	32 GB

たとえば、2 つの管理クラスタノードがあり、それぞれに 4 個の CPU と 16 GB のメモリがある場合、0～10 個のユーザークラスタを実行できます。10 個を超えるユーザークラスタを作成するには、まず管理クラスタノードのメモリを 16 GB から 32 GB にサイズ変更する必要があります。

管理クラスタノードのメモリを変更するには、次の手順で MachineDeployment 構成を編集します。

次のコマンドを実行します。
```
kubectl --kubeconfig ADMIN_CLUSTER_KUBECONFIG edit machinedeployment gke-admin-node
```
ここで、ADMIN_CLUSTER_KUBECONFIG は管理クラスタの kubeconfig ファイルのパスです。
spec.template.spec.providerSpec.value.machineVariables.memory フィールドを 32768 に変更します。
編集内容を保存します。管理クラスタノードは 32 GB のメモリで再作成されます。

Dataplane V2

Dataplane V2 を使用する 500 ノードクラスタの場合、コントロールプレーンに 120 GB のメモリと 32 個の CPU コアを使用することをおすすめします。

システムコンポーネントの自動スケーリング

Anthos clusters on VMware では、構成を変更しなくても、ノード数に応じてクラスタ内のシステムコンポーネントが自動的にスケーリングされます。このセクションの情報は、リソース計画に使用できます。

Anthos clusters on VMware では、addon-resizer を使用して次のシステムコンポーネントの CPU リクエストとメモリリクエスト / 制限をスケーリングして、垂直方向のスケーリングを自動的に行います。

kube-state-metrics は、クラスタワーカーノードで実行される Deployment で、Kubernetes API サーバーをリッスンしてオブジェクトの状態に関する指標を生成します。CPU とメモリのリクエストと上限は、ノード数に基づきます。

次の表に、クラスタ内のノード数に対する、システムで設定されるリソースのリクエスト / 上限を示します。

ノード数	おおよそ ¹ の CPU リクエスト / 上限（ミリ）	おおよそ ¹ のメモリリクエスト / 上限（Mi）
3～5	105	110
6～250	100 + num_nodes	100 + (2 * num_nodes)

¹ スケーリング時のコンポーネントの再起動数を減らすために ±5% のマージンが設定されます。

たとえば、ノード数が 50 のクラスタでは、CPU リクエスト / 上限が 150m / 150m に設定され、メモリリクエスト / 上限が 200Mi / 200Mi に設定されます。ノード数が 250 のクラスタでは、CPU のリクエスト / 上限は 350m / 350m に設定され、メモリのリクエスト / 上限は 600Mi に設定されます。

metrics-server は、クラスタワーカーノードで実行される Deployment であり、Kubernetes の組み込み自動スケーリングパイプラインで使用されます。

展開すると、クラスタ内のノード数に対する、システムによって設定されたリソースのリクエスト / 上限が表示されます。

ノード数	おおよそ ¹ の CPU リクエスト / 上限（ミリ）	おおよそ ¹ のメモリリクエスト / 上限（Mi）
3～5	43	5
6～7	44	63
8～11	46	79
12～16	48	99
17～25	53	135
26～37	59	183
38～56	68	259
57～85	83	375
86～128	104	547
129～192	136	803
193～250	184	1187

¹ スケーリング時のコンポーネントの再起動数を減らすために ±5% のマージンが設定されます。

Anthos clusters on VMware では、次のシステムコンポーネントのレプリカ数をスケーリングして、水平方向のスケーリングを自動的に行います。
- kube-dns は、Anthos clusters on VMware でサービスディスカバリに使用される DNS ソリューションです。これは、ユーザークラスタワーカーノードで Deployment として動作します。Anthos clusters on VMware は、クラスタ内のノードと CPU コアの数に応じてレプリカの数を自動的にスケーリングします。16 ノードまたは 256 コアが追加または削除されるたびに、1 つのレプリカが増減します。N ノードと C コアのクラスタがある場合、max(N/16, C/256) のレプリカを想定しています。Anthos clusters on VMware 1.4 が毎秒 1500 件の同時リクエストをサポートするために、kube-dns が更新されています。
- calico-typha は、Anthos clusters on VMware で Pod ネットワークをサポートするコンポーネントです。これは、ユーザークラスタワーカーノードで Deployment として動作します。Anthos clusters on VMware では、クラスタ内のノード数に応じてレプリカの数が自動的に調整されます。ノード数が 200 未満のクラスタには Calico-typha のレプリカが 1 つあり、ノード数が 200 以上のクラスタには 2 つのレプリカがあります。
- ingress-gateway/istio-pilot は、クラスタ Ingress をサポートするためのコンポーネントであり、ユーザークラスタワーカーノードで Deployment として動作します。Ingress のゲートウェイが処理するトラフィックの量に応じて、Anthos clusters on VMware は水平 Pod オートスケーラーを使用し、CPU 使用量に基づいてレプリカの数をスケーリングします（最小で 2 つのレプリカ、最大で 5 つのレプリカ）。

スケーラビリティ

スケーラビリティの上限

上限について

スケーリングに関する対策

vSphere インフラストラクチャ

CPU、メモリ、ストレージの要件

ディスク I/O とネットワーク I/O の要件

ノード IP アドレス

Kubernetes ネットワーキング

Pod CIDR ブロック

Kubernetes Services

Service CIDR ブロック

ロードバランサ

GKE Hub

Cloud Logging と Cloud Monitoring

1 つのユーザークラスタで多数のノードを実行する

1 つの管理クラスタで多数のユーザークラスタを実行する

Dataplane V2

システムコンポーネントの自動スケーリング

おすすめの方法

クラスタを段階的にスケーリングする

etcd ディスクの I/O パフォーマンスを最適化する

ノードブートディスクの I/O パフォーマンスを最適化する

物理リソースの競合をモニタリングする

スケーラビリティ

スケーラビリティの上限

上限について

スケーリングに関する対策

vSphere インフラストラクチャ

CPU、メモリ、ストレージの要件

ディスク I/O とネットワーク I/O の要件

ノード IP アドレス

Kubernetes ネットワーキング

Pod CIDR ブロック

Kubernetes Services

Service CIDR ブロック

ロードバランサ

GKE Hub

Cloud Logging と Cloud Monitoring

1 つのユーザー クラスタで多数のノードを実行する

1 つの管理クラスタで多数のユーザー クラスタを実行する

Dataplane V2

システム コンポーネントの自動スケーリング

おすすめの方法

クラスタを段階的にスケーリングする

etcd ディスクの I/O パフォーマンスを最適化する

ノード ブートディスクの I/O パフォーマンスを最適化する

物理リソースの競合をモニタリングする

1 つのユーザークラスタで多数のノードを実行する

1 つの管理クラスタで多数のユーザークラスタを実行する

システムコンポーネントの自動スケーリング

ノードブートディスクの I/O パフォーマンスを最適化する