このドキュメントは、Anthos フリートと Anthos Service Mesh を使用する Cloud Run for Anthos の最新バージョンを対象としています。詳細

過去のバージョンはアーカイブされていますが、既存のユーザーはドキュメントを引き続きご利用いただけます。

利用可能なバージョン

最新
アーカイブ

Knative serving のアーキテクチャの概要

このページでは、Knative serving のアーキテクチャの概要を示し、Google Kubernetes Engine クラスタで Knative serving を有効にする際に発生する変更について説明します。

この情報は、次のようなタイプのユーザーに有用です。

Knative serving を使用しているユーザー。
GKE クラスタの実行経験があるオペレータ。
Knative serving を Kubernetes クラスタと統合して、より優れたアプリケーションを設計したり、Knative serving アプリケーションを構成したりする必要があるアプリケーションデベロッパー。

デフォルトインストールのコンポーネント

Knative serving をクラスタにインストールし、ステートレスワークロードを接続して管理します。Knative コンポーネントは knative-serving 名前空間に作成されます。

Knative serving では、Anthos Service Mesh を使用してトラフィックをルーティングします。デフォルトでは、Anthos Service Mesh はコンポーネントを istio-system 名前空間にインストールします。

Knative serving と Anthos Service Mesh によってインストールされるコンポーネントは次のとおりです。

knative-serving 名前空間の Knative serving によってインストールされるコンポーネントは次のとおりです。
- アクティベーター: Pod がゼロにスケールインされるか、リビジョンに送信されるリクエストで過負荷になると、アクティベーターはリクエストを一時的にキューし、オートスケーラーに送信します。オートスケーラーによって報告された指標と使用可能な Pod に基づいてリビジョンがスケーリングされると、キュー内のリクエストがそのリビジョンに転送されます。アクティベーターはデータプレーンコンポーネントです。データプレーンコンポーネントは、ユーザートラフィックを転送するすべての機能とプロセスを管理します。
- オートスケーラー: アクティベーターとリクエストの同時実行制限を適用するデータプレーンコンポーネントであるキュープロキシサイドカーコンテナから、指標を集計して処理します。オートスケーラーは、リビジョンの同時実行数を計算し、目的の Pod 数に基づいてデプロイのサイズを調整します。リビジョンで Pod が使用可能な場合、オートスケーラーはコントロールプレーンコンポーネントになります。それ以外の場合は、Pod をゼロにスケールインすると、オートスケーラーはデータプレーンコンポーネントになります。
- コントローラ: オートスケーラーとサービスオブジェクトの子リソースを作成および更新します。コントローラはコントロールプレーンコンポーネントです。コントロールプレーンコンポーネントは、ユーザートラフィックのリクエストパスを確立するすべての機能とプロセスを管理します。
- Metrics Collector: Knative serving コンポーネントから指標を収集し、Cloud Monitoring に転送します。
- Webhook: デフォルト値の設定、一貫性のないオブジェクトや無効なオブジェクトの拒否、および Knative serving リソースに対する Kubernetes API 呼び出しの検証と変更を行います。Webhook はコントロールプレーンコンポーネントです。
istio-system 名前空間で実行される Anthos Service Mesh によってインストールされるコンポーネントは次のとおりです。
- クラスタローカルゲートウェイ: ある Knative serving サービスから別の Knative serving サービスへの内部トラフィックを処理するデータプレーンのロードバランサ。クラスタローカルゲートウェイは、GKE クラスタ内からのみアクセスできます。個人情報や内部プロセスが誤って公開されることを防ぐために、外部ドメインの登録は行われません。
- Istio Ingress Gateway: クラスタの外部からのトラフィック（外部と内部のいずれかのネットワークからのトラフィックを含む）の受信と処理を担当するデータプレーン内のロードバランサ。
- Istiod: 正しいエンドポイントで HTTP リクエストが処理されるように、クラスタローカルゲートウェイと Istio Ingress ゲートウェイを構成します。Istiod はコントロールプレーンコンポーネントです。詳細については、Istiod をご覧ください。

Knative serving コンポーネントは、GKE コントロールプレーンクラスタの更新の際に自動的に更新されます。詳しくは、利用可能な GKE バージョンをご覧ください。

クラスタリソースの使用量

Knative serving の初期インストールには、クラスタに対しておおよそ 1.5 個の仮想 CPU と 1 GB のメモリが必要です。クラスタ内のノード数は、Knative serving のインストールに必要な容量とメモリ要件に影響しません。

1 つのアクティベーターあたり、最大 1,000 milliCPU および 600 MiB RAM でリクエストの消費が可能です。既存のアクティベーターで受信リクエスト数を処理できない場合は、追加の Activator が提供されます。これには、300 milliCPU および 60 MiB RAM の予約が必要になります。

Knative serving サービスが作成したすべての Pod によって、リクエストの同時実行制限を適用するキュープロキシサイドカーが作成されます。キュープロキシによって 25 milliCPU が予約されますが、メモリは予約されません。キュープロキシの使用量は、キューに追加されるリクエスト数とリクエストのサイズによって異なります。CPU とメモリリソースに制限はありません。

Service を作成する

Knative serving サービスのアーキテクチャを示す図 — Knative serving Service のアーキテクチャ（クリックして拡大）

Knative serving によって、サービス、リビジョン、構成、ルートといった一連のカスタムリソース定義（CRD）が定義され、Kubernetes が拡張されます。CRD により、クラスタ上のアプリケーションの動作が定義および制御されます。

Knative serving Service は、Knative serving によって定義される最上位のカスタムリソースです。これは、ワークロードのライフサイクル全体を管理する単一のアプリケーションです。サービスにおいて、サービスの更新ごとに、ルート、構成、新しいリビジョンがアプリに含まれていることが確認されます。
リビジョンは、コードと構成に関するポイントインタイムかつ不変のスナップショットです。
Configuration には、最新のリビジョンの現在の構成が保持され、過去のすべてのリビジョンの履歴が記録されます。構成を変更すると、新しいリビジョンが作成されます。
Route では、HTTP エンドポイントが定義され、エンドポイントがリクエストの転送先となる 1 つ以上のリビジョンに関連付けられます。

ユーザーが Knative serving Service を作成すると、次の処理が行われます。

Knative serving Service オブジェクトによって、次のことが定義されます。
1. リビジョンの提供方法に関する構成。
2. このバージョンのサービスに対する不変のリビジョン。
3. リビジョンに指定されたトラフィックの割り当てを管理するためのルート。
ルートオブジェクトによって、VirtualService が作成されます。VirtualService オブジェクトによって、ゲートウェイトラフィックが正しいリビジョンにルーティングされるように、Ingress ゲートウェイとクラスタローカルゲートウェイが構成されます。
リビジョンオブジェクトによって、コントロールプレーンコンポーネント（Kubernetes Service オブジェクトと Deployment オブジェクト）が作成されます。
ネットワーク構成によって、アプリのアクティベーター、オートスケーラー、ロードバランサが接続されます。

リクエスト処理

次の図は、サンプルの Google Kubernetes Engine クラスタ上で、Knative serving データプレーンコンポーネントを経由するユーザートラフィックの予想されるリクエストパスの概要を示しています。

Knative serving クラスタのアーキテクチャを示す図 — Knative serving クラスタのアーキテクチャ（クリックして拡大）

次の図は、上の図を展開した、ユーザートラフィックのリクエストパスの詳細を示しています。さらに詳細を次に示します。

Knative serving リクエストパスを示す図 — Knative serving リクエストパス（クリックして拡大）

Knative serving リクエストパスの場合:

トラフィックは、以下を経由します。
- クラスタ外部からのトラフィック用の Ingress ゲートウェイ
- クラスタ内部のトラフィック用のクラスタローカルゲートウェイ
VirtualService コンポーネントは、トラフィックルーティングルールを指定します。VirtualService コンポーネントによって、ユーザートラフィックが正しいリビジョンにルーティングされるように、ゲートウェイが構成されます。
コントロールプレーンコンポーネントである Kubernetes Service は、トラフィックを処理する Pod の可用性に応じて、リクエストパスの次のステップを決定します。
- リビジョンに Pod が存在しない場合:
  1. Pod のスケールアップのために、アクティベーターによって、受信したリクエストが一時的にキューに入れられ、指標がオートスケーラーに push されます。
  2. オートスケーラーによって、Deployment 内の Pod が望ましい状態までスケーリングされます。
  3. Deployment により、追加のリクエストを受信できるように追加の Pod が作成されます。
  4. アクティベーターによって、キュープロキシサイドカーに対するリクエストが再試行されます。
- サービスがスケールアウトされている（Pod が使用可能な）場合、Kubernetes Service によってキュープロキシサイドカーにリクエストが送信されます。
キュープロキシサイドカーでは、コンテナが一度に処理できるリクエストキューパラメータ（シングルスレッドまたはマルチスレッドのリクエスト）が適用されます。
キュープロキシサイドカーに処理可能な数より多くのリクエストが含まれている場合、オートスケーラーによって追加のリクエストを処理する Pod が作成されます。
キュープロキシサイドカーによって、ユーザーコンテナにトラフィックが送信されます。

Knative serving のアーキテクチャの概要

デフォルト インストールのコンポーネント

クラスタ リソースの使用量

Service を作成する

リクエスト処理

デフォルトインストールのコンポーネント

クラスタリソースの使用量