次の図は、Knative serving リソースモデルを示しています。
この図は、2 つの Knative serving サービス(Service A
、Service B
)を含む Google Cloud プロジェクトを示しています。各サービスには複数のリビジョンがあります。
Service A
では、多くのリクエストを受信しているため、複数のコンテナ インスタンスが起動し、実行されています。Service B
では現在リクエストを受信していないため、コンテナ インスタンスは起動していません。
Knative serving サービス
サービスは Knative serving のメインリソースです。各サービスは特定の GKE クラスタ名前空間にあります。
1 つの Google Cloud プロジェクトで、複数のリージョンまたは GKE クラスタを使用して多くのサービスを実行できます。
各サービスは固有のエンドポイントを公開し、受信リクエストを処理するため、基盤となるインフラストラクチャを自動的に拡張します。
Knative serving リビジョン
サービスをデプロイするたびに、リビジョンが作成されます。リビジョンは、環境変数、メモリ制限、同時実行などの環境設定と特定のコンテナ イメージから構成されています。
リビジョンは変更されません。作成されたリビジョンを変更することはできません。たとえば、コンテナ イメージを新しい Knative serving サービスにデプロイすると、最初のリビジョンが作成されます。その後、同じサービスに別のコンテナ イメージをデプロイすると、2 番目のリビジョンが作成されます。さらに、環境変数を設定すると、3 番目のリビジョンが作成されます。
リクエストは、最新で正常な状態のリビジョンに自動的にルーティングされます。必要に応じて、異なるリビジョン間でトラフィックを分割できます。
Knative serving コンテナ インスタンス
リビジョンは、受信したすべてのリクエストを処理できるように、コンテナ インスタンスの数を自動的にスケーリングします。1 つのコンテナ インスタンスが同時に多くのリクエストを受信する場合があります。同時実行の設定を使用すると、1 つのコンテナ インスタンスに同時に送信されるリクエストの最大数を設定できます。