Scalabilità manuale per i pool di worker

Questa pagina mostra come scalare manualmente il pool di worker.

Panoramica

Lo scaling manuale ti consente di impostare un numero specifico di istanze senza richiedere il redeploy. In questo modo, puoi scrivere la tua logica di scalabilità utilizzando un sistema esterno. Per un esempio, consulta il gestore della scalabilità automatica di Kafka.

Considerazioni sulla fatturazione quando si utilizza la scalabilità manuale

Quando utilizzi la scalabilità manuale, tutte le istanze che hai richiesto vengono fatturate come istanze attive, anche se sono inattive. Per i dettagli completi della fatturazione, consulta la pagina dei prezzi.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per eseguire il deployment dei pool di worker Cloud Run, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per un elenco di ruoli e autorizzazioni IAM associati a Cloud Run, consulta Ruoli IAM Cloud Run e Autorizzazioni IAM Cloud Run. Se il tuo pool di worker Cloud Run interagisce con le APIGoogle Cloud , come le librerie client Cloud, consulta la guida alla configurazione dell'identità del servizio. Per ulteriori informazioni sulla concessione dei ruoli, consulta Autorizzazioni di deployment e Gestire l'accesso.

Configura scalabilità

La modifica della modalità di scalabilità o del conteggio manuale delle istanze non crea una nuova revisione.

Per configurare la modalità di scalabilità, utilizza la console Google Cloud o Google Cloud CLI:

Console

  1. Nella console Google Cloud , vai a Cloud Run:

    Vai a Cloud Run

  2. Se stai configurando un nuovo worker pool, seleziona Worker pool dal menu e fai clic su Esegui il deployment del contenitore. Se stai configurando un pool di lavoratori esistente, fai clic sul pool di lavoratori per visualizzare il relativo riquadro dei dettagli, quindi fai clic sull'icona a forma di penna accanto a Scalabilità in alto a destra del riquadro dei dettagli.

  3. Individua il modulo Scalabilità (per un nuovo pool di worker) o il modulo Modifica scalabilità per un pool di worker esistente.

    immagine

  4. Nel campo etichettato Numero di istanze, specifica il numero di istanze di container per il servizio.

  5. Completa la specifica.

  6. Fai clic su Crea per un nuovo pool di worker o su Salva per un pool di worker esistente.

gcloud

Per specificare lo scaling per un nuovo worker pool, utilizza il comando deploy:

gcloud beta run worker-pools deploy WORKER_POOL \
    --scaling=INSTANCE_COUNT \
    --image IMAGE_URL

Sostituisci quanto segue:

  • WORKER_POOL: il nome del pool di worker.
  • INSTANCE_COUNT: il numero di istanze per il pool di worker. In questo modo il pool di worker viene impostato sulla scalabilità manuale. Specifica un valore di 0 per disattivare il pool di worker.
  • IMAGE_URL: un riferimento all'immagine container che contiene il pool di worker, ad esempio us-docker.pkg.dev/cloudrun/container/worker-pool:latest.

Specifica la scalabilità per un pool di worker esistente utilizzando il seguente comando update:

gcloud beta run worker-pools update WORKER_POOL \
   --scaling=INSTANCE_COUNT

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.

resource "google_cloud_run_v2_worker_pool" "default" {
  name     = "WORKER_POOL"
  location = "REGION"
  launch_stage = "BETA"

  template {
    containers {
      image = "IMAGE_URL"
    }
  }
  scaling {
    scaling_mode = "MANUAL"
    manual_instance_count = "INSTANCE_COUNT"
  }
}

Sostituisci quanto segue:

  • WORKER_POOL: il nome del pool di worker.
  • REGION: la regione Google Cloud , ad esempio europe-west1.
  • IMAGE_URL: un riferimento all'immagine container che contiene il pool di worker, ad esempio us-docker.pkg.dev/cloudrun/container/worker-pool:latest.
  • INSTANCE_COUNT: il numero di istanze per il pool di worker. In questo modo il pool di worker viene impostato sulla scalabilità manuale. Specifica un valore di 0 per disattivare il worker pool.

Visualizza la configurazione di scalabilità per un worker pool

  1. Nella console Google Cloud , vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic su Pool di worker per visualizzare l'elenco dei pool di worker di cui è stato eseguito il deployment.

  3. Fai clic sul worker pool che vuoi esaminare per visualizzare il relativo riquadro dei dettagli.

  4. L'impostazione di scalabilità attuale viene visualizzata sopra l'elenco delle revisioni dei pool di worker: Scalabilità: manuale (istanze: ).

Disattivare un worker pool

Per disattivare un pool di worker, utilizza il seguente comando per impostare lo scaling su zero:

gcloud beta run worker-pools update WORKER_POOL --scaling=0

Sostituisci WORKER_POOL con il nome del tuo pool di worker.