Quote di Dataproc

Questa pagina elenca i limiti di quota dell'API Dataproc, che vengono applicati a livello di progetto e di regione. Le quote vengono reimpostate ogni 60 secondi (un minuto).

Per le strategie di ottimizzazione dei cluster che consentono di evitare problemi di quota e disponibilità delle risorse, consulta Disponibilità delle risorse e strategie di zona.

Nella tabella seguente sono elencati i tipi di quote a livello di progetto specifici e predefiniti dell'API Dataproc, i relativi limiti di quota e i metodi a cui vengono applicati.

Tipo di quota Limite Metodi API applicabili
AutoscalingOperationRequestsPerMinutePerProjectPerRegion 400 CreateAutoscalingPolicy, GetAutoscalingPolicy, ListAutoscalingPolicies, UpdateAutoscalingPolicy, DeleteAutoscalingPolicy
ClusterOperationRequestsPerMinutePerProjectPerRegion 200 CreateCluster, DeleteCluster, UpdateCluster, StopCluster, StartCluster, DiagnoseCluster, RepairCluster
NodeGroupOperationRequestsPerMinutePerProjectPerRegion 600 CreateNodeGroup, DeleteNodeGroup, ResizeNodeGroup, RepairNodeGroup, UpdateLabelsNodeGroup, StartNodeGroup, StopNodeGroup
GetJobRequestsPerMinutePerProjectPerRegion 7500 GetJob
JobOperationRequestsPerMinutePerProjectPerRegion 400 SubmitJob, UpdateJob, CancelJob, DeleteJob
WorkflowOperationRequestsPerMinutePerProjectPerRegion 400 CreateWorkflowTemplate, InstantiateWorkflowTemplate, InstantiateInlineWorkflowTemplate, UpdateWorkflowTemplate, DeleteWorkflowTemplate
DefaultRequestsPerMinutePerProjectPerRegion 7500 Tutte le altre operazioni (principalmente operazioni Get)

La tabella seguente elenca limiti aggiuntivi per il totale di operazioni e job attivi a livello di progetto e regione.

Tipo di quota Limite Descrizione
ActiveOperationsPerProjectPerRegion 5000 Limite al numero totale di operazioni attive simultanee di tutti i tipi in un singolo progetto in un singolo database regionale
ActiveJobsPerProjectPerRegion 5000 Limite al numero totale di job attivi nello stato NON_TERMINAL in un singolo progetto in un singolo database regionale

Altre quote Google Cloud

I cluster Dataproc utilizzano altri Google Cloud prodotti. Questi prodotti hanno quote a livello di progetto che includono le quote applicabili all'utilizzo di Dataproc. Per l'utilizzo di Dataproc è necessario utilizzare alcuni servizi, come ad esempio Compute Engine e Cloud Storage. Altri servizi, come BigQuery e Bigtable, possono utilizzare facoltativamente Dataproc.

Servizi del cluster richiesti

I seguenti servizi, che applicano limiti di quota, sono necessari per creare cluster Dataproc.

Compute Engine

I cluster Dataproc utilizzano le macchine virtuali di Compute Engine. Le quote di Compute Engine sono suddivise in limiti globali e a livello di regione. Questi limiti si applicano ai cluster che crei. Ad esempio, la creazione di un cluster con un nodo n1-standard-4 -m e due nodi n1-standard-4 -w utilizza 12 CPU virtuali (4 * 3). L'utilizzo di questo cluster viene conteggiato nel limite di quota a livello di regione di 24 CPU virtuali.

Risorse dei cluster predefiniti

Quando crei un cluster Dataproc con impostazioni predefinite, vengono utilizzate le seguenti risorse di Compute Engine.

Risorsa Utilizzo
CPU virtuali 12
Istanze di macchine virtuali (VM) 3
Disco permanente 1500 GB

Cloud Logging

Dataproc salva l'output del driver e i log del cluster in Cloud Logging. La quota di Logging si applica ai cluster Dataproc.

Servizi del cluster opzionali

Puoi utilizzare facoltativamente i seguenti servizi, che hanno limiti di quota, con i cluster Dataproc.

BigQuery

Durante la lettura o la scrittura di dati in BigQuery, si applica la quota di BigQuery.

Bigtable

Durante la lettura o la scrittura di dati in Bigtable, si applica la quota di Bigtable.

Disponibilità delle risorse e strategie di zona

Per ottimizzare i cluster in base alla disponibilità delle risorse e ridurre i potenziali errori di esaurimento delle scorte, valuta le seguenti strategie:

  • Selezione automatica della zona:quando crei cluster, utilizza la selezione automatica della zona. In questo modo, Dataproc può selezionare una zona ottimale all'interno della regione specificata, migliorando le probabilità di creazione del cluster.

  • Quote regionali:verifica che le quote regionali di Compute Engine siano sufficienti, poiché le quote possono esaurirsi anche con il posizionamento automatico delle zone se la capacità regionale totale non è sufficiente per le tue richieste.

  • Flessibilità del tipo di macchina:se riscontri esaurimenti persistenti con un tipo di macchina specifico, utilizza un tipo di macchina diverso e più facilmente disponibile per il tuo cluster.