Gestione di capacità e quota

Last reviewed 2023-08-21 UTC

Questo documento nel framework dell'architettura Google Cloud mostra come valutare e pianificare la capacità e la quota sul cloud.

Nei data center convenzionali, solitamente si utilizzano i cicli ogni trimestre per esaminare i requisiti delle risorse attuali e prevedere quelli futuri. È necessario tenere conto di problemi fisici, logistici e relativi alle risorse umane. Problemi come spazio rack, raffreddamento, elettricità, larghezza di banda, cablaggio, tempi di approvvigionamento, tempi di spedizione e numero di ingegneri disponibili per lo stack e l'impilamento di nuove apparecchiature devono essere considerati. Devi inoltre gestire attivamente le distribuzioni di capacità e carichi di lavoro in modo che i job ad alta intensità di risorse, come le pipeline Hadoop, non interferiscano con i servizi, come i server web, che devono essere a disponibilità elevata.

Al contrario, quando utilizzi Google Cloud cedi la maggior parte della pianificazione della capacità a Google. Utilizzando il cloud, non è necessario eseguire il provisioning e la manutenzione delle risorse inattive quando non sono necessarie. Ad esempio, puoi creare, fare lo scale up e fare lo scale down delle istanze VM in base alle esigenze. Poiché paghi per ciò che utilizzi, puoi ottimizzare la spesa, inclusa la capacità in eccesso di cui hai bisogno solo nei periodi di picco del traffico. Per aiutarti a salvare, Compute Engine fornisce consigli sui tipi di macchine se rileva che hai istanze di VM sottoutilizzate che possono essere ridimensionate o eliminate.

Valuta i tuoi requisiti di capacità del cloud

Per gestire efficacemente la tua capacità, devi conoscere i requisiti di capacità della tua organizzazione.

Per valutare i tuoi requisiti di capacità, inizia identificando i principali carichi di lavoro cloud. Valuta l'utilizzo medio e di picco di questi carichi di lavoro e le relative esigenze di capacità attuali e future.

Identifica i team che utilizzano questi carichi di lavoro principali. Collabora con loro per definire un processo interno di pianificazione della domanda. Utilizza questo processo per comprendere le esigenze di risorse cloud attuali e previste.

Analizzare il pattern di carico e la distribuzione delle chiamate. Utilizza fattori come il picco degli ultimi 30 giorni, il picco orario e il picco al minuto nell'analisi.

Prendi in considerazione l'utilizzo di Cloud Monitoring per ottenere visibilità su prestazioni, uptime e integrità complessiva delle tue applicazioni e dell'infrastruttura.

Visualizza le metriche di utilizzo dell'infrastruttura

Per semplificare la pianificazione della capacità, raccogli e archivia i dati storici sull'utilizzo delle risorse cloud da parte della tua organizzazione.

Assicurati di avere visibilità sulle metriche di utilizzo dell'infrastruttura. Ad esempio, per i principali carichi di lavoro, valuta quanto segue:

  • Utilizzo medio e di picco
  • Picchi nei pattern di utilizzo
  • Picchi stagionali basati su requisiti aziendali, come periodi di vacanza per i rivenditori
  • Quanto è necessario il provisioning eccessivo per prepararsi agli eventi di picco e gestire rapidamente i picchi di traffico potenziali

Assicurati che la tua organizzazione abbia configurato avvisi per ricevere automaticamente notifiche quando ti avvicini ai limiti di quota e capacità.

Utilizza gli strumenti di monitoraggio di Google per ottenere insight sull'utilizzo e sulla capacità delle applicazioni. Ad esempio, con Monitoring puoi definire metriche personalizzate. Usa queste metriche personalizzate per definire le tendenze di avviso. Monitoring offre inoltre dashboard flessibili e strumenti di visualizzazione avanzati per identificare i problemi emergenti.

Crea un processo per la pianificazione della capacità

Stabilisci un processo per la pianificazione della capacità e documenta questo piano.

Quando crei il piano, segui questi passaggi:

  1. Esegui test di carico per determinare quanto il sistema può gestire mentre soddisfa i target di latenza, dato un numero fisso di risorse. I test di carico devono utilizzare una combinazione di tipi di richiesta corrispondenti ai profili di traffico di produzione degli utenti attivi. Non utilizzare un insieme di operazioni uniforme o casuale. Includere i picchi di utilizzo nel profilo di traffico.
  2. Creare un modello di capacità. Un modello di capacità è un insieme di formule per il calcolo delle risorse incrementali necessarie per ogni aumento di unità di carico del servizio, come determinato dai test di carico.
  3. Prevedere il traffico futuro e tenere conto della crescita. Consulta l'articolo Misurare il carico futuro per un riepilogo di come Google crea previsioni di traffico.
  4. Applica il modello di capacità alla previsione per determinare le esigenze di risorse future.
  5. Stima il costo delle risorse necessarie per la tua organizzazione. Quindi, richiedi l'approvazione del budget alla tua organizzazione finanziaria. Questo passaggio è essenziale perché l'azienda può scegliere di scendere a compromessi tra costi e rischi per una gamma di prodotti. Questi compromessi possono comportare l'acquisizione di capacità inferiore o superiore alla necessità prevista per un determinato prodotto in base alle priorità aziendali.
  6. Collabora con il tuo cloud provider per ottenere la quantità corretta di risorse al momento giusto con quote e prenotazioni. Coinvolgi i team dell'infrastruttura per la pianificazione della capacità e fai in modo che le operazioni creino piani di capacità con intervalli di confidenza.
  7. Ripeti i passaggi precedenti ogni due o tre trimestri.

Per indicazioni più dettagliate sul processo di pianificazione della capacità e durante l'ottimizzazione dell'utilizzo delle risorse, consulta Pianificazione della capacità.

Assicurati che le quote corrispondano ai tuoi requisiti di capacità

Google Cloud utilizza le quote per limitare la quantità di una determinata risorsa Google Cloud condivisa che puoi utilizzare. Ogni quota rappresenta una specifica risorsa conteggiabile, come le chiamate API a un particolare servizio, il numero di bilanciatori di carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Ad esempio, le quote assicurano che alcuni clienti o progetti non possano monopolizzare i core della CPU in una particolare regione o zona.

Quando esamini la quota, tieni presente questi dettagli:

  • Pianifica in anticipo i requisiti di capacità dei tuoi progetti per evitare una limitazione imprevista del consumo di risorse.
  • Configura la tua quota e la tua capacità per gestire gli errori relativi all'intera area geografica.
  • Utilizza le quote per limitare il consumo di una determinata risorsa. Ad esempio, puoi impostare una quota massima di utilizzo di query al giorno sull'API BigQuery per assicurarti che un progetto non spenda troppo in BigQuery.
  • Pianifica i picchi di utilizzo e includi questi picchi nella pianificazione della quota. I picchi di utilizzo possono essere previsti fluttuazioni durante il giorno, eventi di traffico di picco imprevisti o eventi di picco e di traffico noti. Per i dettagli su come pianificare gli eventi di picco e di picco di traffico, leggi la sezione successiva in Eccellenza operativa: Pianificare gli eventi di picco di traffico e di lancio.

Se le tue quote attuali non sono sufficienti, puoi gestire la tua quota utilizzando la console Google Cloud. Se hai bisogno di una grande capacità, contatta il team di vendita di Google Cloud. Tuttavia, devi sapere che molti servizi hanno anche limiti non correlati al sistema delle quote. Per ulteriori informazioni, consulta la pagina sull'utilizzo delle quote.

Controlla regolarmente le quote. Invia le richieste di quota prima che siano necessarie. Leggi Utilizzo delle quote per i dettagli su come vengono valutate le richieste di quota e come vengono approvate o rifiutate.

Puoi visualizzare e gestire la tua quota di Google Cloud in diversi modi:

Passaggi successivi