Un componente fondamentale della preparazione agli eventi è la pianificazione della capacità, in cui determini la quantità di risorse cloud necessarie per garantire ai tuoi workload quanto serve per operare in modo efficace, senza eseguire il provisioning eccessivo e pagare inutilmente per ciò di cui non hai bisogno.
La capacità è la quantità totale di una determinata risorsa disponibile, condivisa tra tutti i clienti. Tuttavia, per garantire che alcuni clienti o progetti non possano monopolizzare le risorse, Google Cloud limita la quantità di una particolare risorsa condivisa Google Cloud che puoi utilizzare con le quote.
Ogni quota rappresenta una risorsa specifica, ad esempio le chiamate API a un particolare servizio, il numero di VM utilizzate dal tuo progetto in un determinato momento, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare.
Sebbene molti servizi abbiano quote predefinite per alcune risorse, le quote che si applicano alle tue applicazioni sono specifiche per te, il tuo progetto o la tua organizzazione. L'attivazione della fatturazione per il tuo progetto aumenta le quote per la maggior parte dei servizi. Le quote possono aumentare anche man mano che il tuo utilizzo di Google Cloud aumenta nel tempo.
Mentre ti prepari per l'evento con traffico elevato o per il picco stagionale, devi assicurarti che le quote corrispondano ai requisiti delle risorse per evitare errori imprevisti.
Ti consigliamo di procedere come segue:
Utilizza gli strumenti di Cloud Monitoring per ottenere visibilità sull'utilizzo e sulla capacità delle tue applicazioni, nonché sull'integrità complessiva delle tue applicazioni e della tua infrastruttura.
Valuta l'utilizzo medio e di picco dei tuoi principali carichi di lavoro cloud e le loro esigenze di capacità attuali e future per determinare la quantità di over-provisioning necessaria per prepararsi ai picchi di traffico.
Esegui test di carico per determinare il carico che il sistema può gestire rispettando i target di latenza, dato un importo fisso di risorse.
Utilizza lo strumento di pianificazione della capacità
Lo strumento di pianificazione della capacità ti consente di visualizzare l'utilizzo storico e quello previsto delle tue istanze di macchine virtuali (VM), dei volumi di Persistent Disk e delle GPU. Puoi anche visualizzare le prenotazioni, prenotare le risorse in anticipo e gestire i limiti di quota del progetto controllando quanto ti avvicini al limite e configurando richieste automatiche di aumento della quota. Per ulteriori informazioni, vedi Visualizza i dati di utilizzo e di previsione nello strumento di pianificazione della capacità.
Abilita l'aggiustamento delle quote
L'aggiustamento delle quote monitora il tuo consumo di risorse e invia in modo proattivo richieste di aggiustamento delle quote per conto tuo, in modo da non dover effettuare richieste manuali. Per ulteriori informazioni, consulta Come funziona l'aggiustamento delle quote.
Richiedi un aggiustamento delle quote
Se le quote non sono sufficienti per le tue esigenze, puoi richiedere un aggiustamento della quota. Esistono tre modi principali per inviare una richiesta di aumento della quota:
- Tramite la console Google Cloud
- Tramite una richiesta di assistenza
- Direttamente con il team dedicato al tuo account o il TAM
Se hai bisogno di una risposta rapida a una richiesta di aumento della quota, ti consigliamo di utilizzare la console Google Cloud . Tuttavia, se la richiesta richiede ulteriori analisi, potresti dover collaborare con il team dedicato al tuo account.
Per modificare un valore di quota tramite la console Google Cloud , consulta Visualizza e gestisci le quote.
La maggior parte delle richieste di aumento della quota viene valutata da sistemi automatici. La decisione si basa su criteri che includono la disponibilità delle risorse, il periodo di tempo in cui hai utilizzato Google Cloude altri fattori. Le richieste che non soddisfano i criteri vengono rifiutate. Se la tua richiesta viene rifiutata, puoi provare a richiedere l'aumento della quota creando una richiesta di assistenza o contattando il team dedicato al tuo account o il TAM.
Crea una prenotazione
Le prenotazioni ti aiutano ad avere sempre a disposizione le risorse di Compute Engine necessarie per creare VM con lo stesso hardware (memoria e vCPU) e le risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.
Viene eseguito il provisioning di una prenotazione on demand al momento della richiesta, se la capacità richiesta è disponibile. Una prenotazione futura ti consente di richiedere la capacità in anticipo e ti offre un elevato livello di garanzia per l'ottenimento e la protezione della capacità per gli eventi di picco di scalabilità. Ti consigliamo di procurarti le prenotazioni future con largo anticipo rispetto all'evento. Per ulteriori informazioni, consulta le seguenti risorse:
- Prenotazioni di risorse di zona di Compute Engine
- Crea una prenotazione per un singolo progetto
- Creare richieste di prenotazione futura per un singolo progetto