Questa pagina è stata tradotta dall'API Cloud Translation.

Progettare per la riduzione controllata

Last reviewed 2024-12-30 UTC

Questo principio nel pilastro dell'affidabilità del Google Cloud framework Well-Architected fornisce consigli per aiutarti a progettare i tuoi Google Cloud carichi di lavoro in modo che non si verifichino errori.

Questo principio è pertinente all'area di interesse risposta dell'affidabilità.

Panoramica del principio

Il degrado controllato è un approccio di progettazione in cui un sistema che subisce un carico elevato continua a funzionare, possibilmente con prestazioni o precisione ridotte. Il degrado controllato garantisce la disponibilità continua del sistema e impedisce il guasto completo, anche se il funzionamento del sistema non è ottimale. Quando il carico torna a un livello gestibile, il sistema riprende la piena funzionalità.

Ad esempio, durante i periodi di carico elevato, la Ricerca Google dà la priorità ai risultati delle pagine web con un ranking più elevato, sacrificando potenzialmente un po' di precisione. Quando il carico diminuisce, la Ricerca Google ricalcola i risultati di ricerca.

Consigli

Per progettare i tuoi sistemi in modo che la riduzione controllata sia efficace, tieni presenti i suggerimenti nelle seguenti sottosezioni.

Implementare la limitazione

Assicurati che le repliche possano gestire in modo indipendente i sovraccarichi e limitare le richieste in entrata durante gli scenari di traffico elevato. Questo approccio ti aiuta a prevenire errori a cascata causati da spostamenti del traffico in eccesso tra le zone.

Utilizza strumenti come Apigee per controllare la frequenza delle richieste API durante i periodi di traffico elevato. Puoi configurare le regole dei criteri in modo che riflettano il modo in cui vuoi ridurre le richieste.

Elimina le richieste in eccesso in anticipo

Configura i tuoi sistemi in modo da eliminare le richieste in eccesso nel livello frontend per proteggere i componenti di backend. L'eliminazione di alcune richieste impedisce errori globali e consente al sistema di ripristinarsi in modo più controllato.Con questo approccio, alcuni utenti potrebbero riscontrare errori. Tuttavia, puoi ridurre al minimo l'impatto delle interruzioni, a differenza di un approccio come l'interruzione del circuito, in cui tutto il traffico viene interrotto durante un sovraccarico.

Gestire errori parziali e tentativi

Crea le tue applicazioni in modo che gestiscano senza problemi errori parziali e tentativi. Questo design contribuisce a garantire che il maggior traffico possibile venga gestito durante gli scenari di carico elevato.

Scenari di sovraccarico di test

Per verificare che i meccanismi di limitazione e eliminazione delle richieste funzionino in modo efficace, simula regolarmente le condizioni di sovraccarico nel tuo sistema. I test contribuiscono a garantire che il tuo sistema sia pronto per i picchi di traffico reali.

Monitorare i picchi di traffico

Utilizza gli strumenti di analisi e monitoraggio per prevedere e rispondere ai picchi di traffico prima che si trasformino in sovraccarichi. Il rilevamento e la risposta tempestivi possono contribuire a mantenere la disponibilità del servizio durante i periodi di forte domanda.

Indietro

Rileva potenziali errori utilizzando l'osservabilità

Avanti

Esegui test per il ripristino dagli errori