Panoramica della limitazione di frequenza

Google Cloud Armor fornisce funzionalità per aiutarti a proteggere le tue applicazioni Google Cloud da una serie di attacchi di livello 3 e 7. Le regole basate sulla frequenza ti aiutano a proteggere le tue applicazioni da un grande volume di richieste che inondano le tue istanze e a bloccare l'accesso per gli utenti legittimi.

La limitazione di frequenza può:

  • Impedisci a un particolare client di esaurire le risorse dell'applicazione.
  • Proteggi le tue istanze dell'applicazione da picchi irregolari e imprevedibili nella frequenza delle richieste del client.

Inoltre, quando a una risorsa viene presentato un volume elevato di traffico da un numero ridotto di client, puoi evitare che gli altri tuoi client siano interessati da grandi picchi di traffico da un numero ridotto di client, in modo che le risorse siano in grado di gestire il maggior numero possibile di richieste.

Google Cloud Armor ha due tipi di regole basate sulle tariffe:

  1. Limitazione: puoi applicare un limite massimo di richieste per client o per tutti i client limitando i singoli client a una soglia configurata dall'utente.
  2. Esclusione basata sulla tariffa: puoi limitare le richieste che corrispondono a una regola in base a un singolo client e poi escludere temporaneamente tali client per un periodo di tempo configurato se superano una soglia configurata dall'utente.

Google Cloud Armor applica la soglia di limitazione di frequenza a ogni backend associato. Ad esempio, se disponi di due servizi di backend e configuri una regola di limitazione della frequenza con una soglia di 1000 richieste al minuto, ogni servizio di backend può ricevere 1000 richieste al minuto prima che Google Cloud Armor applichi l'azione della regola.

Puoi visualizzare l'anteprima degli effetti delle regole di limitazione di frequenza in un criterio di sicurezza utilizzando la modalità di anteprima ed esaminando i log delle richieste.

Identificazione dei clienti per la limitazione di frequenza

Google Cloud Armor identifica i singoli client per la limitazione di frequenza utilizzando i seguenti tipi di chiavi per l'aggregazione delle richieste e l'applicazione dei limiti di frequenza:

  • ALL: un'unica chiave per tutti i client le cui richieste soddisfano la condizione di corrispondenza della regola.
  • IP: una chiave univoca per ogni indirizzo IP di origine client le cui richieste soddisfano la condizione di corrispondenza della regola.
  • HTTP_HEADER: una chiave univoca per ogni valore di intestazione HTTP univoco il cui nome è configurato. Il valore della chiave viene troncato ai primi 128 byte del valore dell'intestazione. Per impostazione predefinita, il tipo di chiave è ALL se non è presente un'intestazione simile o se cerchi di utilizzare questo tipo di chiave con un bilanciatore del carico di rete proxy esterno.
  • XFF_IP: una chiave univoca per ogni indirizzo IP di origine originale del client, ovvero il primo indirizzo IP nell'elenco di IP specificati nell'intestazione HTTP X-Forwarded-For. Il tipo di chiave è impostato in modo predefinito sull'indirizzo IP se non è presente alcuna intestazione, se il valore non è un indirizzo IP valido o se stai tentando di utilizzare questo tipo di chiave con un bilanciatore del carico di rete proxy esterno.
  • HTTP_COOKIE: una chiave univoca per ogni valore del cookie HTTP di cui è configurato il nome. Il valore della chiave viene troncato ai primi 128 byte del valore del cookie. Per impostazione predefinita, il tipo di chiave è impostato su ALL se non è presente questo cookie o se cerchi di utilizzare questo tipo di chiave con un bilanciatore del carico di rete proxy esterno.
  • HTTP_PATH: il percorso dell'URL della richiesta HTTP. Il valore della chiave viene troncato ai primi 128 byte.
  • SNI: l'indicazione del nome del server nella sessione TLS della richiesta HTTPS. Il valore della chiave viene troncato ai primi 128 byte. Per impostazione predefinita, il tipo di chiave è ALL in una sessione HTTP.
  • REGION_CODE: il paese o la regione da cui ha origine la richiesta.
  • TLS_JA3_FINGERPRINT: impronta TLS/SSL JA3 se il client si connette utilizzando HTTPS, HTTP/2 o HTTP/3. Se non è disponibile, il tipo di chiave è impostato in modo predefinito su TUTTI. Per ulteriori informazioni su JA3, consulta la pagina Riferimento al linguaggio delle regole.
  • USER_IP: l'indirizzo IP del client di origine, incluso nelle intestazioni configurate in userIpRequestHeaders e il cui valore è compilato da un proxy upstream. Se non esiste alcuna configurazione userIpRequestHeaders o se non è possibile risolvere un indirizzo IP, il tipo di chiave è impostato in modo predefinito su IP. Per ulteriori informazioni, consulta la documentazione di riferimento sul linguaggio delle regole.

Puoi utilizzare le chiavi precedenti singolarmente oppure applicare una limitazione di frequenza in base a una combinazione di massimo tre chiavi. Puoi utilizzare più chiavi HTTP-HEADER o HTTP-COOKIE e solo una di ogni altro tipo di chiave. Per ulteriori informazioni, consulta Limitazione di frequenza basata su più chiavi.

Limitazione del traffico

L'azione throttle in una regola consente di applicare una soglia di richiesta per client al fine di proteggere i servizi di backend. Questa regola applica la soglia per limitare il traffico proveniente da ciascun client che soddisfa le condizioni di corrispondenza della regola. La soglia viene configurata come numero specificato di richieste in un intervallo di tempo specificato.

Ad esempio, puoi impostare la soglia delle richieste su 2000 richieste entro 1200 secondi (20 minuti). Se un client invia 2500 richieste in un periodo di 1200 secondi, circa il 20% del traffico del client viene limitato finché il volume di richieste consentito non raggiunge o è inferiore alla soglia configurata.

Imposta i seguenti parametri per controllare l'azione:

  • rate_limit_threshold: il numero di richieste per client consentito in un intervallo di tempo specificato. Il valore minimo è 1 e il valore massimo è 10.000.
    • interval_sec: il numero di secondi nell'intervallo di tempo. Il valore deve essere 10, 30, 60, 120, 180, 240, 300, 600, 900, 1200, 1800, 2700 o 3600 secondi.
  • exceed_action: quando una richiesta supera rate_limit_threshold, Google Cloud Armor applica il valore exceed_action configurato. I valori possibili per exceed_action sono i seguenti:
    • deny(status): la richiesta viene rifiutata e il codice di errore specificato viene restituito (i valori validi sono 403, 404, 429 e 502). Ti consigliamo di utilizzare il codice di risposta 429 (Too Many Requests).
    • redirect: la richiesta viene reindirizzata per la valutazione di reCAPTCHA Enterprise o a un URL diverso, in base al parametro exceed_redirect_options.
  • exceed_redirect_options: se exceed_action è redirect, utilizza questo parametro per specificare l'azione di reindirizzamento:
    • type: digita l'azione di reindirizzamento, GOOGLE_RECAPTCHA o EXTERNAL_302.
    • target: target URL per l'azione di reindirizzamento. Applicabile solo quando il type è EXTERNAL_302.
  • conform_action: questa è l'azione eseguita quando il numero di richieste è inferiore a rate_limit_threshold. Si tratta sempre di un'azione allow.

Quando la frequenza di traffico di un client è inferiore o uguale a rate_limit_threshold, le richieste seguono conform_action, che è sempre un'azione allow. La richiesta viene consentita tramite il criterio di sicurezza e può raggiungere la sua destinazione. Quando la frequenza di traffico di un client supera il valore rate_limit_threshold specificato, Google Cloud Armor applica exceed_action, che può essere deny o redirect, per le richieste che superano il limite per il resto dell'intervallo di soglia.

Esclusione dei clienti in base alle percentuali delle richieste

L'azione rate_based_ban in una regola consente di applicare una soglia per client per escludere temporaneamente i client che superano il limite applicando il valore exceed_action configurato per tutte le richieste del client per un periodo di tempo configurabile. La soglia è configurata come numero specificato di richieste in un intervallo di tempo specificato. Puoi escludere temporaneamente il traffico per un periodo di tempo configurato dall'utente ('ban_duration_sec'), a condizione che il traffico corrisponda alla condizione di corrispondenza specificata e superi la soglia configurata.

Ad esempio, puoi impostare la soglia delle richieste su 2000 richieste entro 1200 secondi (20 minuti). Se un client invia 2500 richieste entro 1200 secondi, Google Cloud Armor applica il exceed_action al traffico proveniente da quel client superando la soglia di 2000 richieste fino a quando non sono trascorsi tutti i 1200 secondi e per un numero aggiuntivo di secondi impostato come periodo di esclusione. Ad esempio, se la durata dell'esclusione è impostata su 3600, il traffico proveniente dal client viene escluso per 3600 secondi (un'ora) oltre la fine dell'intervallo di soglia.

Questi parametri controllano l'azione di una regola rate_based_ban:

  • rate_limit_threshold: il numero di richieste per client consentito in un intervallo di tempo specificato. Il valore minimo è 1 richiesta e il valore massimo è 10.000 richieste.
    • interval_sec: il numero di secondi nell'intervallo di tempo. Il valore deve essere 10, 30, 60, 120, 180, 240, 300, 600, 900, 1200, 1800, 2700 o 3600 secondi.
  • exceed_action: quando una richiesta supera rate_limit_threshold, Google Cloud Armor applica il valore exceed_action configurato. I valori possibili per exceed_action sono i seguenti:
    • deny(status): la richiesta viene rifiutata e il codice di errore specificato viene restituito. I valori validi per il codice di errore sono 403, 404, 429 e 502. Ti consigliamo di utilizzare il codice di risposta 429 (Too Many Requests).
    • redirect: la richiesta viene reindirizzata per la valutazione di reCAPTCHA Enterprise o a un URL diverso, in base al parametro exceed_redirect_options.
  • exceed_redirect_options: se exceed_action è redirect, utilizza questo parametro per specificare l'azione di reindirizzamento:
    • type: digita l'azione di reindirizzamento, GOOGLE_RECAPTCHA o EXTERNAL_302.
    • target: target URL per l'azione di reindirizzamento. Applicabile solo quando il type è EXTERNAL_302.
  • conform_action: questa è l'azione eseguita quando il numero di richieste è inferiore a rate_limit_threshold. Si tratta sempre di un'azione allow.
  • ban_threshold_count: questo è il numero di richieste per client con cui Google Cloud Armor esclude le richieste. Se specificato, la chiave viene esclusa per l'oggetto ban_duration_sec configurato quando il numero di richieste che superano il valore rate_limit_threshold_count supera anche questo valore di ban_threshold_count.
  • ban_duration_sec: questo è il numero aggiuntivo di secondi durante i quali un client viene escluso dopo la scadenza del periodo interval_sec. Il valore deve essere 60, 120, 180, 240, 300, 600, 900, 1200, 1800, 2700 o 3600 secondi.

Quando tasso di richieste di un client è al di sotto della soglia del limite di frequenza, questo consente immediatamente alla richiesta di procedere al servizio di backend. Quando la frequenza di traffico di un client supera il valore rate_limit_threshold specificato, Google Cloud Armor applica il valore exceed_action a tutte le richieste in entrata del client per il resto dell'intervallo di soglia e per i successivi ban_duration_sec secondi, indipendentemente dal fatto che la soglia venga superata o meno.

Con questa configurazione è possibile escludere accidentalmente i client di benvenuto che superano solo occasionalmente la tasso di richieste consentita. Per evitare questo problema ed escludere solo i client che spesso superano la tasso di richieste, puoi scegliere di monitorare le richieste totali del client rispetto a un'ulteriore configurazione di soglia, preferibilmente più lunga, denominata ban_threshold_count. In questa modalità, il client viene escluso per il ban_duration_sec configurato solo se la tasso di richieste supera il valore ban_threshold_count configurato. Se la tasso di richieste non supera ban_threshold_count, le richieste continuano a essere limitate a rate_limit_threshold. Ai fini di ban_threshold_count, vengono conteggiate le richieste totali del client, costituite da tutte le richieste in entrata prima della limitazione.

Criterio di sicurezza predefinito per limitazione di frequenza

Quando configuri un criterio di sicurezza predefinito durante la creazione del bilanciatore del carico, la soglia predefinita è di 500 richieste durante ogni intervallo di un minuto (rispettivamente rate_limit_threshold e interval_sec pari a 500 e 60). Se vuoi selezionare una soglia diversa, ti consigliamo di seguire i passaggi per ottimizzare i parametri:

  1. Abilita Cloud Logging ed esegui query sul numero massimo di richieste ricevute per indirizzo IP e al minuto in un giorno o più presso il tuo servizio di backend protetto da Google Cloud Armor.

    Ad esempio, supponi di ritenere che il 99% del traffico di rete che ricevi non sia interessato dalla regola per la limitazione di frequenza. In questo scenario, ti consigliamo di impostare la soglia del limite di frequenza sul 99° percentile del numero massimo di richieste per indirizzo IP e per minuto della distribuzione generata dai dati di Cloud Logging.

  2. Se continui a notare che le regole di limitazione di frequenza predefinite bloccano il traffico legittimo, prendi in considerazione i seguenti passaggi aggiuntivi:

    1. Attiva la memorizzazione nella cache (Cloud CDN o Media CDN).
    2. Aumenta l'intervallo di tempo per la limitazione (richieste ricevute ogni diversi minuti, anziché ogni 60 secondi).
    3. Puoi escludere i client per ridurre ulteriormente l'impatto dell'attacco dopo l'ondata iniziale. L'azione rate_based_ban di Google Cloud Armor consente di escludere tutti i client che superano i limiti troppe volte all'interno di una finestra specificata dall'utente. Ad esempio, i client che superano i limiti 10 volte in un minuto possono essere esclusi per 15 minuti.

Applicazione della soglia

Le soglie configurate per la limitazione e le esclusioni basate sulla frequenza vengono applicate in modo indipendente in ciascuna delle regioni di Google Cloud in cui viene eseguito il deployment dei servizi di backend HTTP(S). Ad esempio, se il deployment del servizio viene eseguito in due regioni, ciascuna delle due regioni limita ogni chiave alla soglia configurata, quindi il tuo servizio di backend potrebbe riscontrare volumi di traffico aggregati tra regioni raddoppiati della soglia configurata. Se la soglia configurata è impostata su 5000 richieste, il servizio di backend potrebbe ricevere 5000 richieste da una regione e 5000 richieste dalla seconda regione.

Tuttavia, per l'indirizzo IP del tipo di chiave, è ragionevole presumere che il traffico proveniente dallo stesso indirizzo IP client sia indirizzato alla regione più vicina a quella in cui viene eseguito il deployment dei backend. In questo caso, la limitazione di frequenza può essere considerata come applicata a livello di servizio di backend, indipendentemente dalle regioni in cui viene eseguito il deployment.

È importante notare che i limiti di frequenza applicati sono approssimativi e potrebbero non essere rigorosamente accurati rispetto alle soglie configurate. Inoltre, in rari casi, a causa del comportamento di routing interno, è possibile che la limitazione di frequenza possa essere applicata in più regioni rispetto a quelle in cui viene eseguito il deployment, con ripercussioni sull'accuratezza. Per questi motivi, ti consigliamo di utilizzare la limitazione di frequenza solo per ridurre gli abusi o per mantenere la disponibilità di applicazioni e servizi, non per applicare requisiti rigorosi in materia di quota o licenza.

Logging

Cloud Logging registra il nome del criterio di sicurezza, la priorità delle regole di limitazione della tariffa corrispondente, l'ID regola, l'azione associata e altre informazioni nei log delle richieste. Per ulteriori informazioni sul logging, consulta Utilizzare il logging delle richieste.

Integrazione con reCAPTCHA Enterprise

Puoi applicare una limitazione di frequenza ad alcune risorse reCAPTCHA Enterprise per ridurre l'abuso dei token e limitarne il riutilizzo. Queste risorse includono token di azione, token di sessione e cookie di esenzione. Per ulteriori informazioni sull'utilizzo della limitazione di frequenza con reCAPTCHA Enterprise, consulta la panoramica sulla gestione dei bot.

Passaggi successivi