Utilizza il grafico di confronto riportato di seguito per decidere quale criterio utilizzare per il tuo caso d'uso di limitazione della frequenza:
Quota
SpikeArrest
Utilizzalo per:
Limita il numero di chiamate proxy API che uno sviluppatore o un'app per sviluppatori può effettuare in un
determinato periodo di tempo. Il criterio SpikeArrest è più adatto per la limitazione della frequenza su intervalli di tempo più brevi, come secondi o minuti. Valuta la possibilità di utilizzare Quota se il conteggio accurato è un requisito.
Limita il numero di chiamate API che possono essere effettuate su un proxy API per tutti i consumatori
in un periodo di tempo specifico (in genere breve). Il criterio di quota è più adatto per impostare limiti su intervalli di tempo più lunghi come giorni, settimane, mesi o anni.
Non utilizzarlo per:
Non utilizzarlo per proteggere il backend di destinazione del proxy API dagli picchi di traffico.
A tale scopo, utilizza il criterio SpikeArrest.
Non utilizzarlo per conteggiare e limitare il numero di connessioni che le app possono effettuare al backend di destinazione del proxy API in un determinato periodo di tempo. Nota: per tutti i casi d'uso che richiedono un conteggio accurato, utilizza il criterio di quota.
Memorizza un conteggio?
Sì
No
Best practice per l'attacco del criterio:
Allegalo al PreFlow della richiesta ProxyEndpoint, in genere dopo
l'autenticazione dell'utente.
In questo modo, il criterio può controllare il contatore delle quote nel punto di contatto del proxy API.
Collegalo al PreFlow della richiesta ProxyEndpoint, in genere all'inizio del flusso.
In questo modo viene fornita una protezione contro i picchi nel punto di contatto del proxy API.
Codice di stato HTTP quando viene raggiunto il limite:
429 (servizio non disponibile)
429 (servizio non disponibile)
Buono a sapersi:
Il contatore della quota è archiviato in Cassandra.
Configura il criterio per sincronizzare il contatore in modo asincrono per risparmiare risorse.
La sincronizzazione asincrona del contatore può causare un ritardo nella risposta del limite di frequenza, il che potrebbe consentire chiamate leggermente superiori al limite impostato.
Ti consente di scegliere tra un algoritmo di "appiattimento" o un algoritmo di conteggio effettivo. Il primo uniforma il numero di richieste che possono verificarsi in un determinato periodo di tempo, mentre il secondo limita il numero totale di richieste che possono verificarsi in un determinato periodo di tempo, indipendentemente dalla velocità con cui vengono inviate in successione. Inoltre, l'appiattimento non è coordinato tra i diversi
processori di messaggi.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-02-14 UTC."],[],[]]