Questa pagina descrive le best practice per la gestione della quota dell'API Cloud Healthcare. Utilizza questa pagina se il tuo Google Cloud progetto ha o potrebbe avere un volume elevato di traffico e hai bisogno di una quota maggiore di quella fornita dall'API Cloud Healthcare per impostazione predefinita.
Quote predefinite dell'API Cloud Healthcare
Le quote predefinite dell'API Cloud Healthcare non sono progettate per tutti i casi d'uso, in particolare se il tuo Google Cloud progetto ha un volume elevato di traffico. L'API Cloud Healthcare non aumenta automaticamente la quota. Devi pianificare e monitorare l'utilizzo della quota.
Best practice per il monitoraggio e la visualizzazione della quota
Esistono diversi metodi per visualizzare l'utilizzo della quota. Per stimare e visualizzare la quota per l'API Cloud Healthcare, ti consigliamo di utilizzare il modello di quota del servizio. Il modello ti consente di valutare con precisione la quota disponibile in base ai seguenti criteri:
- Se è presente una sostituzione dell'amministratore. Un principale a cui è stato assegnato il ruolo Amministratore quota in un'organizzazione può applicare un'override amministrativo alla quota neiGoogle Cloud progetti all'interno dell'organizzazione. Un'override dell'amministratore sostituisce i limiti predefiniti e le override del producer.
Se è presente un'override del produttore. Un proprietario di servizio concede un'override del produttore a un consumatore di un servizio. Google Cloud è il proprietario del servizio dell'API Cloud Healthcare. Qualsiasi sostituzione della quota Google Cloud fornita è una sostituzione del producer.
Indica se è presente un override del consumer. Chi invia richieste all'API Cloud Healthcare è un consumatore del servizio dell'API Cloud Healthcare. Puoi applicare le sostituzioni dei consumer per varie situazioni, ad esempio limitare le quote nel Google Cloud progetto come misura di controllo dei costi per evitare di superare il budget.
Se hai attivato una di queste sostituzioni, puoi calcolare il limite della quota consumer per ottenere una valutazione accurata della quota disponibile.
Best practice per la richiesta di una quota aggiuntiva
Google Cloud ha procedure per richiedere una quota più alta. Per scoprire come vengono elaborate le richieste di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.
Prima di richiedere una quota aggiuntiva, assicurati di aver implementato entrambi i seguenti elementi:
Queste implementazioni potrebbero ridurre la quantità di quota richiesta per i seguenti motivi:
- Entrambe le implementazioni distribuiscono gli picchi di carico su diverse ore o minuti, piuttosto che su secondi.
- Entrambe le implementazioni utilizzano in modo efficiente la quota in un periodo di 24 ore. Se le richieste che superano notevolmente la quota predefinita sono coerenti per un periodo di 24 ore, è possibile allocare pool di risorse più grandi al servizio API Cloud Healthcare. L'allocazione aggiuntiva delle risorse avviene solo su richiesta e viene determinata caso per caso.
- L'utilizzo coerente delle risorse semplifica Google Cloud la comprensione delle tue esigenze relative alle quote e ti consente di ottenere la quota di cui hai bisogno.
Per gestire in modo efficace la capacità e la quota, devi conoscere i requisiti di capacità della tua organizzazione. Se stai pianificando i requisiti di capacità e ritieni di aver bisogno di un aumento significativo della quota quando il Google Cloud progetto è in produzione, richiedi un aumento al Google Cloud team dell'assistenza clienti. L'assistenza clienti può aiutarti ad allocare e aumentare la quota durante le fasi di test e implementazione del tuo Google Cloud progetto.
Non è necessario disporre di un servizio clienti a pagamento per richiedere un aumento della quota. Alcune richieste di aumento della quota vengono completate entro 2-3 giorni lavorativi, ma consigliamo di pianificare un periodo di tempo più lungo. Se l'aumento della quota è elevato, possono essere necessari 10 giorni lavorativi o più per completare la richiesta di aumento della quota. Parte della pianificazione deve prevedere la possibilità di rispondere all'assistenza clienti per risolvere eventuali domande o problemi relativi alla richiesta. Se ti assicuri che la richiesta di aumento della quota iniziale sia sufficientemente dettagliata, potresti ridurre il tempo di attesa per l'evasione della richiesta.
Best practice per prevedere le esigenze relative alle quote
Prima che il Google Cloud progetto venga implementato in produzione, prevedi e pianifica la quota di cui avrai bisogno. La pianificazione dei requisiti di quota evita una limitazione imprevista del consumo di risorse in un secondo momento.
Le sezioni seguenti spiegano cosa prendere in considerazione quando pianifichi la quota.
Anticipa l'utilizzo totale per tutti i client e gli store di dati
Scopri il tuo utilizzo totale in tutti i datastore dell'API Cloud Healthcare e l'utilizzo totale di tutti i client che inviano richieste al tuo progettoGoogle Cloud .
- Alcuni Google Cloud progetti implementano più casi d'uso dell'API Cloud Healthcare. Ad esempio, il tuo Google Cloud progetto potrebbe utilizzare più set di dati e datastore dell'API Cloud Healthcare per tipi diversi di dati, aumentando così l'utilizzo totale della quota.
- Le quote vengono applicate a livello di progettoGoogle Cloude di regione. Assicurati di avere misurazioni accurate della quota richiesta in più regioni. Se hai più Google Cloud progetti, potrebbe essere necessario eseguire misurazioni più accurate tra i progetti. Per saperne di più sulla pianificazione della quota per regione, consulta Prevedere l'utilizzo per regione.
- L'API Cloud Healthcare non esegue il bilanciamento del carico della quota tra client, set di dati o
datastore. Il cliente deve stabilire se implementare un sistema di priorità per assicurarsi che il traffico più critico non generi errori
429 RESOURCE_EXHAUSTED
.
Anticipare l'utilizzo per regione
L'API Cloud Healthcare misura le quote in base al progettoGoogle Cloude alla regione. Le quote vengono misurate in genere in base al minuto, il che consente di bilanciare piccoli picchi di richieste al secondo su una scala in base al minuto.
Se il tuo Google Cloud progetto utilizza più regioni, puoi impostare quote per regione.
Se il set di dati dell'API Cloud Healthcare si trova nella località multiregionale us
e vuoi richiedere una quota aggiuntiva, indica nella richiesta che la quota è per la "metaregione degli Stati Uniti". La us
località multiregionale è composta dalle seguenti sottoregioni:
us-central1
us-east1
us-west1
Se il traffico dell'API Cloud Healthcare utilizza già una quota in una delle subregioni us-
, assicurati di prendere in considerazione il traffico esistente in queste subregioni quando effettui una richiesta di aumento della quota per la regione multipla us
.
Ad esempio, se hai set di dati in us-central1
e us
e richiedi un aumento della quota in us
, specifica nella richiesta che hai set di dati in us-central1
.
Favorire le transazioni a basso volume in modo coerente
Il seguente scenario spiega l'importanza di inviare quantità minori di traffico in modo coerente anziché inviare transazioni ad alto volume con un intervallo più lungo tra le transazioni.
Il volume di traffico viene calcolato utilizzando la formula request payload * time = traffic volume
.
Una transazione ad alto volume è costituita da una o più richieste all'API Cloud Healthcare in un breve intervallo di tempo che contengono un payload di grandi dimensioni.
Una serie di richieste può essere considerata ad alto volume anche se vengono inviate molte richieste in un breve intervallo, indipendentemente dalle dimensioni del payload.
Supponiamo che un client raccolga transazioni ad alto volume e le invii all'API Cloud Healthcare in un picco ogni cinque minuti. accade quanto segue:
- L'impennata iniziale del traffico consuma la quota nel primo minuto (a seconda dei rollover minuto) fino a esaurimento della quota.
- Qualsiasi traffico burst rimanente riceve errori
429 RESOURCE_EXHAUSTED
. Se è configurato, tutte le richieste interessate subiscono un backoff esponenziale. - Per una certa percentuale di richieste che hanno riscontrato il backoff esponenziale iniziale, viene pianificato un nuovo tentativo nel minuto successivo. Per alcune richieste viene eseguito un tentativo più volte in un solo minuto, dopodiché viene eseguito un nuovo tentativo nel minuto successivo.
- Se il volume delle richieste è sufficientemente elevato, le richieste ripetute potrebbero riscontrare nuovamente errori
429 RESOURCE_EXHAUSTED
e il backoff esponenziale. Determinati picchi di traffico potrebbero riscontrare un backoff esponenziale in momenti diversi e i tentativi di inviare nuovamente traffico potrebbero convergere nello stesso minuto in futuro. - Se il volume delle richieste è ancora elevato, viene eseguito un nuovo tentativo per parte del traffico all'inizio del successivo picco di traffico. Il problema è aggravato dal fatto che al backlog esistente di richieste viene aggiunto altro traffico. La tua applicazione potrebbe avere difficoltà a gestire l'elenco di richieste in attesa e a inviarle in modo coerente all'API Cloud Healthcare.
Questo scenario mostra l'importanza di conoscere il volume del traffico su base giornaliera. Implementa il volume del traffico e i ritardi per evitare la congestione della rete e assicurarti che la tua applicazione non riscontri molti errori che richiedono ripetuti tentativi.
Rivedi le quote DICOM e FHIR
Per visualizzare le quote dell'API Cloud Healthcare associate a operazioni e depositi FHIR e DICOM, consulta Limiti di quota.