Questa pagina descrive le best practice per la gestione della quota dell'API Cloud Healthcare. Utilizza questa pagina se il tuo progetto Google Cloud ha o potrebbe avere un volume elevato di traffico e hai bisogno di una quota maggiore di quella fornita per impostazione predefinita dall'API Cloud Healthcare.
Quote predefinite dell'API Cloud Healthcare
Le quote predefinite dell'API Cloud Healthcare non sono progettate per tutti i casi d'uso, in particolare se il tuo progetto Google Cloud ha un volume elevato di traffico. L'API Cloud Healthcare non aumenta automaticamente la quota. Devi pianificare e monitorare l'utilizzo della quota.
Best practice per il monitoraggio e la visualizzazione della quota
Esistono diversi metodi per visualizzare l'utilizzo della quota. Per stimare e visualizzare la quota per l'API Cloud Healthcare, ti consigliamo di utilizzare il modello di quota del servizio. Il modello ti consente di valutare con precisione la quota disponibile in base ai seguenti criteri:
- Se è presente una sostituzione dell'amministratore. Un principale a cui è stato assegnato il ruolo Amministratore quota in un'organizzazione può applicare un'override amministrativo alla quota nei progetti Google Cloud all'interno dell'organizzazione. Un'override dell'amministratore sostituisce i limiti predefiniti e le override del producer.
Se è presente un'sostituzione del produttore. Un proprietario di un servizio concede un'override del producer a un consumatore di un servizio. Google Cloud è il proprietario del servizio API Cloud Healthcare. Qualsiasi override della quota fornito da Google Cloud è un override del produttore.
Indica se è presente un override del consumer. Chi invia richieste all'API Cloud Healthcare è un consumatore del servizio dell'API Cloud Healthcare. Puoi applicare le sostituzioni dei consumatori per varie situazioni, ad esempio limitare le quote nel tuo progetto Google Cloud come misura di controllo dei costi per evitare di superare il budget.
Se hai attivato una di queste sostituzioni, puoi calcolare il limite della quota consumer per ottenere una valutazione accurata della quota disponibile.
Best practice per la richiesta di una quota aggiuntiva
Google Cloud dispone di procedure per richiedere una quota più alta. Per scoprire come vengono elaborate le richieste di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.
Prima di richiedere una quota aggiuntiva, assicurati di aver implementato entrambi i seguenti elementi:
Queste implementazioni potrebbero ridurre la quantità di quota richiesta per i seguenti motivi:
- Entrambe le implementazioni distribuiscono gli picchi di carico su diverse ore o minuti, piuttosto che su secondi.
- Entrambe le implementazioni utilizzano in modo efficiente la quota in un periodo di 24 ore. Se le richieste che superano notevolmente la quota predefinita sono coerenti per un periodo di 24 ore, è possibile allocare pool di risorse più grandi al servizio API Cloud Healthcare. L'allocazione aggiuntiva delle risorse avviene solo su richiesta e viene determinata caso per caso.
- Un utilizzo coerente delle risorse semplifica per Google Cloud la comprensione dei requisiti relativi alle quote e la fornitura della quota necessaria.
Per gestire in modo efficace la capacità e la quota, devi conoscere i requisiti di capacità della tua organizzazione. Se stai pianificando i requisiti di capacità e ritieni di aver bisogno di un aumento significativo della quota quando il tuo progetto Google Cloud è in produzione, richiedi un aumento all'assistenza clienti di Google Cloud. L'assistenza clienti può aiutarti ad allocare e aumentare la quota durante le fasi di test e implementazione del tuo progetto Google Cloud.
Non è necessario disporre di un servizio clienti a pagamento per richiedere un aumento della quota. Alcune richieste di aumento della quota vengono completate entro 2-3 giorni lavorativi, ma consigliamo di prevedere un periodo di tempo più lungo. Se l'aumento della quota è elevato, possono essere necessari 10 giorni lavorativi o più per completare la richiesta di aumento della quota. Parte della pianificazione deve prevedere la possibilità di rispondere all'assistenza clienti per risolvere eventuali domande o problemi relativi alla richiesta. Se ti assicuri che la richiesta di aumento della quota iniziale sia sufficientemente dettagliata, potresti ridurre il tempo di attesa per l'evasione della richiesta.
Best practice per prevedere le esigenze relative alle quote
Prima di rendere produttivo il tuo progetto Google Cloud, prevedi e pianifica la quota di cui avrai bisogno. La pianificazione dei requisiti di quota evita una limitazione imprevista del consumo di risorse in un secondo momento.
Le sezioni seguenti spiegano cosa prendere in considerazione quando pianifichi la quota.
Anticipa l'utilizzo totale per tutti i client e gli store di dati
Scopri il tuo utilizzo totale in tutti i datastore dell'API Cloud Healthcare e l'utilizzo totale di tutti i client che inviano richieste al tuo progetto Google Cloud.
- Alcuni progetti Google Cloud implementano più casi d'uso dell'API Cloud Healthcare. Ad esempio, il tuo progetto Google Cloud potrebbe utilizzare più set di dati e datastore dell'API Cloud Healthcare per tipi di dati diversi, aumentando così l'utilizzo totale della quota.
- Le quote vengono applicate in base al progetto Google Cloud e alla regione. Assicurati di avere misurazioni accurate della quota richiesta in più regioni. Se hai più progetti Google Cloud, potresti aver bisogno di misurazioni più precise tra i progetti. Per saperne di più sulla pianificazione della quota per regione, consulta Prevedere l'utilizzo per regione.
- L'API Cloud Healthcare non esegue il bilanciamento del carico della quota tra client, set di dati o
datastore. Il cliente deve stabilire se implementare un sistema di priorità per assicurarsi che il traffico più critico non generi errori
429 RESOURCE_EXHAUSTED
.
Anticipa l'utilizzo per regione
L'API Cloud Healthcare misura le quote in base a progetto Google Cloud e regione. Le quote vengono misurate in genere in base al minuto, il che consente di bilanciare piccoli picchi di richieste al secondo su una scala in base al minuto.
Se il tuo progetto Google Cloud utilizza più regioni, puoi impostare quote per regione.
Se il set di dati dell'API Cloud Healthcare si trova nella località multiregionale us
e vuoi richiedere una quota aggiuntiva, indica nella richiesta che la quota è per la "metaregione degli Stati Uniti". La us
località multiregionale è composta dalle seguenti sottoregioni:
us-central1
us-east1
us-west1
Se il traffico dell'API Cloud Healthcare utilizza già una quota in una delle subregioni us-
, assicurati di prendere in considerazione il traffico esistente in queste subregioni quando effettui una richiesta di aumento della quota per la regione multipla us
.
Ad esempio, se hai set di dati in us-central1
e us
e richiedi un aumento della quota in us
, specifica nella richiesta che hai set di dati in us-central1
.
Favorire le transazioni a basso volume in modo coerente
Il seguente scenario spiega l'importanza di inviare quantità minori di traffico in modo coerente anziché inviare transazioni ad alto volume con un intervallo più lungo tra le transazioni.
Il volume di traffico viene calcolato utilizzando la formula request payload * time = traffic volume
.
Una transazione ad alto volume è costituita da una o più richieste all'API Cloud Healthcare in un breve intervallo di tempo che contengono un payload di grandi dimensioni.
Una serie di richieste può essere considerata ad alto volume anche se vengono inviate molte richieste in un breve intervallo, indipendentemente dalle dimensioni del payload.
Supponiamo che un client raccolga transazioni ad alto volume e le invii all'API Cloud Healthcare in un picco ogni cinque minuti. accade quanto segue:
- L'impennata iniziale del traffico consuma la quota nel primo minuto (a seconda dei rollover di un minuto) fino a esaurimento della quota.
- Qualsiasi traffico burst rimanente riceve errori
429 RESOURCE_EXHAUSTED
. Se è configurato, tutte le richieste interessate presentano un backoff esponenziale. - Per una certa percentuale di richieste che hanno riscontrato il backoff esponenziale iniziale, viene pianificato un nuovo tentativo nel minuto successivo. Per alcune richieste viene eseguito un tentativo più volte in un solo minuto, dopodiché viene eseguito un nuovo tentativo nel minuto successivo.
- Se il volume delle richieste è sufficientemente elevato, le richieste ripetute potrebbero riscontrare nuovamente errori
429 RESOURCE_EXHAUSTED
e il backoff esponenziale. Determinati picchi di traffico potrebbero riscontrare il backoff esponenziale in momenti diversi e i tentativi di inviare nuovamente traffico potrebbero convergere nello stesso minuto in futuro. - Se il volume delle richieste è ancora elevato, viene riprovato con parte del traffico quando inizia il successivo picco di traffico. Il problema è aggravato dal fatto che al backlog esistente di richieste viene aggiunto altro traffico. La tua applicazione potrebbe avere difficoltà a gestire l'elenco di richieste in attesa e a inviarle in modo coerente all'API Cloud Healthcare.
Questo scenario mostra l'importanza di conoscere il volume del traffico su base giornaliera. Implementa il volume del traffico e i ritardi per evitare la congestione della rete e assicurarti che la tua applicazione non riscontri molti errori che richiedono ripetuti tentativi.
Rivedi le quote DICOM e FHIR
Per visualizzare le quote dell'API Cloud Healthcare associate a operazioni e depositi FHIR e DICOM, consulta Limiti di quota.