In questa pagina vengono descritte le best practice per la gestione della quota dell'API Cloud Healthcare. Utilizza questa pagina se il tuo progetto Google Cloud ha, o potrebbe avere, una grande quantità di traffico e hai bisogno di più quota rispetto a quella fornita dall'API Cloud Healthcare per impostazione predefinita.
Quote predefinite dell'API Cloud Healthcare
Le quote predefinite per l'API Cloud Healthcare non sono progettate per tutti i casi d'uso, in particolare se il progetto Google Cloud ha una grande quantità di traffico. L'API Cloud Healthcare non aumenta automaticamente la quota. Devi pianificare e monitorare l'utilizzo della quota.
Best practice per il monitoraggio e la visualizzazione della quota
Esistono diversi metodi per visualizzare l'utilizzo della quota. Per la stima e la visualizzazione della quota per l'API Cloud Healthcare, ti consigliamo di utilizzare il modello di quota di servizio. Il modello consente di valutare con precisione la quota disponibile in base ai seguenti criteri:
- Indica se è presente un override dell'amministratore. Un'entità a cui è stato concesso il ruolo Amministratore quote in un'organizzazione può applicare un override amministrativo alla quota nei progetti Google Cloud all'interno dell'organizzazione. Un override amministratore sostituisce i limiti predefiniti e gli override del producer.
Indica se è presente un override del producer. Il proprietario di un servizio concede l'override del producer a un consumer di un servizio. Google Cloud è il proprietario del servizio API Cloud Healthcare. Qualsiasi override della quota fornito da Google Cloud rappresenta un override del producer.
Indica se è presente un override del consumer. Chi invia richieste all'API Cloud Healthcare è un consumer del servizio API Cloud Healthcare. Puoi applicare override dei consumatori per varie situazioni, ad esempio la limitazione delle quote nel progetto Google Cloud come misura di controllo dei costi per evitare di superare il budget.
Se hai applicato uno di questi override, puoi calcolare il limite della quota consumer per avere una valutazione accurata della quota disponibile.
Best practice per richiedere una quota aggiuntiva
Google Cloud prevede procedure per richiedere una quota più alta. Per scoprire come vengono elaborate le richieste di aumento della quota, consulta Informazioni sulle richieste di aumento della quota.
Prima di richiedere una quota aggiuntiva, assicurati di aver implementato entrambe le seguenti operazioni:
Queste implementazioni potrebbero ridurre la quantità di quota richiesta per i seguenti motivi:
- Entrambe le implementazioni distribuiscono i picchi di carico nell'arco di diverse ore o minuti, anziché in secondi.
- Entrambe le implementazioni utilizzano la quota in modo efficiente in un periodo di 24 ore. Se le richieste che superano in modo significativo la quota predefinita sono coerenti nell'arco di 24 ore, pool di risorse più grandi possono essere assegnati al servizio API Cloud Healthcare. L'allocazione aggiuntiva delle risorse avviene solo su richiesta e viene determinata caso per caso.
- Un utilizzo coerente delle risorse consente a Google Cloud di comprendere più facilmente i requisiti di quota e di fornirti la quota di cui hai bisogno.
Per gestire in modo efficace capacità e quota, devi conoscere i requisiti di capacità della tua organizzazione. Se stai pianificando le tue esigenze di capacità e ritieni di aver bisogno di un aumento significativo della quota quando il tuo progetto Google Cloud sarà in produzione, richiedi un aumento all'assistenza clienti Google Cloud. L'assistenza clienti può aiutarti ad allocare e aumentare la quota durante le fasi di test e implementazione del tuo progetto Google Cloud.
Per richiedere un aumento della quota, non è necessario disporre di un servizio di assistenza clienti a pagamento. Alcune richieste di aumento della quota vengono completate entro 2-3 giorni lavorativi, ma ti consigliamo di pianificare più a lungo. Se l'aumento della quota è elevato, il completamento della richiesta di aumento della quota può richiedere almeno 10 giorni lavorativi. Parte della pianificazione deve includere l'allocazione del tempo per rispondere all'assistenza clienti per la risoluzione di eventuali domande o problemi irrisolti relativi alla richiesta. Se ti assicuri che la richiesta di aumento iniziale della quota sia sufficientemente dettagliata, potresti essere in grado di ridurre il tempo di attesa per il completamento della richiesta.
Best practice per prevedere il fabbisogno di quota
Prima che il tuo progetto Google Cloud vada in produzione, prevedi e pianifica la quota di cui avrai bisogno. La pianificazione dei requisiti di quota evita di limitare inaspettatamente il consumo delle risorse in un secondo momento.
Le sezioni seguenti spiegano cosa considerare quando si pianifica la quota.
Prevedi l'utilizzo totale per tutti i datastore e i clienti
Scopri il tuo utilizzo totale in tutti i datastore dell'API Cloud Healthcare e l'utilizzo totale di tutti i client che effettuano richieste al tuo progetto Google Cloud.
- Alcuni progetti Google Cloud implementano più casi d'uso dell'API Cloud Healthcare. Ad esempio, il tuo progetto Google Cloud potrebbe utilizzare più set di dati e datastore dell'API Cloud Healthcare per diversi tipi di dati, aumentando così l'utilizzo della quota totale.
- Le quote vengono applicate in base al singolo progetto Google Cloud e alla regione. Assicurati di disporre di misurazioni accurate della quota richiesta in più regioni. Se hai più progetti Google Cloud, potresti aver bisogno di misurazioni più accurate nei vari progetti. Per ulteriori informazioni sulla pianificazione della quota per regione, consulta Anticipare l'utilizzo per regione.
- L'API Cloud Healthcare non bilancia il carico delle quote tra client, set di dati o datastore. Il client deve determinare se implementare uno schema di priorità per garantire che il traffico più critico non rilevi errori
429 RESOURCE_EXHAUSTED
.
Prevedi l'utilizzo per regione
L'API Cloud Healthcare misura le quote in base al progetto Google Cloud e alla regione. In genere le quote vengono misurate al minuto, il che consente di bilanciare piccoli picchi di richieste al secondo su una scala al minuto.
Se il tuo progetto Google Cloud utilizza più regioni, puoi impostare quote per regione.
Se il set di dati dell'API Cloud Healthcare si trova nella località a più regioni us
e vuoi richiedere una quota aggiuntiva, nella richiesta di quota indica che la quota è per la "meta regione degli Stati Uniti". La località multiregionale us
è composta dalle seguenti sottoregioni:
us-central1
us-east1
us-west1
Se hai già il traffico dell'API Cloud Healthcare che utilizza la quota in una delle
us-
regioni secondarie, assicurati di prendere in considerazione il traffico esistente in queste regioni quando effettui una richiesta di aumento della quota per la località multiregionale us
.
Ad esempio, se disponi di set di dati in us-central1
e us
e richiedi un aumento della quota in us
, specifica nella richiesta che sono presenti set di dati in us-central1
.
Favorisci regolarmente le transazioni di volume ridotto
Lo scenario seguente spiega l'importanza di inviare quantità ridotte di traffico su base coerente invece di inviare transazioni ad alto volume con un intervallo più lungo tra le transazioni.
Il volume di traffico viene calcolato utilizzando la formula request payload * time = traffic volume
.
Una transazione a volume elevato corrisponde a una o più richieste all'API Cloud Healthcare in un breve intervallo che contengono un payload di grandi dimensioni.
Una serie di richieste può anche essere considerata con volume elevato se vengono inviate molte richieste in un intervallo breve, indipendentemente dalle dimensioni del payload.
Supponiamo che un client raccolga transazioni con volumi elevati e le invii all'API Cloud Healthcare in un burst ogni cinque minuti. Si verifica quanto segue:
- Il burst iniziale di traffico consuma quota nel primo minuto (in base ai riporti dei minuti) fino a esaurimento della quota.
- Tutto il traffico di burst rimanente riceve
429 RESOURCE_EXHAUSTED
errori. Se configurate, tutte le richieste interessate avranno un backoff esponenziale. - Una percentuale di richieste che hanno riscontrato il backoff esponenziale iniziale viene ripianificata per essere ritentata nel minuto successivo. Alcune richieste vengono tentate più volte in un solo minuto, quindi vengono ritentate il minuto successivo.
- Se il volume delle richieste è sufficientemente elevato, le richieste tentate nuovamente potrebbero riscontrare errori
429 RESOURCE_EXHAUSTED
e un backoff esponenziale di nuovo. Alcune burst di traffico potrebbero incontrare un backoff esponenziale in momenti diversi e i tentativi di inviare di nuovo il traffico potrebbero convergere nello stesso minuto in futuro. - Se il volume delle richieste è ancora elevato, viene fatto un nuovo tentativo all'inizio del successivo burst di traffico. Il problema si aggrava perché viene aggiunto più traffico al backlog esistente di richieste. La tua applicazione potrebbe avere difficoltà a gestire il backlog delle richieste e a inviarle in modo coerente all'API Cloud Healthcare.
Questo scenario mostra l'importanza di conoscere il volume del traffico al minuto. Implementa il volume di traffico e i backoff per evitare la congestione della rete e assicurarti che l'applicazione non incontri molti errori che richiedono nuovi tentativi.
Rivedi le quote DICOM e FHIR
Per visualizzare le quote dell'API Cloud Healthcare associate agli archivi e alle operazioni FHIR e DICOM, consulta Limiti di quota.
Risorse di gestione delle quote
Per ulteriori informazioni sulla pianificazione e la gestione delle quote, consulta Gestione di capacità e quota.