Bonnes pratiques de gestion des quotas

Cette page décrit les bonnes pratiques de gestion des quotas de l'API Cloud Healthcare. Utilisez cette page si votre projet Google Cloud a, ou peut avoir, un trafic important et que vous avez besoin d'un quota supérieur à celui fourni par défaut par l'API Cloud Healthcare.

Quotas par défaut de l'API Cloud Healthcare

Les quotas par défaut de l'API Cloud Healthcare ne sont pas conçus pour tous les cas d'utilisation, en particulier si votre projet Google Cloud génère une grande quantité de trafic. L'API Cloud Healthcare n'augmente pas automatiquement le quota. Vous devez planifier et surveiller votre utilisation des quotas.

Bonnes pratiques de surveillance et d'affichage des quotas

Il existe plusieurs méthodes pour consulter l'utilisation des quotas. Lorsque vous estimez et affichez le quota de l'API Cloud Healthcare, nous vous recommandons d'utiliser le modèle de quota de service. Le modèle vous permet d'évaluer avec précision le quota disponible dont vous disposez en fonction des critères suivants:

  • Indique si un remplacement par l'administrateur est présent. Un compte principal disposant du rôle Administrateur de quotas au sein d'une organisation peut appliquer un quota de remplacement défini par l'administrateur aux quotas des projets Google Cloud de l'organisation. Un quota de remplacement défini par l'administrateur remplace les limites par défaut et les remplacements définis par le producteur.
  • Indique si un forçage défini par le producteur est présent. Le propriétaire d'un service accorde un quota de remplacement au producteur au consommateur d'un service. Google Cloud est le propriétaire du service de l'API Cloud Healthcare. Tout dépassement de quota fourni par Google Cloud est considéré comme un quota de remplacement défini par le producteur.

  • Indique si un forçage défini par le client est présent. Une personne qui envoie des requêtes à l'API Cloud Healthcare est un consommateur du service de l'API Cloud Healthcare. Vous pouvez appliquer des exceptions au niveau du client dans diverses situations, par exemple en limitant les quotas dans votre projet Google Cloud afin de maîtriser les coûts pour éviter de dépasser votre budget.

Si l'un de ces forçages est en vigueur, vous pouvez calculer votre limite de quota client pour obtenir une évaluation précise du quota disponible.

Bonnes pratiques pour demander des quotas supplémentaires

Google Cloud dispose de procédures pour demander un quota supérieur. Pour savoir comment sont traitées les demandes d'augmentation de quota, consultez À propos des demandes d'augmentation de quota.

Avant de demander une augmentation de quota, assurez-vous d'avoir mis en œuvre les deux éléments suivants:

Ces implémentations peuvent réduire la quantité de quota dont vous avez besoin pour les raisons suivantes:

  • Les deux implémentations répartissent les pics de charge sur plusieurs heures ou minutes, plutôt que sur plusieurs secondes.
  • Les deux implémentations utilisent efficacement le quota sur une période de 24 heures. Si les requêtes qui dépassent considérablement le quota par défaut sont cohérentes sur une période de 24 heures, des pools de ressources plus importants peuvent être alloués au service de l'API Cloud Healthcare. L'allocation supplémentaire des ressources est effectuée sur demande et déterminée au cas par cas.
  • Une utilisation cohérente des ressources permet à Google Cloud de mieux comprendre vos exigences en termes de quotas et de vous fournir le quota dont vous avez besoin.

Pour gérer efficacement votre capacité et vos quotas, vous devez connaître les exigences de capacité de votre organisation. Si vous planifiez vos besoins en capacité et pensez avoir besoin d'une augmentation importante de quota lorsque votre projet Google Cloud sera en production, demandez une augmentation auprès du Google Cloud Customer Care. Customer Care peut vous aider à attribuer et à augmenter les quotas pendant les phases de test et de déploiement de votre projet Google Cloud.

Vous n'avez pas besoin d'avoir une offre d'assistance Customer Care payante pour demander une augmentation de quota. Certaines demandes d'augmentation de quota sont traitées sous deux à trois jours ouvrés, mais nous vous recommandons de prévoir plus longtemps. Si l'augmentation de quota est importante, la demande peut prendre 10 jours ouvrés ou plus. Une partie de votre planification doit consister à prévoir du temps pour répondre au service client afin de résoudre toute question ou tout problème en suspens concernant la demande. Si vous vous assurez que votre demande initiale d'augmentation de quota est suffisamment détaillée, vous pourrez peut-être réduire le temps d'attente nécessaire à son traitement.

Bonnes pratiques d'anticipation des besoins en termes de quotas

Avant de lancer votre projet Google Cloud en production, anticipez et planifiez le quota dont vous aurez besoin. La planification de vos exigences en termes de quotas permet d'éviter toute limitation inattendue de votre consommation de ressources par la suite.

Dans les sections suivantes, nous expliquons les éléments à prendre en compte lors de la planification des quotas.

Anticipez l'utilisation totale de tous les data stores et clients

Comprenez votre utilisation totale dans tous les magasins de données de l'API Cloud Healthcare et l'utilisation totale de tous les clients qui envoient des requêtes à votre projet Google Cloud.

  • Certains projets Google Cloud implémentent plusieurs cas d'utilisation de l'API Cloud Healthcare. Par exemple, votre projet Google Cloud peut utiliser plusieurs ensembles de données et datastores de l'API Cloud Healthcare pour différents types de données, ce qui augmente votre utilisation totale de votre quota.
  • Les quotas sont appliqués par projet Google Cloud et par région. Assurez-vous de disposer de mesures précises du quota requis dans plusieurs régions. Si vous avez plusieurs projets Google Cloud, vous aurez peut-être besoin de mesures plus précises pour l'ensemble des projets. Pour en savoir plus sur la planification des quotas par région, consultez Anticiper l'utilisation par région.
  • L'API Cloud Healthcare n'équilibre pas la charge des quotas entre les clients, les ensembles de données ou les datastores. Le client doit déterminer s'il faut implémenter un schéma de priorisation pour s'assurer que le trafic le plus critique ne rencontre pas d'erreurs 429 RESOURCE_EXHAUSTED.

Anticiper l'utilisation par région

L'API Cloud Healthcare mesure les quotas par projet Google Cloud et par région. Les quotas sont généralement mesurés à la minute, ce qui permet de compenser de petits pics de requêtes par seconde sur une échelle par minute.

Si votre projet Google Cloud utilise plusieurs régions, vous pouvez définir des quotas par région.

Si l'ensemble de données de l'API Cloud Healthcare se trouve dans la zone multirégionale us et que vous souhaitez demander un quota supplémentaire, indiquez dans votre demande de quota que le quota correspond à la "métarégion des États-Unis". L'emplacement multirégional us se compose des sous-régions suivantes:

  • us-central1
  • us-east1
  • us-west1

Si vous disposez déjà de trafic de l'API Cloud Healthcare utilisant le quota dans l'une des sous-régions us-, veillez à prendre en compte le trafic existant dans ces sous-régions lorsque vous effectuez une demande d'augmentation de quota pour l'emplacement multirégional us. Par exemple, si vous avez des ensembles de données dans us-central1 et us, et que vous demandez une augmentation de quota dans us, indiquez que vous avez des ensembles de données dans us-central1.

Favoriser régulièrement les transactions à faible volume

Le scénario suivant explique l'importance d'envoyer de petites quantités de trafic de manière cohérente plutôt que d'envoyer des transactions à volume élevé avec un intervalle plus long entre les transactions.

Le volume de trafic est calculé à l'aide de la formule request payload * time = traffic volume. Une transaction de volume élevé correspond à une ou plusieurs requêtes adressées à l'API Cloud Healthcare dans un court intervalle, qui contiennent une charge utile importante. Une série de requêtes peut également être considérée comme un volume élevé si de nombreuses requêtes sont envoyées sur un court intervalle, quelle que soit la taille de la charge utile.

Supposons qu'un client collecte des transactions volumineuses et les envoie à l'API Cloud Healthcare en rafale toutes les cinq minutes. Voici ce qui se produit:

  1. La première rafale de trafic consomme le quota au cours de la première minute (en fonction de reportages de minutes) jusqu'à ce que la totalité du quota soit épuisée.
  2. Tout trafic en rafale restant reçoit 429 RESOURCE_EXHAUSTED erreurs. Si elle est configurée, toutes les requêtes concernées rencontrent un intervalle exponentiel entre les tentatives.
  3. Un certain pourcentage des requêtes ayant rencontré l'intervalle exponentiel initial est reprogrammé pour être réessayé au cours de la minute suivante. Certaines requêtes sont exécutées plusieurs fois en une seule minute, puis font l'objet d'une nouvelle tentative dans la minute qui suit.
  4. Si le volume de requêtes est suffisamment élevé, les requêtes relancées peuvent rencontrer des erreurs 429 RESOURCE_EXHAUSTED et un intervalle exponentiel entre les tentatives. Certaines rafales de trafic peuvent rencontrer un intervalle exponentiel entre les tentatives à différents moments, et les tentatives d'envoi de trafic peuvent converger à la même minute à l'avenir.
  5. Si le volume de requêtes est toujours élevé, une nouvelle tentative de trafic est effectuée au début de la prochaine rafale de trafic. Le problème est aggravé, car davantage de trafic est ajouté aux tâches en attente existantes. Votre application peut avoir des difficultés à gérer les requêtes en attente et à les envoyer de manière cohérente à l'API Cloud Healthcare.

Ce scénario montre l'importance de connaître le volume de votre trafic par minute. Mettez en œuvre le volume de trafic et les intervalles entre les tentatives pour éviter l'encombrement du réseau et vous assurer que votre application ne rencontre pas de nombreuses défaillances nécessitant de nouvelles tentatives.

Examiner les quotas DICOM et FHIR

Pour afficher les quotas de l'API Cloud Healthcare associés aux magasins et aux opérations FHIR et DICOM, consultez la section Limites de quota.

Ressources pour la gestion des quotas

Pour en savoir plus sur la planification et la gestion des quotas, consultez la page Gérer la capacité et les quotas.