Prácticas recomendadas para la administración de cuotas

En esta página, se describen las prácticas recomendadas para administrar la cuota de la API de Cloud Healthcare. Usa esta página si tu proyecto de Google Cloud tiene o podría tener una gran cantidad de tráfico y necesitas más cuota de la que proporciona la API de Cloud Healthcare de forma predeterminada.

Cuotas predeterminadas de la API de Cloud Healthcare

Las cuotas predeterminadas de la API de Cloud Healthcare no están diseñadas para todos los casos de uso, en particular, si tu proyecto de Google Cloud tiene una gran cantidad de tráfico. La API de Cloud Healthcare no aumenta automáticamente la cuota. Debes planificar y supervisar el uso de tu cuota.

Prácticas recomendadas para supervisar y ver la cuota

Existen varios métodos para ver el uso de tu cuota. Cuando estimes y veas la cuota de la API de Cloud Healthcare, te recomendamos que uses el modelo de cuota de servicio. El modelo te permite evaluar con precisión la cuota disponible que tienes según los siguientes criterios:

  • Si hay una anulación de administrador. Un principal al que se le otorgó el rol de Administrador de cuotas en una organización puede aplicar una anulación del administrador a la cuota en los proyectos de Google Cloud de la organización. Las anulaciones del administrador sustituyen los límites predeterminados y las anulaciones del productor.
  • Si hay una anulación del productor Un propietario de un servicio otorga una anulación del productor a un consumidor de un servicio. Google Cloud es el propietario del servicio de la API de Cloud Healthcare. Cualquier anulación de cuota que proporcione Google Cloud es una anulación del productor.

  • Indica si hay una anulación del consumidor. Una persona que realiza solicitudes a la API de Cloud Healthcare es un consumidor del servicio de la API de Cloud Healthcare. Puedes aplicar anulaciones del consumidor en varias situaciones, como limitar las cuotas en tu proyecto de Google Cloud como medida de control de costos para evitar que se exceda tu presupuesto.

Si tienes alguna de estas anulaciones en vigencia, puedes calcular tu límite de cuota del consumidor para obtener una evaluación precisa de tu cuota disponible.

Prácticas recomendadas para solicitar una cuota adicional

Google Cloud tiene procedimientos para solicitar una cuota más alta. Para obtener información sobre cómo se procesan las solicitudes de aumento de cuota, consulta Acerca de las solicitudes de aumento de cuota.

Antes de solicitar una cuota adicional, asegúrate de haber implementado lo siguiente:

Estas implementaciones podrían reducir la cantidad de cuota que necesitas por los siguientes motivos:

  • Ambas implementaciones distribuyen los aumentos repentinos de carga en varias horas o minutos, en lugar de segundos.
  • Ambas implementaciones usan la cuota de manera eficiente durante un período de 24 horas. Si las solicitudes que superan significativamente la cuota predeterminada son coherentes durante un período de 24 horas, se pueden asignar grupos de recursos más grandes al servicio de la API de Cloud Healthcare. La asignación adicional de recursos solo se realiza a pedido y se determina caso por caso.
  • El uso de recursos coherente facilita que Google Cloud comprenda tus requisitos de cuota y te proporcione la cuota que necesitas.

Para administrar la capacidad y la cuota de manera efectiva, debes conocer los requisitos de capacidad de la organización. Si estás planificando tus requisitos de capacidad y crees que necesitarás un gran aumento de cuota cuando tu proyecto de Google Cloud esté en producción, solicita un aumento al equipo de Atención al cliente de Google Cloud. El equipo de Atención al cliente puede ayudarte a asignar y aumentar la cuota durante las fases de prueba y lanzamiento de tu proyecto de Google Cloud.

No necesitas tener un servicio pagado de Atención al cliente para solicitar un aumento de cuota. Algunas solicitudes de aumento de cuota se completan en un plazo de 2 a 3 días hábiles, pero te recomendamos que te programes para un plazo más largo. Si el aumento de cuota es grande, la solicitud puede demorar 10 días hábiles o más en completarse. Parte de tu planificación debe incluir asignar tiempo para responder al equipo de Atención al cliente y resolver cualquier pregunta o problema abierto sobre la solicitud. Si te aseguras de que tu solicitud inicial de aumento de cuota sea lo suficientemente detallada, es posible que puedas reducir el tiempo que esperas a que se complete la solicitud.

Prácticas recomendadas para anticipar las necesidades de cuota

Antes de que tu proyecto de Google Cloud entre en producción, anticipa y planifica cuánta cuota necesitarás. Planificar tus requisitos de cuota evita limitaciones inesperadas del consumo de recursos más adelante.

En las siguientes secciones, se explica lo que debes tener en cuenta cuando planifiques la cuota.

Anticipar el uso total de todos los almacenes de datos y clientes

Comprende el uso total en todos los almacenes de datos de la API de Cloud Healthcare y el uso total de todos los clientes que realizan solicitudes a tu proyecto de Google Cloud.

  • Algunos proyectos de Google Cloud implementan varios casos de uso de la API de Cloud Healthcare. Por ejemplo, tu proyecto de Google Cloud podría usar varios conjuntos de datos y almacenes de datos de la API de Cloud Healthcare para diferentes tipos de datos, lo que aumentaría el uso total de tu cuota.
  • Las cuotas se aplican por proyecto de Google Cloud y por región. Asegúrate de tener mediciones precisas de la cuota requerida en varias regiones. Si tienes varios proyectos de Google Cloud, es posible que necesites mediciones más precisas en todos ellos. Para obtener más información sobre la planificación de la cuota por región, consulta Anticipa el uso por región.
  • La API de Cloud Healthcare no equilibra la cuota de carga entre clientes, conjuntos de datos ni almacenes de datos. El cliente debe determinar si debe implementar un esquema de priorización para garantizar que el tráfico más crítico no encuentre errores de 429 RESOURCE_EXHAUSTED.

Anticipa el uso por región

La API de Cloud Healthcare mide las cuotas por proyecto de Google Cloud y por región. Por lo general, las cuotas se miden por minuto, lo que permite que pequeños aumentos repentinos de solicitudes por segundo se equilibren en una escala por minuto.

Si tu proyecto de Google Cloud usa varias regiones, puedes establecer cuotas por región.

Si tu conjunto de datos de la API de Cloud Healthcare se encuentra en la ubicación multirregional us y deseas solicitar una cuota adicional, indica en tu solicitud que la cuota es para la "metaregión de EE.UU.". La ubicación multirregional us consiste en las siguientes subregiones:

  • us-central1
  • us-east1
  • us-west1

Si ya tienes tráfico de la API de Cloud Healthcare que usa la cuota en cualquiera de las subregiones de us-, asegúrate de tener en cuenta el tráfico existente en esas subregiones cuando realices una solicitud de aumento de cuota para la multiregión de us. Por ejemplo, si tienes conjuntos de datos en us-central1 y us, y solicitas un aumento de la cuota en us, especifica en tu solicitud que tienes conjuntos de datos en us-central1.

Prioriza las transacciones de bajo volumen de forma coherente

En la siguiente situación, se explica la importancia de enviar cantidades menores de tráfico de forma coherente en lugar de enviar transacciones de alto volumen con un intervalo más largo entre ellas.

El volumen de tráfico se calcula con la fórmula request payload * time = traffic volume. Una transacción de gran volumen es una o más solicitudes a la API de Cloud Healthcare en un intervalo breve que contienen una gran carga útil. Una serie de solicitudes también se puede considerar de gran volumen si se envían muchas solicitudes en un intervalo corto, independientemente del tamaño de la carga útil.

Supongamos que un cliente recopila transacciones de alto volumen y las envía a la API de Cloud Healthcare en una ráfaga cada cinco minutos. Ocurre lo siguiente:

  1. El aumento inicial de tráfico consume la cuota en el primer minuto (según los rollovers de minutos) hasta que se agota.
  2. El tráfico de ráfaga restante recibe errores 429 RESOURCE_EXHAUSTED. Si se configura, todas las solicitudes afectadas encuentran una retirada exponencial.
  3. Un porcentaje de las solicitudes que encontraron la retirada exponencial inicial se vuelve a programar para que se vuelvan a intentar en el siguiente minuto. Algunas solicitudes se intentan varias veces en un solo minuto y, luego, se vuelven a intentar al minuto siguiente.
  4. Si el volumen de solicitudes es lo suficientemente alto, es posible que las solicitudes reintentadas vuelvan a encontrar errores 429 RESOURCE_EXHAUSTED y una retirada exponencial. Ciertos aumentos repentinos de tráfico pueden encontrar una retirada exponencial en diferentes momentos, y los intentos de volver a enviar tráfico pueden converger en el mismo minuto en el futuro.
  5. Si el volumen de solicitudes sigue siendo alto, se vuelve a intentar parte del tráfico cuando comienza la siguiente expulsión de tráfico. El problema se agrava porque se agrega más tráfico al retraso existente de solicitudes. Es posible que tu aplicación tenga dificultades para mantener el retraso de las solicitudes y enviarlas de forma coherente a la API de Cloud Healthcare.

Esta situación muestra la importancia de conocer el volumen de tu tráfico por minuto. Implementa el volumen de tráfico y las retiradas para evitar la congestión de la red y asegúrate de que tu aplicación no encuentre muchos errores que requieran reintentos.

Revisa las cuotas de DICOM y FHIR

Para ver las cuotas de la API de Cloud Healthcare asociadas con las operaciones y los almacenes de FHIR y DICOM, consulta Límites de cuotas.