Prácticas recomendadas para la administración de cuotas

En esta página, se describen las prácticas recomendadas para administrar las cuotas de la API de Cloud Healthcare. Usa esta página si tu proyecto de Google Cloud tiene o podría tener una gran cantidad de tráfico y necesitas más cuota que la que proporciona la API de Cloud Healthcare de forma predeterminada.

Cuotas predeterminadas de la API de Cloud Healthcare

Las cuotas de la API de Cloud Healthcare predeterminadas no están diseñadas para todos los casos prácticos, en particular si tu proyecto de Google Cloud tiene una gran cantidad de tráfico. La API de Cloud Healthcare no aumenta la cuota de forma automática. Debes planificar y supervisar el uso de la cuota.

Prácticas recomendadas para supervisar y ver las cuotas

Existen varios métodos para ver el uso de tu cuota. Cuando estimes y visualices la cuota de la API de Cloud Healthcare, te recomendamos que uses el Modelo de cuota de servicio. El modelo te permite evaluar con precisión la cuota disponible que tienes según los siguientes criterios:

  • Indica si hay una anulación del administrador. Una principal a la que se le otorga la función de Administrador de cuotas en una organización puede aplicar una anulación de administrador a la cuota en los proyectos de Google Cloud dentro de la organización. Una anulación de administrador reemplaza los límites predeterminados y las anulaciones de productor.
  • Indica si hay una anulación del productor. El propietario del servicio otorga una anulación del productor a un consumidor de un servicio. Google Cloud es el propietario del servicio de la API de Cloud Healthcare. Cualquier anulación de cuota que proporcione Google Cloud es una anulación del productor.

  • Indica si hay una anulación del consumidor. Alguien que realiza solicitudes a la API de Cloud Healthcare es consumidor del servicio de la API de Cloud Healthcare. Puedes aplicar anulaciones del consumidor en varias situaciones, como limitar las cuotas en tu proyecto de Google Cloud como una medida de control de costos para evitar exceder el presupuesto.

Si tienes alguna de estas anulaciones vigente, puedes calcular el límite de cuota de consumidor para obtener una evaluación precisa de tu cuota disponible.

Prácticas recomendadas para solicitar cuota adicional

Google Cloud tiene procedimientos para solicitar una cuota más alta. Si deseas obtener información sobre cómo se procesan las solicitudes de aumento de cuota, consulta Acerca de las solicitudes de aumento de cuota.

Antes de solicitar una cuota adicional, asegúrate de implementar las siguientes opciones:

Estas implementaciones pueden reducir la cantidad de cuota que necesitas por los siguientes motivos:

  • Ambas implementaciones distribuyen la carga repentinamente durante varias horas o minutos, en lugar de segundos.
  • Ambas implementaciones usan la cuota de forma eficiente durante un período de 24 horas. Si las solicitudes que superan significativamente la cuota predeterminada son coherentes durante un período de 24 horas, se pueden asignar grupos de recursos más grandes al servicio de la API de Cloud Healthcare. La asignación adicional de recursos se realiza solo a pedido y se determina según cada caso.
  • El uso coherente de recursos permite que Google Cloud comprenda los requisitos de cuota y te proporcione la cuota que necesitas con más facilidad.

Para administrar la capacidad y la cuota de manera efectiva, debes conocer los requisitos de capacidad de tu organización. Si estás planificando tus requisitos de capacidad y crees que necesitarás un gran aumento de cuota cuando tu proyecto de Google Cloud esté en producción, solicita un aumento al equipo de Atención al cliente de Google Cloud. Customer Care puede ayudarte a asignar y aumentar la cuota durante las fases de prueba y lanzamiento de tu proyecto de Google Cloud.

No necesitas tener un servicio pagado de Atención al cliente para solicitar un aumento de cuota. Algunas solicitudes de aumento de cuota se completan en un plazo de 2 a 3 días hábiles, pero te recomendamos que planifiques más tiempo. Si el aumento de cuota es grande, la solicitud de aumento de cuota puede tardar 10 días hábiles o más en completarse. Parte de tu planificación debe implicar asignar tiempo para responder al equipo de Atención al cliente y resolver cualquier pregunta o problema abierto en relación con la solicitud. Si te aseguras de que tu solicitud de aumento de cuota inicial sea lo suficientemente detallada, es posible que puedas reducir el tiempo dedicado a esperar que se complete la solicitud.

Prácticas recomendadas para anticipar las necesidades de cuota

Antes de que tu proyecto de Google Cloud entre en producción, anticipa la cuota que necesitarás y planifica la cantidad de cuota que necesitarás. Planificar los requisitos de cuota evita que se limite el consumo de recursos de forma inesperada más adelante.

En las siguientes secciones, se explica qué debes tener en cuenta cuando planificas la cuota.

Anticipa el uso total de todos los almacenes de datos y clientes.

Comprende tu uso total en todos los almacenes de datos de la API de Cloud Healthcare y el uso total de todos los clientes que realizan solicitudes a tu proyecto de Google Cloud.

  • Algunos proyectos de Google Cloud implementan varios casos de uso de la API de Cloud Healthcare. Por ejemplo, tu proyecto de Google Cloud podría usar varios conjuntos de datos y almacenes de datos de la API de Cloud Healthcare para diferentes tipos de datos, lo que aumentaría el uso total de la cuota.
  • Las cuotas se aplican por proyecto de Google Cloud y por región. Asegúrate de tener mediciones precisas de la cuota requerida en varias regiones. Si tienes varios proyectos de Google Cloud, es posible que necesites mediciones más precisas en todos los proyectos. Si quieres obtener más información para planificar la cuota por región, consulta Anticipa el uso por región.
  • Esta API no balancea las cargas de la cuota entre clientes, conjuntos de datos ni almacenes de datos. El cliente debe determinar si debe implementar un esquema de priorización para asegurarse de que el tráfico más crítico no encuentre errores 429 RESOURCE_EXHAUSTED.

Anticipa el uso por región

La API de Cloud Healthcare mide las cuotas por proyecto de Google Cloud y por región. Por lo general, las cuotas se miden por minuto, lo que permite que los pequeños aumentos de solicitudes por segundo se equilibran en una escala por minuto.

Si tu proyecto de Google Cloud usa varias regiones, puedes establecer cuotas por región.

Si el conjunto de datos de la API de Cloud Healthcare se encuentra en la ubicación multirregional us y deseas solicitar una cuota adicional, indica en tu solicitud de cuota que la cuota corresponde a la “metaregión de EE.UU.”. La ubicación multirregional us consta de las siguientes subregiones:

  • us-central1
  • us-east1
  • us-west1

Si ya tienes tráfico de la API de Cloud Healthcare mediante cuota en cualquiera de las subregiones us-, asegúrate de tener en cuenta el tráfico existente en esas subregiones cuando realices una solicitud de aumento de cuota para la multirregión us. Por ejemplo, si tienes conjuntos de datos en us-central1 y us, y solicitas un aumento de cuota en us, especifica en tu solicitud que tengas conjuntos de datos en us-central1.

Priorizar las transacciones de bajo volumen de forma periódica

En la siguiente situación, se explica la importancia de enviar pequeñas cantidades de tráfico de manera coherente en lugar de enviar transacciones de gran volumen con un intervalo más largo entre transacciones.

El volumen de tráfico se calcula con la fórmula request payload * time = traffic volume. Una transacción de volumen alto es una o más solicitudes a la API de Cloud Healthcare en un intervalo corto que contienen una carga útil grande. Una serie de solicitudes también se puede considerar de alto volumen si hay muchas solicitudes enviadas en un intervalo corto, sin importar el tamaño de la carga útil.

Supongamos que un cliente recopila transacciones de gran volumen y las envía a la API de Cloud Healthcare en ráfaga cada cinco minutos. Ocurre lo siguiente:

  1. El aumento de actividad inicial de tráfico consume la cuota en el primer minuto (depende de las transferencias de minutos) hasta que se agote toda la cuota.
  2. El tráfico en ráfaga restante recibe errores 429 RESOURCE_EXHAUSTED. Si se configura, todas las solicitudes afectadas experimentan una retirada exponencial.
  3. Algunos porcentajes de las solicitudes que encontraron la retirada exponencial inicial se reprograman para que se vuelvan a intentar en el siguiente minuto. Algunas solicitudes se intentan varias veces en un solo minuto y, luego, se vuelven a intentar en el minuto siguiente.
  4. Si el volumen de solicitudes es lo suficientemente alto, las solicitudes que se reintentarán podrían generar errores 429 RESOURCE_EXHAUSTED y una retirada exponencial nuevamente. Ciertos aumentos de actividad de tráfico pueden encontrar una retirada exponencial en diferentes momentos, y los intentos de volver a enviar tráfico pueden converger en el mismo minuto en el futuro.
  5. Si el volumen de solicitudes sigue siendo alto, se reintenta parte del tráfico cuando comienza el siguiente aumento de actividad. El problema se agrava porque se agrega más tráfico a las solicitudes pendientes existentes. Es posible que tu aplicación tenga dificultades para mantener las solicitudes pendientes y enviarlas de manera coherente a la API de Cloud Healthcare.

En esta situación, se muestra la importancia de conocer el volumen de tu tráfico por minuto. Implementa el volumen de tráfico y las retiradas para evitar la congestión de la red y asegúrate de que tu aplicación no encuentre muchas fallas que requieran reintentos.

Revisa las cuotas de DICOM y FHIR

Para ver las cuotas de la API de Cloud Healthcare asociadas con los almacenes y operaciones de FHIR y DICOM, consulta Límites de cuota.

Recursos de administración de cuotas

Para obtener más información sobre la planificación y administración de las cuotas, consulta Administra la capacidad y la cuota.