Política de cuotas

AI Platform limita el uso y la asignación de recursos, y aplica las cuotas correspondientes a cada proyecto. Las políticas específicas varían según la disponibilidad de los recursos, el perfil del usuario, el historial de uso del servicio y otros factores, y están sujetas a cambios sin previo aviso.

En las siguientes secciones, se describen los límites de cuota actuales del sistema.

Límites de las solicitudes de servicio

Solo se puede realizar una cantidad limitada de solicitudes de API individuales por intervalo de 60 segundos. Cada límite se aplica a una API o grupo de API específico, según se describe en las siguientes secciones.

Puedes ver las cuotas de solicitud de tu proyecto en el administrador de API para AI Platform en Google Cloud Console. Si deseas solicitar una cuota superior, haz clic en el ícono de edición que aparece junto con el límite de cuota y selecciona Solicitar una cuota mayor.

Solicitudes de trabajos

Se aplican los siguientes límites a las solicitudes projects.jobs.create (se combinan los trabajos de entrenamiento y predicción por lotes):

Período Límite
60 segundos 60

Solicitudes de predicción en línea

Se aplican los siguientes límites a las solicitudes projects.predict:

Período Límite
60 segundos 6,000

Solicitudes de administración de recursos

Se aplican los siguientes límites al total combinado de las solicitudes compatibles de esta lista:

Período Límite
60 segundos 300

Además, todas las solicitudes delete mencionadas y todas las solicitudes create de versiones están limitadas a un total combinado de 10 solicitudes simultáneas.

Cuotas de recursos

Además de los límites que se aplican a las solicitudes en el tiempo, se limita el uso de recursos, como se muestra en la siguiente lista:

  • Cantidad máxima de modelos: 100
  • Cantidad máxima de versiones: 200. El límite de versiones corresponde al total de versiones que haya en el proyecto, que se pueden distribuir entre los modelos activos como prefieras.

Solicita un aumento de cuota

Las cuotas que se indican en esta página se asignan por proyecto y pueden aumentar con el uso a medida que pase el tiempo. Si necesitas mayor capacidad de procesamiento, puedes solicitar un aumento de la cuota.

  • Usa Google Cloud Console a fin de solicitar aumentos de cuotas que están enumeradas en el administrador de API de AI Platform:

    1. Encuentra la sección de la cuota que deseas aumentar.

    2. Haz clic en el ícono de lápiz que aparece junto al valor de la cuota, en la parte inferior del gráfico de uso de esa cuota.

    3. Ingresa el aumento que quieres solicitar:

      • Si el valor de la cuota que deseas se encuentra dentro del rango que figura en el cuadro de diálogo de límite de cuota, escribe el nuevo valor y haz clic en Guardar.

      • Si quieres aumentar la cuota más allá del valor máximo que se muestra, haz clic en Solicitar una cuota mayor y sigue las instrucciones del segundo método para solicitar un aumento.

  • Utiliza el formulario de solicitud personalizado para las cuotas que no figuran en Google Cloud Console, o si deseas una cuota que sea mayor que el máximo indicado, o si necesitas implementar un modelo que exceda el límite predeterminado de 500 MB:

    1. Ve al formulario de solicitud de cuota de AI Platform. También puedes seguir el vínculo Solicitar una cuota mayor en uno de los cuadros de diálogo de aumento de cuota.

    2. Completa los campos obligatorios, y describe la situación y por qué necesitas una cuota mayor.

    3. Haz clic en Enviar. Recibirás una respuesta por correo electrónico sobre la solicitud.

Límites en el uso simultáneo de máquinas virtuales

El uso de tu proyecto de los recursos de procesamiento de Google Cloud se mide por la cantidad de máquinas virtuales utilizadas para el entrenamiento y la cantidad de nodos utilizados correspondientes a la predicción por lotes. En esta sección, se describen los límites del uso simultáneo de esos recursos en el proyecto.

Límites de nodos simultáneos para la predicción por lotes

Un proyecto típico de un usuario que recién comienza a usar AI Platform tiene límites para la cantidad de nodos simultáneos que se pueden usar en la predicción por lotes:

  • Cantidad de nodos de predicción simultáneos: 72

Uso de nodos para la predicción en línea

AI Platform no aplica cuotas para el uso de nodos en la predicción en línea cuando usas tipos de máquinas heredadas (MLS1). Obtén más información sobre la asignación de nodos y recursos para las predicciones.

Para las versiones de modelos que usan tipos de máquinas (N1) de Compute Engine (Beta), se aplica el siguiente límite de forma predeterminada:

  • Número simultáneo de CPU virtuales ejecutándose en nodos de predicción: 450.

Límites en el uso simultáneo de CPU para entrenamiento

La cantidad de CPU virtuales simultáneas en un proyecto típico se escala según el historial de uso del proyecto.

  • Cantidad total de CPU simultáneas: A partir de 20 CPU, con capacidad de escalamiento a un valor típico de 450 CPU. Estos límites representan la cantidad máxima combinada de CPU en uso simultáneo, incluidos todos los tipos de máquina.

Las CPU que usas para entrenar modelos no se consideran CPU de Compute Engine. Además, la cuota de AI Platform no otorga acceso a ninguna VM de Compute Engine para otros requisitos de procesamiento. Si quieres iniciar una VM de Compute Engine, debes solicitar una cuota de Compute Engine, como se describe en la documentación de Compute Engine.

Límites en el uso simultáneo de GPU para entrenamiento

En un proyecto típico de un usuario que recién comienza a usar AI Platform, se puede usar la siguiente cantidad limitada de GPU simultáneas en el entrenamiento de los modelos de AA:

  • Cantidad total de GPU simultáneas: es la cantidad máxima de GPU en uso simultáneamente, desglosada por tipo de la siguiente manera:

    • Cantidad de GPU Tesla K80 simultáneas: 30.
    • Cantidad de GPU Tesla P4 simultáneas: 8.
    • Cantidad de GPU Tesla P100 simultáneas: 30.
    • Cantidad de GPU Tesla V100 simultáneas: 8.
    • Cantidad de GPU Tesla T4 simultáneas: 6.

Las GPU que usas para entrenar modelos no se consideran GPU de Compute Engine. Además, la cuota de AI Platform no otorga acceso a ninguna VM de Compute Engine con GPU. Si quieres iniciar una VM de Compute Engine que use una GPU, deberás solicitar una cuota de GPU de Compute Engine, como se describe en la documentación de Compute Engine.

Para obtener más información acerca de las GPU, consulta cómo usar GPU para entrenar modelos en la nube.

Límites en el uso simultáneo de GPU para predicción en línea

En un proyecto típico de un usuario que recién comienza a usar AI Platform Prediction, se puede usar la siguiente cantidad limitada de GPU simultáneas en el entrenamiento de los modelos de AA:

  • Cantidad total de GPU simultáneas: es la cantidad máxima de GPU en uso simultáneamente, desglosada por tipo de la siguiente manera:

    • Cantidad de GPU Tesla K80 simultáneas: 30.
    • Cantidad de GPU Tesla P4 simultáneas: 2.
    • Cantidad de GPU Tesla P100 simultáneas: 30.
    • Cantidad de GPU Tesla V100 simultáneas: 2.
    • Cantidad de GPU Tesla T4 simultáneas: 6.

Estas son las cuotas predeterminadas y puedes solicitar un aumento de cuota.

Las GPU que usas para predicciones no se cuentan como GPU correspondientes a Compute Engine, y la cuota de AI Platform no te da acceso a ninguna VM de Compute Engine mediante GPU. Si quieres iniciar una VM de Compute Engine que use una GPU, deberás solicitar una cuota de GPU de Compute Engine, como se describe en la documentación de Compute Engine.

Para obtener más información, consulta cómo usar GPU para predicciones en línea (Beta).

Límites en el uso simultáneo de TPU para entrenamiento

Todos los proyectos de Google Cloud tienen una cuota asignada de una al menos Cloud TPU de forma predeterminada.

Si necesitas una cuota mayor de Cloud TPU, completa el formulario de solicitud de cuotas de TPU. La cuota se asigna en unidades de 8 núcleos de TPU por Cloud TPU.

Recibirás una notificación cuando se apruebe la cuota. El próximo paso es configurar tu proyecto de Google Cloud para usar la TPU. Consulta la guía para usar TPU.

Ten en cuenta que, debido a la gran demanda, es posible que no podamos aceptar todas las solicitudes de cuota.

Próximos pasos

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

¿Necesitas ayuda? Visita nuestra página de asistencia.