Política de cuotas

AI Platform Training limita el uso y la asignación de recursos, y aplica las cuotas correspondientes a cada proyecto. Las políticas específicas varían según la disponibilidad de los recursos, el perfil del usuario, el historial de uso del servicio y otros factores, y están sujetas a cambios sin previo aviso.

En las siguientes secciones, se describen los límites de cuota actuales del sistema.

Límites de las solicitudes de servicio

Solo se puede realizar una cantidad limitada de solicitudes a la API individuales por intervalo de 60 segundos. Cada límite se aplica a una API o grupo de API específico, según se describe en las siguientes secciones.

Para ver las cuotas de solicitud de tu proyecto, consulta el Administrador de API para AI Platform Training en la consola de Google Cloud. Si deseas solicitar una cuota superior, haz clic en el ícono de edición que aparece junto al límite de cuota y selecciona Solicitar una cuota mayor.

Solicitudes de trabajos

Se aplican los siguientes límites a las solicitudes projects.jobs.create (se combinan los trabajos de entrenamiento y predicción por lotes):

Período Límite
60 segundos 60

Solicitudes de predicción en línea

Se aplican los siguientes límites a las solicitudes projects.predict:

Período Límite
60 segundos 600,000

Solicitudes de administración de recursos

Se aplican los siguientes límites al total combinado de las solicitudes compatibles de esta lista:

Período Límite
60 segundos 300

Además, todas las solicitudes delete mencionadas y todas las solicitudes create de versiones están limitadas a un total combinado de 10 solicitudes simultáneas.

Límites en el uso simultáneo de máquinas virtuales

El uso de los recursos de procesamiento de Google Cloud en tus proyectos se mide según la cantidad de máquinas virtuales que utilizan. En esta sección, se describen los límites del uso simultáneo de esos recursos en el proyecto.

Límites en el uso simultáneo de las CPU para el entrenamiento

La cantidad de CPU virtuales simultáneas en un proyecto típico se escala según el historial de uso del proyecto.

  • Cantidad total de CPU simultáneas: A partir de 20 CPU, con capacidad de escalamiento a un valor típico de 450 CPU. Estos límites representan la cantidad máxima combinada de CPU en uso simultáneo, incluidos todos los tipos de máquina.

Algunas regiones tienen cuotas predeterminadas adicionales. Cuando usas CPU en estas regiones, estas se consideran en la cuota regional, además de la cuota total:

  • asia-northeast2: 20 CPU
  • asia-northeast3: 20 CPU
  • europe-north1: 20 CPU
  • europe-west3: 20 CPU
  • europe-west6: 20 CPU
  • us-east4: 20 CPU
  • us-west2: 20 CPU
  • us-west3: 20 CPU

Las CPU que usas cuando entrenas un modelo no se cuentan como tales en Compute Engine. Además, la cuota de AI Platform Training no te da acceso a ninguna VM de Compute Engine para satisfacer otros requisitos de procesamiento. Si quieres iniciar una VM de Compute Engine, debes solicitar una cuota de Compute Engine, como se describe en la documentación de Compute Engine.

Límites en el uso simultáneo de GPU para entrenamiento

En un proyecto típico de un usuario que recién comienza a usar AI Platform, se puede usar la siguiente cantidad limitada de GPU simultáneas en el entrenamiento de los modelos de AA:

  • Cantidad total de GPU simultáneas: Es la cantidad máxima de GPU en uso simultáneamente, desglosada por tipo de la siguiente manera:

    • Cantidad de GPU A100 simultáneas: 8
    • Cantidad de GPU P4 simultáneas: 8
    • Cantidad de GPU P100 simultáneas: 30
    • Cantidad de GPU V100 simultáneas: 8
    • Cantidad de GPU T4 simultáneas: 6

Algunas regiones tienen cuotas predeterminadas adicionales. Cuando usas las siguientes GPU en las regiones enumeradas, se consideran en las cuotas regionales, así como la cuota total:

  • GPU P4 en asia-southeast1: 4
  • GPU P4 en us-east4: 1
  • GPU P4 en us-west2: 1
  • GPU T4 en asia-northeast3: 1
  • GPU T4 en asia-southeast1: 4

Ten en cuenta que las cuotas de un proyecto dependen de varios factores, por lo que las de un proyecto específico podrían ser menores que las cantidades de la lista anterior. Las GPU que usas cuando entrenas un modelo no se cuentan como tales en Compute Engine. Además, la cuota de AI Platform Training no te da acceso a ninguna VM de Compute Engine que use GPU. Si quieres iniciar una VM de Compute Engine que use una GPU, deberás solicitar una cuota de GPU de Compute Engine, como se describe en la documentación de Compute Engine.

Si necesitas más GPU para AI Platform Training, consulta la sección Solicita un aumento de la cuota de esta guía.

Para obtener más información acerca de las GPU, consulta cómo usar GPU para entrenar modelos en la nube.

Límites en el uso simultáneo de TPU para entrenamiento

Al igual que con las GPU, la cuota de TPU para AI Platform Training es distinta de la de Cloud TPU, la que puedes usar directamente con las VM de Compute Engine. Las TPU que usas cuando entrenas un modelo no se cuentan como tales en Compute Engine. Además, la cuota de AI Platform Training no te da acceso a ninguna VM de Compute Engine que use TPU.

En la consola de Google Cloud solo se muestra la cuota de Cloud TPU con Compute Engine. Para solicitar cuota de Cloud TPU a fin de usarla con Compute Engine, envía una solicitud al equipo de Cloud TPU.

De forma predeterminada, a todos los proyectos de Google Cloud se les asigna una cuota de AI Platform Training de al menos una Cloud TPU. La cuota se asigna en unidades de 8 núcleos de TPU por Cloud TPU. Esta cuota no se muestra en la consola de Google Cloud.

Solicita un aumento de cuota

Las cuotas que se indican en esta página se asignan por proyecto y pueden aumentar con el uso a medida que pase el tiempo. Si necesitas más capacidad de procesamiento, puedes solicitar un aumento de cuota de una de las siguientes maneras:

  • Usa la consola de Google Cloud para solicitar aumentos de las cuotas que se indican en el administrador de API para AI Platform Training:

    1. Busca la sección de la cuota que quieres aumentar.

    2. Haz clic en el ícono de lápiz que aparece junto al valor de la cuota, en la parte inferior del gráfico de uso de esa cuota.

    3. Ingresa el aumento que quieres solicitar:

      • Si el valor de la cuota que deseas se encuentra dentro del rango que figura en el cuadro de diálogo de límite de cuota, escribe el nuevo valor y haz clic en Guardar.

      • Si quieres aumentar la cuota más allá del valor máximo que se muestra, haz clic en Solicitar una cuota mayor y sigue las instrucciones del segundo método para solicitar un aumento.

  • Si deseas aumentar una cuota que no aparece en la consola de Google Cloud, como las cuotas de GPU, usa el formulario de solicitud de cuota de AI Platform para solicitar el aumento de una cuota. Estas solicitudes se abordan en función del mejor esfuerzo, lo que significa que ni los Acuerdos de Nivel de Servicio (ANS) ni los objetivos de nivel de servicio (SLO) se involucran en la revisión de estas solicitudes.

Límites en el uso simultáneo de discos para entrenamiento

La cantidad de discos virtuales simultáneos para un proyecto típico se escala según el historial de uso del proyecto:

  • Cantidad total de discos simultáneos: A partir de 4,000 GB para unidades de disco duro estándar (HDD) y 500 GB para unidades de estado sólido (SSD), el escalamiento se realiza hasta un valor típico de 180,000 GB para las unidades de HDD y 75,000 GB para las unidades de SSD. Estos límites representan la cantidad máxima combinada de discos en uso simultáneo, incluidos todos los tipos de máquina.

Los discos que usas cuando entrenas un modelo no se cuentan como discos para Compute Engine, y la cuota de AI Platform Training no te da acceso a ninguna instancia de máquina virtual (VM) de Compute Engine para otros requisitos de procesamiento. Si quieres crear una VM de Compute Engine, debes solicitar cuota de este componente.

Próximos pasos