Política de cuotas

Cloud Machine Learning Engine limita el uso y la asignación de recursos y aplica las cuotas correspondientes por proyecto. Las políticas específicas varían según la disponibilidad de los recursos, el perfil del usuario, el historial de uso del servicio y otros factores, y están sujetas a cambios sin previo aviso.

Las siguientes secciones describen los límites de cuota vigentes en el sistema.

Límites para las solicitudes de servicio

Solo se puede hacer una cantidad limitada de solicitudes de API individuales en cada intervalo de 100 segundos. Cada límite se aplica a una API o grupo de API específico, según se describe en las siguientes secciones.

Puedes ver las cuotas de solicitudes que se aplican a tu proyecto en el Administrador de API de Cloud ML Engine en Google Cloud Platform Console. Para solicitar que se incremente una cuota hasta el valor máximo aplicable, puedes hacer clic en el ícono que aparece junto al límite actual que quieres aumentar. Si deseas solicitar que la cuota se aumente más allá del valor máximo, haz clic en el ícono de edición que aparece junto al límite de cuota y selecciona Solicitar una cuota mayor.

Solicitudes de trabajos

Los siguientes límites se aplican a las solicitudes projects.jobs.create (se combinan los trabajos de entrenamiento y predicción):

Período Límite predeterminado Límite máximo
100 segundos 10 100

Solicitudes de predicción en línea

Los siguientes límites se aplican a las solicitudes projects.predict:

Período Límite predeterminado Límite máximo
100 segundos 1,000 10,000

Solicitudes de administración de recursos

Los siguientes límites se aplican al total combinado de las solicitudes compatibles de esta lista:

Período Límite predeterminado Límite máximo
100 segundos 50 500

Además, todas las solicitudes delete mencionadas y todas las solicitudes create de versiones están limitadas a un total combinado de 10 solicitudes simultáneas.

Cuotas de recursos

Además de los límites que se aplican a las solicitudes en el tiempo, también se aplica un límite al uso de recursos, tal como se muestra en la siguiente lista:

  • Cantidad máxima de modelos: 100
  • Cantidad máxima de versiones: 200. El límite de versiones es para el total de versiones que haya en tu proyecto, que puede distribuirse entre tus modelos activos como tú prefieras

Límites para las unidades de entrenamiento de AA y los nodos de predicción simultáneos

Los recursos de procesamiento de Google Cloud Platform que se asignan a Cloud ML Engine se miden en unidades de entrenamiento de AA (en el caso de los trabajos de entrenamiento) y nodos de predicción (en el caso de la predicción en línea y por lotes).

Para obtener más información sobre las unidades de entrenamiento de AA y los nodos de predicción, y su efecto en los costos, consulta la página de la política de precios.

Un proyecto habitual, de un usuario que recién comienza a utilizar Cloud ML Engine, puede usar una cantidad limitada de recursos de procesamiento en forma simultánea:

  • Cantidad de unidades de entrenamiento de AA simultáneas: 15
  • Cantidad de nodos de predicción simultáneos: 24

Límites sobre el uso simultáneo de GPU

Un proyecto habitual está limitado a la siguiente cantidad de GPU en forma simultánea:

  • Cantidad de GPU simultáneas: 10

Las GPU que usas cuando entrenas un modelo no se cuentan como GPU para Google Compute Engine, y la cuota de Cloud ML Engine no te da acceso a ninguna VM de Compute Engine que use GPU. Si quieres una VM de Compute Engine que use una GPU, deberás solicitar una cuota de GPU de Compute Engine, como se describe en la documentación de Compute Engine.

Para obtener más información acerca de las GPU, consulta cómo usar GPU para entrenar modelos en la nube.

Solicita un aumento de la cuota

Las cuotas que se indican en esta página se asignan por proyecto y pueden aumentar con el uso a medida que pase el tiempo. Si necesitas mayor capacidad de procesamiento, puedes solicitar un aumento de la cuota.

  • Usa Google Cloud Platform Console para solicitar aumentos de las cuotas que se indican en el Administrador de API de Cloud ML Engine:

    1. Encuentra la sección de la cuota que deseas aumentar.

    2. Haz clic en el ícono del lápiz que aparece junto al valor de la cuota, en la parte inferior del cuadro de uso de esa cuota.

    3. Ingresa el aumento que quieres solicitar:

      • Si el valor de la cuota que deseas se encuentra dentro del rango que figura en el cuadro de diálogo de límite de cuota, ingresa el nuevo valor y haz clic en Guardar.

      • Si quieres aumentar la cuota más allá del valor máximo que se muestra, haz clic en Solicitar una cuota mayor y sigue las instrucciones del segundo método para solicitar un aumento.

  • Usa el formulario de solicitud personalizada si la cuota que deseas no aparece en Google Cloud Platform Console, si quieres una cuota superior al máximo que se muestra o si necesitas implementar un modelo que supera el límite predeterminado de 250 MB:

    1. Ve al formulario de solicitud de cuota de Cloud Machine Learning Engine. También puedes seguir el vínculo que dice Solicitar una cuota mayor en uno de los cuadros de diálogo de aumento de cuota.

    2. Llena los campos obligatorios, describe la situación y por qué necesitas contar con una cuota mayor.

    3. Haz clic en Enviar. Recibirás una respuesta por correo electrónico acerca de tu solicitud.

¿Qué sigue?

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…