Configurar el entorno de TPU de Cloud

Antes de poder usar recursos de TPU de Cloud para entrenar modelos o ejecutar inferencias en ellos, debes seguir estos pasos:

Configurar un Google Cloud proyecto

Para usar Cloud TPU, debes tener una Google Cloud cuenta y un proyecto.

  1. En la Google Cloud consola, inicia sesión en tu cuenta de Google o regístrate para crear una.

  2. Crea un Google Cloud proyecto. Para obtener más información, consulta Crear un proyecto.

  3. Habilita la facturación de tu Google Cloud proyecto.

    Es necesario configurar la facturación para todo el Google Cloud uso. Solo se te cobrará cuando empieces a usar los recursos de Google Cloud . Para obtener más información, consulta la documentación de Facturación de Cloud.

    La facturación del uso de todas las versiones de TPU de Cloud sigue los precios regionales estándar que se muestran en la página de precios de TPU de Cloud.

  4. Instala Google Cloud CLI. Google Cloud CLI es un conjunto de bibliotecas y herramientas para acceder a recursos y servicios, así como para gestionarlos. Google Cloud

  5. Configura el comando gcloud que has instalado como parte de Google Cloud CLI.

    Ejecuta los siguientes comandos para configurar gcloud de forma que use tu proyecto de Google Cloud.

    $ gcloud config set project PROJECT_ID
  6. Asegúrate de que la facturación esté habilitada en tu Google Cloud proyecto.

    Es necesario configurar la facturación para todo el Google Cloud uso. Solo se te cobrará cuando empieces a usar los recursos de Google Cloud . Para obtener más información, consulta la documentación de Facturación de Cloud.

    La facturación del uso de todas las versiones de TPU de Cloud sigue los precios regionales estándar que se muestran en la página de precios de TPU de Cloud.

Configurar el entorno para usar Cloud TPU

Antes de solicitar una TPU de Cloud, debes activar la API Cloud TPU y asegurarte de que tienes permisos para gestionar el acceso en tu proyecto y para crear una TPU de Cloud. También te recomendamos que crees una cuenta de servicio gestionada por el usuario para asociarla a tu TPU.

  1. Activa la API Cloud TPU desde la Google Cloud consola o mediante la CLI de gcloud en Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com

    Consola

    1. En la Google Cloud consola, ve a la página de la API de Cloud TPU.

    Ir a la página de la API de TPU de Cloud

    1. Haz clic en Enable (Habilitar).
  2. Asegúrate de que tu proyecto tenga los siguientes roles:

    Sigue las instrucciones de la sección Ver el acceso actual para ver qué principales tienen acceso a tu proyecto, carpeta u organización. Para ver tu propio acceso, en la columna Principal, busca la fila que tenga tu dirección de correo. Si tu dirección de correo no aparece en esa columna, significa que no tienes ningún rol. En la columna Rol de la fila con tu dirección de correo electrónico, comprueba si la lista de roles incluye los roles necesarios.

    Si no tienes un rol obligatorio, concede el rol o pide a un administrador que lo haga.

  3. Crea un agente de servicio de TPU de Cloud:

    Los agentes de servicio, un tipo de identidad de servicio, son identidades de servicio mantenidas por Google que utiliza el servicio Cloud TPU para realizar operaciones en tu proyecto de Google Cloud . Por ejemplo, el agente de servicio se usa para crear y gestionar recursos de TPU de Cloud.

      $ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
  4. Crea una cuenta de servicio de TPU:

    Las cuentas de servicio actúan como credenciales de tus VMs de TPU. Los roles asociados a una cuenta de servicio conceden acceso a los Google Cloud recursos. Te recomendamos que utilices una cuenta de servicio gestionada por el usuario y que solo le concedas los permisos que necesite tu VM de TPU. Si usas una cuenta de servicio gestionada por el usuario, debes especificarla al crear una VM de TPU con la marca --service-account.

    1. Sigue las instrucciones que se indican en Crear cuentas de servicio para crear una cuenta de servicio gestionada por el usuario.

    2. Sigue las instrucciones de Gestionar acceso a proyectos, carpetas y organizaciones para conceder acceso a tu cuenta de servicio a los servicios de Google Cloud a los que accederá tu TPU. Te recomendamos que asignes los siguientes roles a tu TPU para que pueda acceder a los servicios deGoogle Cloud que se usan con frecuencia.

Preparar la creación de una TPU de Cloud

Antes de crear una TPU de Cloud, debes solicitar una cuota. También debes tener en cuenta si quieres usar recursos en cola y qué parámetros quieres usar para configurar tu TPU.

  1. Elige una opción de consumo.

    Las opciones de consumo son los métodos que se usan para solicitar capacidad de TPU de Cloud. Elige una opción de consumo en función de los siguientes factores:

    • La rapidez con la que necesitas la capacidad
    • Durante cuánto tiempo necesitas la capacidad
    • Si necesitas capacidad durante un periodo fijo o flexible
    • Si tu capacidad se puede usar de forma preventiva
    • Precios

    Para obtener más información, consulta las opciones de consumo de TPU de Cloud.

  2. Cuota de solicitudes:

    Las cuotas de TPU son límites en el número de núcleos de TPU de Cloud que puedes usar con unGoogle Cloud proyecto. Cada versión de TPU está asociada a su propia cuota. Para crear una TPU de Cloud, tu proyecto debe tener cuota para la versión y el tamaño de la TPU que quieras crear, así como para la zona en la que quieras crearla. Google Cloud Para obtener más información sobre la asignación y los tipos de cuota, así como sobre cómo solicitar cuota, consulta Cuotas.

    Si creas TPUs con Google Kubernetes Engine o Vertex AI, necesitas cuota para esos servicios. Para obtener más información sobre las cuotas de GKE, consulta Planificar la configuración de TPU con GKE. Para obtener más información sobre las cuotas de Vertex AI, consulta Cuotas y límites de Vertex AI.

  3. Determina si quieres usar recursos en cola.

    Crear una TPU de Cloud como recurso en cola es una práctica recomendada. Los recursos en cola te permiten recibir capacidad cuando esté disponible. Puede especificar una hora de inicio y otra de finalización opcionales para que se complete la solicitud.

    Hay diferentes comandos de la interfaz de línea de comandos de gcloud para trabajar con recursos en cola. Para obtener más información, consulta la guía de usuario de recursos en cola.

  4. Determina los parámetros de creación de la TPU de Cloud:

    • Zona: define la marca --zone en la zona en la que quieras crear una TPU. Debes tener cuota asignada en esta zona. Para obtener más información, consulta Regiones y zonas de TPU.

    • Configuración de TPU: si no necesitas especificar una topología personalizada o usas la versión 2 o 3 de TPU, define el indicador --accelerator-type como vVERSION-TENSORCORES. Sustituye VERSION por el número de versión de la TPU que quieras usar. Sustituye TENSORCORES por el número de Tensor Cores que quieras usar.

      Si quieres personalizar la topología física de tu TPU, usa las marcas --version y --topology. Define la marca --version en la versión de TPU que quieras usar. Define la marca --topology en la topología que quieras usar.

      Para obtener más información sobre las configuraciones de TPU, incluidas las configuraciones admitidas y las variantes de topología, consulta Versiones de TPU.

    • Versión de software: si solicitas un recurso en cola, asigna el valor --runtime-version a la versión de software que quieras usar. De lo contrario, usa la marca --version. Las versiones de software de TPU están disponibles para los frameworks TensorFlow, PyTorch y JAX. Para obtener más información sobre las versiones de software compatibles, consulta Versiones de software de las VMs de TPU.

    • Cuenta de servicio: asigna --service-account a la dirección de correo de una cuenta de servicio (si has creado una) para adjuntarla a tu TPU. Si está vacío, se usará la cuenta de servicio predeterminada de Compute Engine.

    • Tipo de cuota: añade la marca que corresponda al tipo de cuota que quieras usar:

      Tipo de cuota Bandera
      Reservadas --reserved
      Spot VMs --spot
      Interrumpible (no disponible para recursos en cola; usa --spot en su lugar) --preemptible
      bajo demanda No se necesita ninguna otra marca
    • Configuración avanzada: puedes añadir más marcas a tu solicitud para configurar tu TPU. Para obtener más información, consulta la documentación de gcloud compute tpus tpu-vm create y las siguientes secciones:

Para ver ejemplos de cómo crear una TPU de Cloud, consulta la página Empezar.

Siguientes pasos

  1. Consulta cómo crear y gestionar recursos de máquina virtual y de TPU.
  2. Ejecutar una guía de inicio rápido de TPU de Cloud