Configura el entorno de Cloud TPU

Antes de que puedas usar los recursos de Cloud TPU para entrenar o ejecutar inferencias en modelos, debes realizar los siguientes pasos de configuración:

Configura el proyecto de Google Cloud

Debes tener una cuenta y un proyecto de Google Cloud para usar Cloud TPU.

  1. En la consola de Google Cloud, accede a tu Cuenta de Google o regístrate para obtener una cuenta nueva.

  2. Instala Google Cloud CLI. Google Cloud CLI es una interfaz para acceder a recursos y servicios de Google Cloud y administrarlos.

  3. Selecciona o crea un proyecto de Google Cloud:

    En la consola de Google Cloud, selecciona o crea un proyecto de Cloud desde el selector de proyectos.

    En Cloud Shell, configura el ID del proyecto con gcloud CLI. El ID del proyecto es el nombre de tu proyecto que se muestra en la consola de Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

    La configuración de facturación es obligatoria para todo el uso de Google Cloud. Solo se te cobrará después de que comiences a usar los recursos de Google Cloud. Para obtener más información, consulta la documentación de Facturación de Cloud.

    La facturación del uso de todas las versiones de Cloud TPU sigue los precios regionales estándar que se muestran en la página de precios de Cloud TPU.

Configura tu entorno para usar Cloud TPU

Antes de solicitar una Cloud TPU, debes activar la API de Cloud TPU y asegurarte de tener permisos para administrar el acceso en tu proyecto y crear una Cloud TPU. También se recomienda crear una cuenta de servicio administrada por el usuario para conectarla a tu TPU.

  1. Activa la API de Cloud TPU desde la consola de Google Cloud o con gcloud CLI en Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. En la consola de Google Cloud, ve a la página de la API de Cloud TPU.

    Ir a la página de la API de Cloud TPU

    1. Haz clic en Habilitar.
  2. Asegúrate de tener los siguientes roles en tu proyecto:

    Sigue las instrucciones que se indican en Ver acceso actual para saber quién tiene acceso a tu proyecto, organización o carpeta. Para ver tu propio acceso, en la columna Principal, busca la fila que tiene tu dirección de correo electrónico. Si tu dirección de correo electrónico no aparece en esa columna, significa que no tienes ningún rol. En la columna Rol de la fila con tu dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.

    Si no tienes una función requerida, otorga la función o pídele a un administrador que lo haga.

  3. Crea un agente de servicio de Cloud TPU:

    Los agentes de servicio, un tipo de identidad de servicio, son identidades de servicio mantenidas por Google que el servicio de Cloud TPU usa para realizar operaciones en tu proyecto de Google Cloud. Por ejemplo, el agente de servicio se usa para crear y administrar los recursos de Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
    
  4. Crea una cuenta de servicio de TPU:

    Las cuentas de servicio actúan como credenciales para tus VMs de TPU. Las funciones vinculadas a una cuenta de servicio otorgan acceso a los recursos de Google Cloud. Recomendamos usar una cuenta de servicio administrada por el usuario y otorgar solo los permisos que requiere tu VM de TPU. Si usas una cuenta de servicio administrada por el usuario, debes especificarla cuando crees una VM de TPU con la marca --service-account.

    1. Sigue las instrucciones en Crea cuentas de servicio para crear una cuenta de servicio administrada por el usuario.

    2. Sigue las instrucciones que se indican en Administra el acceso a proyectos, carpetas y organizaciones para otorgar a tu cuenta de servicio acceso a los servicios de Google Cloud a los que accederá la TPU. Se recomiendan las siguientes funciones para que la TPU acceda a los servicios de Google Cloud de uso general.

Prepárate para crear una Cloud TPU

Antes de crear una Cloud TPU, debes solicitar una cuota. También debes considerar el uso de recursos en cola, así como los parámetros que deseas utilizar para configurar tu TPU.

  1. Cuota de solicitudes:

    Con el fin de crear una Cloud TPU, tu proyecto de Google Cloud debe tener cuota para la versión y el tamaño de la TPU que deseas crear y la zona en la que deseas crearla. Por ejemplo, si deseas crear una TPU v4-8 en us-central2-b, debes solicitar una cuota de 8 núcleos TPU v4 en us-central2-b. Para obtener más información sobre las zonas donde Cloud TPU está disponible, consulta Regiones y zonas de TPU.

    La cuota se asigna de manera diferente según la versión de TPU. Los distintos tipos de cuota tienen expectativas de disponibilidad diferentes. Para obtener más información sobre la asignación y los tipos de cuotas, y sobre cómo solicitarla, consulta Cuotas.

  2. Determina si deseas usar recursos en cola.

    Crear una Cloud TPU como un recurso en cola es una práctica recomendada. Los recursos en cola te permiten recibir capacidad una vez que está disponible. Puedes especificar una hora de inicio y finalización opcional para cuando se debe completar la solicitud.

    Existen diferentes comandos de gcloud CLI para trabajar con recursos en cola. Para obtener más información, consulta la Guía del usuario de recursos en cola.

  3. Determina los parámetros de creación de Cloud TPU:

    • Zona: Establece la marca --zone en la zona en la que deseas crear una TPU. Debes tener cuota asignada en esta zona. Para obtener más información, consulta Regiones y zonas de TPU.

    • Configuración de TPU: Si no necesitas especificar una topología personalizada o si usas TPU v2 o v3, configura la marca --accelerator-type como vVERSION-TENSORCORES. Reemplaza VERSION por el número de versión de TPU que deseas usar. Reemplaza TENSORCORES por la cantidad de TensorCores que deseas usar.

      Si deseas personalizar la topología física de tu TPU, usa las marcas --version y --topology. Establece la marca --version en la versión de TPU que deseas usar. Establece la marca --topology en la topología que deseas usar.

      Para obtener más información sobre las configuraciones de TPU, incluidas las configuraciones compatibles y las variantes de topología, consulta las versiones de TPU.

    • Versión de software: Si solicitas un recurso en cola, configura la marca --runtime-version con el nombre de la versión de software que deseas usar. De lo contrario, usa la marca --version. Hay versiones de software de TPU disponibles para los frameworks de TensorFlow, PyTorch y JAX. Si quieres obtener más información sobre las versiones de software compatibles, consulta las versiones de software de VM de TPU.

    • Cuenta de servicio: Establece --service-account en la dirección de correo electrónico de una cuenta de servicio, si creaste una, para conectar la cuenta de servicio a tu TPU. Si está vacía, se usará la cuenta de servicio predeterminada de Compute Engine.

    • Tipo de cuota: Agrega la marca que corresponda al tipo de cuota que deseas usar:

      Tipo de cuota Marca
      Reservado --reserved
      VMs Spot --spot
      Interrumpible mediante recursos en cola --best-effort
      Interrumpible que no usa recursos en cola --preemptible
      A pedido No se necesita marca adicional
    • Configuración avanzada: puedes agregar marcas adicionales a tu solicitud para configurar la TPU. Consulta la documentación de gcloud compute tpus tpu-vm create y las siguientes secciones en Administra TPU para obtener más información:

Para ver ejemplos de cómo crear una Cloud TPU, consulta Primeros pasos.

¿Qué sigue?

  1. Aprende a crear y administrar recursos de VM y TPU.
  2. Ejecuta una guía de inicio rápido de Cloud TPU.