Administra TPU

Puedes usar los comandos de gcloud que se describen en este documento con ambas configuraciones de TPU: VM de TPU y nodos TPU. Los comandos de gcloud que uses dependerán de la configuración de TPU que uses. Cada comando de gcloud se muestra en una sección con pestañas. Elige la pestaña de la configuración de TPU que deseas usar y la página web mostrará el comando gcloud apropiado. A menos que sepas que debes usar nodos TPU, te recomendamos que uses VM de TPU. Para obtener más información sobre las configuraciones de TPU, consulta Arquitectura del sistema.

La ejecución de un modelo de aprendizaje automático (AA) requiere una VM de Compute Engine y recursos de Cloud TPU. En esta página, se describe cómo administrar estos recursos mediante lo siguiente:

  • La CLI de Google Cloud, que proporciona la CLI principal a Google Cloud Platform (GCP)
  • La consola, que proporciona una consola de administración integrada para tus recursos de GCP.

Prerequisites

Para ejecutar estos procedimientos, debes tener configurado un proyecto de Google Cloud Platform (GCP). Si no tienes un proyecto, consulta la página sobre cómo crear y administrar proyectos para configurar uno.

Si usas el comando gcloud, puedes usar Google Cloud Shell o instalar el comando gcloud de forma local. Google Cloud Shell te permite interactuar con Cloud TPU sin necesidad de instalar software. Es posible que Google Cloud Shell se desconecte después de un período de inactividad, por lo que, si ejecutas comandos de larga duración, te recomendamos que instales gcloud en tu máquina local. El comando gcloud forma parte de la CLI de Google Cloud.

  1. Instala Google Cloud CLI.
  2. Configura gcloud para usar tu proyecto.

    gcloud config set project project-name
    
  3. Configura gcloud para usar la zona en la que planeas crear tus recursos de Cloud TPU. Por ejemplo, us-central1-b.

    $ gcloud config set compute/zone zone
    

Para obtener más información sobre el comando gcloud, consulta la Referencia de gcloud.

Crea una Cloud TPU

Cuando creas una Cloud TPU, creas la VM de Compute Engine y los recursos TPU.

Crea una Cloud TPU con gcloud

Si quieres usar Cloud Shell, haz clic en Abrir Cloud Shell. De lo contrario, abre una ventana de terminal o un símbolo del sistema en la computadora local.

Crea tus recursos de Cloud TPU. Los comandos que uses dependerán de si usas VM o nodos de TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm create tpu-name \
  --zone=zone \
  --accelerator-type=v3-8 \
  --version=tpu-vm-tf-2.8.0

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

accelerator-type
El tipo de Cloud TPU que se creará.

version
La versión de software de Cloud TPU.

Nodos TPU

$ gcloud compute tpus execution-groups create --name=tpu-name \
  --zone=zone \
  --tf-version=2.8.0 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

tf-version
La versión de Tensorflow que el comando gcloud instala en tu VM.

machine-type
El tipo de máquina de la VM de Compute Engine que se creará.

accelerator-type
El tipo de Cloud TPU que se creará.

Ejecuta secuencias de comandos de instalación estándar

Puedes ejecutar una secuencia de comandos de inicio en cada VM de TPU si especificas el parámetro --metadata startup-script cuando creas la VM de TPU. El siguiente es un ejemplo de cómo usar un startup-script para una VM de TPU.

$ gcloud compute tpus tpu-vm create tpu-name \
    --zone=zone \
    --accelerator-type=tpu-type \
    --version=tpu-vm-tf-2.8.0 \
    --metadata startup-script='#! /bin/bash
      pip3 install numpy
      EOF'

Después de crear la VM de TPU, puedes ver los registros desde la secuencia de comandos de inicio si te conectas a la VM de TPU con SSH y ejecutas lo siguiente:

$ cat /var/log/syslog | grep startup-script

Crea una Cloud TPU en Google Cloud Console

  1. Navegue a Google Cloud Console.
  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU.
  3. Haz clic en CREAR NODO TPU.
  4. En el cuadro Nombre, escribe un nombre de instancia de TPU.
  5. En el cuadro Zona, selecciona la zona en la que se creará la TPU.
  6. En TPU Configuration, selecciona la VM de TPU o el Nodo TPU. La configuración de la TPU determina si creas la TPU como una VM de TPU o un nodo TPU. Para obtener más información, consulta Arquitectura del sistema.
  7. En Tipo de TPU, selecciona el tipo de TPU que deseas crear.
  8. En Versión de software de TPU, selecciona la versión de software. Cuando creas una VM de Cloud TPU, la versión de software de TPU especifica la versión del entorno de ejecución de TPU que se debe instalar. Cuando creas un nodo de Cloud TPU, la versión de software de TPU te permite elegir el marco de trabajo de AA instalado en la VM del nodo. No se requiere ninguna otra configuración. Para obtener más información, consulta Modelos compatibles.
  9. Haz clic en CREAR para crear tus recursos.

Conéctate a una VM de Cloud TPU

De forma predeterminada, el comando gcloud que usas para crear nodos TPU intenta establecer una conexión SSH a tu nodo TPU automáticamente. Si usas nodos de TPU y no estás conectado a la instancia de Compute Engine mediante el comando gcloud, puedes conectarte mediante la ejecución del siguiente comando de nodos TPU. Cuando usas VM de TPU, debes establecer una conexión SSH explícitamente a tu TPU con el siguiente comando de VM de TPU.

VM de TPU

$ gcloud compute tpus tpu-vm ssh tpu-name \
  --zone=zone

Nodos TPU

$ gcloud compute ssh tpu-name\
  --zone=zone

Enumera los recursos de Cloud TPU

Puedes enumerar todas las Cloud TPU en una zona específica.

Enumera los recursos de Cloud TPU con gcloud

Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm list --zone=zone

Nodos TPU

$ gcloud compute tpus execution-groups list --zone=zone

Con este comando, se enumeran los recursos de Cloud TPU en la zona especificada. Si no hay recursos configurados, el resultado solo mostrará guiones para la VM y la TPU. Si un recurso está activo y el otro no, verás un mensaje que dice que está en mal estado. Debes iniciar o reiniciar el recurso que no esté en ejecución.

Enumera tus recursos de Cloud TPU con GCP Console

  1. Navegue a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

Recupera información sobre Cloud TPU

Puedes recuperar información sobre una Cloud TPU especificada.

Recupera información sobre Cloud TPU con gcloud

Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm describe tpu-name \
  --zone=zone

Nodos TPU

$ gcloud compute tpus execution-groups describe tpu-name \
  --zone=zone

Recuperar información sobre una Cloud TPU con Google Cloud Console

  1. Navegue a Google Cloud Console.
  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.
  3. Haz clic en el nombre de tu Cloud TPU; se mostrará la página de detalles de Cloud TPU.

Detén tus recursos de Cloud TPU

Puedes detener una sola Cloud TPU para que deje de generar cargos sin perder la configuración y el software de tu VM. No se admite la detención de pods de TPU.

Detén una Cloud TPU con gcloud

El comando que usas para detener una Cloud TPU depende de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm stop tpu-name \
--zone=zone

Nodos TPU

$ gcloud compute tpus stop tpu-name \
--zone=zone

Detén una Cloud TPU en GCP Console

  1. Navegue a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Detener.

Inicia tus recursos de Cloud TPU

Puedes iniciar una Cloud TPU cuando se detiene.

Inicia una Cloud TPU con gcloud

El comando que usas para detener una Cloud TPU depende de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm start tpu-name --zone=zone

Nodos TPU

$ gcloud compute tpus start tpu-name --zone=zone

Inicia una Cloud TPU en GCP Console

  1. Navegue a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Iniciar.

Borra tus VM de Compute Engine y recursos de Cloud TPU

Puedes borrar la Cloud TPU cuando termines de usarlas.

Borra una Cloud TPU con gcloud

El comando que uses depende de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

Nodos TPU

$ gcloud compute tpus execution-groups delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

Borra una Cloud TPU con GCP Console

  1. Navegue a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Borrar.