Administra TPU

Puedes usar los comandos de gcloud que se describen en este documento con ambas configuraciones de TPU: VM de TPU y nodos TPU. Los comandos de gcloud que uses dependerán de la configuración de TPU que uses. Cada comando gcloud se muestra en una sección con pestañas. Elige la pestaña de la configuración de la TPU que deseas usar y la página web mostrará el comando gcloud adecuado. A menos que sepas que necesitas usar nodos TPU, te recomendamos usar VM de TPU. Para obtener más información sobre las configuraciones de TPU, consulta Arquitectura del sistema.

La ejecución de un modelo de aprendizaje automático (AA) requiere una VM de Compute Engine y recursos de Cloud TPU. En esta página, se describe cómo administrar estos recursos mediante lo siguiente:

Requisitos previos

Para ejecutar estos procedimientos, debes tener configurado un proyecto de Google Cloud Platform (GCP). Si no tienes un proyecto, consulta la página sobre cómo crear y administrar proyectos para configurar uno.

Si usas el comando gcloud, puedes usar Google Cloud Shell o instalar el comando gcloud de forma local. Google Cloud Shell te permite interactuar con Cloud TPU sin tener que instalar ningún software. Es posible que Google Cloud Shell se desconecte después de un período de inactividad, por lo que, si ejecutas comandos de larga duración, te recomendamos que instales gcloud en tu máquina local. El comando gcloud forma parte del SDK de Cloud.

  1. Instala el SDK de Cloud.
  2. Configura gcloud para usar tu proyecto.

    gcloud config set project project-name
    
  3. Configura gcloud para usar la zona en la que planeas crear tus recursos de Cloud TPU. Por ejemplo, us-central1-b

    $ gcloud config set compute/zone zone
    

Para obtener más información sobre el comando gcloud, consulta la referencia de gcloud.

Crea una Cloud TPU

Cuando creas una Cloud TPU, creas los recursos TPU y de VM de Compute Engine.

Crea una Cloud TPU con gcloud

Si deseas usar Cloud Shell, haz clic en Abrir Cloud Shell. De lo contrario, abre una ventana de símbolo del terminal o símbolo del sistema en tu computadora local.

Crea tus recursos de Cloud TPU. Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm create tpu-name \
  --zone=zone \
  --accelerator-type=v3-8 \
  --version=v2-alpha

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

accelerator-type
El tipo de Cloud TPU que se creará.

version
La versión del entorno de ejecución de Cloud TPU. Las versiones compatibles son v2-alpha para TPU únicas y v2-alpha-pod para Pods

Nodos TPU

$ gcloud compute tpus execution-groups create --name=tpu-name \
  --zone=zone \
  --tf-version=2.4.1 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

tf-version
La versión de Tensorflow que el comando gcloud instala en tu VM.

machine-type
El tipo de máquina de la VM de Compute Engine que se creará.

accelerator-type
El tipo de Cloud TPU que se creará.

Crea una Cloud TPU en Google Cloud Console

  1. Navega a Google Cloud Console.
  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU.
  3. Haz clic en CREAR NODO de TPU.
  4. En el cuadro Nombre, escribe un nombre de instancia de TPU.
  5. En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
  6. En Configuración de TPU, selecciona VM de TPU o Nodo TPU. La configuración de TPU determina si creas la TPU como una VM de TPU o un nodo de TPU. Para obtener más información, consulta Arquitectura del sistema.
  7. En Tipo de TPU, selecciona el tipo de TPU que deseas crear.
  8. En Versión de software de TPU, selecciona la versión de software. Cuando creas una VM de Cloud TPU, la versión del software de TPU especifica la versión del entorno de ejecución de TPU que se debe instalar. Cuando creas un nodo de Cloud TPU, la versión de software de TPU te permite elegir el marco de trabajo de AA instalado en la VM del nodo. No se requiere otra configuración. Para obtener más información, consulta Modelos compatibles.
  9. Haz clic en CREAR para crear los recursos.

Conéctate a una VM de Cloud TPU

De forma predeterminada, el comando gcloud que usas para crear nodos TPU intenta automáticamente establecer una conexión SSH con tu nodo TPU. Si usas nodos TPU y no estás conectado a la instancia de Compute Engine mediante el comando gcloud, puedes conectarte mediante la ejecución del comando de nodos TPU que se muestra a continuación. Cuando usas VM de TPU, debes establecer una conexión SSH explícita con tu TPU mediante el siguiente comando de VM de TPU.

VM de TPU

$ gcloud compute tpus tpu-vm ssh tpu-name \
  --zone=zone

Nodos TPU

$ gcloud compute tpus execution-groups compute ssh tpu-name\
  --zone=zone

Enumera los recursos de Cloud TPU

Puedes enumerar todas tus Cloud TPU en una zona específica.

Enumera los recursos de Cloud TPU con gcloud

Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm list --zone=zone

Nodos TPU

$ gcloud compute tpus execution-groups list --zone=zone

Con este comando, se enumeran los recursos de Cloud TPU en la zona especificada. Si no hay recursos configurados, el resultado solo mostrará guiones para la VM y la TPU. Si un recurso está activo y el otro no, verás un mensaje que indica que está en mal estado. Debes iniciar o reiniciar cualquier recurso que no esté en ejecución.

Enumera tus recursos de Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

Recupera información sobre Cloud TPU

Puedes recuperar información sobre una Cloud TPU especificada.

Recupera información sobre Cloud TPU con gcloud

Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm describe tpu-name \
  --zone=zone

Nodos TPU

$ gcloud describe tpu-name \
  --zone=zone

Recupera información sobre Cloud TPU con Google Cloud Console

  1. Navega a Google Cloud Console.
  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.
  3. Haz clic en el nombre de la Cloud TPU; se mostrará la página de detalles de Cloud TPU.

Detén tus recursos de Cloud TPU

Puedes detener una sola Cloud TPU para evitar que se generen cargos sin perder la configuración ni el software de la VM. No se pueden detener los pods de TPU.

Detén una Cloud TPU con gcloud

El comando que uses para detener Cloud TPU dependerá de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm stop tpu-name \
--zone=zone

Nodos TPU

$ gcloud alpha compute tpus stop tpu-name \
--zone=zone

Detén una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Detener.

Inicia tus recursos de Cloud TPU

Puedes iniciar una Cloud TPU cuando se detiene.

Inicia una Cloud TPU con gcloud

El comando que uses para detener Cloud TPU dependerá de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm start tpu-name --zone=zone

Nodos TPU

$ gcloud alpha compute tpus start tpu-name --zone=zone

Inicia una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Iniciar.

Borra tus VM de Compute Engine y recursos de Cloud TPU

Puedes borrar tu Cloud TPU cuando termines de usarlos.

Borra una Cloud TPU con gcloud

El comando que uses depende de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.

VM de TPU

$ gcloud compute tpus tpu-vm delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

Nodos TPU

$ gcloud delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
Es la zona en la que deseas crear la Cloud TPU.

Borra una Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Borrar.