Esta página se ha traducido con Cloud Translation API.
Switch to English

Administra TPU

El entrenamiento de un modelo de aprendizaje automático (AA) requiere una VM de Compute Engine y recursos de Cloud TPU. En esta página, se describe cómo administrar estos recursos mediante lo siguiente:

  • La gcloud command-line tool, que proporciona la CLI principal de Google Cloud Platform (GCP)
  • Cloud Console, que proporciona una consola de administración integrada para tus recursos de GCP

Requisitos previos

Para ejecutar estos procedimientos, debes tener configurado un proyecto de Google Cloud Platform (GCP). Si no tienes un proyecto, consulta la página sobre cómo crear y administrar proyectos para configurar uno.

Si usas el comando gcloud, puedes usar Google Cloud Shell o instalar el comando gcloud de forma local. Google Cloud Shell te permite interactuar con Cloud TPU sin tener que instalar ningún software. Es posible que Google Cloud Shell se desconecte después de un período de inactividad. Por lo tanto, si ejecutas comandos de larga duración, te recomendamos instalar gcloud en la máquina local. El comando gcloud es parte del SDK de Google Cloud.

  1. Si usas un símbolo del sistema local, instala el SDK de Google Cloud.
  2. Configura gcloud para usar tu proyecto.

    gcloud config set project project-name
    
  3. Configura gcloud para usar la zona en la que planeas crear tus recursos de Cloud TPU. Por ejemplo, us-central1-b.

    $ gcloud config set compute/zone zone
    

Para obtener más información sobre el comando gcloud, consulta la referencia de gcloud.

Crea una Cloud TPU

Cuando creas una Cloud TPU, creas una VM de Compute Engine y recursos de TPU.

Crea una Cloud TPU con gcloud

$ gcloud compute tpus execution-groups create --name=tpu-name \
  --zone=zone \
  --tf-version=2.4.1 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8

Descripciones de las marcas de comandos

zone
La zona en la que planeas crear tu Cloud TPU.
tf-version
La versión de Tensorflow que instala el comando gcloud en tu VM.
machine-type
El tipo de máquina de la VM de Compute Engine que se creará.
accelerator-type
El tipo de Cloud TPU que se creará.

Crea una Cloud TPU en Google Cloud Console

  1. Navega a Google Cloud Console.
  2. En el menú de navegación, selecciona Compute Engine > TPU.
  3. Haz clic en CREAR NODO TPU.
  4. En el cuadro Nombre, escribe un nombre de instancia de TPU.
  5. En el cuadro Zona, selecciona la zona en la que deseas crear la TPU.
  6. Para el Tipo de TPU, selecciona el tipo de TPU que deseas crear.
  7. En la versión de software de TPU, selecciona la versión de software. Cuando creas una VM de Cloud TPU, la versión de software de TPU especifica la versión del entorno de ejecución de TPU que se debe instalar. Cuando creas un nodo de Cloud TPU, la versión del software del TPU te permite elegir el marco de trabajo del AA instalado en la VM del nodo. No se requiere ninguna otra configuración. Para obtener más información, consulta Modelos compatibles.
  8. Haz clic en CREAR para crear tus recursos.

Conéctate a una VM de Cloud TPU

$ gcloud compute ssh tpu-name\
  --zone=zone

Enumera tus recursos de Cloud TPU

Puedes enumerar todas tus Cloud TPU en una zona específica.

Enumera tus recursos de Cloud TPU mediante gcloud

$ gcloud compute tpus execution-groups list --zone=zone

Este comando enumera los recursos de Cloud TPU de la zona especificada. Si no hay recursos configurados, el resultado solo mostrará guiones para la VM y la TPU. Si un recurso está activo y el otro no, verás un mensaje que indica que no se encuentra en buen estado. Debes iniciar o reiniciar el recurso que no está en ejecución.

Enumera tus recursos de Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. En el menú de navegación, selecciona Compute Engine > TPU. Console muestra la página de TPU.

Recupera información sobre tu Cloud TPU

Puedes recuperar información sobre una Cloud TPU específica.

Recupera información sobre una Cloud TPU con gcloud.

$ gcloud compute tpus execution-groups describe tpu-name \
  --zone=zone

Recupera información sobre una Cloud TPU con Google Cloud Console

  1. Navega a Google Cloud Console.
  2. En el menú de navegación, selecciona Compute Engine > TPU. Console muestra la página de TPU.
  3. Haz clic en el nombre de tu Cloud TPU, se mostrará la página de detalles de Cloud TPU.

Detén tus recursos de Cloud TPU

Puedes detener una Cloud TPU para dejar de generar cargos sin perder la configuración y el software de tu VM.

Detén una Cloud TPU con gcloud

$ gcloud alpha compute tpus stop tpu-name \
  --zone=zone

Detén una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. En el menú de navegación, selecciona Compute Engine > TPU. Console muestra la página de TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Detener.

Inicia tus recursos de Cloud TPU

Puedes iniciar una Cloud TPU cuando se detiene.

Inicia una Cloud TPU con gcloud

$ gcloud alpha compute tpus start tpu-name --zone=zone

Inicia una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. En el menú de navegación, selecciona Compute Engine > TPU. Console muestra la página de TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Iniciar.

Borra tus VM de Compute Engine y recursos de Cloud TPU

Puedes borrar tu Cloud TPU cuando hayas terminado de usarlas.

Borra una Cloud TPU mediante gcloud

$ gcloud compute tpus execution-groups delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
La zona en la que planeas crear tu Cloud TPU.

Borra una Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. En el menú de navegación, selecciona Compute Engine > TPU. Console muestra la página de TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Borrar.