Administra TPU

El entrenamiento de un modelo de aprendizaje automático (AA) requiere una VM de Compute Engine y recursos de Cloud TPU. En esta página, se describe cómo administrar estos recursos mediante las siguientes opciones:

  • La gcloud command-line tool, que proporciona la CLI principal de Google Cloud Platform (GCP)
  • Cloud Console, que proporciona una consola de administración integrada para tus recursos de GCP

Requisitos previos

Para ejecutar estos procedimientos, debes tener configurado un proyecto de Google Cloud Platform (GCP). Si no tienes un proyecto, consulta la página sobre cómo crear y administrar proyectos para configurar uno.

Si usas el comando gcloud, puedes usar Google Cloud Shell o instalar el comando gcloud de forma local. Google Cloud Shell te permite interactuar con Cloud TPU sin tener que instalar ningún software. Es posible que Google Cloud Shell se desconecte después de un período de inactividad, por lo que, si ejecutas comandos de larga duración, te recomendamos que instales gcloud en tu máquina local. El comando gcloud forma parte del SDK de Google Cloud.

  1. Si usas un símbolo del sistema local, instala el SDK de Google Cloud.
  2. Configura gcloud para usar tu proyecto.

    gcloud config set project project-name
    
  3. Configura gcloud para usar la zona en la que planeas crear los recursos de Cloud TPU. Por ejemplo, us-central1-b

    $ gcloud config set compute/zone zone
    

Para obtener más información sobre el comando gcloud, consulta la referencia de gcloud.

Crea una Cloud TPU

Cuando creas una Cloud TPU, creas una VM de Compute Engine y recursos de TPU.

Crea una Cloud TPU con gcloud

$ gcloud compute tpus execution-groups create --name=tpu-name \
  --zone=zone \
  --tf-version=2.4.1 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8

Descripciones de las marcas de comandos

zone
La zona en la que planeas crear tu Cloud TPU.
tf-version
La versión de TensorFlow del comando gcloud se instala en tu VM.
machine-type
El tipo de máquina de la VM de Compute Engine que se creará.
accelerator-type
El tipo de Cloud TPU que se creará.

Crea una Cloud TPU en Google Cloud Console

  1. Navega a Google Cloud Console.
  2. En Menú de navegación, selecciona Compute Engine > TPU.
  3. Haz clic en CREAR NODO TPU.
  4. En el cuadro Nombre, escribe un nombre de instancia de TPU.
  5. En el cuadro Zona, selecciona la zona en la que crearás la TPU.
  6. En Tipo de TPU, selecciona el tipo de TPU que deseas crear.
  7. En Versión de software de TPU, selecciona la versión de software. Cuando creas una VM de Cloud TPU, la versión de software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Cuando creas un nodo de Cloud TPU, la versión de software de TPU te permite elegir el marco de trabajo de AA instalado en la VM del nodo. No se requiere ninguna otra configuración. Para obtener más información, consulta Modelos compatibles.
  8. Haz clic en CREAR para crear tus recursos.

Conéctate a una VM de Cloud TPU

$ gcloud compute ssh tpu-name\
  --zone=zone

Enumera los recursos de Cloud TPU

Puedes enumerar todas tus Cloud TPU en una zona específica.

Enumera tus recursos de Cloud TPU con gcloud

$ gcloud compute tpus execution-groups list --zone=zone

Con este comando, se enumeran los recursos de Cloud TPU en la zona especificada. Si no hay recursos configurados, se mostrarán guiones para la VM y la TPU. Si un recurso está activo y el otro no, verás un mensaje que indica que está en mal estado. Debes iniciar o reiniciar el recurso que no esté en ejecución.

Enumera los recursos de Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. En Menú de navegación, selecciona Compute Engine > TPU. La consola muestra la página TPU.

Recupera información sobre Cloud TPU

Puedes recuperar información sobre una Cloud TPU especificada.

Recupera información sobre una Cloud TPU con gcloud

$ gcloud compute tpus execution-groups describe tpu-name \
  --zone=zone

Recupera información sobre una Cloud TPU con Google Cloud Console

  1. Navega a Google Cloud Console.
  2. En Menú de navegación, selecciona Compute Engine > TPU. La consola muestra la página TPU.
  3. Haz clic en el nombre de tu Cloud TPU para que se muestre la página de detalles de la Cloud TPU.

Detén tus recursos de Cloud TPU

Puedes detener una Cloud TPU para que deje de generar cargos sin perder la configuración ni el software de la VM.

Detén una Cloud TPU con gcloud

$ gcloud alpha compute tpus stop tpu-name \
  --zone=zone

Detén una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. En Menú de navegación, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Detener.

Inicia tus recursos de Cloud TPU

Puedes iniciar una Cloud TPU cuando está detenida.

Inicia una Cloud TPU con gcloud

$ gcloud alpha compute tpus start tpu-name --zone=zone

Inicia una Cloud TPU en GCP Console

  1. Navega a Google Cloud Console.

  2. En Menú de navegación, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación junto a Cloud TPU y haz clic en Iniciar.

Borra tus VM de Compute Engine y recursos de Cloud TPU

Puedes borrar tu Cloud TPU cuando termines de usarlas.

Borra una Cloud TPU con gcloud

$ gcloud compute tpus execution-groups delete tpu-name \
  --zone=zone

Descripciones de las marcas de comandos

zone
La zona en la que planeas crear tu Cloud TPU.

Borra una Cloud TPU con GCP Console

  1. Navega a Google Cloud Console.

  2. En Menú de navegación, selecciona Compute Engine > TPU. La consola muestra la página TPU.

  3. Selecciona la casilla de verificación que aparece junto a Cloud TPU y haz clic en Borrar.