Administra TPU
Puedes usar los comandos de gcloud
que se describen en este documento con configuraciones de TPU: VM de TPU y nodos TPU. Los comandos gcloud
que usas dependen de la configuración de TPU que uses. Cada comando gcloud
se muestra en una sección con pestañas. Elige la pestaña de la configuración de TPU que quieres usar y la página web muestra el comando gcloud
adecuado. A menos que sepas que debes usar nodos TPU, te recomendamos usar las VM de TPU. Para obtener más información sobre las configuraciones de TPU, consulta Arquitectura del sistema.
La ejecución de un modelo de aprendizaje automático (AA) requiere una VM de Compute Engine y recursos de Cloud TPU. En esta página, se describe cómo administrar estos recursos mediante lo siguiente:
- Google Cloud CLI, que proporciona la CLI principal a Google Cloud
- Google Cloud Console, que proporciona una consola de administración integrada para tus recursos de Google Cloud
Requisitos previos
Para ejecutar estos procedimientos, debes tener configurado un proyecto de Google Cloud. Si no tienes un proyecto, consulta la página sobre cómo crear y administrar proyectos para configurar uno.
Si usas el comando gcloud
, puedes usar Google Cloud Shell o instalar el comando gcloud
de forma local. Google Cloud Shell te permite interactuar con las Cloud TPU sin tener que instalar ningún software. Es posible que Google Cloud Shell se desconecte después de un período de inactividad, por lo que si ejecutas comandos de larga duración, recomendamos instalar gcloud
en tu máquina local. El comando gcloud
forma parte de Google Cloud CLI.
- Instala Google Cloud CLI.
Configura
gcloud
para usar tu proyecto.gcloud config set project project-name
Configura
gcloud
para usar la zona en la que planeas crear los recursos de Cloud TPU. Por ejemplo,us-central1-b
$ gcloud config set compute/zone zone
Para obtener más información sobre el comando gcloud
, consulta la Referencia de gcloud
.
Crea una Cloud TPU
Cuando creas una Cloud TPU, creas una VM de Compute Engine y recursos de TPU.
Crea una Cloud TPU con gcloud
Si deseas usar Cloud Shell, haz clic en Abrir Cloud Shell. De lo contrario, abre una ventana de terminal o el símbolo del sistema en tu computadora local.
Crea tus recursos de Cloud TPU. Los comandos que uses dependerán de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm create tpu-name \
--zone=zone \
--accelerator-type=v3-8 \
--version=tpu-vm-tf-2.11.0
Descripciones de las marcas de comandos
zone
- Es la zona en la que deseas crear la Cloud TPU.
accelerator-type
- El tipo de Cloud TPU que se creará.
version
- La versión del software de Cloud TPU.
shielded-secure-boot
(opcional)- Especifica que las instancias de TPU se crean con el inicio seguro habilitado. Esto las convierte de forma implícita en instancias de VM protegidas. Consulta ¿Qué es una VM protegida? para obtener más información.
Nodos TPU
$ gcloud compute tpus execution-groups create --name=tpu-name \
--zone=zone \
--tf-version=2.11.0 \
--machine-type=n1-standard-1 \
--accelerator-type=v3-8
Descripciones de las marcas de comandos
zone
- Es la zona en la que deseas crear la Cloud TPU.
tf-version
- La versión de Tensorflow que el comando
gcloud
instala en tu VM. machine-type
- El tipo de máquina de la VM de Compute Engine que se creará.
accelerator-type
- El tipo de Cloud TPU que se creará.
Crea un recurso en cola de Cloud TPU con gcloud
Con gcloud
, también puedes crear una Cloud TPU como un recurso en cola. Cuando realizas una solicitud para un recurso en cola, tu solicitud se agrega a una cola administrada por Cloud TPU. Cuando un recurso está disponible, el recurso se asigna y está disponible para uso exclusivo. Para obtener más información, consulta Recursos de Cloud TPU en cola.
Ejecuta secuencias de comandos de instalación estándar
Puedes ejecutar una secuencia de comandos de inicio en cada VM de TPU si especificas el parámetro --metadata startup-script
cuando creas la VM de TPU. El siguiente es un ejemplo del uso de un startup-script
para una VM de TPU.
$ gcloud compute tpus tpu-vm create tpu-name \
--zone=zone \
--accelerator-type=tpu-type \
--version=tpu-vm-tf-2.11.0 \
--metadata startup-script='#! /bin/bash
pip3 install numpy
EOF'
Después de crear la VM de TPU, puedes ver los registros desde la secuencia de comandos de inicio si te conectas a la VM de TPU con SSH
y ejecuta lo siguiente:
$ cat /var/log/syslog | grep startup-script
Crea una Cloud TPU en la consola de Google Cloud
- Ve a Google Cloud Console.
- Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU.
- Haz clic en CREAR NODO TPU.
- En el cuadro Nombre, escribe un nombre de instancia de TPU.
- En la casilla Zona, selecciona la zona en la que se creará la TPU.
- En TPU Configuration, selecciona TPU VM o Nodo TPU. La configuración de TPU determina si creas la TPU como una VM de TPU o un nodo TPU. Para obtener más información, consulta Arquitectura del sistema.
- En Tipo de TPU, selecciona el tipo de TPU que deseas crear.
- En Versión de software de TPU, selecciona la versión de software. Cuando creas una VM de Cloud TPU, la versión de software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Cuando creas un nodo de Cloud TPU, la versión de software de TPU te permite elegir el marco de trabajo de AA instalado en la VM del nodo. No se requiere ninguna otra configuración. Para obtener más información, consulta Modelos compatibles.
- Haz clic en CREAR para crear tus recursos.
Conéctate a una VM de Cloud TPU
De forma predeterminada, el comando gcloud
que usas para crear nodos TPU intenta establecer una conexión SSH a tu nodo TPU de forma automática. Si usas nodos TPU y no estás conectado a la instancia de Compute Engine mediante el comando gcloud
, puedes conectarte mediante la ejecución del siguiente comando de nodos TPU. Cuando usas VM de TPU, debes establecer una conexión SSH explícitamente a tu TPU con el siguiente comando de VM de TPU.
VM de TPU
$ gcloud compute tpus tpu-vm ssh tpu-name \
--zone=zone
Nodos TPU
$ gcloud compute ssh tpu-name\
--zone=zone
Enumera los recursos de Cloud TPU
Puedes enumerar todas las Cloud TPU en una zona específica.
Enumera los recursos de Cloud TPU con gcloud
Los comandos que uses dependerán de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm list --zone=zone
Nodos TPU
$ gcloud compute tpus execution-groups list --zone=zone
Con este comando, se enumeran los recursos de Cloud TPU en la zona especificada. Si no hay recursos configurados, el resultado solo mostrará guiones para la VM y la TPU. Si un recurso está activo y el otro no, verás un mensaje que dice que el estado es incorrecto. Debes iniciar o reiniciar el recurso que no esté en ejecución.
Haz una lista de tus recursos de Cloud TPU con Google Cloud Console
Ve a Google Cloud Console.
Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. En la consola, se muestra la página de TPU.
Recupera información sobre Cloud TPU
Puedes recuperar información sobre una Cloud TPU especificada.
Recupera información sobre Cloud TPU con gcloud
Los comandos que uses dependerán de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm describe tpu-name \
--zone=zone
Nodos TPU
$ gcloud compute tpus execution-groups describe tpu-name \
--zone=zone
Recuperar información sobre una Cloud TPU con la consola de Google Cloud
- Ve a Google Cloud Console.
- Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. En la consola, se muestra la página de TPU.
- Haz clic en el nombre de tu Cloud TPU. Se mostrará la página de detalles de Cloud TPU.
Detén tus recursos de Cloud TPU
Puedes detener una sola Cloud TPU para evitar que se generen cargos sin perder la configuración y el software de la VM. No se pueden detener los pods de TPU.
Detén una Cloud TPU con gcloud
El comando que usas para detener una Cloud TPU depende de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm stop tpu-name \
--zone=zone
Nodos TPU
$ gcloud compute tpus stop tpu-name \
--zone=zone
Detén una Cloud TPU en la consola de Google Cloud
Ve a Google Cloud Console.
Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. En la consola, se muestra la página de TPU.
Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Detener.
Inicia tus recursos de Cloud TPU
Puedes iniciar una Cloud TPU cuando está detenida.
Inicia una Cloud TPU con gcloud
El comando que usas para detener una Cloud TPU depende de si usas VM o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm start tpu-name --zone=zone
Nodos TPU
$ gcloud compute tpus start tpu-name --zone=zone
Inicia una Cloud TPU en la consola de Google Cloud
Ve a Google Cloud Console.
Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. En la consola, se muestra la página de TPU.
Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Iniciar.
Borra tus VM de Compute Engine y recursos de Cloud TPU
Puedes borrar tu Cloud TPU cuando termines de usarlos.
Borra una Cloud TPU con gcloud
El comando que uses depende de si usas VM de TPU o nodos TPU. Para obtener más información, consulta Arquitectura del sistema.
VM de TPU
$ gcloud compute tpus tpu-vm delete tpu-name \
--zone=zone
Descripciones de las marcas de comandos
zone
- Es la zona en la que deseas crear la Cloud TPU.
Nodos TPU
$ gcloud compute tpus execution-groups delete tpu-name \
--zone=zone
Descripciones de las marcas de comandos
zone
- Es la zona en la que deseas crear la Cloud TPU.
Borra una Cloud TPU con la consola de Google Cloud
Ve a Google Cloud Console.
Desde el menú de navegación de la izquierda, selecciona Compute Engine > TPU. En la consola, se muestra la página de TPU.
Selecciona la casilla de verificación junto a tu Cloud TPU y haz clic en Borrar.