Configura el entorno de Cloud TPU
Antes de que puedas usar los recursos de Cloud TPU para entrenar o ejecutar inferencias en modelos, debes realizar los siguientes pasos de configuración:
- Configura tu proyecto de Google Cloud
- Configura tu entorno para usar Cloud TPU
- Prepárate para solicitar una Cloud TPU
Configura el proyecto de Google Cloud
Debes tener una cuenta y un proyecto de Google Cloud para usar Cloud TPU.
En la consola de Google Cloud, accede a tu Cuenta de Google o regístrate para crear una cuenta nueva.
Instala Google Cloud CLI. Google Cloud CLI es una interfaz para acceder a los recursos y servicios de Google Cloud y administrarlos.
Selecciona o crea un proyecto de Google Cloud:
En la consola de Google Cloud, selecciona o crea un proyecto de Cloud desde el selector de proyectos.
En Cloud Shell, establece el ID de tu proyecto con gcloud CLI. El ID del proyecto es el nombre de tu proyecto que se muestra en la consola de Google Cloud.
$ gcloud config set project PROJECT-ID
Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.
La configuración de facturación es obligatoria para todo el uso de Google Cloud. Solo se te cobrará después de que comiences a usar los recursos de Google Cloud. Para obtener más información, consulta la documentación de Facturación de Cloud.
La facturación de todos los usos de las versiones de Cloud TPU sigue los precios regionales estándar que se muestran en la página de precios de Cloud TPU.
Configura tu entorno para usar Cloud TPU
Antes de solicitar una Cloud TPU, debes activar la API de Cloud TPU y asegurarte de tener permisos para administrar el acceso en tu proyecto y crear una Cloud TPU. También te recomendamos que crees una cuenta de servicio administrada por el usuario para conectarla a tu TPU.
Activa la API de Cloud TPU desde la consola de Google Cloud o con la gcloud CLI en Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- En la consola de Google Cloud, ve a la página de la API de Cloud TPU.
Ve a la página de la API de Cloud TPU
- Haz clic en Habilitar.
Asegúrate de tener los siguientes roles en tu proyecto:
- Administrador de cuentas de servicio: Es necesario para crear una cuenta de servicio.
- Administrador de IAM del proyecto: Es necesario para otorgar un rol en un proyecto.
- Administrador de TPU: Es necesario para crear una TPU.
Sigue las instrucciones que se indican en Cómo ver el acceso actual para ver quién tiene acceso a tu proyecto, organización o carpeta. Para ver tu propio acceso, en la columna Principal, busca la fila que tiene tu dirección de correo electrónico. Si tu dirección de correo electrónico no está en esa columna, significa que no tienes ningún rol. En la columna Rol de la fila con tu dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.
Si no tienes un rol obligatorio, otorga el rol o pídele a un administrador que lo haga.
Crea un agente de servicio de Cloud TPU:
Los agentes de servicio, un tipo de identidad de servicio, son identidades de servicio que mantiene Google y que usa el servicio de Cloud TPU para realizar operaciones en tu proyecto de Google Cloud. Por ejemplo, el agente de servicio se usa para crear y administrar recursos de Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
Crea una cuenta de servicio de TPU:
Las cuentas de servicio actúan como credenciales para tus VMs de TPU. Los roles conectados a una cuenta de servicio otorgan acceso a los recursos de Google Cloud. Recomendamos usar una cuenta de servicio administrada por el usuario y otorgar solo los permisos que requiere tu VM de TPU. Cuando usas una cuenta de servicio administrada por el usuario, debes especificarla cuando creas una VM de TPU con la marca
--service-account
.Sigue las instrucciones en Crea cuentas de servicio para crear una cuenta de servicio administrada por el usuario.
Sigue las instrucciones que se indican en Administra el acceso a proyectos, carpetas y organizaciones para otorgar a tu cuenta de servicio acceso a los servicios de Google Cloud a los que accederá tu TPU. Se recomiendan los siguientes roles para que tu TPU acceda a los servicios de Google Cloud más usados.
- Administrador de TPU: Es necesario para tener acceso completo a los recursos de TPU.
- Administrador de almacenamiento: Es necesario para acceder a Cloud Storage.
- Logs Writer: Es necesario para escribir registros con la API de Logging.
- Escritor de métricas de Monitoring: Es necesario para escribir métricas en Cloud Monitoring.
Prepárate para crear una Cloud TPU
Antes de crear una Cloud TPU, debes solicitar una cuota. También debes considerar usar recursos en cola, así como los parámetros que deseas usar para configurar tu TPU.
Cuota de solicitudes:
Para crear una Cloud TPU, tu proyecto de Google Cloud debe tener cuota para la versión y el tamaño de la TPU que deseas crear, y la zona en la que deseas crearla. Por ejemplo, si quieres crear una TPU v4-8 en
us-central2-b
, pides una cuota de 8 núcleos de TPU v4 enus-central2-b
. Para obtener más información sobre las zonas en las que Cloud TPU está disponible, consulta Regiones y zonas de TPU.La cuota se asigna de manera diferente según la versión de TPU. Los diferentes tipos de cuotas tienen diferentes expectativas de disponibilidad. Si quieres obtener más información sobre la asignación de cuotas, los tipos de cuotas y cómo solicitarlas, consulta Cuotas.
Determina si quieres usar recursos en cola.
Se recomienda crear una Cloud TPU como recurso en cola. Los recursos en fila te permiten recibir capacidad una vez que esté disponible. Puedes especificar una hora de inicio y finalización opcionales para el momento en que se debe completar la solicitud.
Existen diferentes comandos de gcloud CLI para trabajar con recursos en fila. Para obtener más información, consulta la guía del usuario de recursos en cola.
Determina los parámetros de creación de Cloud TPU:
Zona: Establece la marca
--zone
en la zona en la que deseas crear una TPU. Debes tener cuota asignada en esta zona. Para obtener más información, consulta Regiones y zonas de TPU.Configuración de TPU: Si no necesitas especificar una topología personalizada o si usas TPU v2 o v3, establece la marca
--accelerator-type
envVERSION-TENSORCORES
. Reemplaza VERSION por el número de versión de la TPU que deseas usar. Reemplaza TENSORCORES por la cantidad de TensorCores que deseas usar.Si deseas personalizar la topología física de tu TPU, usa las marcas
--version
y--topology
. Establece la marca--version
en la versión de TPU que deseas usar. Establece la marca--topology
en la topología que deseas usar.Para obtener más información sobre las configuraciones de TPU, incluidas las configuraciones compatibles y las variantes de topología, consulta Versiones de TPU.
Versión de software: Si solicitas un recurso en cola, establece la marca
--runtime-version
en el nombre de la versión de software que deseas usar. De lo contrario, usa la marca--version
. Las versiones de software de TPU están disponibles para los frameworks de TensorFlow, PyTorch y JAX. Para obtener más información sobre las versiones de software compatibles, consulta Versiones de software de las VMs de TPU.Cuenta de servicio: Establece
--service-account
en la dirección de correo electrónico de una cuenta de servicio, si creaste una, para conectarla a tu TPU. Si está vacía, se usará la cuenta de servicio predeterminada de Compute Engine.Tipo de cuota: Agrega la marca que corresponda al tipo de cuota que deseas usar:
Tipo de cuota Marcar Reservado --reserved
VMs Spot --spot
Interrumpible (no disponible para recursos en cola; usa --spot
en su lugar)--preemptible
A pedido No se necesita ninguna marca adicional Configuración avanzada: Puedes agregar marcas adicionales a tu solicitud para configurar tu TPU. Consulta la documentación de
gcloud compute tpus tpu-vm create
y las siguientes secciones para obtener más información:
Para ver ejemplos de cómo crear una Cloud TPU, consulta Cómo comenzar.
¿Qué sigue?
- Aprende a crear y administrar recursos de VM y TPU
- Ejecuta una guía de inicio rápido de Cloud TPU.