TPU v2

En este documento se describen la arquitectura y las configuraciones admitidas de la TPU de Cloud v2.

Arquitectura del sistema

Puedes consultar los detalles de la arquitectura y las características de rendimiento de la TPU v2 en el artículo A Domain Specific Supercomputer for Training Deep Neural Networks (Un superordenador específico de un dominio para entrenar redes neuronales profundas).

Configuraciones

Una porción de TPU v2 se compone de 512 chips interconectados con enlaces de alta velocidad reconfigurables. Para crear un segmento de TPU v2, usa la marca --accelerator-type en el comando de creación de TPU (gcloud compute tpus tpu-vm). Especifica el tipo de acelerador indicando la versión de TPU y el número de núcleos de TPU. Por ejemplo, para una sola TPU v2, usa --accelerator-type=v2-8. Para una porción de la versión 2 con 128 TensorCores, usa --accelerator-type=v2-128.

El siguiente comando muestra cómo crear un segmento de TPU v2 con 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central1-a \
    --accelerator-type=v2-128 \
    --version=tpu-ubuntu2204-base

Para obtener más información sobre cómo gestionar las TPUs, consulta Gestionar TPUs. Para obtener más información sobre la arquitectura del sistema de las TPU de Cloud, consulta Arquitectura del sistema.

En la siguiente tabla se indican los tipos de TPU v2 admitidos:

Versión de TPU Fin de la asistencia
v. 2-8 (Fecha de finalización aún no definida)
v. 2-32 (Fecha de finalización aún no definida)
v. 2-128 (Fecha de finalización aún no definida)
v. 2-256 (Fecha de finalización aún no definida)
v. 2-512 (Fecha de finalización aún no definida)