TPU v2

En este documento, se describen la arquitectura y las configuraciones compatibles de Cloud TPU v2.

Arquitectura del sistema

Los detalles de la arquitectura y las características de rendimiento de TPU v2 están disponibles en Una supercomputadora específica del dominio para el entrenamiento de redes neuronales profundas.

Parámetros de configuración

Un pod de TPU v2 está compuesto por 512 chips interconectados con vínculos de alta velocidad reconfigurables. Para crear una porción de pod de TPU v2, usa la marca --accelerator-type en el comando de creación de TPU (gcloud compute tpus tpu-vm). Para especificar el tipo de acelerador, especifica la versión de TPU y la cantidad de núcleos de TPU. Por ejemplo, para una sola TPU v2, usa --accelerator-type=v2-8. Para una porción de pod v2 con 128 TensorCores, usa --accelerator-type=v2-128.

En el siguiente comando, se muestra cómo crear una porción de pod de TPU v2 con 128 TensorCores:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=zone \
    --accelerator-type=v2-128 \
    --version=tpu-vm-tf-2.16.1-pjrt

Para obtener más información sobre cómo administrar las TPU, consulta Administra las TPU. Para obtener más información sobre la arquitectura del sistema de TPU de Cloud TPU, consulta Arquitectura del sistema.

En la siguiente tabla, se enumeran los tipos de TPU v2 compatibles:

Versión de TPU Finalización de compatibilidad
v2-8 (Fecha de finalización aún no establecida)
v2-32 (Fecha de finalización aún no establecida)
v2-128 (Fecha de finalización aún no establecida)
v2-256 (Fecha de finalización aún no establecida)
v2-512 (Fecha de finalización aún no establecida)