Conecta una TPU a una red de VPC compartida

La forma de conectar un host de TPU a una VPC compartida depende de la arquitectura de TPU (VM de TPU o nodo TPU) que uses. Para obtener más información sobre las arquitecturas de TPU, consulta Arquitectura de sistemas de TPU.

Conecta una VM de TPU a una red de VPC compartida

Configura un proyecto host de VPC

Cuando usas la arquitectura de VM de TPU, debes otorgar permisos a la cuenta de servicio de TPU en tu proyecto de servicio para administrar recursos en el proyecto host. Para ello, usa la función “Agente de VPC compartida de TPU” (roles/tpu.xpnAgent). Ejecuta los siguientes comandos de gcloud para otorgar esta vinculación de función.

gcloud projects add-iam-policy-binding host-project-id \
--member=serviceAccount:service-your-service-project-number@gcp-sa-tpu.iam.gserviceaccount.com \
--role=roles/tpu.xpnAgent

Crea una VM de TPU conectada a una red de VPC compartida

Primero, determina qué tipos y versiones de aceleradores están disponibles en la zona

gcloud compute tpus accelerator-types list --zone zone
gcloud compute tpus versions list --zone zone

Debes conectar una VM de TPU a una red de VPC compartida cuando creas la TPU. Especifica tu VPC compartida con la etiqueta --network:

gcloud compute tpus tpu-vm create tpu-name \
--zone zone \
--accelerator-type accelerator-type \
--network projects/host-project-id/global/networks/host-network \
--version runtime-version \
--project your-service-project-id

Puedes verificar que la VM de TPU esté conectada a la VPC compartida con el comando gcloud compute tpus tpu-vm describe:

$ gcloud compute tpus tpu-vm describe tpu-name --zone zone

La respuesta incluye la red a la que está conectada la VM de TPU:

acceleratorType: v3-8
apiVersion: V2
cidrBlock: 10.128.0.0/20
createTime: '2022-06-17T21:32:13.859274143Z'
health: HEALTHY
id: '0000000000000000000'
name: projects/my-project/locations/us-central1-b/nodes/my-tpu
networkConfig:
  enableExternalIps: true
  network: projects/my-project/global/networks/default
  subnetwork: projects/my-project/regions/us-central1/subnetworks/default
networkEndpoints:
- accessConfig:
    externalIp: 000.000.000.000
  ipAddress: 10.128.0.104
  port: 8470
runtimeVersion: tpu-vm-tf-2.8.0
schedulingConfig: {}
serviceAccount:
  email: 00000000000-compute@developer.gserviceaccount.com
  scope:
  - https://www.googleapis.com/auth/devstorage.read_write
  - https://www.googleapis.com/auth/logging.write
  - https://www.googleapis.com/auth/service.management
  - https://www.googleapis.com/auth/servicecontrol
  - https://www.googleapis.com/auth/cloud-platform
  - https://www.googleapis.com/auth/pubsub
shieldedInstanceConfig: {}
state: READY

Borra la VM de TPU

Cuando termines de usar la VM de TPU, asegúrate de borrarla.

gcloud compute tpus tpu-vm delete tpu-name \
--zone zone \

Conecta un nodo TPU a una VPC compartida

Configura el acceso privado a los servicios

Antes de usar nodos TPU con VPC compartidas, debes establecer una conexión de acceso privado a servicios.

  1. Habilita la API de Service Networking con el siguiente comando de Google Cloud CLI. Esto solo se debe hacer una vez por proyecto de Cloud Platform.

    gcloud services enable servicenetworking.googleapis.com
    
  2. Asigna un rango de direcciones reservado para que lo use Service Networking. El prefix-length debe ser 24 o menos. Por ejemplo:

    gcloud compute addresses create sn-range-1 --global \
    --addresses=10.110.0.0 \
    --prefix-length=16 \
    --purpose=VPC_PEERING \
    --network=network-name
  3. Establece una conexión de acceso a servicios privados

    $ gcloud services vpc-peerings connect --service=servicenetworking.googleapis.com \
    --ranges=sn-range-1 \
    --network=network-name
    
  4. Verifica que se haya creado el intercambio de tráfico de VPC. Con el siguiente comando, se enumeran todos los intercambios de tráfico de VPC de la red especificada.

    gcloud services vpc-peerings list --network=network-name
    

Conecta un nodo TPU con una red de VPC compartida

Debes conectar un nodo TPU a una red de VPC compartida cuando creas la TPU. Especifica tu VPC compartida con la etiqueta --network:

$ gcloud compute tpus execution-groups create \
  --name=tpu-name \
  --zone=zone \
  --tf-version=2.12.0 \
  --machine-type=n1-standard-1 \
  --accelerator-type=v3-8 \
  --network=network-name

Recupera información sobre un nodo de TPU específico

$ gcloud compute tpus describe tpu-name --zone zone

La respuesta contiene la siguiente información:

acceleratorType: v3-8
apiVersion: V1
cidrBlock: 00.0.000.000/29
createTime: '2022-11-30T18:59:20.655858097Z'
health: HEALTHY
ipAddress: 00.000.0.000
name: projects/ml-writers/locations/us-central1-a/nodes/mikegre-vcp
network: global/networks/mikegre-vpc
networkEndpoints:
- ipAddress: 00.0.000.000
  port: 8470
port: '8470'
schedulingConfig: {}
serviceAccount: service-00000000000@cloud-tpu.iam.gserviceaccount.com
state: READY
tensorflowVersion: 2.10.0

Borra el nodo TPU

Cuando termines de usar el nodo TPU, asegúrate de borrarlo.

$ gcloud compute tpus execution-groups delete tpu-name \
  --zone=zone
### Borra el intercambio de tráfico de VPC Una conexión de intercambio de tráfico se puede desconectar mediante la API de Compute Networking. Estas llamadas deben realizarse en proyectos host de VPC compartida. 1. Enumera todos los intercambios de tráfico de VPC para encontrar el nombre del intercambio de tráfico que se borrará.
   $ gcloud compute networks peerings list --network=network-name
   
  1. Borra un intercambio de tráfico de VPC.

    $ gcloud compute networks peerings delete peering-name --network=network-name