TPU

Esta página presenta Cloud TPU y te muestra dónde encontrar información sobre el uso de Cloud TPU con Google Kubernetes Engine. Las unidades de procesamiento tensorial (TPUs) son los circuitos integrados específicos de aplicaciones (ASIC) desarrolladas por Google que se usan para acelerar las cargas de trabajo TensorFlow de aprendizaje automático.

Descripción general

Usar GKE para administrar tu Cloud TPU te da las siguientes ventajas:

  • Configuración y administración más sencillas: Cuando usas Cloud TPU, necesitas una Compute Engine VM a fin de ejecutar tu carga de trabajo y un bloque de enrutamiento entre dominios sin clases (CIDR) para la Cloud TPU. GKE configura y administra la VM y el bloque CIDR por ti.

  • Costo optimizado: GKE escala tus VM y nodos de Cloud TPU automáticamente según las cargas de trabajo y el tráfico. Solo pagas por Cloud TPU y la VM cuando ejecutas las cargas de trabajos en ellas.

  • Uso flexible: Es un cambio de una línea en la especificación de tu Pod para solicitar un acelerador de hardware diferente (CPU, GPU o TPU):

    kind: Pod
    spec:
      containers:

    • name: example-container resources: limits: cloud-tpus.google.com/v2: 8 # See the line above for TPU, or below for CPU / GPU. # cpu: 2 # nvidia.com/gpu: 1
  • Escalabilidad: GKE proporciona las API de (Implementación y Trabajo) que pueden escalar fácilmente a cientos de pods y nodos de Cloud TPU.

  • Tolerancia a errores: La API de trabajo de GKE, junto con el mecanismo de punto de control de TensorFlow, proporcionan la semántica de ejecución completa. Tus trabajos de capacitación se volverán a ejecutar automáticamente con la última lectura del estado del punto de control si se producen fallas en las instancias de VM o en los nodos Cloud TPU.

  • ¿Qué sigue?

    • Sigue el Instructivo de Cloud TPU ResNet que te muestra cómo entrenar el modelo TensorFlow ResNet-50 usando Cloud TPU y GKE.
    • Como alternativa, sigue la guía rápida para configurar Cloud TPU con GKE.
    • Obtener más recomendaciones sobre cómo usar Cloud TPU para tus tareas de aprendizaje automático.
    ¿Te ha resultado útil esta página? Enviar comentarios:

    Enviar comentarios sobre...