Esta documentación corresponde a la versión más reciente de Knative Serving, que usa flotas y Anthos Service Mesh. Más información

La versión anterior (Cloud Run for Anthos) se ha archivado, pero la documentación sigue estando disponible para los usuarios actuales.

Versiones disponibles

Último
Archivo

Esta página se ha traducido con Cloud Translation API.

Usar GPUs NVIDIA

En esta página se describe cómo llevar a cabo tareas de aprendizaje profundo, como el reconocimiento de imágenes y el procesamiento del lenguaje natural, así como otras tareas que requieren muchos recursos computacionales, mediante grupos de nodos con aceleradores de hardware de unidad de procesamiento gráfico (GPU) de NVIDIA para obtener potencia de cálculo con tu instancia de contenedor de servicio de Knative.

Añadir un grupo de nodos con GPUs a un clúster de GKE

Pide a un administrador que cree un grupo de nodos con GPUs:

Configurar el servicio para que consuma GPUs

Puedes especificar un límite de recursos para consumir GPUs en tu servicio mediante la consola de Google Cloud o la CLI de Google Cloud cuando implementes un servicio nuevo, actualices un servicio o implementes una revisión:

Consola

Ir a Knative serving
Haga clic en Crear servicio para que se muestre el formulario Crear servicio.
En la sección Configuración del servicio:
1. Selecciona el clúster de GKE con el pool de nodos habilitado para GPU.
2. Especifica el nombre que quieras darle al servicio.
3. Haz clic en Siguiente para ir a la siguiente sección.
En la sección Configurar la primera revisión del servicio:
1. Añade una URL de imagen de contenedor.
2. Haz clic en Ajustes avanzados y, en el menú GPU asignada, selecciona el número de GPUs que quieras asignar a tu servicio.
Haz clic en Siguiente para ir a la siguiente sección.
En la sección Configurar la activación del servicio, selecciona la conectividad que quieras usar para invocar el servicio.
Haz clic en Crear para desplegar la imagen en Knative Serving y espera a que se complete el despliegue.

Línea de comandos

Puedes descargar la configuración de un servicio en un archivo YAML con el comando gcloud run services describe mediante la marca --format=export. A continuación, puedes modificar ese archivo YAML e implementar los cambios con el comando gcloud run services replace. Debe asegurarse de modificar solo los atributos especificados.

Descarga la configuración de tu servicio en un archivo llamado service.yaml en el espacio de trabajo local:
```
gcloud run services describe SERVICE --format export > service.yaml
```
Sustituye SERVICE por el nombre de tu servicio de Knative.

En su archivo local, actualice el atributo nvidia.com/gpu:

apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: SERVICE_NAME
spec:
template:
 spec:
   containers:
   – image: IMAGE_URL
     resources:
       limits:
        nvidia.com/gpu: "GPU_UNITS"

Sustituye GPU_UNITS por el valor de GPU que quieras en unidades de GPU de Kubernetes. Por ejemplo, especifica 1 para 1 GPU.

Despliega el archivo YAML y sustituye tu servicio por la nueva configuración ejecutando el siguiente comando:
```
gcloud run services replace service.yaml
```

Para obtener más información sobre el rendimiento y el coste de las GPUs, consulta GPUs.