Solución de problemas

En esta página, se describen los problemas que pueden surgir cuando creas instancias de imágenes de VM de aprendizaje profundo y se brinda información sobre cómo solucionarlos.

Se superó la cuota

Síntoma: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region us-east1.

Problema: No tienes cuota suficiente.

Solución: debes tener cuota de GPU antes de que puedas crear instancias con las GPU. Consulta la página de cuotas a fin de asegurarte de que tienes suficientes GPU disponibles en el proyecto. Si las GPU no se enumeran en la página de cuotas o si necesitas más cuota de GPU, solicita un aumento de cuota. Si el proyecto tiene un historial de facturación establecido, recibirá la cuota de forma automática después de que envíes la solicitud. Las cuentas de la prueba gratuita no reciben cuota de GPU de forma predeterminada.

Ten en cuenta que las GPU interrumpibles y las GPU normales requieren solicitudes de cuota diferentes. No puedes utilizar la cuota de GPU interrumpible para GPU normales. Además, la cuota es por región, así que asegúrate de crear la instancia en la región donde tienes cuota.

No se encontró el recurso

Síntoma: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4' was not found

Problema: intentas crear una instancia con una o más GPU en una región donde no hay GPU disponibles (por ejemplo, una instancia con una GPU P4 en europe-west4-c).

Solución: Para determinar qué región tiene la GPU requerida, consulta GPU en Compute Engine.

Instancias interrumpibles

Síntoma: No puedo crear una instancia interrumpible desde la IU, a pesar de que tengo cuota.

Solución: En este momento, no se puede crear una instancia interrumpible desde Google Cloud Marketplace. Se debe usar la CLI. Asegúrate de agregar --preemptible cuando configures la instancia nueva.

No se puede usar la redirección de puertos SSH para conectarse a JupyterLab

Síntoma: cuando usas la redirección de puertos SSH para conectarte a JupyterLab, no puedes conectarte a la instancia.

Problema: Intentas conectarte al socket TCP incorrecto.

Solución:

  • En algunos clientes de Linux, el localhost apunta a la dirección de bucle invertido de IPv6 (::1). Verifica esto mediante ping -c 1 localhost. Si este comando muestra la dirección IPv6, usa -L 8080:127.0.0.1:8080 (en lugar de -L 8080:localhost:8080) en el comando gcloud compute ssh.

  • Asegúrate de conectarte a http://localhost:8080 (en lugar de https://localhost:8080) en tu cliente local.

Asistencia de la comunidad

Haz una pregunta sobre la VM de Deep Learning en Stack Overflow o únete al grupo de Google google-dl-platform para debatir sobre la VM de Deep Learning.

Obtén más información para obtener asistencia de la comunidad.