Risoluzione dei problemi di Vertex AI Workbench

Questa pagina descrive i passaggi per la risoluzione dei problemi, utili in caso di problemi durante l'utilizzo di Vertex AI Workbench.

Consulta anche Risoluzione dei problemi di Vertex AI per ricevere assistenza sull'utilizzo di altri componenti di Vertex AI.

Per filtrare i contenuti di questa pagina, fai clic su un argomento:

Procedure utili

Questa sezione descrive le procedure che potresti trovare utili.

Utilizza SSH per connetterti all'istanza dei blocchi note gestiti dall'utente

Utilizza SSH per connetterti all'istanza digitando il comando seguente in Cloud Shell o in qualsiasi ambiente in cui è installata Google Cloud CLI.

gcloud compute ssh --project PROJECT_ID \
  --zone ZONE \
  INSTANCE_NAME -- -L 8080:localhost:8080

Sostituisci quanto segue:

  • PROJECT_ID: il tuo ID progetto
  • ZONE: la zona Google Cloud in cui si trova l'istanza
  • INSTANCE_NAME: il nome dell'istanza

Esegui di nuovo la registrazione con il server Inverting Proxy

Per registrare di nuovo l'istanza di blocchi note gestiti dall'utente con il server proxy inverting interno, puoi arrestare e avviare la VM dalla pagina Blocchi note gestiti dall'utente oppure puoi utilizzare SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserire:

cd /opt/deeplearning/bin
sudo ./attempt-register-vm-on-proxy.sh

verifica lo stato del servizio Docker

Per verificare lo stato del servizio Docker, puoi utilizzare SSH per connetterti alla tua istanza di blocchi note gestiti dall'utente e inserire:

sudo service docker status

Verifica che l'agente Inverting Proxy sia in esecuzione

Per verificare se l'agente proxy inverting del blocco note è in esecuzione, utilizza SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserisci:

# Confirm Inverting Proxy agent Docker container is running (proxy-agent)
sudo docker ps

# Verify State.Status is running and State.Running is true.
sudo docker inspect proxy-agent

# Grab logs
sudo docker logs proxy-agent

Verifica lo stato del servizio Jupyter e raccogli i log

Per verificare lo stato del servizio Jupyter, puoi utilizzare SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserire:

sudo service jupyter status

Per raccogliere i log del servizio Jupyter:

sudo journalctl -u jupyter.service --no-pager

Verifica che l'API interna Jupyter sia attiva

L'API Jupyter deve sempre essere eseguita sulla porta 8080. Puoi verificarlo ispezionando i syslog dell'istanza per trovare una voce simile a:

Jupyter Server ... running at:
http://localhost:8080

Per verificare che l'API interna Jupyter sia attiva, puoi anche utilizzare SSH per connetterti alla tua istanza di blocchi note gestiti dall'utente e inserire:

curl http://127.0.0.1:8080/api/kernelspecs

Puoi anche misurare il tempo necessario all'API per rispondere nel caso in cui le richieste richiedano troppo tempo:

time curl -V http://127.0.0.1:8080/api/status
time curl -V http://127.0.0.1:8080/api/kernels
time curl -V http://127.0.0.1:8080/api/connections

Per eseguire questi comandi nella tua istanza di Vertex AI Workbench, apri JupyterLab e crea un nuovo terminale.

riavvia il servizio Docker

Per riavviare il servizio Docker, puoi arrestare e avviare la VM dalla pagina Blocchi note gestiti dall'utente oppure puoi utilizzare SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserire:

sudo service docker restart

Riavvia l'agente Inverting Proxy

Per riavviare l'agente Inverting Proxy, puoi arrestare e avviare la VM dalla pagina Blocchi note gestiti dall'utente oppure puoi utilizzare SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserire:

sudo docker restart proxy-agent

Riavvia il servizio Jupyter

Per riavviare il servizio Jupyter, puoi arrestare e avviare la VM dalla pagina Blocchi note gestiti dall'utente oppure puoi utilizzare SSH per connetterti all'istanza di blocchi note gestiti dall'utente e inserire:

sudo service jupyter restart

Riavvia l'agente di raccolta Notebooks

Il servizio dell'agente raccolta Notebooks esegue in background un processo Python che verifica lo stato dei servizi principali dell'istanza di Vertex AI Workbench.

Per riavviare il servizio dell'agente raccolta Notebooks, puoi arrestare e avviare la VM dalla console Google Cloud oppure puoi utilizzare SSH per connetterti all'istanza di Vertex AI Workbench e inserire:

sudo systemctl stop notebooks-collection-agent.service

seguito da:

sudo systemctl start notebooks-collection-agent.service

Per eseguire questi comandi nella tua istanza di Vertex AI Workbench, apri JupyterLab e crea un nuovo terminale.

Modifica lo script dell'agente raccolta Notebooks

Per accedere allo script e modificarlo, apri un terminale nella nostra istanza o utilizza SSH per connetterti alla tua istanza di Vertex AI Workbench e inserisci:

nano /opt/deeplearning/bin/notebooks_collection_agent.py

Dopo aver modificato il file, ricordati di salvarlo.

Quindi, devi riavviare il servizio dell'agente di raccolta Notebooks.

Verifica che l'istanza possa risolvere i domini DNS richiesti

Per verificare che l'istanza possa risolvere i domini DNS richiesti, puoi utilizzare SSH per connetterti alla tua istanza di blocchi note gestiti dall'utente e inserire:

host notebooks.googleapis.com
host *.notebooks.cloud.google.com
host *.notebooks.googleusercontent.com
host *.kernels.googleusercontent.com

oppure:

curl --silent --output /dev/null "https://notebooks.cloud.google.com"; echo $?

Se per l'istanza è abilitato Dataproc, puoi verificare che l'istanza risolva *.kernels.googleusercontent.com eseguendo:

curl --verbose -H "Authorization: Bearer $(gcloud auth print-access-token)" https://${PROJECT_NUMBER}-dot-${REGION}.kernels.googleusercontent.com/api/kernelspecs | jq .

Per eseguire questi comandi nella tua istanza di Vertex AI Workbench, apri JupyterLab e crea un nuovo terminale.

Crea una copia dei dati utente su un'istanza

Per archiviare una copia dei dati utente di un'istanza in Cloud Storage, completa i passaggi riportati di seguito.

Crea un bucket Cloud Storage (facoltativo)

Nello stesso progetto in cui si trova l'istanza, crea un bucket Cloud Storage in cui archiviare i dati utente. Se hai già un bucket Cloud Storage, salta questo passaggio.

Copiare i dati utente

  1. Nell'interfaccia di JupyterLab della tua istanza, seleziona File > Nuovo > Terminale per aprire una finestra del terminale. Per le istanze di blocchi note gestiti dall'utente, puoi invece connetterti al terminale dell'istanza utilizzando SSH.

  2. Utilizza gsutil tool per copiare i dati utente in un bucket Cloud Storage. Il comando di esempio seguente copia tutti i file dalla directory /home/jupyter/ dell'istanza in una directory in un bucket Cloud Storage.

    gsutil cp -R /home/jupyter/* gs://BUCKET_NAMEPATH
    

    Sostituisci quanto segue:

    • BUCKET_NAME: il nome del tuo bucket Cloud Storage
    • PATH: il percorso della directory in cui vuoi copiare i file, ad esempio: /copy/jupyter/