Introduzione alle istanze Vertex AI Workbench

Le istanze di Vertex AI Workbench sono ambienti di sviluppo basati su blocchi note Jupyter per l'intero flusso di lavoro di data science. Puoi interagire con Vertex AI e altri servizi Google Cloud da un blocco note Jupyter di un'istanza di Vertex AI Workbench.

Le integrazioni e le funzionalità di Vertex AI Workbench possono semplificare l'accesso ai dati, l'elaborazione più rapida dei dati, la pianificazione delle esecuzioni dei blocchi note e altro ancora.

Le istanze di Vertex AI Workbench sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework di TensorFlow e PyTorch. Puoi configurare istanze solo CPU o con GPU.

Le istanze di Vertex AI Workbench supportano la possibilità di sincronizzarsi con un repository GitHub. Le istanze di Vertex AI Workbench sono protette dall'autenticazione e dall'autorizzazione di Google Cloud .

Accesso ai dati

Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente di JupyterLab.

Nel menu di navigazione di JupyterLab su un'istanza di Vertex AI Workbench, puoi utilizzare l'integrazione di Cloud Storage per sfogliare i dati e gli altri file a cui hai accesso. Consulta Accedere ai file e ai bucket Cloud Storage da JupyterLab.

Puoi anche utilizzare l'integrazione di BigQuery per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare i dati nel tuo notebook. Consulta Eseguire query sui dati nelle tabelle BigQuery da JupyterLab.

Esegui esecuzioni del notebook

Utilizza l'executor per eseguire un file del notebook come esecuzione una tantum o pianificata. Scegli l'ambiente e l'hardware specifici su cui vuoi eseguire l'esecuzione. Il codice del tuo notebook verrà eseguito sull'addestramento personalizzato di Vertex AI, il che può semplificare l'addestramento distribuito, l'ottimizzazione degli iperparametri o la pianificazione dei job di addestramento continuo.

Puoi utilizzare i parametri nella tua esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, puoi specificare un set di dati diverso da utilizzare, cambiare il tasso di apprendimento del modello o la versione del modello.

Puoi anche impostare un notebook in modo che venga eseguito su un programma recurrente. Anche quando l'istanza è inattiva, Vertex AI Workbench eseguirà il file del tuo notebook e salverà i risultati per consentirti di visualizzarli e condividerli con altri.

Condividere approfondimenti

Le esecuzioni dei notebook vengono archiviate in un bucket Cloud Storage, pertanto puoi condividere le tue informazioni con altri concedendo l'accesso ai risultati. Consulta la sezione precedente sull'esecuzione di esecuzioni del notebook.

Proteggi l'istanza

Puoi eseguire il deployment dell'istanza Vertex AI Workbench con la rete gestita da Google predefinita, che utilizza una rete e una subnet VPC predefinite. Anziché la rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza.

Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono in stato at-rest utilizzando chiavi di crittografia gestite da Google. Se hai requisiti di conformità o normativi specifici relativi alle chiavi che proteggono i tuoi dati, puoi utilizzare le chiavi di crittografia gestite dal cliente (CMEK) con le istanze di Vertex AI Workbench. Per saperne di più, consulta Chiavi di crittografia gestite dal cliente.

Arresto automatico per le istanze inattive

Per aiutarti a gestire i costi, per impostazione predefinita le istanze di Vertex AI Workbench si arrestano dopo essere rimaste inattive per un determinato periodo di tempo. Puoi modificare il periodo di tempo o disattivare questa funzionalità. Per ulteriori informazioni, consulta Spegnimento in caso di inattività.

Aggiungere ambienti conda

Le istanze Vertex AI Workbench utilizzano kernel basati su ambienti conda. Puoi aggiungere un ambiente conda alla tua istanza Vertex AI Workbench, che verrà visualizzata come un kernel nell'interfaccia JupyterLab dell'istanza.

L'aggiunta di ambienti conda ti consente di utilizzare kernel non disponibili nell'istanza Vertex AI Workbench predefinita. Ad esempio, puoi aggiungere ambienti conda per R e Apache Beam. In alternativa, puoi aggiungere ambienti conda per versioni precedenti specifiche dei framework disponibili, come TensorFlow, PyTorch o Python.

Per ulteriori informazioni, consulta Aggiungere un ambiente conda.

Container personalizzati

Puoi creare un'istanza di Vertex AI Workbench in base a un contenitore personalizzato. Inizia con un'immagine container di base fornita da Google e modificala in base alle tue esigenze. Quindi, crea un'istanza basata sul tuo container personalizzato.

Per ulteriori informazioni, consulta Creare un'istanza utilizzando un contenuto personalizzato.

Integrazione di Dataproc

Puoi elaborare rapidamente i dati eseguendo un blocco note su un cluster Dataproc. Una volta configurato il cluster, puoi eseguire un file del notebook senza uscire dall'interfaccia utente di JupyterLab. Per ulteriori informazioni, consulta Creare un'istanza abilitata per Dataproc.

Creare istanze con credenziali di terze parti

Puoi creare e gestire istanze di Vertex AI Workbench con credenziali di terze parti fornite da Workforce Identity Federation. La federazione delle identità della forza lavoro utilizza il tuo provider di identità (IdP) esterno per concedere a un gruppo di utenti l'accesso alle istanze di Vertex AI Workbench tramite un proxy.

L'accesso a un'istanza di Vertex AI Workbench viene concesso assegnando un principale del pool di risorse umane all'account di servizio dell'istanza di Vertex AI Workbench.

Per ulteriori informazioni, consulta Creare un'istanza con credenziali di terze parti.

Tag per le istanze di Vertex AI Workbench

La VM di base di un'istanza Vertex AI Workbench è una VM Compute Engine. Puoi aggiungere e gestire i tag delle risorse all'istanza Vertex AI Workbench tramite la VM Compute Engine.

Quando crei un'istanza di Vertex AI Workbench, Vertex AI Workbench allega il tag della risorsa Compute Engine vertex-workbench-instances:prod=READ_ONLY. Questo tag risorsa viene utilizzato solo per uso interno.

Per scoprire di più sulla gestione dei tag per le istanze Compute Engine, consulta Gestire i tag per le risorse.

Limitazioni

Tieni presenti le seguenti limitazioni delle istanze di Vertex AI Workbench quando pianifichi il tuo progetto:

  • Le estensioni JupyterLab di terze parti non sono supportate.

  • Quando utilizzi Access Context Manager e Chrome Enterprise Premium per proteggere le istanze di Vertex AI Workbench con controlli di accesso basati sul contesto, l'accesso viene valutato ogni volta che l'utente si autentica nell'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che accede successivamente se il cookie del browser web è scaduto.

  • L'utilizzo di un contenitore personalizzato non derivato dal contenitore di base fornito da Google (gcr.io/deeplearning-platform-release/workbench-container:latest) aumenta i rischi di problemi di compatibilità con i nostri servizi e non è supportato. Modifica invece il contenitore di base per creare un contenutore personalizzato che soddisfi le tue esigenze, quindi crea un'istanza utilizzando il contenitore personalizzato.

  • Le istanze Vertex AI Workbench si aspettano immagini dal progettocloud-notebooks-managed. L'elenco dei nomi delle immagini è disponibile nella pagina di creazione della console Google Cloud . Sebbene l'utilizzo di immagini di macchine virtuali (VM) personalizzate o di immagini di VM per il deep learning con le istanze di Vertex AI Workbench possa essere possibile, Vertex AI Workbench non fornisce assistenza per comportamenti o malfunzionamenti imprevisti durante l'utilizzo di queste immagini.

  • L'utilizzo di un'immagine di notebook gestita dall'utente o di un'immagine di notebook gestita per creare un'istanza di Vertex AI Workbench non è supportato.

  • Non puoi modificare la VM sottostante di un'istanza di Vertex AI Workbench utilizzando la console Google Cloud o l'API Compute Engine. Per modificare la VM sottostante di un'istanza di Vertex AI Workbench, utilizza il metodo projects.locations.instances.patch nell'API Notebooks o il comando gcloud workbench instances update nell'Google Cloud SDK.

  • Nelle istanze che utilizzano i Controlli di servizio VPC, l'utilizzo dell'executor non è supportato.

  • Per utilizzare gli acceleratori con le istanze Vertex AI Workbench, il tipo di acceleratore che ti interessa deve essere disponibile nella zona dell'istanza. Per informazioni sulla disponibilità degli acceleratori per zona, consulta Disponibilità di regioni e zone GPU.

Passaggi successivi