Introduzione ai blocchi note gestiti

Le istanze di blocchi note gestiti di Vertex AI Workbench sono ambienti gestiti da Google con integrazioni e funzionalità che consentono di configurare e lavorare in un ambiente di produzione Jupyter end-to-end basato su blocchi note.

Le istanze di blocchi note gestiti sono preconfezionate con JupyterLab e hanno una suite preinstallata di pacchetti di deep learning, che include il supporto per i framework TensorFlow e PyTorch. Le istanze di blocchi note gestiti supportano gli acceleratori GPU e la possibilità di sincronizzazione con un repository GitHub. Le istanze di blocchi note gestiti sono protette dall'autenticazione e dall'autorizzazione Google Cloud.

Infrastruttura di computing gestita da Google

Un'istanza di blocchi note gestiti di Vertex AI Workbench è un'infrastruttura di calcolo Jupyter gestita da Google.

Quando crei un'istanza di blocchi note gestiti, ne viene eseguito il deployment come istanza di macchina virtuale (VM) gestita da Google in un progetto tenant.

L'istanza di blocchi note gestiti include molti ambienti framework di data science comuni, come TensorFlow e PyTorch. Puoi anche aggiungere immagini container personalizzate all'istanza di blocchi note gestiti. Questi ambienti sono disponibili come kernel in cui puoi eseguire il file blocco note.

Quando esegui un blocco note in uno dei kernel, Vertex AI Workbench avvia il container corrispondente, crea una sessione Jupyter al suo interno e utilizza quella sessione Jupyter per eseguire il blocco note nel container.

Questa infrastruttura di computing gestita da Google include integrazioni e funzionalità che consentono di implementare flussi di lavoro di data science e machine learning dall'inizio alla fine. Per i dettagli, vedi le sezioni seguenti.

Utilizzo di container personalizzati

Puoi aggiungere immagini di container Docker personalizzate all'istanza di blocchi note gestiti per eseguire il codice del blocco note in un ambiente personalizzato in base alle tue esigenze.

Questi container personalizzati possono essere utilizzati direttamente dall'interfaccia utente di JupyterLab, insieme ai framework preinstallati. Per ulteriori informazioni, consulta Aggiungere un container personalizzato a un'istanza di blocchi note gestiti.

Flusso di lavoro basato su blocchi note

Le istanze di blocchi note gestiti consentono di eseguire attività orientate al flusso di lavoro senza uscire dall'interfaccia utente di JupyterLab.

Controlla hardware e framework da JupyterLab

In un'istanza di blocchi note gestiti, nell'interfaccia utente JupyterLab puoi specificare su quali risorse di calcolo verrà eseguito il codice. Ad esempio, puoi configurare il numero di vCPU o GPU che vuoi, la quantità di RAM che vuoi e il framework in cui eseguire il codice. Puoi prima scrivere il codice, quindi scegliere come eseguirlo senza uscire da JupyterLab o riavviare l'istanza. Per test rapidi del codice, puoi fare lo scale down dell'hardware e poi lo scale up per eseguire il codice su più dati.

Accesso ai dati

Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente di JupyterLab.

Nel menu di navigazione di JupyterLab in un'istanza di blocchi note gestiti, puoi utilizzare l'integrazione di Cloud Storage per sfogliare dati e altri file a cui hai accesso. Vedi Accedere a bucket e file di Cloud Storage dall'interno di JupyterLab.

Puoi utilizzare l'integrazione di BigQuery anche per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare dati nel blocco note. Consulta Eseguire query sui dati nelle tabelle BigQuery da JupyterLab.

Esegui esecuzioni blocco note

Utilizza l'esecutore per eseguire un file blocco note come esecuzione una tantum o in base a una pianificazione. Scegli l'ambiente e l'hardware specifici su cui eseguire l'esecuzione. Il codice del blocco note verrà eseguito sull'addestramento personalizzato di Vertex AI, che semplifica l'addestramento distribuito, l'ottimizzazione degli iperparametri o la pianificazione di job di addestramento continuo. Vedi Eseguire file di blocco note con l'esecutore.

Puoi utilizzare i parametri nell'esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, potresti specificare un set di dati diverso da utilizzare, modificare il tasso di apprendimento sul modello o modificare la versione del modello.

Puoi anche impostare un blocco note in modo che venga eseguito in base a una pianificazione ricorrente. Anche quando l'istanza è arrestata, Vertex AI Workbench eseguirà il file blocco note e salverà i risultati per consentirti di esaminarli e condividerli con altri.

Condividere informazioni

Le esecuzioni di blocchi note eseguite sono archiviate in un bucket Cloud Storage, così puoi condividere gli insight con altri concedendo l'accesso ai risultati. Consulta la sezione precedente sull'esecuzione delle esecuzioni di blocchi note.

Proteggi l'istanza

Puoi eseguire il deployment dell'istanza di blocchi note gestiti con la rete predefinita gestita da Google, che utilizza una rete e una subnet VPC predefinite. Invece della rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza. Per maggiori informazioni, consulta Configurare una rete. Puoi utilizzare i Controlli di servizio VPC per fornire ulteriore sicurezza per le tue istanze di blocchi note gestiti.

Per utilizzare blocchi note gestiti all'interno di un perimetro di servizio, vedi Utilizzare un'istanza di blocchi note gestiti all'interno di un perimetro di servizio.

Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono at-rest utilizzando chiavi di crittografia gestite da Google. Se hai requisiti normativi o di conformità specifici relativi alle chiavi per la protezione dei dati, puoi utilizzare le chiavi di crittografia gestite dal cliente (CMEK) con le istanze dei blocchi note gestiti. Per ulteriori informazioni, consulta Utilizzare le chiavi di crittografia gestite dal cliente.

Arresto automatico per le istanze inattive

Per gestire i costi, le istanze di blocchi note gestiti vengono arrestate per impostazione predefinita dopo essere state inattive per un periodo di tempo specifico. Puoi modificare il periodo di tempo o disattivare questa funzionalità. Per ulteriori informazioni, consulta Chiusura per inattività.

Integrazione di Dataproc

Per elaborare i dati rapidamente, esegui un blocco note su un cluster Dataproc. Dopo aver configurato il cluster, puoi eseguire un file blocco note senza uscire dall'interfaccia utente di JupyterLab. Per ulteriori informazioni, vedi Eseguire un'istanza di blocchi note gestiti su un cluster Dataproc.

Limitazioni

Tieni presente le seguenti limitazioni dei blocchi note gestiti quando pianifichi il tuo progetto:

  • Le istanze di blocchi note gestiti sono gestite da Google e, di conseguenza, meno personalizzabili rispetto a quelle di Vertex AI Workbench gestite dall'utente. Le istanze dei blocchi note gestiti dall'utente possono essere più ideali per gli utenti che hanno bisogno di molto controllo sull'ambiente. Per ulteriori informazioni, consulta Introduzione ai blocchi note gestiti dall'utente.

  • Le estensioni JupyterLab di terze parti non sono supportate.

  • Il plug-in JupyterLab di Dataproc non è supportato per i blocchi note gestiti, ma puoi utilizzarlo nelle istanze di Vertex AI Workbench. Vedi Creare un'istanza abilitata per Dataproc.

  • Le istanze di blocchi note gestiti non consentono agli utenti di avere accesso a sudo.

  • Quando utilizzi Gestore contesto accesso e BeyondCorp Enterprise per proteggere le istanze di blocchi note gestiti con controlli di accesso sensibili al contesto, l'accesso viene valutato ogni volta che l'utente esegue l'autenticazione all'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che vi accede successivamente se il cookie del browser web è scaduto.

  • Per utilizzare acceleratori con istanze di blocchi note gestiti, il tipo di acceleratore desiderato deve essere disponibile nella zona dell'istanza. Per scoprire di più sulla disponibilità dell'acceleratore per zona, consulta Disponibilità delle regioni e delle zone GPU.

Passaggi successivi