Introduzione ai notebook gestiti
Le istanze di notebook gestiti di Vertex AI Workbench sono ambienti gestiti da Google con integrazioni e funzionalità che ti aiutano a configurare e lavorare in un ambiente di produzione end-to-end basato su blocchi note Jupyter.
Le istanze di notebook gestiti sono preconfigurate con JupyterLab e hanno una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework TensorFlow e PyTorch. Le istanze di Managed Notebooks supportano gli acceleratori GPU e la possibilità di sincronizzarsi con un repository GitHub. Le istanze di blocchi note gestiti sono protette dall'autenticazione e dall'autorizzazione Google Cloud .
Infrastruttura di calcolo gestita da Google
Un'istanza di notebook gestiti da Vertex AI Workbench è un'infrastruttura di calcolo basata su notebook Jupyter e gestita da Google.
Quando crei un'istanza di notebook gestiti, viene implementata come istanza di macchina virtuale (VM) gestita da Google in un progetto tenant.
L'istanza di blocchi note gestiti include molti ambienti di framework di data science comuni, come TensorFlow e PyTorch. Puoi anche aggiungere le tue immagini container personalizzate all'istanza di Managed Notebooks. Questi ambienti sono disponibili come kernel in cui puoi eseguire il file del blocco note.
Quando esegui un notebook in uno dei kernel, Vertex AI Workbench avvia il container corrispondente, crea una sessione Jupyter e la utilizza per eseguire il notebook sul container.
Questa infrastruttura di calcolo gestita da Google include integrazioni e funzionalità che ti aiutano a implementare i flussi di lavoro di data science e machine learning dall'inizio alla fine. Per maggiori dettagli, consulta le sezioni seguenti.
Utilizzo di container personalizzati
Puoi aggiungere immagini container Docker personalizzate all'istanza di notebook gestiti per eseguire il codice del notebook in un ambiente personalizzato in base alle tue esigenze.
Questi container personalizzati sono disponibili per l'uso direttamente dall'interfaccia utente di JupyterLab, insieme ai framework preinstallati. Per saperne di più, consulta Aggiungere un container personalizzato a un'istanza di notebook gestiti.
Flusso di lavoro basato su notebook
Le istanze di blocchi note gestite ti consentono di svolgere attività orientate al flusso di lavoro senza uscire dall'interfaccia utente di JupyterLab.
Controllare l'hardware e il framework da JupyterLab
In un'istanza di blocchi note gestiti, l'interfaccia utente JupyterLab è il punto in cui specifichi le risorse di calcolo su cui verrà eseguito il codice. Ad esempio, puoi configurare il numero di vCPU o GPU che vuoi, la quantità di RAM che ti serve e il framework in cui vuoi eseguire il codice. Puoi scrivere prima il codice e poi scegliere come eseguirlo senza uscire da JupyterLab o riavviare l'istanza. Per test rapidi del codice, puoi ridurre le dimensioni dell'hardware e poi aumentarle di nuovo per eseguire il codice su più dati.
Accesso ai dati
Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente di JupyterLab.
Nel menu di navigazione di JupyterLab su un'istanza di blocchi note gestiti, puoi utilizzare l'integrazione di Cloud Storage per sfogliare i dati e altri file a cui hai accesso. Consulta Accedere ai bucket e ai file Cloud Storage da JupyterLab.
Puoi anche utilizzare l'integrazione di BigQuery per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare i dati nel notebook. Consulta Esegui query sui dati nelle tabelle BigQuery da JupyterLab.
Esegui le esecuzioni del notebook
Utilizza l'executor per eseguire un file di blocco note come esecuzione una tantum o in base a una pianificazione. Scegli l'ambiente e l'hardware specifici su cui vuoi che venga eseguita l'esecuzione. Il codice del notebook verrà eseguito nell'addestramento personalizzato di Vertex AI, il che può semplificare l'addestramento distribuito, l'ottimizzazione degli iperparametri o la pianificazione di job di addestramento continuo. Consulta Eseguire file notebook con l'executor.
Puoi utilizzare i parametri nell'esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, potresti specificare un set di dati diverso da utilizzare, modificare il tasso di apprendimento del modello o cambiare la versione del modello.
Puoi anche impostare l'esecuzione di un blocco note in base a una pianificazione ricorrente. Anche se l'istanza è arrestata, Vertex AI Workbench eseguirà il file del notebook e salverà i risultati in modo che tu possa visualizzarli e condividerli con altri.
Condividere approfondimenti
Le esecuzioni dei notebook vengono archiviate in un bucket Cloud Storage, in modo da poter condividere i tuoi approfondimenti con altri concedendo l'accesso ai risultati. Consulta la sezione precedente sull'esecuzione delle esecuzioni dei notebook.
Proteggere l'istanza
Puoi eseguire il deployment dell'istanza di blocchi note gestiti con la rete gestita da Google predefinita, che utilizza una rete VPC e una subnet predefinite. Anziché la rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza. Per saperne di più, consulta Configurare una rete. Puoi utilizzare Controlli di servizio VPC per fornire ulteriore sicurezza alle tue istanze di notebook gestiti.
Per utilizzare i blocchi note gestiti all'interno di un perimetro di servizio, consulta Utilizzo di un'istanza di blocchi note gestiti all'interno di un perimetro di servizio.
Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono inattivi utilizzando chiavi di crittografia gestite da Google. Se hai requisiti normativi o di conformità specifici relativi alle chiavi che proteggono i tuoi dati, puoi utilizzare le chiavi di crittografia gestite dal cliente (CMEK) con le tue istanze di notebook gestiti. Per saperne di più, vedi Utilizzare le chiavi di crittografia gestite dal cliente.
Arresto automatico per le istanze inattive
Per contribuire a gestire i costi, le istanze di notebook gestiti vengono arrestate dopo un periodo di inattività specifico per impostazione predefinita. Puoi modificare la durata o disattivare questa funzionalità. Per ulteriori informazioni, vedi Arresto inattivo.
Integrazione di Dataproc
Puoi elaborare i dati rapidamente eseguendo un notebook su un cluster Dataproc. Una volta configurato il cluster, puoi eseguire un file di notebook senza uscire dall'interfaccia utente di JupyterLab. Per saperne di più, consulta Esecuzione di un'istanza di blocchi note gestiti su un cluster Dataproc.
Limitazioni
Quando pianifichi il progetto, tieni presente le seguenti limitazioni dei notebook gestiti:
Le istanze di notebook gestiti sono gestite da Google e pertanto sono meno personalizzabili rispetto alle istanze di notebook gestiti dall'utente di Vertex AI Workbench. Le istanze di blocchi note gestiti dall'utente possono essere più adatte agli utenti che hanno bisogno di un maggiore controllo sul proprio ambiente. Per saperne di più, consulta la pagina Introduzione ai blocchi note gestiti dall'utente.
Le estensioni JupyterLab di terze parti non sono supportate.
Il plug-in Dataproc JupyterLab non è supportato per i notebook gestiti, ma puoi utilizzarlo nelle istanze Vertex AI Workbench. Consulta Creare un'istanza abilitata per Dataproc.
Le istanze di blocchi note gestiti non consentono agli utenti di avere accesso a
sudo
.Quando utilizzi Access Context Manager e Chrome Enterprise Premium per proteggere le istanze di notebook gestiti con controlli di accesso sensibili al contesto, l'accesso viene valutato ogni volta che l'utente esegue l'autenticazione all'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che vi accede successivamente se il cookie del browser web è scaduto.
Per utilizzare gli acceleratori con le istanze di blocchi note gestiti, il tipo di acceleratore che vuoi deve essere disponibile nella zona dell'istanza. Per informazioni sulla disponibilità degli acceleratori per zona, consulta la sezione Disponibilità delle GPU per regioni e zone.
Passaggi successivi
Scopri di più sulle opzioni di networking disponibili per l'istanza di notebook gestiti.