Introduzione ai notebook gestiti
Le istanze di notebook gestiti di Vertex AI Workbench sono ambienti gestiti da Google con integrazioni e funzionalità che ti aiutano a configurare e lavorare in un ambiente di produzione end-to-end basato su blocchi note Jupyter.
Le istanze di notebook gestite sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework di TensorFlow e PyTorch. Le istanze di notebook gestite supportano gli acceleratori GPU e la possibilità di sincronizzarsi con un repository GitHub. Le istanze di notebook gestite sono protette da Google Cloud autenticazione e autorizzazione.
Infrastruttura di calcolo gestita da Google
Un'istanza di notebook gestiti di Vertex AI Workbench è un'infrastruttura di calcolo basata su blocchi note Jupyter gestita da Google.
Quando crei un'istanza di notebook gestita, viene dispiattata come istanza di macchina virtuale (VM) gestita da Google in un progetto tenant.
L'istanza di notebook gestiti include molti ambienti di framework di data science comuni, come TensorFlow e PyTorch. Puoi anche aggiungere le tue immagini container personalizzate all'istanza di notebook gestita. Questi ambienti sono disponibili come kernel in cui puoi eseguire il file del tuo blocco note.
Quando esegui un blocco note in uno dei kernel, Vertex AI Workbench avvia il contenitore corrispondente, crea una sessione Jupyter al suo interno e utilizza questa sessione Jupyter per eseguire il blocco note nel contenitore.
Questa infrastruttura di calcolo gestita da Google include integrazioni e funzionalità che ti aiutano a implementare le attività di data science e di machine learning dall'inizio alla fine. Per maggiori dettagli, consulta le sezioni seguenti.
Utilizzo di container personalizzati
Puoi aggiungere immagini container Docker personalizzate alla tua istanza di Notebooks gestita per eseguire il codice del tuo notebook in un ambiente personalizzato in base alle tue esigenze.
Questi container personalizzati sono disponibili per l'utilizzo direttamente dall'interfaccia utente di JupyterLab, insieme ai framework preinstallati. Per ulteriori informazioni, consulta Aggiungere un contenitore personalizzato a un'istanza di notebook gestita.
Flusso di lavoro basato su notebook
Le istanze di notebook gestite ti consentono di eseguire attività orientate al flusso di lavoro senza uscire dall'interfaccia utente di JupyterLab.
Controllare l'hardware e il framework da JupyterLab
In un'istanza di blocchi note gestiti, l'interfaccia utente di JupyterLab consente di specificare le risorse di calcolo su cui verrà eseguito il codice. Ad esempio, puoi configurare il numero di vCPU o GPU, la quantità di RAM e il framework in cui eseguire il codice. Puoi scrivere prima il codice e poi scegliere come eseguirlo senza uscire da JupyterLab o riavviare l'istanza. Per test rapidi del codice, puoi ridurre le dimensioni dell'hardware e poi riaumentarle per eseguire il codice su più dati.
Accesso ai dati
Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente di JupyterLab.
Nel menu di navigazione di JupyterLab su un'istanza di notebook gestita, puoi utilizzare l'integrazione di Cloud Storage per sfogliare i dati e altri file a cui hai accesso. Consulta Accedere ai file e ai bucket Cloud Storage da JupyterLab.
Puoi anche utilizzare l'integrazione di BigQuery per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare i dati nel tuo notebook. Consulta Eseguire query sui dati nelle tabelle BigQuery da JupyterLab.
Esegui le esecuzioni del notebook
Utilizza l'executor per eseguire un file del notebook come esecuzione una tantum o pianificata. Scegli l'ambiente e l'hardware specifici su cui vuoi eseguire l'esecuzione. Il codice del tuo notebook verrà eseguito sull'addestramento personalizzato di Vertex AI, il che può semplificare l'addestramento distribuito, l'ottimizzazione degli iperparametri o la pianificazione dei job di addestramento continuo. Consulta Eseguire i file del notebook con l'executor.
Puoi utilizzare i parametri nella tua esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, potresti specificare un set di dati diverso da utilizzare, cambiare il tasso di apprendimento del modello o la versione del modello.
Puoi anche impostare un notebook in modo che venga eseguito su una programmazione ricorrente. Anche quando l'istanza è inattiva, Vertex AI Workbench eseguirà il file del tuo notebook e salverà i risultati per consentirti di visualizzarli e condividerli con altri.
Condividere approfondimenti
Le esecuzioni dei notebook vengono archiviate in un bucket Cloud Storage, pertanto puoi condividere le tue informazioni con altri concedendo l'accesso ai risultati. Consulta la sezione precedente sull'esecuzione di esecuzioni del notebook.
Proteggi l'istanza
Puoi eseguire il deployment dell'istanza di Notebook gestita con la rete gestita da Google predefinita, che utilizza una rete e una subnet VPC predefinite. Anziché la rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza. Per ulteriori informazioni, consulta Configurare una rete. Puoi utilizzare Controlli di servizio VPC per fornire una maggiore sicurezza per le tue istanze di notebook gestite.
Per utilizzare i notebook gestiti all'interno di un perimetro di servizio, consulta Utilizzare un'istanza di notebook gestita all'interno di un perimetro di servizio.
Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono in stato at-rest utilizzando chiavi di crittografia gestite da Google. Se hai requisiti di conformità o normativi specifici relativi alle chiavi che proteggono i tuoi dati, puoi utilizzare le chiavi di crittografia gestite dal cliente (CMEK) con le istanze di notebook gestite. Per saperne di più, consulta Utilizzare le chiavi di crittografia gestite dal cliente.
Arresto automatico per le istanze inattive
Per contribuire a gestire i costi, per impostazione predefinita le istanze di notebook gestiti si arrestano dopo essere rimaste inattive per un determinato periodo di tempo. Puoi modificare il periodo di tempo o disattivare questa funzionalità. Per ulteriori informazioni, consulta Spegnimento in caso di inattività.
Integrazione di Dataproc
Puoi elaborare rapidamente i dati eseguendo un blocco note su un cluster Dataproc. Una volta configurato il cluster, puoi eseguire un file del notebook senza uscire dall'interfaccia utente di JupyterLab. Per saperne di più, consulta Eseguire un'istanza di blocchi note gestiti su un cluster Dataproc.
Limitazioni
Tieni presenti le seguenti limitazioni dei notebook gestiti quando pianifichi il tuo progetto:
Le istanze di notebook gestiti sono gestite da Google e quindi meno personalizzabili rispetto alle istanze di notebook gestiti dall'utente di Vertex AI Workbench. Le istanze di blocchi note gestite dall'utente possono essere più ideali per gli utenti che hanno bisogno di un elevato controllo sul proprio ambiente. Per saperne di più, consulta la Introduzione ai notebook gestiti dall'utente.
Le estensioni JupyterLab di terze parti non sono supportate.
Il plug-in JupyterLab di Dataproc non è supportato per i blocchi note gestiti, ma puoi utilizzarlo nelle istanze Vertex AI Workbench. Consulta Creare un'istanza con Dataproc.
Le istanze di notebook gestite non consentono agli utenti di avere accesso a
sudo
.Quando utilizzi Access Context Manager e Chrome Enterprise Premium per proteggere le istanze di notebook gestite con controlli di accesso sensibili al contesto, l'accesso viene valutato ogni volta che l'utente si autentica nell'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che accede successivamente se il cookie del browser web è scaduto.
Per utilizzare gli acceleratori con le istanze di notebook gestite, il tipo di acceleratore che ti interessa deve essere disponibile nella zona dell'istanza. Per informazioni sulla disponibilità degli acceleratori per zona, consulta Disponibilità di regioni e zone GPU.
Passaggi successivi
Scopri di più sulle opzioni di networking disponibili per l'istanza di notebook gestita.