Introduzione ai blocchi note gestiti

Istanze di blocchi note gestiti da Vertex AI Workbench sono ambienti gestiti da Google con integrazioni e funzionalità utili per configurare un ambiente di produzione end-to-end basato su blocchi note Jupyter.

Le istanze di notebook gestite sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework TensorFlow e PyTorch. Le istanze di blocchi note gestiti supportano gli acceleratori GPU e la possibilità di sincronizzarsi con GitHub. Le tue istanze di blocchi note gestiti sono protette tramite l'autenticazione e l'autorizzazione di Google Cloud.

Infrastruttura di calcolo gestita da Google

Un'istanza di Notebooks gestita da Vertex AI Workbench è un'infrastruttura di calcolo basata su blocchi note Jupyter gestita da Google.

Quando crei un'istanza di Notebooks gestita, viene dispiattata come istanza di macchina virtuale (VM) gestita da Google in un progetto tenant.

L'istanza di blocchi note gestiti include molti ambienti framework di data science, come TensorFlow e PyTorch. Puoi anche aggiungere le tue immagini container personalizzate all'istanza di notebook gestita. Questi ambienti disponibili come kernel, che puoi eseguire blocco note.

Quando esegui un blocco note in uno dei kernel, Vertex AI Workbench avvia il container corrispondente, crea una sessione Jupyter su di esso la sessione Jupyter per eseguire il blocco note sul container.

Questa infrastruttura di calcolo gestita da Google include integrazioni e funzionalità che ti aiutano a implementare le attività di data science e di machine learning dall'inizio alla fine. Per maggiori dettagli, consulta le sezioni seguenti.

Utilizzo di container personalizzati

Puoi aggiungere immagini container Docker personalizzate la tua istanza di blocchi note gestiti di eseguire il codice del tuo blocco note in un ambiente personalizzato in base alle tue esigenze.

Questi container personalizzati sono disponibili per l'utilizzo direttamente dall'interfaccia utente di JupyterLab, insieme ai framework preinstallati. Per ulteriori informazioni, consulta Aggiungere un container personalizzato di un'istanza di blocchi note gestiti.

Flusso di lavoro basato su blocco note

Le istanze di notebook gestite ti consentono di eseguire attività orientate al flusso di lavoro senza uscire dall'interfaccia utente di JupyterLab.

Controlla il tuo hardware e framework da JupyterLab

In un'istanza di blocchi note gestiti, la tua interfaccia utente JupyterLab specifica su quali risorse di computing verrà eseguito il tuo codice. Ad esempio, puoi configurare il numero di vCPU o GPU, la quantità di RAM e il framework in cui eseguire il codice. Puoi scrivere prima il codice e poi scegliere come eseguirlo senza uscire da JupyterLab o riavviare l'istanza. Per eseguire test rapidi del codice, puoi fare lo scale down dell'hardware e poi scalare l'hardware per eseguire il codice su più dati.

Accesso ai dati

Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente JupyterLab.

Nel menu di navigazione di JupyterLab su per un'istanza di blocchi note gestiti, puoi utilizzare Integrazione di Cloud Storage per sfogliare i dati e altri file a cui hai accesso. Vedi Accedere a bucket e file di Cloud Storage da JupyterLab.

Puoi anche utilizzare l'integrazione di BigQuery per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare i dati nel tuo notebook. Consulta Eseguire query sui dati nelle tabelle BigQuery da JupyterLab.

Esegui esecuzioni blocco note

Utilizzare l'esecutore per eseguire un file blocco note come esecuzione una tantum o in base a una pianificazione. Scegli l'ambiente e l'hardware specifici su cui vuoi eseguire l'esecuzione. Il codice del blocco note verrà eseguito l'addestramento personalizzato di Vertex AI, che può semplificare eseguire l'addestramento distribuito, ottimizzare gli iperparametri o e pianificare job di addestramento continuo. Consulta Eseguire i file del blocco note con l'eseguitore.

Puoi utilizzare i parametri nell'esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, puoi specificare un set di dati diverso da utilizzare, cambiare il tasso di apprendimento sul modello o cambiare la versione del modello.

Puoi anche impostare un notebook in modo che venga eseguito su una programmazione ricorrente. Anche quando l'istanza è in esecuzione, Vertex AI Workbench eseguire il file del blocco note e salvare i risultati da guardare e condividere con gli altri.

Condividi approfondimenti

Le esecuzioni dei notebook vengono archiviate in un bucket Cloud Storage, pertanto puoi condividere le tue informazioni con altri concedendo l'accesso ai risultati. Visualizza la sezione precedente sull'esecuzione del blocco note.

Proteggi l'istanza

Puoi eseguire il deployment dell'istanza di Notebook gestita con la rete gestita da Google predefinita, che utilizza una rete e una subnet VPC predefinite. Anziché la rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza. Per ulteriori informazioni, vedi Configura una rete. Puoi utilizzare Controlli di servizio VPC per fornire una maggiore sicurezza per le tue istanze di notebook gestite.

Per utilizzare i blocchi note gestiti all'interno di un perimetro di servizio, consulta Utilizzare un'istanza di blocchi note gestiti all'interno di un servizio perimetrale.

Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono rest utilizzando chiavi di crittografia. gestiti da Google. Se hai requisiti normativi o di conformità specifici alle chiavi che proteggono i tuoi dati, puoi utilizzare i cluster chiavi di crittografia (CMEK) con le tue istanze di blocchi note gestiti. Per ulteriori informazioni, consulta Utilizzare le chiavi di crittografia gestite dal cliente.

Arresto automatico per le istanze inattive

Per gestire i costi, istanze di blocchi note gestiti si arrestano per impostazione predefinita dopo un periodo di inattività specifico. Puoi modificare il periodo di tempo o disattivare questa funzionalità. Per ulteriori informazioni, consulta Spegnimento in caso di inattività.

Integrazione di Dataproc

Puoi elaborare i dati rapidamente eseguendo un blocco note su un cluster Dataproc. Una volta configurato il cluster, puoi eseguire un file del blocco note senza uscire dall'interfaccia utente di JupyterLab. Per maggiori informazioni, consulta Eseguire un'istanza di blocchi note gestiti su un cluster Dataproc.

Limitazioni

Tieni presenti le seguenti limitazioni dei notebook gestiti quando pianifichi il tuo progetto:

  • Le istanze di blocchi note gestiti sono gestite da Google e quindi meno personalizzabili rispetto alle istanze di blocchi note gestiti dall'utente di Vertex AI Workbench. Le istanze di blocchi note gestiti dall'utente possono essere più ideale per gli utenti che necessitano di un elevato controllo sull'ambiente. Per ulteriori informazioni, consulta la sezione Introduzione a e gestire i blocchi note gestiti dall'utente.

  • Le estensioni JupyterLab di terze parti non sono supportate.

  • Il plug-in JupyterLab di Dataproc non è supportato per i blocchi note gestiti, ma puoi utilizzarlo nelle istanze di Vertex AI Workbench. Consulta Creare un'istanza con Dataproc.

  • Le istanze di blocchi note gestiti non consentono agli utenti dispongono dell'accesso sudo.

  • Quando utilizzi Gestore contesto accesso e Chrome Enterprise Premium per proteggere le istanze di blocchi note gestiti sensibili al contesto, l'accesso viene valutato ogni volta l'utente esegue l'autenticazione nell'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che lo accede, se il browser è scaduto.

  • Per utilizzare acceleratori con istanze di blocchi note gestiti, il tipo di acceleratore desiderato deve essere disponibile zona di destinazione. Per informazioni sulla disponibilità degli acceleratori per zona, consulta Disponibilità di regioni e zone GPU.

Passaggi successivi