Einführung in verwaltete Notebooks

Von Vertex AI Workbench verwaltete Notebookinstanzen sind von Google verwaltete Umgebungen mit Integrationen und Funktionen, die Sie bei der Einrichtung und Arbeit in einer durchgängigen Jupyter-Notebook-basierten Produktionsumgebung unterstützen.

Verwaltete Notebookinstanzen sind mit JupyterLab vorverpackt und bieten eine vorinstallierte Suite von Deep-Learning-Paketen mit Unterstützung für TensorFlow- und PyTorch-Frameworks. Verwaltete Notebookinstanzen unterstützen GPU-Beschleuniger und die Synchronisierung mit einem GitHub-Repository. Ihre verwalteten Notebookinstanzen sind durch die Authentifizierungs- und Autorisierungsfunktion von Google Cloud geschützt.

Von Google verwaltete Computing-Infrastruktur

Eine von Vertex AI Workbench verwaltete Notebookinstanz ist eine von Google verwaltete, Jupyter-Notebook-basierte Computing-Infrastruktur.

Wenn Sie eine verwaltete Notebookinstanz erstellen, wird sie als von Google verwaltete VM-Instanz in einem Mandantenprojekt bereitgestellt.

Ihre verwaltete Notebookinstanz enthält viele gängige Data-Science-Framework-Umgebungen wie TensorFlow und PyTorch. Sie können Ihrer verwaltete^n Notebookinstanz auch eigene benutzerdefinierte Container-Images hinzufügen. Diese Umgebungen sind als Kernel verfügbar, in denen Sie Ihre Notebookdatei ausführen können.

Wenn Sie ein Notebook in einem der Kernel ausführen, startet Vertex AI Workbench den entsprechenden Container, erstellt eine Jupyter-Sitzung darauf und verwendet diese Jupyter-Sitzung, um Ihr Notebook auf dem Container auszuführen.

Diese von Google verwaltete Computing-Infrastruktur umfasst Integrationen und Funktionen, mit denen Sie Data-Science- und ML-Workflows von Anfang bis Ende implementieren können. Weitere Informationen finden Sie in den folgenden Abschnitten.

Benutzerdefinierte Container verwenden

Sie können Ihrer verwalteten Notebookinstanz benutzerdefinierte Docker-Container-Images hinzufügen, um Ihren Notebookcode in einer Umgebung auszuführen, die Ihren Anforderungen entspricht.

Diese benutzerdefinierten Container können direkt über die JupyterLab-Benutzeroberfläche zusammen mit den vorinstallierten Frameworks verwendet werden. Weitere Informationen finden Sie unter Benutzerdefinierten Container zu einer Instanz mit einem verwalteten Notebook hinzufügen.

Notebook-basierter Workflow

Mit verwalteten Notebookinstanzen können Sie Workflow-orientierte Aufgaben ausführen, ohne die JupyterLab-Benutzeroberfläche zu verlassen.

Hardware und Framework über JupyterLab steuern

In einer verwalteten Notebookinstanz können Sie in der JupyterLab-Benutzeroberfläche angeben, auf welchen Rechenressourcen Ihr Code ausgeführt werden soll. Beispielsweise können Sie konfigurieren, wie viele vCPUs oder GPUs Sie möchten, wie viel RAM Sie benötigen und in welchem Framework Sie den Code ausführen möchten. Sie können zuerst Ihren Code schreiben und dann auswählen, wie er ausgeführt werden soll, ohne JupyterLab zu verlassen oder Ihre Instanz neu zu starten. Für schnelle Tests Ihres Codes können Sie Ihre Hardware herunter- und dann wieder hochskalieren, um Ihren Code für weitere Daten auszuführen.

Datenzugriff

Sie können auf Ihre Daten zugreifen, ohne die JupyterLab-Benutzeroberfläche zu verlassen.

Im JupyterLab-Navigationsmenü auf einer verwalteten Notebookinstanz können Sie die Cloud Storage-Einbindung verwenden, um Daten und andere Dateien zu durchsuchen, auf die Sie Zugriff haben. Auf Cloud Storage-Buckets und -Dateien über JupyterLab zugreifen

Mit der BigQuery-Integration können Sie auch Tabellen durchsuchen, auf die Sie Zugriff haben, Abfragen schreiben, Ergebnisse in der Vorschau anzeigen und Daten in Ihr Notebook laden. Daten in BigQuery-Tabellen über JupyterLab abfragen

Notebook-Ausführungen ausführen

Führen Sie mit dem Executor eine Notebookdatei als einmalige Ausführung oder nach einem Zeitplan aus. Wählen Sie die Umgebung und Hardware aus, in der die Ausführung ausgeführt werden soll. Der Code Ihres Notebooks wird in dem benutzerdefinierten Vertex AI-Training ausgeführt, was das Ausführen verteilter Trainings, das Optimieren von Hyperparametern oder das Planen kontinuierlicher Trainingsjobs erleichtern kann. Notebook-Dateien mit dem Executor ausführen

Sie können Parameter in Ihrer Ausführung verwenden, um bestimmte Änderungen an jeder Ausführung vorzunehmen. Sie können beispielsweise ein anderes zu verwendendes Dataset angeben, die Lernrate für Ihr Modell oder die Version des Modells ändern.

Sie können ein Notebook so einstellen, dass es nach einem wiederkehrenden Zeitplan ausgeführt wird. Selbst wenn die Instanz heruntergefahren wurde, führt Vertex AI Workbench Ihre Notebookdatei aus und speichert die Ergebnisse, sodass Sie sie ansehen und mit anderen teilen können.

Informationen teilen

Ausgeführte Notebookausführungen werden in einem Cloud Storage-Bucket gespeichert, sodass Sie Ihre Informationen mit anderen teilen können, indem Sie Zugriff auf die Ergebnisse gewähren. Informationen dazu finden Sie im vorherigen Abschnitt zum Ausführen der Notebook-Ausführungen.

Instanz sichern

Sie können Ihre Instanz mit verwalteten Notebooks über das von Google verwaltete Standardnetzwerk bereitstellen, das ein Standard-VPC-Netzwerk und ein Subnetz verwendet. Anstelle des Standardnetzwerks können Sie ein VPC-Netzwerk angeben, das mit Ihrer Instanz verwendet werden soll. Weitere Informationen finden Sie unter Netzwerk einrichten. VPC Service Controls bietet zusätzliche Sicherheit für Ihre verwalteten Notebookinstanzen.

Informationen zur Verwendung von verwalteten Notebooks in einem Dienstperimeter finden Sie unter Verwaltete Notebookinstanzen innerhalb eines Dienstperimeters verwenden.

Standardmäßig verschlüsselt Google Cloud Daten im inaktiven Zustand automatisch mit von Google verwalteten Verschlüsselungsschlüsseln. Wenn Sie bestimmte Compliance- oder behördlichen Anforderungen in Bezug auf die Schlüssel zum Schutz Ihrer Daten haben, können Sie für Ihre nutzerverwalteten Notebookinstanzen vom Kunden verwaltete Verschlüsselungsschlüssel (Customer-Managed Encryption Keys, CMEK) verwenden. Weitere Informationen finden Sie unter vom Kunden verwaltete Verschlüsselungsschlüssel verwenden.

Automatisiertes Herunterfahren bei inaktiven Instanzen

Zur Kostensenkung werden verwaltete Notebookinstanzen standardmäßig heruntergefahren, nachdem sie für einen bestimmten Zeitraum inaktiv waren. Sie können den Zeitraum ändern oder diese Funktion deaktivieren. Weitere Informationen finden Sie unter Inaktives Herunterfahren.

Dataproc-Integration

Sie können Daten schnell verarbeiten, indem Sie ein Notebook in einem Dataproc-Cluster ausführen. Wenn der Cluster eingerichtet ist, können Sie eine Notebookdatei darauf ausführen, ohne die JupyterLab-Benutzeroberfläche zu verlassen. Weitere Informationen finden Sie unter Verwaltete Notebookinstanz in einem Dataproc-Cluster ausführen.

Beschränkungen

Beachten Sie beim Planen Ihres Projekts die folgenden Einschränkungen für verwaltete Notebooks:

  • Verwaltete Notebookinstanzen werden von Google verwaltet und sind daher weniger anpassbar als nutzerverwaltete Vertex AI Workbench-Notebookinstanzen. Nutzerverwaltete Notebookinstanzen eignen sich besser für Nutzer, die viel Kontrolle über ihre Umgebung benötigen. Weitere Informationen finden Sie unter Einführung in nutzerverwaltete Notebooks.

  • JupyterLab-Erweiterungen von Drittanbietern werden nicht unterstützt.

  • Verwaltete Notebookinstanzen gewähren Nutzern keinen sudo-Zugriff.

  • Wenn Sie Access Context Manager undBeyondCorp Enterprise zum Schutz verwalteter Notebookinstanzen mit kontextsensitiver Zugriffssteuerung verwenden, wird der Zugriff bei jeder Authentifizierung des Nutzers bei der Instanz ausgewertet. Beispielsweise wird der Zugriff ausgewertet, wenn der Nutzer zum ersten Mal auf JupyterLab zugreift und bei jedem Zugriff, nachdem das Cookie seines Webbrowsers abgelaufen ist.

  • Damit Sie Beschleuniger mit verwalteten Notebookinstanzen verwenden können, muss der gewünschte Beschleunigertyp in der Zone Ihrer Instanz verfügbar sein. Weitere Informationen zur Verfügbarkeit von Beschleunigern nach Zone finden Sie unter Verfügbarkeit von GPU-Regionen und -Zonen.

Nächste Schritte