Vorgänge und Entwicklung bei der Verwendung von nutzerverwalteten Notebooks trennen: Übersicht

Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

In diesem Dokument wird eine Lösung beschrieben, um die Bereitstellung und Verwendung von Umgebungen zum Ausführen nutzerverwalteter Notebooks von Vertex AI Workbench zu beschleunigen. Die Lösung richtet sich an IT-Administratoren, die Jupyter-Notebooks verwalten, und an Datenexperten, die diese verwenden, einschließlich Data Scientists, Datenanalysten und Data Engineers. Dabei wird davon ausgegangen, dass Leser mit Google Cloud und Jupyter-Notebooks vertraut sind.

Das Dokument ist Teil einer Reihe, die folgende Themen behandelt:

  • Übersicht (dieses Dokument): Beschreibt eine Lösung, die Sie zum Bereitstellen von Notebooks-Manager und erweiterten Notebooks-UIs zur Arbeit mit nutzerverwalteten Notebooks von Vertex AI Workbench verwenden können.
  • Bereitstellen: Bietet eine Anleitung für IT-Administratoren, wie der Notebooks-Manager und die erweiterten Notebooks-UIs bereitgestellt werden.
  • Verwenden: Bietet eine Anleitung für Datenexperten, wie Sie den Notebooks-Manager und die erweiterten Notebooks-UIs verwenden.
  • Fehlerbehebung: Hier werden mögliche Probleme und vorgeschlagene Lösungen beschrieben.

Terminologie

In dieser Reihe beziehen sich nutzerverwaltete Notebooks auf Instanzen von Jupyter-Notebooks, die mit Vertex AI Workbench erstellt wurden.

Übersicht

Datenexperten verwenden häufig nutzerverwaltete Notebooks von Vertex AI Workbench, um dynamisch mit Daten zu interagieren und Tests für maschinelles Lernen (ML) auszuführen. Nutzer mit den relevanten IAM-Berechtigungen (Identity and Access Management) können über verschiedene Schnittstellen, z. B. die Google Cloud CLI, Cloud APIs, Cloud-Clientbibliotheken oder die Google Cloud Console, auf nutzerverwaltete Notebooks zugreifen. Die Google Cloud Console bietet eine visuelle Schnittstelle mit Vertex AI Workbench-Aktionen, z. B. Starten, Löschen oder Auflisten von Instanzen von nutzerverwalteten Notebooks.

Bei dieser Lösung werden IT-Administratoren und Datenexperten als separate Rollen betrachtet: IT-Administratoren erstellen nutzerverwaltete Notebooks-Instanzen (Vorgänge) und Datenexperten verwenden nutzerverwaltete Notebooks für den Zugriff auf Google Cloud-Dienste (Entwicklung). Diese Trennung der Rollen hat folgende Vorteile:

  • IT-Administratoren verwalten die Umgebungen für nutzerverwaltete Notebooks zentral, was Nutzern Flexibilität bietet. Außerdem sorgt sie für Konsistenz in einer Organisation und dies hilft bei der Kostenverwaltung.
  • Datenexperten greifen schnell auf ihre nutzerverwalteten Notebooks-Umgebungen zu, da diese Lösung die Anzahl der erforderlichen Aufgaben reduziert. Nutzer können dann mit Diensten wie Cloud Storage oder BigQuery über dasselbe Tool interagieren, mit dem sie auch nutzerverwaltete Notebooks entwickeln.

Die in diesen Dokumenten beschriebene Lösung umfasst die folgenden Komponenten:

Beide Komponenten werden mit Google Cloud-Ressourcen erstellt und unterstützen Sicherheitsmechanismen wie die Nutzerauthentifizierung über Google Log-in durch IAM oder über VPC Service Controls.

Wenn ein IT-Administrator die in diesen Dokumenten beschriebene Lösung implementiert, verwenden Datenexperten nicht mehr die Google Cloud Console, um auf nutzerverwaltete Notebooks zuzugreifen und sie zu verwalten. (Die Ersatz-UI bietet keine vollständige Funktionsparität mit der Google Cloud Console.)

Architektur

Das folgende Diagramm veranschaulicht die Lösungsarchitektur.

Grafik: Architektur der Lösung, die die Benutzeroberfläche von Notebooks-Manager und erweiterte Notebooks verwendet.

Das Diagramm zeigt, wie IT-Administratoren die Lösung zum Einrichten der folgenden Architektur verwenden können:

  • Der Notebooks-Manager wird in Cloud Storage in einem geschützten VPC Service Controls-Perimeter gehostet.
  • Autorisierte Clients greifen über ihre öffentliche URL im Format https://storage.googleapis.com/BUCKET/index.html sicher auf den Notebooks-Manager zu.
  • Datenexperten nutzen den Notebooks-Manager, um auf ihre erweiterten Notebooks-UIs zuzugreifen und sie zu verwalten.
  • Datenexperten verwenden eine erweiterte Notebooks-UI, um mit Google Cloud-Diensten zu interagieren.

Notebooks-Manager

Der Notebooks-Manager sieht, wie im folgenden Screenshot gezeigt, ähnlich aus wie die Seite der Google Cloud Console für Vertex AI Workbench:

Notebooks-Manager

Auf dieser statischen Seite werden die folgenden Funktionen reproduziert, die von der Google Cloud Console bereitgestellt werden:

  • Projektauswahl: Ermöglicht einem Nutzer die Auswahl eines Projekts, um nutzerverwaltete Notebooks-Instanzen aufzulisten.
  • Schaltflächen: Ein Nutzer kann Aktionen wie das Auflisten, Starten und Beenden von nutzerverwalteten Notebooks-Instanzen ausführen. Die Fähigkeit eines Nutzers zur Interaktion mit einer bestimmten Instanz muss durch IAM erzwungen werden. Dieser Vorgang wird in diesem Dokument nicht behandelt.

Weitere Informationen zur Projektauswahl finden Sie in der README-Datei im Code-Repository.

In der folgenden Tabelle sind die Komponenten des Notebooks-Managers aufgeführt, die Sie im Abschnitt „Bereitstellen“ dieser Reihe verwenden.

Posten Typ Beschreibung
Lesezugriff für Nutzer des Administratorverzeichnisses OAuth 2.0-Bereich Ruft grundlegende Informationen zum angemeldeten Nutzer (E-Mail-Adresse und Name) ab, ähnlich wie die Google Cloud Console.
Resource Manager API Cloud APIs Ruft Projekt-IDs ab. Listet Projekte auf, auf die der Nutzer Zugriff hat. Wenn Sie die Projektauswahl nicht verwenden, können Sie diesen Bereich entfernen.
Bereich „https://www.googleapis.com/auth/cloud-platform“ OAuth 2.0-Bereich Definiert den OAuth 2.0-Bereich für die Anwendung.
Google Log-in Google API Ermöglicht Datenexperten, ihre Anmeldedaten beim Aufrufen von Google Cloud APIs zu verwenden.
Notebooks API Cloud APIs Listet, startet, beendet und ruft nutzerverwaltete Notebooks-Instanzen ab.
OAuth 2.0-Webclient-ID Ressource Identifiziert Client-IDs, die für die Anmeldung bei Google erforderlich sind. Sie müssen diese IDs manuell in der Google Cloud Console erstellen. Weitere Informationen finden Sie unter OAuth 2.0-Flow einrichten.
Statische Cloud Storage-Webseite Ressource Hostet die statische UI in Cloud Storage, die skalierbar, lokalisiert und VPC-SC-konform ist. In dieser Architektur wird die statische Seite durch Terraform-Skript bereitgestellt.

Erweiterte Notebooks-UI

Nutzerverwaltete Notebooks bieten zwei Optionen für die Interaktion mit BigQuery und Cloud Storage:

  • Für einen codebasierten Ansatz können Nutzer Google Cloud Python-Bibliotheken verwenden. Zu den Bibliotheken gehört die Zellmagie, mit der Sie Code in IPython schreiben können.
  • Für einen visuellen Ansatz, der das Suchen von Daten unterstützt, können Nutzer die erweiterten Notebooks-UIs verwenden. Weitere Informationen finden Sie unter Notebooks-Manager bereitstellen im Abschnitt „Bereitstellen“ dieser Reihe.

Der folgende Screenshot zeigt eine nutzerverwaltete Notebooks-Instanz, wenn die erweiterte Notebooks-UI eingerichtet ist.

Grafik: Erweiterte Notebooks-UI.

Weitere Informationen zum Aktivieren der Erweiterungen für nutzerverwaltete Notebooks mit Terraform finden Sie im Dokument Bereitstellen in dieser Reihe.

In der folgenden Tabelle sind die Komponenten aufgeführt, mit denen die erweiterte Notebooks-UI erstellt wird.

Notebooks-Manager-Komponente Typ Beschreibung
Notebooks Ressource Vertex AI Workbench
Container-Image Ressource Deep Learning Container-Images
IAM Ressource Identität für die nutzerverwaltete Notebooks-Instanz

Nächste Schritte