Lebenszyklus einer Cloud Datalab-Instanz verwalten

Auf dieser Seite werden der Lebenszyklus einer Cloud Datalab-Instanz und die Optionen beschrieben, mit denen Compute-Ressourcen verwaltet und wirtschaftlich eingesetzt werden können.

Cloud Datalab wird innerhalb einer Google Compute Engine-VM mit einem zugeordneten nichtflüchtigen Speicher ausgeführt, auf dem Notebooks gespeichert werden. Cloud Datalab-VMs sind mit einem besonderen Netzwerk in einem Projekt namens datalab-network. verbunden. Die Standardkonfiguration dieses Netzwerks begrenzt eingehende Verbindungen auf SSH-Verbindungen.

Vorbereitung

Folgende Schritte müssen ausgeführt worden sein, damit die unten beschriebenen Befehle verwendet werden können:

  1. Sie müssen das Cloud SDK installiert haben, einschließlich der Komponente datalab.
  2. Sie müssen die Authentifizierung mit dem gcloud-Befehlszeilentool ausgeführt haben.
  3. Sie müssen das gcloud-Befehlszeilentool zur Verwendung des ausgewählten Projekts und der ausgewählten Zone konfiguriert haben.

Instanz erstellen

Sie erstellen eine Cloud Datalab-Instanz mit dem Befehl datalab create.

datalab create instance-name

Mit diesem Befehl sind verschiedene Befehlszeilenoptionen verfügbar. Beispiel: Wenn Sie eine Instanz mit mehr Arbeitsspeicher als dem Standardarbeitsspeicher erstellen möchten, können Sie das Flag --machine-type einfügen:

datalab create --machine-type n1-highmem-2 instance-name

Führen Sie folgenden Befehl aus, um alle verfügbaren Optionen aufzulisten:

datalab create --help

Standardmäßig stellt der Befehl datalab create die Verbindung zu der neu erstellten Instanz her. Wenn Sie die Instanz erstellen, jedoch keine Verbindung zu ihr herstellen möchten, fügen Sie das Flag --no-connect ein:

datalab create --no-connect instance-name

Der Befehl datalab create erstellt auch die folgenden Google Cloud Platform-Ressourcen (wenn nicht bereits verfügbar):

  • Das Netzwerk datalab-network
  • Eine Firewallregel in datalab-network, die eingehende SSH-Verbindungen zulässt
  • Das Google Cloud Source Repository datalab-notebooks
  • Den nichtflüchtigen Speicher zur Speicherung von Cloud Datalab-Notebooks

Für einige der oben aufgeführten Schritte sind Eigentümerberechtigungen erforderlich (siehe Cloud Datalab in einer Teamumgebung verwenden).

Verbindung zu einer Instanz herstellen

Das Tool datalab kann einen persistenten SSH-Tunnel zur Cloud Datalab-Instanz erstellen, mit dem Sie die Verbindung zu der Instanz aus Ihrem lokalen Browser herstellen können. Cloud Datalab verhält sich also so, als würde es auf Ihrer lokalen Maschine ausgeführt.

Mit dem Befehl datalab connect können Sie diese Verbindung herstellen:

datalab connect instance-name

Der Befehl datalab connect startet die Instanz neu, wenn sie nicht ausgeführt wird. Der Befehl wird ausgeführt, bis Sie ihn stoppen (die Verbindung bleibt verfügbar, solange der Befehl ausgeführt wird).

Der für die Verbindung verwendete lokale Port ist standardmäßig 8081. Um zu einem anderen Port zu wechseln, fügen Sie das Flag --port ein. Beispiel: Zur Verwendung des lokalen Ports 8082 führen Sie den folgenden Befehl aus:

datalab connect --port 8082 instance-name

Instanz stoppen

Mit dem folgenden Befehl stoppen Sie die Cloud Datalab-Instanz, um unnötige Kosten zu vermeiden, wenn Sie die Nutzung von Cloud Datalab unterbrechen möchten.

datalab stop instance-name

Wenn Sie Cloud Datalab wieder nutzen möchten, starten Sie die Instanz mit dem Befehl datalab connect neu.

Cloud Datalab-VM aktualisieren, ohne die Notebookfestplatte zu löschen

Um auf eine neue Cloud Datalab-Version zu aktualisieren oder VM-Eigenschaften wie den Maschinentyp oder das Dienstkonto zu ändern, können Sie die Cloud Datalab-VM löschen und neu erstellen. Hierbei gehen die im nichtflüchtigen Speicher enthaltenen Notebooks nicht verloren.

datalab delete --keep-disk instance-name
datalab create instance-name

Instanz und Notebookfestplatte löschen

Standardmäßig löscht der Befehl datalab delete den nichtflüchtigen Speicher nicht, auf dem die Notebooks gespeichert sind. So können Sie die VM problemlos ändern, ohne versehentlich Daten zu verlieren (siehe Instanz löschen und neu erstellen, ohne die Notebookfestplatte zu löschen).

Wenn Sie die VM und den zugewiesenen nichtflüchtigen Speicher löschen möchten, fügen Sie dem Befehl das Flag --delete-disk hinzu:

datalab delete --delete-disk instance-name

Nutzung der Compute-Ressourcen reduzieren

Für Google Compute Engine-VMs fallen Kosten an. Die Zeit, während der eine Cloud Datalab-Instanz ausgeführt wird, wird Ihnen in Rechnung gestellt, ob Sie sie nutzen oder nicht. Sie können Cloud Datalab-VM-Gebühren reduzieren, indem Sie die Instanz stoppen, wenn Sie sie nicht verwenden. Für die Ressourcen, die der VM zugeordnet sind (wie der nichtflüchtige Speicher und die externe IP-Adresse), fallen weiter Gebühren an. Für die VM-Instanz selbst gilt das jedoch nicht, solange sie gestoppt ist.

Wenn Sie eine gestoppte Instanz wieder verwenden möchten, führen Sie datalab connect instance-name aus, um eine Verbindung zu der Instanz herzustellen. Das datalab-Tool startet die Instanz dann neu, bevor versucht wird, eine Verbindung zu dieser Instanz herzustellen.

Wenn Sie Gebühren für eine Cloud Datalab-Instanz komplett vermeiden möchten, löschen Sie sowohl die VM als auch den zugewiesenen nichtflüchtigen Speicher. Dazu führen Sie den Befehl datalab delete mit der Option --delete-disk aus.