Kurzanleitung für Datalab

In dieser Kurzanleitung erfahren Sie, wie Sie Datalab für die Verwendung mit Ihren Stackdriver Monitoring-Projekten einrichten. Sie können mithilfe der dynamischen Notebooks von Cloud Datalab Ad-hoc-Analysen und -Visualisierungen durchführen, die über die vorhandenen Funktionen von Monitoring hinaus gehen.

Wie Sie die Monitoring-Anleitungen in Cloud Datalab aufrufen, erfahren Sie in den Anleitungen zu Monitoring. Sie können mit den Anleitungen nur interagieren, wenn Sie Cloud Datalab ausführen.

Vorbereitung

  1. Melden Sie sich in Ihrem Google-Konto an.

    Wenn Sie noch kein Konto haben, registrieren Sie sich hier für ein neues Konto.

  2. Wählen Sie in der GCP Console auf der Projektauswahlseite ein GCP-Projekt aus oder erstellen Sie eins.

    Zur Projektauswahl

  3. Prüfen Sie, ob die Abrechnung für Ihr Google Cloud Platform-Projekt aktiviert ist. So bestätigen Sie die Abrechnung für Ihr Projekt.

  4. Aktivieren Sie die Compute Engine and Cloud Source Repositorieserforderlichen APIs.

    APIs aktivieren

  5. Installieren und initialisieren Sie das Cloud SDK.

Datalab einrichten

Führen Sie die folgenden Schritte in einem Terminalfenster auf Ihrem lokalen Computer aus:

  1. Rufen Sie den neuesten gcloud-Befehl ab:
    gcloud components update
    
  2. Installieren Sie die Komponente gcloud datalab:
    gcloud components install datalab
    
  3. Führen Sie folgenden Befehl aus, nachdem Sie [PROJECT_ID] durch Ihre Google Cloud-Projekt-ID ersetzt haben, um gcloud für die Verbindung zu Ihrer Google Cloud-Projekt-ID zu konfigurieren:

    gcloud config set project [PROJECT_ID]
    

    Führen Sie den folgenden Befehl aus, um die Konfiguration zu überprüfen:

    gcloud config get-value project
    

  4. Führen Sie zum Erstellen einer Datalab-Instanz den folgenden Befehl aus, nachdem Sie [DATALAB-INSTANCE-NAME] durch den Namen der Instanz ersetzt haben. Der Name muss mit einem Kleinbuchstaben beginnen, gefolgt von bis zu 62 Kleinbuchstaben, Ziffern oder Bindestrichen. Er darf nicht mit einem Bindestrich enden.

    datalab create [DATALAB-INSTANCE-NAME]
    

    • Wählen Sie bei entsprechender Aufforderung eine Zone aus der Liste aus.
    • Wenn Sie aufgefordert werden, eine SSH-Passphrase festzulegen, geben Sie eine Passphrase ein. Notieren Sie sich diese Passphrase unbedingt.
    • Nach einigen Augenblicken erhalten Sie in etwa folgende Meldung:

      Created [https://www.googleapis.com/compute/v1/projects/[PROJECT_ID]/zones/[ZONE]/instances/[DATALAB-INSTANCE-NAME]].
      Connecting to [DATALAB-INSTANCE-NAME].
      This will create an SSH tunnel and may prompt you to create an rsa key pair. To manage these keys, see https://cloud.google.com/compute/docs/instances/adding-removing-ssh-keys
      Waiting for Datalab to be reachable at http://localhost:8081/
      

      Wenn Sie dazu aufgefordert werden, geben Sie die Passphrase ein:

      Enter passphrase for key '[...]/.ssh/google_compute_engine':
      

      Nach einigen Minuten ist der Befehl zum Erstellen erfolgreich abgeschlossen und Sie erhalten eine Meldung ähnlich der folgenden:

      The connection to Datalab is now open and will remain until this command is killed.
      You can connect to Datalab at http://localhost:8081/
      

  5. Die Verbindung mit Ihrer Datalab-Instanz bleibt geöffnet, während der datalab-Befehl aktiv ist. Wenn das Terminalbefehlsfenster geschlossen oder unterbrochen wird, wird die Verbindung beendet. Führen Sie den folgenden Befehl aus, um die Verbindung wiederherzustellen:

    datalab connect [DATALAB-INSTANCE-NAME]
    

Die Datalab-Benutzeroberfläche

Wenn Sie die Datalab-Benutzeroberfläche aufrufen möchten, rufen Sie die URL http://127.0.0.1:8081/ auf oder klicken auf die folgende Schaltfläche. Wenn Sie Datalab zum ersten Mal verwenden, werden Sie gebeten, den Nutzungsbedingungen zuzustimmen.

Laufendes Datalab aufrufen

Datalab-Benutzeroberfläche

Im Cloud Datalab-Ordner docs/ finden Sie mehrere Cloud Datalab-Notebooks für den Einstieg, die Sie sich ansehen können, einschließlich Notebooks für Stackdriver Monitoring.

Datalab und Stackdriver Monitoring

Stackdriver Monitoring verwendet Arbeitsbereiche, um Ressourcen zu organisieren, die in einem oder mehreren Google Cloud-Projekten enthalten sind. Mit einem Arbeitsbereich können Sie unter anderem Benachrichtigungen und Dashboards erstellen und Gruppen konfigurieren.

Sie müssen einen Arbeitsbereich erstellen, um Gruppen mit Datalab verwenden zu können. Wechseln Sie zu Monitoring, um einen Arbeitsbereich zu erstellen:

Zu Monitoring

Wenn Ihr Google Cloud-Projekt bereits mit einem Arbeitsbereich verknüpft ist, wird die Startseite von Stackdriver Monitoring angezeigt. Andernfalls wird automatisch ein Arbeitsbereich erstellt. Im Allgemeinen erfordert dieser Vorgang keine Interaktion von Ihnen. Dies kann jedoch einen Moment dauern. In einigen Fällen wird das Dialogfeld Projekt zu einem Arbeitsbereich hinzufügen angezeigt. Wählen Sie in diesem Fall die Option zum Erstellen eines neuen Arbeitsbereichs aus. Weitere Informationen finden Sie unter Arbeitsbereiche.

Stackdriver Monitoring-Anleitungen

Cloud Datalab wird mit mehreren interaktiven Monitoring-Anleitungen installiert:

Einstieg
Hier erfahren Sie, wie Sie die Python Stackdriver API in Cloud Datalab importieren und Ihre Standard-Projekt-ID für Google Cloud festlegen. Der Beispielcode wird verwendet, um die API aufzurufen und Monitoring-Daten aus Ihrem Projekt abzurufen.
Gruppenmesswerte
Hier erfahren Sie, wie Sie die Gruppenstruktur eines Projekts aufrufen und Messwertdaten mithilfe von Gruppen filtern und aggregieren. Damit Sie Gruppenmesswerte verwenden können, müssen Sie einen Arbeitsbereich haben. Wenn Ihr Arbeitsbereich keine Gruppen enthält, wechseln Sie zu einem Arbeitsbereich mit Gruppen. Weitere Informationen finden Sie unter Arbeitsbereiche.
Zeitversetzte Daten
Hier lernen Sie nützliche Methoden zur Transformation von Zeitachsendaten kennen. Da Ihr Projekt möglicherweise nicht genügend VM-Instanzen hat, um als gutes Beispiel zu dienen, können Sie für die Anleitung zuvor aus einem Demo-Projekt extrahierte Daten verwenden.

Wie Sie die Anleitungen ausführen und auf Wunsch ändern, erfahren Sie im folgenden Abschnitt.

Anleitungen ausführen

So führen Sie die Anleitungen aus:

  1. Klicken Sie in der Cloud Datalab-Benutzeroberfläche auf docs, tutorials und Stackdriver Monitoring (Dokumente, Anleitungen, Stackdriver Monitoring). Die folgende Seite sollte aufgerufen werden:

    Stackdriver-Anleitungen

  2. Wählen Sie die Anleitung aus. Klicken Sie auf den Namen der auszuführenden Anleitung.

  3. Legen Sie die Projekt-ID fest: Bearbeiten Sie die Zelle, die set_datalab_project_id('my-project-id') enthält, so:

    • Wenn Sie bereits einen Arbeitsbereich erstellt haben, ersetzen Sie my-project-id durch den Namen des Arbeitsbereichs. Sie müssen einen Arbeitsbereich haben, um Gruppenmesswerte verwenden zu können.
    • Wenn Sie noch keinen Arbeitsbereich haben, ersetzen Sie my-project-id durch Ihre Google Cloud-Projekt-ID.
  4. Führen Sie den Anleitungscode aus. Klicken Sie in der Menüleiste im oberen Teil der Benutzeroberfläche auf Run > Run all cells (Ausführen > Alle Zellen ausführen). Daraufhin wird der gesamte Code der Anleitung unter Verwendung Ihrer aktuellen Projekt-ID neu ausgeführt.

Sie können den Code in den Anleitungen jederzeit ändern und die Änderungen testen. Wenn Sie den Code einer einzelnen Zelle ausführen möchten, klicken Sie auf die Zelle und wählen Sie im Menü links neben der Zelle die Option Ausführen aus. Sie können auch eigene Notizbücher erstellen.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Kurzanleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Klicken Sie auf der Cloud Datalab-Benutzeroberfläche rechts oben auf das Symbol Running Sessions (Ausgeführte Sitzungen) und schließen Sie alle nicht verwendeten Notebooks. Sie können diese später nach Bedarf erneut aufrufen. Schließen Sie die zugehörigen Browsertabs bzw. -fenster.

  2. Geben Sie CTRL-C in dem Fenster ein, in dem Datalab ausgeführt wird, und schließen Sie den Datalab-Tab in Ihrem Browser.

  3. Kosten entstehen ab dem Erstellen bis zum Löschen einer Cloud Datalab-VM-Instanz (siehe Cloud Datalab-Preise). Der nichtflüchtige Speicher, in dem die Notebooks gespeichert sind, wird ebenfalls berechnet. Dieser Speicher bleibt nach dem Löschen der Cloud Datalab-VM solange bestehen, bis er gelöscht wird.

    Führen Sie folgenden Befehl aus, um die Datalab-VM-Instanz und ihren nichtflüchtigen Speicher zu löschen:

    datalab delete --delete-disk [DATALAB-INSTANCE-NAME]
    

  4. Durch den Befehl datalab create wurden außerdem weitere Ressourcen erstellt, die Cloud Datalab-Instanzen, die Sie in Zukunft vielleicht erstellen werden, wiederverwenden würden. Sie können die folgenden Befehle ausführen, um die unten aufgeführten zusätzlichen Ressourcen zu löschen, wenn Sie nicht davon ausgehen, dass Sie in Zukunft weitere Datalab-Instanzen erstellen werden:

    • Löschen Sie die Firewallregel datalab-network-allow-ssh, die SSH-Verbindungen zu Ihren Datalab-Instanzen zulässt:
      gcloud compute firewall-rules delete datalab-network-allow-ssh
      
    • Löschen Sie das Virtual Private Cloud (VPC)-Netzwerk datalab-network, mit dem Datalab-Instanzen standardmäßig verbunden sind:
      gcloud compute networks delete datalab-network
      
    • Löschen Sie das Cloud Source Repository datalab-notebooks, das zum Speichern der Notebooks zur Verfügung steht. Informationen zum Sichern von Notebooks vor dem Löschen des Repositories finden Sie unter Mit Notebooks arbeiten.
      gcloud source repos delete datalab-notebooks
      
  5. Entfernen Sie alle erstellten Arbeitsbereiche, Projekte oder VM-Instanzen, die Sie nicht behalten möchten.

Weitere Informationen

Sehen Sie sich das folgende API-Referenzmaterial an: