Kurzanleitung

Vorbereitung

  1. Melden Sie sich bei Ihrem Google-Konto an.

    Wenn Sie noch kein Konto haben, melden Sie sich hier für ein neues Konto an.

  2. Wählen Sie in der Cloud Console auf der Seite für die Projektauswahl ein Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist.

  4. Google Compute Engine and Cloud Source Repositories APIs aktivieren.

    Aktivieren Sie die APIs

  5. Installieren und initialisieren Sie das Cloud SDK.

Schritte zum Einrichten und Öffnen von Cloud Datalab

Führen Sie in einem Terminalfenster auf Ihrem lokalen Computer folgende Schritte aus:

  1. Aktualisieren Sie die Komponenten des gcloud-Befehlszeilentools:

    gcloud components update
    
    Wenn Sie das gcloud-Befehlszeilentool über apt oder yum installiert haben, verwenden Sie diese Paketmanager, um die Komponenten zu aktualisieren:
    sudo apt update && sudo apt upgrade google-cloud-sdk
    
    sudo yum upgrade google-cloud-sdk
    

  2. Installieren Sie die datalab-Komponente für das gcloud-Befehlszeilentool:

    gcloud components install datalab
    
    Wenn Sie das gcloud-Befehlszeilentool über apt oder yum installiert haben, verwenden Sie diese Paketmanager, um die Komponenten zu aktualisieren:
    sudo apt update && sudo apt install google-cloud-sdk-datalab
    
    sudo yum install google-cloud-sdk-datalab
    

  3. Erstellen Sie eine Cloud Datalab-Instanz. Der Name muss mit einem Kleinbuchstaben beginnen, gefolgt von bis zu 62 Kleinbuchstaben, Ziffern oder Bindestrichen. Das letzte Zeichen darf kein Bindestrich sein.

    datalab create datalab-instance-name
    
    Wenn der Befehl einen Fehler zurückgibt, führen Sie den Befehl mit dem folgenden Debug-Flag noch einmal aus, um das Problem zu ermitteln: datalab create --verbosity=debug datalab-instance-name.

  4. Öffnen Sie die Cloud Datalab-Startseite in Ihrem Browser.

    http://localhost:8081
    

Bereinigen

So vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Kurzanleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Kosten entstehen ab dem Erstellen bis zum Löschen einer Cloud Datalab-VM-Instanz (siehe Cloud Datalab-Preise). Der nichtflüchtige Speicher, in dem die Notebooks gespeichert sind, wird ebenfalls berechnet. Dieser Speicher bleibt nach dem Löschen der VM solange bestehen, bis er gelöscht wird. Mit dem folgenden Befehl werden die VM-Instanz und der zugehörige nichtflüchtige Speicher gelöscht:
    datalab delete --delete-disk instance-name
    
  2. Sonstige Bereinigungsaufgaben: Zusätzliche Ressourcen werden mit dem Befehl datalab create erstellt und von anderen erstellten Cloud Datalab-Instanzen wiederverwendet. Mit den folgenden Befehlen löschen Sie die nachstehend aufgeführten Zusatzressourcen, wenn Sie keine weiteren Cloud Datalab-Instanzen erstellen wollen.

    • Löschen Sie die Firewallregel datalab-network-allow-ssh, die SSH-Verbindungen zu Ihren Cloud Datalab-Instanzen zulässt:
      gcloud compute firewall-rules delete datalab-network-allow-ssh
      
    • Löschen Sie das Virtual Private Cloud (VPC)-Netzwerk datalab-network, mit dem Datalab-Instanzen standardmäßig verbunden sind.
      gcloud compute networks delete datalab-network
      
      • Löschen Sie das Cloud Source Repository datalab-notebooks, das zum Speichern der Notebooks zur Verfügung steht. Informationen zum Sichern von Notebooks vor dem Löschen des Repositories finden Sie unter Mit Notebooks arbeiten.
        gcloud source repos delete datalab-notebooks
        

Nächste Schritte

  1. Machen Sie sich mit den verschiedenen Funktionen von Cloud Datalab mithilfe der Ressourcen im Notebookordner /datalab/docs/intro vertraut. Dort finden Sie Anleitungen und Beispiele für die Verwendung von Google Cloud Platform-Diensten und zu gängigen Datenanalyseaufgaben.
  2. Rufen Sie die Server-VM-Logs von datalab in der Loganzeige der Cloud Platform Console auf.
  3. Lesen Sie die Cloud Datalab-Anleitungen.
  4. Erfahren Sie mehr über die im datalab-Befehlszeilentool verfügbaren Optionen, indem Sie datalab --help ausführen.
  5. Lesen Sie Datalab in einer Teamumgebung verwenden.