Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

Jupyter-Notebook in einem Dataproc-Cluster installieren und ausführen

Ziele

In dieser Anleitung erfahren Sie, wie Sie die Jupyter-Komponenten "Jupyter" und "Anaconda" auf einem neuen Cluster installieren und dann über den lokalen Browser eine Verbindung zur Jupyter-Notebook-UI herstellen, die auf dem Cluster ausgeführt wird. mit dem Dataproc Component Gateway.

Kosten

In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloud verwendet, darunter:

Der Preisrechner kann eine Kostenschätzung anhand Ihrer voraussichtlichen Nutzung generieren. Neuen Google Cloud-Nutzern steht möglicherweise eine kostenlose Testversion zur Verfügung.

Hinweis

Erstellen Sie ein Google Cloud Platform-Projekt und einen Cloud Storage-Bucket, falls noch nicht geschehen.

  1. Projekt einrichten

    1. Melden Sie sich bei Ihrem Google-Konto an.

      Wenn Sie noch kein Konto haben, melden Sie sich hier für ein neues Konto an.

    2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

      Zur Projektauswahl

    3. Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist.

    4. Dataproc, Compute Engine, and Cloud Storage APIs aktivieren.

      Aktivieren Sie die APIs

    5. Installieren und initialisieren Sie das Cloud SDK.

  2. Cloud Storage-Bucket im Projekt zum Speichern aller in dieser Anleitung erstellten Notebooks erstellen

    1. Wechseln Sie in der Cloud Console zum Cloud Storage-Browser.

      Zum Cloud Storage-Browser

    2. Klicken Sie auf Bucket erstellen.
    3. Geben Sie im Dialogfeld Bucket erstellen die folgenden Attribute an:
    4. Klicken Sie auf Erstellen.
    5. Ihre Notebooks werden in Cloud Storage unter gs://bucket-name/notebooks/jupyter gespeichert.

Cluster erstellen und Jupyter-Komponente installieren

Erstellen Sie einen Cluster mit der installierten Jupyter-Komponente.

Jupyter-UI und JupyterLab-UI öffnen

Klicken Sie in der Cloud Console auf Cloud Gateway Component Gateway, um die Jupyter-Notebook-UI oder die JupyterLab-UI zu öffnen, die auf dem Masterknoten des Clusters ausgeführt werden.

Das Verzeichnis der obersten Ebene, das von Ihrer Jupyter-Instanz angezeigt wird, ist ein virtuelles Verzeichnis, mit dem Sie den Inhalt Ihres Cloud Storage-Buckets oder Ihres lokalen Dateisystems aufrufen können. Sie können einen Standort auswählen. Klicken Sie dazu auf den Link GCS für Cloud Storage oder Lokales Laufwerk für das lokale Dateisystem des Masterknotens in Ihrem Cluster.

  1. Klicken Sie auf den Link GCS. In der Web-UI von Jupyter Notebook werden in Ihrem Cloud Storage-Bucket gespeicherte Notebooks angezeigt, einschließlich aller in dieser Anleitung erstellten Notebooks.

Bereinigen

Nachdem Sie die Anleitung zum Installieren und Ausführen eines Jupyter-Notebooks in einem Dataproc-Cluster abgeschlossen haben, können Sie die in Google Cloud erstellten Ressourcen bereinigen, damit sie keine kostenpflichtigen Kontingente verbrauchen. Ihnen in Rechnung gestellt werden. In den folgenden Abschnitten erfahren Sie, wie Sie diese Ressourcen löschen oder deaktivieren.

Projekt löschen

Am einfachsten vermeiden Sie weitere Kosten, wenn Sie das zum Ausführen der Anleitung erstellte Projekt löschen.

So löschen Sie das Projekt:

  1. Wechseln Sie in der Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Cluster löschen

  • So löschen Sie den Cluster:
    gcloud dataproc clusters delete cluster-name \
        --region=${REGION}
    

Bucket löschen

  • Wenn Sie den Cloud Storage-Bucket löschen möchten, den Sie unter Hinweise erstellt haben, fahren Sie mit Schritt 2 mit den im Bucket gespeicherten Notebooks fort:
    gsutil -m rm -r gs://${BUCKET_NAME}
    

Nächste Schritte