Auf dieser Seite erfahren Sie, wie Sie interaktive Sitzungen und Sitzungsvorlagen für Dataproc Serverless erstellen. Anhand einer Sitzungsvorlage können Sie mehrere interaktive Sitzungen basierend auf der Konfiguration der Sitzungsvorlage erstellen.
Dataproc Serverless-Sitzung erstellen
Sie können eine interaktive Dataproc Serverless-Sitzung mit der Google Cloud Console, der Google Cloud CLI oder der Dataproc API erstellen.
Console
So erstellen Sie eine Dataproc Serverless-Sitzung mit der Google Cloud Console:
Rufen Sie in der Google Cloud Console die Seite Interaktive Sitzungen auf.
- Klicken Sie auf Erstellen.
Geben Sie auf der Seite Interaktive Sitzung hinzufügen (Vorabversion) die Konfigurationseinstellungen für die Sitzung ein oder bestätigen Sie sie. Wichtige Hinweise:
- Name der interaktiven Sitzung:Erforderlich. Übernehmen Sie den Standardnamen oder geben Sie einen Sitzungsnamen an.
- Region: Erforderlich. Akzeptieren Sie die Standardregion oder geben Sie eine verfügbare Region für die Sitzung an.
- Laufzeitkonfiguration:Optional. Die auswählbaren Sitzungslaufzeiten entsprechen den verfügbaren Laufzeitversionen von Dataproc Serverless für Spark. Sie können ein benutzerdefiniertes Container-Image für die Sitzung angeben.
- Properties (Eigenschaften): Optional. Klicken Sie für jede Property, die Sie für die Sitzung festlegen möchten, auf Element hinzufügen. Weitere Informationen finden Sie unter Spark-Properties.
- Spark-UI (Vorabversion): Optional. Mit der Spark-Benutzeroberfläche können Sie Details zur Sitzungsausführung erfassen und überwachen.
- Dienstkonto:Optional. Das Dienstkonto, das für die Sitzung verwendet werden soll. Wenn nicht angegeben, wird das Compute Engine-Standarddienstkonto verwendet.
- Netzwerkkonfiguration:Erforderlich. Für das Subnetz der Sitzung muss der private Google-Zugriff (PGA) aktiviert sein und die Subnetzkommunikation muss auf allen Ports zulässig sein. In diesem Abschnitt sind nur Netzwerke mit Subnetzwerken in der angegebenen Sitzungsregion aufgeführt, für die PGA aktiviert ist. Weitere Informationen finden Sie unter Dataproc Serverless for Spark-Netzwerkkonfiguration.
Klicken Sie auf Senden, um die Sitzung zu erstellen.
gcloud
Mit der Taste gcloud beta dataproc sessions create command SESSION_NAME
können Sie eine interaktive Dataproc Serverless-Sitzung erstellen.
Hinweise zu Befehls-Flags:
--region
: erforderlich. Eine verfügbare Region für Ihre Sitzung.--version
: Optional. Eine unterstützte Spark-Laufzeitversion Wenn Sie mit diesem Flag keine Version angeben, wird die aktuelle Standardversion der Spark-Laufzeit verwendet.--container-image
: Optional. Ein benutzerdefiniertes Container-Image, das für die Sitzung verwendet werden soll.--property
: Optional. Eine oder mehrere kommagetrennte Spark-Properties für die Sitzung.--service-account
: Optional. Das Dienstkonto, das für die Sitzung verwendet werden soll. Wenn nicht angegeben, wird das Compute Engine-Standarddienstkonto verwendet.--subnet
: Optional. Ein VPC-Subnetz im folgenden Format:projects/PROJECT_ID/regions/REGION/subnetworks/SUBNET_NAME
- REGION: Die
--region
, die Sie für die Sitzung ausgewählt haben. - SUBNET_NAME: Für das Subnetz muss der private Google-Zugriff (PGA) aktiviert sein und die Subnetzkommunikation muss auf allen Ports zulässig sein. Weitere Informationen finden Sie unter Dataproc Serverless for Spark-Netzwerkkonfiguration.
- REGION: Die
REST
Sie können die Dataproc API sessions.create
verwenden, um eine interaktive Dataproc Serverless-Sitzung zu erstellen.
Hinweise:
name
: Erforderlich. Sitzungsname.version
: Optional. Eine der unterstützten Spark-Laufzeitversionen für Ihre Sitzung. Wenn Sie keine Version angeben, wird die aktuelle Standardversion verwendet.containerImage
: Optional. Ein benutzerdefiniertes Container-Image, das für die Sitzung verwendet werden soll.properties
: Optional. Eine Zuordnung von Sitzungseigenschaftsnamen zu Werten. Weitere Informationen finden Sie unter Spark-Attribute.serviceAccount
: Optional. Das Dienstkonto, das für die Ausführung der Sitzung verwendet werden soll. Wenn nicht angegeben, wird das Compute Engine-Standarddienstkonto verwendet.subnetworkUri
: Optional. Ein VPC-Subnetz für Ihre Sitzung im folgenden Format: Für das Subnetz muss der private Google-Zugriff (Private Google Access, PGA) aktiviert sein und die Subnetzkommunikation muss auf allen Ports zulässig sein. Weitere Informationen finden Sie unter Dataproc Serverless for Spark-Netzwerkkonfiguration.projects/PROJECT_ID/regions/REGION/subnetworks/SUBNET_NAME
Dataproc Serverless-Sitzungsvorlage erstellen
In einer Dataproc Serverless-Sitzungsvorlage werden die Konfigurationseinstellungen für das Erstellen einer oder mehrerer interaktiver Dataproc Serverless-Sitzungen definiert.
Sie können eine Dataproc-Serverless-Sitzungsvorlage mit der Google Cloud Console, der gcloud CLI oder der Dataproc API erstellen.
Console
So erstellen Sie mit der Google Cloud Console eine Dataproc Serverless-Sitzungsvorlage:
Rufen Sie in der Google Cloud Console die Seite Vorlagen für interaktive Sitzungen auf.
Vorlagen für interaktive Sitzungen aufrufen
- Klicken Sie auf Erstellen.
Geben Sie auf der Seite Sitzungsvorlage erstellen die Konfigurationseinstellungen für die Vorlage ein oder bestätigen Sie sie. Wichtige Hinweise:
- Vorlagenlaufzeit-ID:Erforderlich. Übernehmen Sie die Standard-ID (den Standardnamen) oder geben Sie einen Namen für die Vorlagenlaufzeit an.
- Region: Erforderlich. Akzeptieren Sie die Standardregion oder geben Sie eine verfügbare Region für Vorlagensitzungen an.
- Laufzeitversion:Optional. Die auswählbaren Sitzungslaufzeiten entsprechen den Laufzeitversionen von Dataproc Serverless für Spark.
- Template configuration type (Vorlagenkonfigurationstyp): Erforderlich. Wählen Sie einen Typ aus. Wenn Sie
Jupyter
auswählen, geben Sie den Anzeigenamen an und wählen Sie den Jupyter-Kerneltyp aus. Weitere Informationen finden Sie unter Jupyter-Notebook in Dataproc Serverless starten. - Dienstkonto:Optional. Das Dienstkonto, das zum Ausführen von Sitzungen mit Vorlagen verwendet werden soll. Wenn nicht angegeben, wird das Compute Engine-Standarddienstkonto verwendet.
- Benutzerdefiniertes Container-Image:Optional. Ein benutzerdefiniertes Container-Image, das für Ihre Vorlagensitzungen verwendet werden soll.
- Properties (Eigenschaften): Optional. Klicken Sie für jede Property, die Sie für die Sitzungen mit Vorlagen festlegen möchten, auf Element hinzufügen. Weitere Informationen finden Sie unter Spark-Properties.
- Netzwerkkonfiguration: * Erforderlich. Für das Subnetz der Sitzung muss der private Google-Zugriff (PGA) aktiviert sein und die Subnetzkommunikation muss auf allen Ports zulässig sein. In diesem Abschnitt sind nur Netzwerke mit Subnetzwerken in der Sitzungsregion Region aufgeführt, für die PGA aktiviert ist. Weitere Informationen finden Sie unter Dataproc Serverless for Spark-Netzwerkkonfiguration.
Klicken Sie auf Senden, um die Sitzungsvorlage zu erstellen.
gcloud
Sie können mit der gcloud CLI keine serverlose Dataproc-Sitzungsvorlage direkt erstellen. Sie können jedoch den Befehl gcloud beta dataproc session-templates import
verwenden, um eine vorhandene Sitzungsvorlage zu importieren. Sie können die importierte Vorlage bearbeiten und dann mit dem Befehl gcloud beta dataproc session-templates export
exportieren.
REST
Mit der Dataproc API sessionTemplates.create
können Sie eine Dataproc Serverless-Sitzungsvorlage erstellen.
Hinweise:
name
: Erforderlich. Name der Sitzungsvorlage.version
: Optional. Eine der unterstützten Spark-Laufzeitversionen für Ihre Sitzungen mit Vorlagen. Wenn Sie keine Version angeben, wird die Standardversion verwendet.containerImage
: Optional. Ein benutzerdefiniertes Container-Image, das für Ihre Sitzungen mit Vorlage verwendet werden soll.properties
: Optional. Eine Zuordnung von Sitzungseigenschaftsnamen zu Werten. Weitere Informationen finden Sie unter Spark-Attribute.serviceAccount
: Optional. Ein Dienstkonto, mit dem Sie Ihre Sitzungen mit Vorlagen ausführen. Wenn nicht angegeben, wird das Compute Engine-Standarddienstkonto verwendet.subnetworkUri
: Optional. Ein VPC-Subnetz für Ihre Sitzungen mit Vorlagen im folgenden Format: Für das Subnetz muss der private Google-Zugriff (Private Google Access, PGA) aktiviert sein und die Subnetzkommunikation muss auf allen Ports zulässig sein. Weitere Informationen finden Sie unter Dataproc Serverless for Spark-Netzwerkkonfiguration.projects/PROJECT_ID/regions/REGION/subnetworks/SUBNET_NAME