Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Sie können zusätzliche Komponenten wie Apache Pig installieren, wenn Sie einen Dataproc-Cluster mit dem Feature Optionale Komponenten erstellen. Auf dieser Seite wird die Pig-Komponente beschrieben, eine Open-Source-Plattform zum Analysieren großer Datasets.
Komponente installieren
Installieren Sie die Komponente, wenn Sie einen Dataproc-Cluster erstellen.
Apache Pig ist eine optionale Komponente in Dataproc-Imageversionen 2.3 und höher.
Informationen zu den Komponentenversionen, die in den neuesten Dataproc-Image-Releases enthalten sind, finden Sie unter Unterstützte Dataproc-Versionen.
gcloud
Verwenden Sie zum Erstellen eines Dataproc-Clusters, der die Pig-Komponente enthält, den Befehl gcloud dataproc clusters create CLUSTER_NAME mit dem Flag --optional-components (mit Image-Version 2.3 oder höher).
Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
Wählen Sie im Abschnitt „Komponenten“ unter „Optionale Komponenten“ Pig und andere optionale Komponenten aus, die auf Ihrem Cluster installiert werden sollen.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[],[],null,["You can install additional components like [Apache Pig](https://pig.apache.org/)\nwhen you create a Dataproc cluster using the\n[Optional components](/dataproc/docs/concepts/components/overview#available_optional_components)\nfeature. This page describes the Pig component, an open source platform for\nanalyzing large data sets.\n\nInstall the component\n\nInstall the component when you create a Dataproc cluster.\n\nApache Pig is an optional component in Dataproc `2.3` and later\nimage versions.\n| **Note:** Apache Pig is automatically installed on Dataproc `2.2` and earlier image versions.\n\nSee\n[Supported Dataproc versions](/dataproc/docs/concepts/versioning/dataproc-versions#supported_cloud_dataproc_versions)\nfor component versions included in the latest Dataproc image\nreleases. \n\ngcloud\n\nTo create a Dataproc cluster that includes the Pig component,\nuse the\n[`gcloud dataproc clusters create `\u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e](/sdk/gcloud/reference/dataproc/clusters/create)\ncommand with the `--optional-components` flag (using image version\n2.3 or later). \n\n```\ngcloud dataproc clusters create CLUSTER_NAME \\\n --region=REGION \\\n --optional-components=PIG \\\n --image-version=2.3 \\\n ... other flags\n```\n\nREST API\n\nThe Pig component can be specified through the Dataproc API\nusing\n[SoftwareConfig.Component](/dataproc/docs/reference/rest/v1/ClusterConfig#Component)\nas part of a\n[clusters.create](/dataproc/docs/reference/rest/v1/projects.regions.clusters/create)\nrequest.\n\nConsole\n\nEnable the component:\n\n1. In the Google Cloud console, open the Dataproc [Create a cluster](https://console.cloud.google.com/dataproc/clustersAdd) page. The Set up cluster panel is selected.\n2. In the Components section, under Optional components, select Pig and other optional components to install on your cluster."]]