Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Puedes instalar componentes adicionales, como Apache Pig, cuando creas un clúster de Dataproc con la función de componentes opcionales. En esta página, se describe el componente de Pig, una plataforma de código abierto para analizar grandes conjuntos de datos.
Instala el componente
Instala el componente cuando crees un clúster de Dataproc.
Apache Pig es un componente opcional en las versiones de imagen de Dataproc 2.3 y posteriores.
Consulta las versiones compatibles de Dataproc para conocer las versiones de los componentes incluidas en las versiones más recientes de imágenes de Dataproc.
gcloud
Para crear un clúster de Dataproc que incluya el componente Pig, usa el comando gcloud dataproc clusters create CLUSTER_NAME con la marca --optional-components (con la versión 2.3 o posterior de la imagen).
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[],[],null,["You can install additional components like [Apache Pig](https://pig.apache.org/)\nwhen you create a Dataproc cluster using the\n[Optional components](/dataproc/docs/concepts/components/overview#available_optional_components)\nfeature. This page describes the Pig component, an open source platform for\nanalyzing large data sets.\n\nInstall the component\n\nInstall the component when you create a Dataproc cluster.\n\nApache Pig is an optional component in Dataproc `2.3` and later\nimage versions.\n| **Note:** Apache Pig is automatically installed on Dataproc `2.2` and earlier image versions.\n\nSee\n[Supported Dataproc versions](/dataproc/docs/concepts/versioning/dataproc-versions#supported_cloud_dataproc_versions)\nfor component versions included in the latest Dataproc image\nreleases. \n\ngcloud\n\nTo create a Dataproc cluster that includes the Pig component,\nuse the\n[`gcloud dataproc clusters create `\u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e](/sdk/gcloud/reference/dataproc/clusters/create)\ncommand with the `--optional-components` flag (using image version\n2.3 or later). \n\n```\ngcloud dataproc clusters create CLUSTER_NAME \\\n --region=REGION \\\n --optional-components=PIG \\\n --image-version=2.3 \\\n ... other flags\n```\n\nREST API\n\nThe Pig component can be specified through the Dataproc API\nusing\n[SoftwareConfig.Component](/dataproc/docs/reference/rest/v1/ClusterConfig#Component)\nas part of a\n[clusters.create](/dataproc/docs/reference/rest/v1/projects.regions.clusters/create)\nrequest.\n\nConsole\n\nEnable the component:\n\n1. In the Google Cloud console, open the Dataproc [Create a cluster](https://console.cloud.google.com/dataproc/clustersAdd) page. The Set up cluster panel is selected.\n2. In the Components section, under Optional components, select Pig and other optional components to install on your cluster."]]