Componenti di Dataproc

Quando crei un cluster, i componenti dell'ecosistema Apache Hadoop standard vengono installati automaticamente sul cluster (consulta Elenco delle versioni di Dataproc). Puoi installare componenti aggiuntivi, chiamati "componenti facoltativi", sul cluster quando lo crei. L'aggiunta di componenti facoltativi a un cluster è simile all'aggiunta di componenti tramite l'uso di azioni di inizializzazione, ma presenta i seguenti vantaggi:

  • Tempi di avvio del cluster più rapidi
  • Compatibilità testata con versioni specifiche di Dataproc
  • Utilizzo di un parametro cluster anziché di uno script di azioni di inizializzazione
di Gemini Advanced.

Componenti facoltativi disponibili

Componente facoltativo COMPONENT_NAME
nei comandi gcloud e nelle richieste API
Versione immagine Fase di rilascio
Docker DOCKER 1.5 e versioni successive GA
Flink FLINK 1.5 e versioni successive GA
HBase HBASE 1.5 e versioni successive
(non disponibile in 2.1 e versioni successive)
Beta
WebHCat Hive HIVE_WEBHCAT 1.3 e versioni successive GA
Hudi Hudi 1.5 e versioni successive GA
Blocco note Jupyter JUPYTER 1.3 e versioni successive GA
Presto PRESTO 1.3 e versioni successive
(non disponibile in 2.1 e versioni successive)
GA
Ranger RANGER 1.3 e versioni successive GA
Solr SOLR 1.3 e versioni successive GA
Trino TRINO 2.1 e versioni successive GA
Zeppelin Notebook ZEPPELIN 1.3 e versioni successive GA
Zookeeper ZOOKEEPER 1.0 e versioni successive GA

Aggiunta di componenti facoltativi

Comando g-cloud

Per creare un cluster Dataproc e installare uno o più componenti facoltativi sul cluster, utilizza il comando gcloud beta dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
  --optional-components=COMPONENT-NAME(s) \
  ... other flags

API REST

Per specificare componenti facoltativi tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di un clusters.create richiesta.

Console

Nella console Google Cloud, apri la pagina Dataproc Crea un cluster. Il riquadro Configura cluster è selezionato. In Componenti facoltativi della sezione Componenti, seleziona uno o più componenti da installare sul cluster.