Componenti Dataproc

Quando crei un cluster, i componenti standard dell'ecosistema Apache Hadoop vengono installati automaticamente nel cluster (consulta l'elenco delle versioni di Dataproc). Puoi installare componenti aggiuntivi, denominati "componenti facoltativi", sul cluster quando lo crei. L'aggiunta di componenti facoltativi a un cluster è simile a quella tramite azioni di inizializzazione, ma offre i seguenti vantaggi:

  • Tempi di avvio dei cluster più rapidi
  • Compatibilità testata con versioni specifiche di Dataproc
  • Utilizzo di un parametro cluster invece di uno script di azioni di inizializzazione
  • I componenti facoltativi sono integrati con altri componenti di Dataproc. Ad esempio, quando Anaconda e Zeppelin sono installati su un cluster, Zeppelin utilizzerà l'interprete e le librerie Python di Anaconda.

Componenti facoltativi disponibili

Componente facoltativo COMPONENT_NAME
nei comandi gcloud e nelle richieste API
Versione immagine Fase di rilascio
Anaconda ANACONDA 1.3 e versioni successive
(non disponibile a partire dalla 2.0)
GA
Docker DOCKER 1.5 e versioni successive GA
Flink FLINK 1.5 e versioni successive GA
HBase HBASE 1.5 e versioni successive
(non disponibile in 2.1 e versioni successive)
Beta
WebHCat di Hive HIVE_WEBHCAT 1.3 e versioni successive GA
Hudi Hudi 1.5 e versioni successive GA
Blocco note Jupyter GIOVE 1.3 e versioni successive GA
Presto PRESTO 1.3 e versioni successive
(non disponibile a partire dalla 2.1)
GA
Intervallo RANGER 1.3 e versioni successive GA
Solr SOLR 1.3 e versioni successive GA
Trino TRINO 2.1 e versioni successive GA
Blocco note Zeppelin ZEPPELINA 1.3 e versioni successive GA
Zookeeper ZOOKEEPER 1.0 e versioni successive GA

Aggiunta di componenti facoltativi

Comando g-cloud

Per creare un cluster Dataproc e installare uno o più componenti facoltativi sul cluster, utilizza il comando gcloud beta dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
  --optional-components=COMPONENT-NAME(s) \
  ... other flags

API REST

I componenti facoltativi possono essere specificati tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato. In Componenti facoltativi nella sezione Componenti, seleziona uno o più componenti da installare sul cluster.