Quando crei un cluster, i componenti dell'ecosistema Apache Hadoop standard vengono installati automaticamente nel cluster (vedi Elenco versioni di Dataproc). Puoi installare componenti aggiuntivi, chiamati "componenti facoltativi", sul cluster quando crei il cluster. L'aggiunta di componenti facoltativi a un cluster è simile all'aggiunta di componenti tramite l'utilizzo di azioni di inizializzazione, ma presenta i seguenti vantaggi:
- Tempi di avvio del cluster più rapidi
- Testato compatibilità per versioni specifiche di Dataproc
- Uso di un parametro cluster anziché di uno script di azione di inizializzazione
- I componenti facoltativi sono integrati con altri componenti Dataproc. Ad esempio, quando Anaconda e Zeppelin sono installati su un cluster, Zeppelin utilizzerà l'interprete Python e le librerie di Anaconda.
Componenti facoltativi disponibili
Componente facoltativo | COMPONENT_NAME nei comandi gcloud e nelle richieste API |
Versione immagine | Fase di rilascio |
---|---|---|---|
Anaconda | ANACONDA | 1.3 e versioni successive (non disponibile in 2.0 e versioni successive) |
GA |
Docker | DOCKER | 1.5 e versioni successive | GA |
Faccina con ciglia | FLINK | 1.5 e versioni successive | GA |
HBase | HBASE | 1.5 e versioni successive (non disponibile in 2.1 e versioni successive) |
Beta |
Hive WebHCat | HIVE_WEBHCAT | 1.3 e versioni successive | GA |
Hudi | Hudi | 1.5 e versioni successive | GA |
Taccuino Jupyter | GIORNATORE | 1.3 e versioni successive | GA |
Presto | PRESTO | 1.3 e versioni successive (non disponibile in 2.1 e versioni successive) |
GA |
Ranger | DISTANZA | 1.3 e versioni successive | GA |
Solr | SOLARI | 1.3 e versioni successive | GA |
Trino | TRINO | 2.1 e versioni successive | GA |
Taccuino Zeppelin | ZEPPELIN | 1.3 e versioni successive | GA |
Zookeeper | ZOOKEE | 1.0 e versioni successive | GA |
Aggiunta di componenti facoltativi
Comando gcloud
Per creare un cluster Dataproc e installare uno o più componenti facoltativi sul cluster, utilizza il comando gcloud beta dataproc clusters create cluster-name
con il flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=COMPONENT-NAME(s) \ ... other flags
API REST
I componenti facoltativi possono essere specificati tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.Console
Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configurazione cluster è selezionato. Nella sezione Componenti della sezione Componenti, seleziona uno o più componenti da installare sul cluster.