Puoi installare componenti aggiuntivi come Anaconda quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Anaconda.
Il componente Anaconda è un gestore di pacchetti e distribuzione Python con oltre 1000 pacchetti di data science popolari. Il componente è installato su tutti i nodi del cluster in /opt/conda/anaconda
e diventa l'interprete Python predefinito. Per ulteriori informazioni sull'installazione, consulta
Configurare l'ambiente Python di Dataproc.
Installa il componente
Installa il componente quando crei un cluster Dataproc. Consulta le versioni di Dataproc supportate per la versione dei componenti inclusa in ogni release di immagine Dataproc.
Comando g-cloud
Per creare un cluster Dataproc che includa il componente Anaconda, utilizza il comando cluster-name gcloud dataproc clusters create con il flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=ANACONDA \ ... other args
API REST
Il componente Anaconda può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.Console
- Attiva il componente.
- Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Anaconda e altri componenti facoltativi da installare sul cluster.