Puoi installare componenti aggiuntivi come Anaconda quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Anaconda.
Il componente Anaconda è un gestore di pacchetti e distribuzione Python con oltre 1000 pacchetti di data science molto diffusi. Per ulteriori informazioni sull'installazione, consulta Configurare l'ambiente Python di Dataproc.
Installa il componente
Installa il componente quando crei un cluster Dataproc. Consulta Versioni Dataproc supportate per la versione dei componenti inclusa in ogni release di immagini Dataproc.
Comando g-cloud
Per creare un cluster Dataproc che includa il componente Anaconda,
utilizza il comando
gcloud dataproc clusters create cluster-name
con il flag --optional-components
.
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=ANACONDA \ ... other args
API REST
Il componente Anaconda può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.Console
- Attiva il componente.
- Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Anaconda e altri componenti facoltativi da installare sul cluster.