Componente Anaconda facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Anaconda quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. In questa pagina viene descritto il componente Anaconda.

Il componente Anaconda è un gestore di pacchetti e distribuzione Python con oltre 1000 pacchetti di data science molto diffusi. Per ulteriori informazioni sull'installazione, consulta Configurare l'ambiente Python di Dataproc.

Installa il componente

Installa il componente quando crei un cluster Dataproc. Consulta Versioni Dataproc supportate per la versione dei componenti inclusa in ogni release di immagini Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Anaconda, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=ANACONDA \
    ... other args

API REST

Il componente Anaconda può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Attiva il componente.
    • Nella console Google Cloud, apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti:
      • In Componenti facoltativi, seleziona Anaconda e altri componenti facoltativi da installare sul cluster.