Dataproc 선택적 Anaconda 구성요소

선택적 구성요소 기능을 사용하여 Dataproc 클러스터를 만들 때 Anaconda와 같은 추가 구성요소를 설치할 수 있습니다. 이 페이지에서는 Anaconda 구성요소에 대해 설명합니다.

Anaconda 구성요소는 1,000개 이상의 인기 있는 데이터 사이언스 패키지가 포함된 Python 배포 및 패키지 관리자입니다. 이 구성요소는 /opt/conda/anaconda의 모든 클러스터 노드에 설치되며 기본 Python 인터프리터가 됩니다. 추가 설치 정보는 Dataproc Python 환경 구성을 참조하세요.

구성요소 설치

Dataproc 클러스터를 만들 때 구성요소를 설치합니다. 각 Dataproc 이미지 출시에 포함된 구성요소 버전은 지원되는 Dataproc 버전을 참조하세요.

gcloud 명령어

Anaconda 구성요소를 포함하는 Dataproc 클러스터를 만들려면 gcloud dataproc clusters create cluster-name 명령어를 --optional-components 플래그와 함께 사용합니다.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=ANACONDA \
    ... other args

REST API

Anaconda 구성요소는 SoftwareConfig.Componentclusters.create 요청에 사용하여 Dataproc API를 통해 지정할 수 있습니다.

Console

  1. 구성요소를 사용 설정합니다.
    • Google Cloud 콘솔에서 Dataproc 클러스터 만들기 페이지를 엽니다. 클러스터 설정 패널이 선택되었습니다.
    • 구성요소 섹션에서 다음을 수행합니다.
      • 선택적 구성요소 아래에서 클러스터에 설치할 Anaconda 및 기타 선택적인 구성요소를 선택합니다.