Apache Beam SDK 설치

이 페이지에서는 Cloud Dataflow 서비스에서 파이프라인을 실행할 수 있도록 Apache Beam SDK를 설치하는 방법을 보여줍니다.

Cloud Dataflow SDK 지원 중단 알림: Cloud Dataflow SDK 2.5.0은 Apache Beam SDK와 별개로 출시되는 마지막 Cloud Dataflow SDK입니다. Cloud Dataflow 서비스는 Apache Beam SDK 공식 출시 버전을 완벽하게 지원합니다. 또한 Cloud Dataflow 서비스는 이전에 출시된 Apache Beam SDK 버전 2.0.0 이상을 지원합니다. 각 SDK에 대한 지원 여부는 Cloud Dataflow 지원 페이지를 참조하세요.

SDK 출시 버전 설치

자바

자바용 Apache Beam SDK의 최신 출시 버전은 2.13.0입니다. 이 출시 버전에 포함된 변경사항에 대한 자세한 내용은 출시 발표를 참조하세요.

Maven을 사용하여 자바용 Apache Beam SDK를 가져오려면 Maven Central 저장소에서 출시된 아티팩트 중 하나를 사용합니다.

pom.xml 파일에 종속 항목을 추가하고 다음과 같이 SDK 아티팩트의 버전 범위를 지정합니다.

  <dependency>
  <groupId>org.apache.beam</groupId>
  <artifactId>beam-sdks-java-core</artifactId>
  <version>[2.13.0, 2.99)</version>
  </dependency>
  

참고: beam-sdks-java-core 아티팩트에는 핵심 SDK만 포함되어 있습니다. 또한 다른 종속 항목(예: IO 또는 실행기)을 종속 항목 목록에 명시적으로 추가해야 합니다.

Python

Python용 Apache Beam SDK의 최신 출시 버전은 2.13.0입니다. 이 출시 버전에 포함된 변경사항에 대한 자세한 내용은 출시 발표를 참조하세요.

Python용 Apache Beam SDK를 가져오려면 Python 패키지 색인에서 출시된 패키지 중 하나를 사용합니다.

가상 환경에서 다음 명령어를 실행하여 Python용 Apache Beam SDK의 최신 버전을 설치합니다.

    pip install apache-beam[gcp]
  

기존의 apache-beam 설치를 업그레이드하려면 --upgrade 플래그를 사용합니다.

    pip install --upgrade apache-beam[gcp]
  

참고: 버전 번호는 major.minor.incremental 형식을 사용합니다. 호환되지 않는 API 변경사항의 경우에는 major(주) 버전 번호가 증가하고, 이전 버전과 호환되는 새로운 기능이 추가된 경우에는 minor(부) 버전 번호가 증가합니다. 그리고 이후 버전과 호환되는 버그 수정의 경우에는 incremental(증분) 버전 번호가 증가합니다. 시험용으로 표시된 API는 언제든지 변경될 수 있습니다.

소스 코드 및 예

GitHub의 Apache Beam 저장소에서 Apache Beam 소스 코드를 사용할 수 있습니다.

자바

GitHub의 Apache Beam 저장소에서 코드 샘플을 사용할 수 있습니다.

Python

GitHub의 Apache Beam 저장소에서 코드 샘플을 사용할 수 있습니다.

추가 도구

자바

Cloud Dataflow는 Cloud SDK의 gcloud 명령줄 도구와 통합됩니다. Cloud Dataflow 명령줄 인터페이스 설치에 대한 안내는 Cloud Dataflow 명령줄 인터페이스 사용을 참조하세요.

Cloud Tools for Eclipse는 Eclipse IDE를 사용하여 Cloud Dataflow 프로젝트와 파이프라인을 생성할 수 있도록 지원하는 플러그인입니다. Cloud Tools for Eclipse 플러그인 설치에 대한 안내는 자바와 Eclipse를 사용한 빠른 시작을 참조하세요. 참고: Cloud Tools for Eclipse는 Cloud Dataflow SDK 배포 버전 2.0.0~2.5.0에서만 작동합니다. Cloud Tools for Eclipse 플러그인은 Apache Beam SDK 배포판에서는 작동하지 않습니다.

Python

Cloud Dataflow는 Cloud SDK의 gcloud 명령줄 도구와 통합됩니다. Cloud Dataflow 명령줄 인터페이스 설치에 대한 안내는 Cloud Dataflow 명령줄 인터페이스 사용을 참조하세요.

이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

도움이 필요하시나요? 지원 페이지를 방문하세요.