Apache Beam SDK のインストール

このページでは、Apache Beam SDK をインストールして Cloud Dataflow サービスでパイプラインを実行できるようにする方法を示します。

Cloud Dataflow SDK の利用非推奨のお知らせ: Cloud Dataflow SDK 2.5.0 は、Apache Beam SDK リリースとは別個にリリースされる最後の Cloud Dataflow SDK リリースとなります。Cloud Dataflow サービスでは、正式な Apache Beam SDK リリースが完全にサポートされます。Cloud Dataflow サービスでは、以前にリリースされたバージョン 2.0.0 以降の Apache Beam SDK もサポートされます。各種 SDK のサポート状況については、Cloud Dataflow のサポートページをご覧ください。

SDK リリースのインストール

Java

Apache Beam SDK for Java の最新リリース バージョンは 2.13.0 です。このリリースにおける変更点については、リリースのお知らせをご覧ください。

Maven を使用して Apache Beam SDK for Java を入手するには、Maven Central Repository のリリース済みアーティファクトのいずれかを使用します。

pom.xml ファイルで依存関係を追加し、SDK アーティファクトのバージョン範囲を次のように指定します。

  <dependency>
  <groupId>org.apache.beam</groupId>
  <artifactId>beam-sdks-java-core</artifactId>
  <version>[2.13.0, 2.99)</version>
  </dependency>
  

注: beam-sdks-java-core アーティファクトにはコア SDK だけが含まれています。その他の依存関係(IO やランナーなど)は依存関係リストに明示的に追加する必要があります。

Python

Apache Beam SDK for Python の最新リリース バージョンは 2.13.0 です。このリリースにおける変更点については、リリースのお知らせをご覧ください。

Apache Beam SDK for Python を入手するには、Python Package Index のリリース済みパッケージのいずれかを使用します。

仮想環境から次のコマンドを実行して、最新バージョンの Apache Beam SDK for Python をインストールします。

    pip install apache-beam[gcp]
  

インストール済みの apache-beam をアップグレードするには、--upgrade フラグを使用します。

    pip install --upgrade apache-beam[gcp]
  

注: バージョン番号には major.minor.incremental という形式を使用します。互換性のない API 変更では major バージョンをインクリメントし、後方互換性のある新機能追加では minor バージョンをインクリメントし、前方互換性のあるバグ修正では incremental バージョンをインクリメントします。試験運用版とマークされた API はどの時点でも変更される可能性があります。

ソースコードとサンプル

Apache Beam のソースコードは、GitHub の Apache Beam リポジトリで入手できます。

Java

コードサンプルは GitHub の Apache Beam サンプルのリポジトリで入手できます。

Python

コードサンプルは GitHub の Apache Beam サンプルのリポジトリで入手できます。

追加ツール

Java

Cloud Dataflow は、Cloud SDK の gcloud コマンドライン ツールと統合されています。Cloud Dataflow コマンドライン インターフェースのインストール手順については、Cloud Dataflow コマンドライン インターフェースを使用するをご覧ください。

Cloud Tools for Eclipse には、Eclipse IDE を使用して Cloud Dataflow プロジェクトとパイプラインを作成するためのプラグインが用意されています。Cloud Tools for Eclipse プラグインのインストール手順については、Java と Eclipse を使用したクイックスタートをご覧ください。 注: Cloud Tools for Eclipse は、Cloud Dataflow SDK ディストリビューションのバージョン 2.0.0~2.5.0 でのみ動作します。Cloud Tools for Eclipse プラグインは、Apache Beam SDK ディストリビューションでは動作しません。

Python

Cloud Dataflow は、Cloud SDK の gcloud コマンドライン ツールと統合されています。Cloud Dataflow コマンドライン インターフェースのインストール手順については、Cloud Dataflow コマンドライン インターフェースを使用するをご覧ください。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

ご不明な点がありましたら、Google のサポートページをご覧ください。