English
Deutsch
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
日本語
한국어

お問い合わせ無料で利用開始

Dataflow でカスタムコンテナを使用する

カスタムコンテナイメージを使用すると、Dataflow パイプラインのユーザーコードのランタイム環境をカスタマイズできます。カスタムコンテナは、Dataflow Runner v2 を使用するパイプラインでサポートされています。

Dataflow がワーカー VM を起動すると、Docker コンテナイメージを使用してワーカー上でコンテナ化された SDK プロセスを起動します。デフォルトでは、パイプラインはビルド済みの Apache Beam イメージを使用します。ただし、Dataflow ジョブにカスタムコンテナイメージを使用することもできます。カスタムコンテナイメージを指定すると、Dataflow は指定されたイメージを pull するワーカーを起動します。

カスタムコンテナを使用する理由には、次のようなものがあります。

ワーカーの起動時間を短縮するために、パイプラインの依存関係をプリインストールする。
公開リポジトリでは使用できないパイプラインの依存関係をプリインストールする。
公開リポジトリへのアクセスがオフになっているときに、パイプラインの依存関係をプリインストールします。セキュリティ上の理由から、アクセスが無効になっている可能性があります。
ワーカーの起動時間を短縮するために、大きなファイルを事前ステージングする。
サードパーティソフトウェアをバックグラウンドで起動する。
実行環境をカスタマイズする。

Apache Beam のカスタムコンテナの詳細については、Apache Beam カスタムコンテナガイドをご覧ください。カスタムコンテナを使用する Python パイプラインの例については、Dataflow カスタムコンテナをご覧ください。

次のステップ

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2024-11-20 UTC。