パイプラインログを操作する

Apache Beam SDK の組み込みロギングインフラストラクチャを使用して、パイプラインの実行時に情報をロギングできます。Google Cloud コンソールを使用して、パイプラインの実行中と実行後のロギング情報をモニタリングできます。

パイプラインにログメッセージを追加する

Java

Apache Beam SDK for Java では、オープンソースの Simple Logging Facade for Java（SLF4J）ライブラリを通じてワーカーメッセージをロギングすることをおすすめします。Apache Beam SDK for Java は必要なロギングインフラストラクチャを実装しているため、Java コードで必要なのは、SLF4J API をインポートすることだけです。次に、Logger をインスタンス化して、パイプラインコード内でメッセージロギングを有効にします。

既存のコードやライブラリについては、Apache Beam SDK for Java によって追加のロギングインフラストラクチャが設定されます。Java 用の次のロギングライブラリによって生成されたログメッセージがキャプチャされます。

Python

Apache Beam SDK for Python には logging ライブラリパッケージが用意されており、パイプラインのワーカーでコードを使用してログメッセージを出力できます。ライブラリ関数を使用するには、ライブラリをインポートする必要があります。

import logging

Go

Apache Beam SDK for Go には log ライブラリパッケージが用意されており、パイプラインのワーカーでコードを使用してログメッセージを出力できます。ライブラリ関数を使用するには、ライブラリをインポートする必要があります。

import "github.com/apache/beam/sdks/v2/go/pkg/beam/log"

ワーカーログメッセージコードの例

Java

次の例では、Dataflow ロギングに SLF4J を使用します。Dataflow ロギング用の SLF4J の構成の詳細については、Java のヒントの記事をご覧ください。

Apache Beam WordCount サンプルは、処理されたテキストの行に “love” という単語が見つかった場合にログメッセージを出力するように変更できます。以下の例では、追加されるコードは太字で示されています（わかりやすくするために、前後のコードも含めています）。

 package org.apache.beam.examples;
 // Import SLF4J packages.
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 ...
 public class WordCount {
   ...
   static class ExtractWordsFn extends DoFn<String, String> {
     // Instantiate Logger.
     // Suggestion: As shown, specify the class name of the containing class
     // (WordCount).
     private static final Logger LOG = LoggerFactory.getLogger(WordCount.class);
     ...
     @ProcessElement
     public void processElement(ProcessContext c) {
       ...
       // Output each word encountered into the output PCollection.
       for (String word : words) {
         if (!word.isEmpty()) {
           c.output(word);
         }
         // Log INFO messages when the word "love" is found.
         if(word.toLowerCase().equals("love")) {
           LOG.info("Found " + word.toLowerCase());
         }
       }
     }
   }
 ... // Remaining WordCount example code ...

Python

Apache Beam の wordcount.py サンプルは、処理されたテキストの行に “love” という単語が見つかった場合にログメッセージを出力するように変更できます。

# import Python logging module.
import logging

class ExtractWordsFn(beam.DoFn):
  def process(self, element):
    words = re.findall(r'[A-Za-z\']+', element)
    for word in words:
      yield word

      if word.lower() == 'love':
        # Log using the root logger at info or higher levels
        logging.info('Found : %s', word.lower())

# Remaining WordCount example code ...

Go

Apache Beam の wordcount.go サンプルは、処理されたテキストの行に “love” という単語が見つかった場合にログメッセージを出力するように変更できます。

func (f *extractFn) ProcessElement(ctx context.Context, line string, emit func(string)) {
    for _, word := range wordRE.FindAllString(line, -1) {
        // increment the counter for small words if length of words is
        // less than small_word_length
        if strings.ToLower(word) == "love" {
            log.Infof(ctx, "Found : %s", strings.ToLower(word))
        }

        emit(word)
    }
}

// Remaining Wordcount example

Java

変更された WordCount パイプラインは、デフォルトの DirectRunner を使用してローカルで実行され、出力はローカルファイル（--output=./local-wordcounts）に送信されます。コンソールの出力には、追加されたログメッセージが表示されます。

INFO: Executing pipeline using the DirectRunner.
...
Feb 11, 2015 1:13:22 PM org.apache.beam.examples.WordCount$ExtractWordsFn processElement
INFO: Found love
Feb 11, 2015 1:13:22 PM org.apache.beam.examples.WordCount$ExtractWordsFn processElement
INFO: Found love
Feb 11, 2015 1:13:22 PM org.apache.beam.examples.WordCount$ExtractWordsFn processElement
INFO: Found love
...
INFO: Pipeline execution complete.

デフォルトでは、INFO 以上のログ行のみが Cloud Logging に送信されます。この動作を変更する場合は、パイプラインのワーカーログレベルを設定するをご覧ください。

Python

INFO:root:Found : love
INFO:root:Found : love
INFO:root:Found : love

ロギング構成を logging.config 関数で上書きしないでください。パイプラインログを Dataflow と Cloud Logging に送信する事前構成済みのログハンドラが無効になる可能性があります。

Go

2022/05/26 11:36:44 Found : love
2022/05/26 11:36:44 Found : love
2022/05/26 11:36:44 Found : love

デフォルトでは、INFO 以上のログ行のみが Cloud Logging に送信されます。

ログの量を制御する

また、パイプラインのログレベルを変更して、生成されるログの量を減らすこともできます。一部またはすべての Dataflow ログの取り込みを続行しない場合は、Logging の除外を追加して Dataflow ログを除外します。次に、BigQuery、Cloud Storage、Pub/Sub などの別の宛先にログをエクスポートします。詳細については、Dataflow ログ取り込みの制御をご覧ください。

ロギングの上限と抑制

ワーカーログメッセージの上限は、ワーカーごとに 30 秒あたり 15,000 メッセージに制限されています。この上限に達すると、ロギングが抑制されたことを示す 1 つのワーカーログメッセージが追加されます。

Throttling logger worker. It used up its 30s quota for logs in only 12.345s

30 秒が経過するまで、それ以上のメッセージはログに記録されません。この上限は、Apache Beam SDK とユーザーコードで生成されるログメッセージによって共有されます。

ログの保存と保持

オペレーションログは、_Default ログバケットに保存されます。Logging API サービス名は dataflow.googleapis.com です。Cloud Logging で使用される Google Cloud のモニタリング対象リソースタイプとサービスの詳細については、モニタリング対象リソースとサービスをご覧ください。

Logging でログエントリが保持される期間の詳細については、割り当てと上限: ログの保持期間で保持情報をご覧ください。

オペレーションログの表示方法については、パイプラインログをモニタリングおよび表示するをご覧ください。

パイプラインログをモニタリングおよび表示する

Dataflow サービスでパイプラインを実行すると、Dataflow モニタリングインターフェースを使用して、パイプラインによって出力されたログを表示できます。

Dataflow ワーカーログの例

変更された WordCount パイプラインは、次のオプションを使用してクラウドで実行できます。

Java

--project=WordCountExample
--output=gs://<bucket-name>/counts
--runner=DataflowRunner
--tempLocation=gs://<bucket-name>/temp
--stagingLocation=gs://<bucket-name>/binaries

Python

--project=WordCountExample
--output=gs://<bucket-name>/counts
--runner=DataflowRunner
--staging_location=gs://<bucket-name>/binaries

Go

--project=WordCountExample
--output=gs://<bucket-name>/counts
--runner=DataflowRunner
--staging_location=gs://<bucket-name>/binaries

ログの表示

WordCount クラウドパイプラインはブロック実行を使用するため、パイプラインの実行中にコンソールメッセージが出力されます。ジョブが開始すると、Google Cloud コンソールページへのリンクがコンソールに出力され、続いてパイプラインのジョブ ID が出力されます。

INFO: To access the Dataflow monitoring console, please navigate to
https://console.developers.google.com/dataflow/job/2017-04-13_13_58_10-6217777367720337669
Submitted job: 2017-04-13_13_58_10-6217777367720337669

コンソール URL は、送信されたジョブの概要ページがある Dataflow モニタリングインターフェースを表示します。左側には動的実行グラフが表示され、右側には概要情報が表示されます。下のパネルのをクリックしてログパネルを展開します。

ログパネルにはデフォルトで、ジョブ全体のステータスを報告する [ジョブのログ] が表示されます。[情報] と [ログのフィルタ] をクリックすると、ログパネルに表示されるメッセージをフィルタできます。

グラフのパイプラインステップを選択すると、ビューは、コードによって生成された [ステップのログ] と、パイプラインステップで実行中の生成されたコードに変更されます。

[ジョブのログ] に戻るには、グラフの外側をクリックするか右側のパネルの [ステップを選択解除] ボタンを使用して、ステップの選択を解除します。

ログエクスプローラを開く

ログエクスプローラを開いてさまざまなログタイプを選択するには、ログパネルで [ログエクスプローラで表示]（外部リンクボタン）をクリックします。

ログエクスプローラでさまざまなログタイプを含むパネルを表示するには、[ログのフィールド] 切り替えボタンをクリックします。

[ログエクスプローラ] ページでは、クエリでフィルタが適用されていて、ジョブステップまたはログタイプによってログがフィルタされている場合があります。フィルタを削除するには、[クエリを表示] をクリックしてクエリを編集します。

ジョブのすべてのログを表示する手順は次のとおりです。

[クエリ] フィールドに次のクエリを入力します。
```
resource.type="dataflow_step"
resource.labels.job_id="JOB_ID"
```
JOB_ID をジョブの ID に置き換えます。
[クエリを実行] をクリックします。
このクエリを使用してもジョブのログが表示されない場合は、[日時を編集する] をクリックします。
開始時間と終了時間を調整し、[適用] をクリックします。

ログタイプ

ログエクスプローラには、パイプラインのインフラストラクチャログも含まれます。エラーログと警告ログを使用して、観察されたパイプラインの問題を診断します。パイプラインの問題と関連していないインフラストラクチャログのエラーや警告は、問題を示しているとは限りません。

ここでは、[ログエクスプローラ] ページで表示できる、さまざまなログタイプの概要を示します。

job-message ログには、Dataflow のさまざまなコンポーネントが生成するジョブレベルのメッセージが記録されます。たとえば、自動スケーリング構成、ワーカーの起動やシャットダウン、ジョブステップの進捗状況、ジョブエラーなどが記録されます。ユーザーコードのクラッシュに起因するワーカーレベルのエラーや、ワーカーログに記録されたエラーも job-message ログに記録されます。
worker ログは Dataflow ワーカーによって生成されます。worker は、パイプライン処理の大部分（データへの ParDo の適用など）を実行します。worker のログには、コードと Dataflow によって記録されたメッセージが含まれます。
worker-startup ログは、ほとんどの Dataflow ジョブを表し、起動プロセスに関連するメッセージをキャプチャできます。起動プロセスでは、Cloud Storage からジョブの jar をダウンロードし、ワーカーを起動します。ワーカーの起動に問題がある場合は、ここを調べることをおすすめします。
harness ログには、Runner v2 ランナーハーネスからのメッセージが含まれます。
shuffler ログには、並列パイプラインオペレーションの結果を統合する、ワーカーからのメッセージが含まれます。
system ログには、ワーカー VM のホストオペレーティングシステムからのメッセージが含まれます。シナリオによっては、プロセスのクラッシュや OOM（out-of-memory）イベントがキャプチャされることがあります。
docker と kubelet のログには、Dataflow ワーカーで使用される、これらの一般公開されたテクノロジーに関連するメッセージが含まれます。
nvidia-mps ログには、NVIDIA Multi-Process Service（MPS）オペレーションに関するメッセージが含まれます。

パイプラインのワーカーログレベルを設定する

Java

Apache Beam SDK for Java によってワーカーに設定されるデフォルトの SLF4J ロギングレベルは INFO です。INFO 以上（INFO、WARN、ERROR）のすべてのログメッセージが出力されます。別のデフォルトログレベルを設定して、より低い SLF4J ログレベル（TRACE または DEBUG）をサポートできます。また、コード内の異なるクラスパッケージに異なるログレベルを設定することもできます。

コマンドラインまたはプログラムでワーカーログレベルを設定できるように、次のパイプラインオプションが用意されています。

--defaultSdkHarnessLogLevel=<level>: このオプションを使用して、指定したデフォルトレベルですべてのロガーを設定します。たとえば、次のコマンドラインオプションは、デフォルトの Dataflow INFO ログレベルをオーバーライドして、DEBUG に設定します。
--defaultSdkHarnessLogLevel=DEBUG
--sdkHarnessLogLevelOverrides={"<package or class>":"<level>"}: このオプションを使用して、指定したパッケージまたはクラスのログレベルを設定します。たとえば、org.apache.beam.runners.dataflow パッケージのデフォルトのパイプラインログレベルをオーバーライドして、TRACE に設定するには、次のようにします。
--sdkHarnessLogLevelOverrides='{"org.apache.beam.runners.dataflow":"TRACE"}'
複数のオーバーライドを行うには、次のように JSON マップを指定します。
（--sdkHarnessLogLevelOverrides={"<package/class>":"<level>","<package/class>":"<level>",...}）
defaultSdkHarnessLogLevel と sdkHarnessLogLevelOverrides のパイプラインオプションは、Runner v2 を使用しない Apache Beam SDK バージョン 2.50.0 以前を使用するパイプラインではサポートされていません。その場合、--defaultWorkerLogLevel=<level> と --workerLogLevelOverrides={"<package or class>":"<level>"} のパイプラインオプションを使用します。複数のオーバーライドを行うには、次のように JSON マップを指定します。
（--workerLogLevelOverrides={"<package/class>":"<level>","<package/class>":"<level>",...}）

次のサンプルプログラムでは、パイプラインログオプションに、コマンドラインからオーバーライドできるデフォルト値を設定します。

 PipelineOptions options = ...
 SdkHarnessOptions loggingOptions = options.as(SdkHarnessOptions.class);
 // Overrides the default log level on the worker to emit logs at TRACE or higher.
 loggingOptions.setDefaultSdkHarnessLogLevel(LogLevel.TRACE);
 // Overrides the Foo class and "org.apache.beam.runners.dataflow" package to emit logs at WARN or higher.
 loggingOptions.getSdkHarnessLogLevelOverrides()
     .addOverrideForClass(Foo.class, LogLevel.WARN)
     .addOverrideForPackage(Package.getPackage("org.apache.beam.runners.dataflow"), LogLevel.WARN);

Python

Apache Beam SDK for Python によってワーカーに設定されるデフォルトのロギングレベルは INFO です。INFO 以上（INFO、WARNING、ERROR、CRITICAL）のすべてのログメッセージが出力されます。別のデフォルトのログレベルを設定して、より低いロギングレベル（DEBUG）をサポートできます。また、コード内のモジュールごとに異なるログレベルを設定することもできます。

コマンドラインまたはプログラムでワーカーログレベルを設定できるように、2 つのパイプラインオプションが用意されています。

--default_sdk_harness_log_level=<level>: このオプションを使用して、指定したデフォルトレベルですべてのロガーを設定します。たとえば、次のコマンドラインオプションは、デフォルトの Dataflow INFO ログレベルをオーバーライドして、DEBUG に設定します。
--default_sdk_harness_log_level=DEBUG
--sdk_harness_log_level_overrides={\"<module>\":\"<level>\"}: このオプションを使用して、指定したモジュールのロギングレベルを設定します。たとえば、apache_beam.runners.dataflow モジュールのデフォルトのパイプラインログレベルをオーバーライドして、DEBUG に設定するには、次のようにします。
--sdk_harness_log_level_overrides={\"apache_beam.runners.dataflow\":\"DEBUG\"}
複数のオーバーライドを行うには、次のように JSON マップを指定します。
（--sdk_harness_log_level_overrides={\"<module>\":\"<level>\",\"<module>\":\"<level>\",...}）

次の例では、WorkerOptions クラスを使用して、コマンドラインからオーバーライドできるパイプラインロギングオプションをプログラムで設定しています。

  from apache_beam.options.pipeline_options import PipelineOptions, WorkerOptions

  pipeline_args = [
    '--project=PROJECT_NAME',
    '--job_name=JOB_NAME',
    '--staging_location=gs://STORAGE_BUCKET/staging/',
    '--temp_location=gs://STORAGE_BUCKET/tmp/',
    '--region=DATAFLOW_REGION',
    '--runner=DataflowRunner'
  ]

  pipeline_options = PipelineOptions(pipeline_args)
  worker_options = pipeline_options.view_as(WorkerOptions)
  worker_options.default_sdk_harness_log_level = 'WARNING'

  # Note: In Apache Beam SDK 2.42.0 and earlier versions, use ['{"apache_beam.runners.dataflow":"WARNING"}']
  worker_options.sdk_harness_log_level_overrides = {"apache_beam.runners.dataflow":"WARNING"}

  # Pass in pipeline options during pipeline creation.
  with beam.Pipeline(options=pipeline_options) as pipeline:

次のように置き換えます。

PROJECT_NAME: プロジェクトの名前
JOB_NAME: ジョブの名前
STORAGE_BUCKET: Cloud Storage 名
DATAFLOW_REGION: Dataflow ジョブをデプロイするリージョン
--region フラグは、メタデータサーバー、ローカルクライアント、または環境変数に設定されているデフォルトリージョンをオーバーライドします。

Go

この機能は、Apache Beam SDK for Go では使用できません。

起動された BigQuery ジョブのログを表示する

Dataflow パイプラインで BigQuery を使用すると、BigQuery ジョブが起動し、ユーザーに代わってさまざまなアクションが実行されます。これらのアクションには、データの読み込み、エクスポートなどのタスクが含まれます。トラブルシューティングとモニタリングを行う場合、Dataflow モニタリングインターフェースには、これらの BigQuery ジョブに関する追加情報が [ログ] パネルに表示されます。

[ログ] パネルに表示される BigQuery ジョブの情報は BigQuery システムテーブルに保存され、そこから読み込まれます。基盤となる BigQuery テーブルに対してクエリが実行されると料金が発生します。

BigQuery ジョブの詳細を表示する

BigQuery ジョブの情報を表示するには、パイプラインで Apache Beam 2.24.0 以降を使用する必要があります。

BigQuery ジョブを一覧取得するには、[BigQuery ジョブ] タブを開いて、BigQuery ジョブのロケーションを選択します。次に、[BigQuery ジョブの読み込み] をクリックしてダイアログを確定します。クエリが完了すると、ジョブリストが表示されます。

BigQuery ジョブ情報テーブル内の [BigQuery ジョブの読み込み] ボタン

ジョブ ID、タイプ、期間など、各ジョブの基本情報が提供されます。

現在のパイプラインジョブの実行中に実施された BigQuery ジョブを示すテーブル。

特定のジョブの詳細情報については、[詳細] 列の [コマンドライン] をクリックします。

コマンドラインのモーダルウィンドウで bq jobs describe コマンドをコピーし、ローカルまたは Cloud Shell で実行します。

gcloud alpha bq jobs describe BIGQUERY_JOB_ID

bq jobs describe コマンドは、JobStatistics を出力します。これにより、低速または停滞している BigQuery ジョブの診断時に役立つ追加の詳細情報が提供されます。

また、SQL クエリで BigQueryIO を使用すると、クエリジョブが発行されます。ジョブで使用される SQL クエリを表示するには、[詳細] 列で [クエリを表示] をクリックします。

診断ページを表示する

[ログ] ペインの [診断] タブで、パイプラインで生成された特定のログエントリを収集し、表示します。これらのエントリには、パイプラインで考えられる問題を示すメッセージと、スタックトレースを含むエラーメッセージが含まれます。収集されたログエントリは重複が排除され、エラーグループに結合されます。

サービスエラーのエラーグループがある Dataflow ジョブの [診断] タブ。

エラーレポートには次の情報が含まれます。

エラーとエラーメッセージのリスト
各エラーが発生した回数
各エラーがいつ発生したかを示すヒストグラム
直近のエラーの発生時刻
エラーが初めて発生した時刻
エラーのステータス

特定のエラーのエラーレポートを表示するには、[エラー] 列の説明をクリックします。[エラーレポート] ページが表示されます。サービスエラーの場合は、トラブルシューティングガイドへのリンクが表示されます。

Dataflow サービスエラーのエラーグループの詳細ページ。

このページの詳細については、エラーの表示とフィルタリングをご覧ください。

エラーのミュート

エラーメッセージをミュートする手順は次のとおりです。

[診断] タブを開きます。
ミュートするエラーをクリックします。
解決ステータスのメニューを開きます。ステータスには、[対応待ち]、[確認済み]、[解決済み]、[ミュート中] のいずれかのラベルが付いています。
[ミュート中] を選択します。

パイプライン ログを操作する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

パイプラインにログメッセージを追加する

Java

Python

Go

ワーカー ログ メッセージ コードの例

Java

Python

Go

Java

Python

Go

ログの量を制御する

ロギングの上限と抑制

ログの保存と保持

パイプライン ログをモニタリングおよび表示する

Dataflow ワーカーログの例

Java

Python

Go

ログの表示

ログ エクスプローラを開く

ログタイプ

パイプラインのワーカーログ レベルを設定する

Java

Python

Go

起動された BigQuery ジョブのログを表示する

BigQuery ジョブの詳細を表示する

診断ページを表示する

エラーのミュート

パイプラインログを操作する

ワーカーログメッセージコードの例

パイプラインログをモニタリングおよび表示する

ログエクスプローラを開く

パイプラインのワーカーログレベルを設定する