既知の問題

このページでは、Batch の使用中に発生する可能性のある既知の問題について説明します。

Batch の使用についてさらにサポートが必要な場合は、トラブルシューティングのドキュメントをご覧いただくか、サポートにお問い合わせください。

ジョブを一覧表示するときにレイテンシが発生する可能性がある

プロジェクトに 10,000 を超えるジョブが含まれる場合、Google Cloud コンソール、gcloud CLI、または Batch API の Batch [ジョブリスト] ページでジョブを一覧表示すると、レイテンシが発生することがあります。この問題は、特定のジョブの表示には影響しません。

この問題を回避するには、プロジェクト内のジョブの数を減らすか、BigQuery に保存したジョブ情報を表示してクエリを実行します。BigQuery にジョブ情報を保存するには、次の 1 つ以上のオプションを使用します。

  • ジョブのステータス情報を BigQuery に自動的にストリーミングするには、ジョブの作成時に Pub/Sub 通知を有効にします。詳細については、通知を使用してジョブをモニタリングするをご覧ください。

  • 完了したジョブのすべての情報を BigQuery にエクスポートするには、export-to-bigquery-delete-batch-jobs サンプル スクリプトを実行します。 詳細については、ジョブの削除とエクスポートをご覧ください。

古いカーネルの Compute Engine(またはカスタム)VM OS イメージを指定すると、ジョブが失敗する可能性がある

カーネルのバージョンが最新でない Compute Engine VM OS イメージを指定すると、ジョブが失敗する可能性があります。この問題は、Compute Engine VM OS イメージをベースにしたカスタム イメージにも影響します。この問題を引き起こす Compute Engine の公開イメージは簡単に特定できず、いつでも変更される可能性があります。

この問題を示す特定のエラー メッセージはありません。このため、予期せず失敗したジョブで、Compute Engine VM OS イメージまたは同様のカスタム イメージが指定されている場合は、この問題を検討してください。

この問題を回避または解決する手順は、以下のとおりです。

  1. 可能であれば、この問題の影響を受けない Batch イメージまたは Batch イメージをベースにしたカスタム イメージを使用してください。
  2. Batch イメージを使用できない場合は、目的の Compute Engine イメージの最新バージョンを試してください。一般的に、新しいバージョンの Compute Engine イメージは、古いバージョンではなく最新バージョンのカーネルを使用している可能性が高くなります。
  3. 特定のイメージの最新バージョンが動作しない場合は、別の OS を試すか、カスタム イメージを作成する必要があるかもしれません。たとえば、最新バージョンの Debian 11 が機能しない場合は、Debian 11 が動作し、最新のカーネル バージョンを使用するように更新した Compute Engine VM からカスタム イメージを作成してみてください。

この問題は、VM OS イメージのカーネル バージョンが古いため、VM が再起動されたことが原因です。ジョブで Batch からのものでも Batch イメージをベースにしたものでもない VM OS イメージが指定されている場合、Batch は起動後に必要なパッケージをジョブの VM にインストールします。必要なパッケージはジョブによって異なり、時間とともに変化する可能性があります。また、VM OS イメージに最新のカーネル バージョンを指定する必要があります。この問題は、カーネル バージョンの更新時に VM の再起動が必要になり、パッケージのインストールとジョブが失敗する場合に発生します。

VM OS イメージの詳細については、ジョブの VM OS 環境の概要をご覧ください。

GPU と古いカーネルの VM OS イメージを使用するジョブが、ドライバの自動インストール時にのみ失敗する可能性がある

この問題は、カーネルが古い Compute Engine(またはカスタム)VM OS イメージを指定したジョブが失敗する可能性があることと密接に関連しています。具体的には、カーネルが最新ではない Compute Engine(またはカスタム)VM OS イメージを指定し、GPU を使用するジョブは、GPU ドライバを自動的にインストールしようとした場合にのみ失敗する可能性があります。このようなジョブでは、GPU ドライバを手動でインストールするだけで障害を解決できる可能性があります。

GPU の詳細については、GPU を使用するジョブを作成して実行するをご覧ください。