トラブルシューティング

このページでは、Deep Learning VM Images インスタンスの作成時に発生する可能性のある問題と、その対処法について説明します。

割り当てを超過した

症状: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region us-east1.

問題: 割り当てが不足しています。

解決策: GPU を使用するインスタンスを作成するには、GPU の割り当てが必要です。割り当てページに移動して、プロジェクトで十分な GPU を使用できるかどうかを確認します。GPU が割り当てページのリストにない場合や、さらに GPU 割り当てが必要な場合には、割り当て量の増加をリクエストしてください。プロジェクトに確定済みのお支払い履歴がある場合、リクエストの送信後に割り当てが自動的にプロジェクトで受信されます。無料トライアル アカウントはデフォルトでは GPU の割り当てがありません。

プリエンプティブルな GPU と通常の GPU では、別々の割り当てリクエストが必要になります。プリエンプティブルな GPU の割り当てを通常の GPU に使用することはできません。また、割り当てはリージョンごとであるため、割り当てのあるリージョンでインスタンスを作成する必要があります。

リソースが見つからない

症状: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4' was not found

問題: GPU が使用できないリージョンで GPU を使用するインスタンスを作成しようとしています(例: europe-west4-c で P4 GPU を使用するインスタンスを作成しようとしているなど)。

解決策: 必要な GPU に対応しているリージョンを確認するには、Compute Engine の GPU をご覧ください。

プリエンプティブル インスタンス

症状: 割り当てがあるにもかかわらず、UI からプリエンプティブル インスタンスを作成できません。

解決策: 現時点では、Google Cloud Marketplace からプリエンプティブル インスタンスを作成することはできません。CLI を使用する必要があります。新しいインスタンスを設定するときに、必ず --preemptible を追加してください。

SSH ポート転送を使用して JupyterLab に接続できない

症状: SSH ポート転送を使用して JupyterLab に接続すると、インスタンスに接続できません。

問題: 間違った TCP ソケットに接続しようとしている。

解決策:

  • 一部の Linux クライアントでは、localhost が IPv6 ループバック アドレス(::1)に解決されます。ping -c 1 localhost を使用して確認できます。このコマンドで IPv6 アドレスが返された場合は、gcloud compute ssh コマンドで -L 8080:127.0.0.1:8080-L 8080:localhost:8080 ではない)を使用します。

  • ローカル クライアントで(https://localhost:8080 ではなく)http://localhost:8080 に接続していることを確認します。

コミュニティ サポート

Stack Overflow で Deep Learning VM について質問したり、google-dl-platform Google グループに参加して Deep Learning VM についてディスカッションします。

コミュニティ サポートを利用する方法の詳細をご覧ください