このページは Cloud Translation API によって翻訳されました。

NVMe ディスクのトラブルシューティング

このドキュメントでは、NonVolatile Memory express（NVMe）インターフェースを備えたディスクの使用時に発生する可能性のあるエラーの一覧を示します。

ローカル SSD と永続ディスク（Persistent Disk または Google Cloud Hyperdisk）には NVMe インターフェースを使用できます。Tau T2A、M3、C3、C3D、H3 など、最新のマシンシリーズのみが Persistent Disk に NVMe インターフェースを使用します。Confidential VMs も Persistent Disk に NVMe を使用します。他のすべての Compute Engine マシンシリーズは、永続ディスクの SCSI ディスクインターフェースを使用します。

I/O オペレーションタイムアウトエラー

I/O タイムアウトエラーが発生する場合、レイテンシが NVMe デバイスに送信される I/O オペレーションのデフォルトのタイムアウトパラメータを超過している可能性があります。

エラーメッセージ:

[1369407.045521] nvme nvme0: I/O 252 QID 2 timeout, aborting
[1369407.050941] nvme nvme0: I/O 253 QID 2 timeout, aborting
[1369407.056354] nvme nvme0: I/O 254 QID 2 timeout, aborting
[1369407.061766] nvme nvme0: I/O 255 QID 2 timeout, aborting
[1369407.067168] nvme nvme0: I/O 256 QID 2 timeout, aborting
[1369407.072583] nvme nvme0: I/O 257 QID 2 timeout, aborting
[1369407.077987] nvme nvme0: I/O 258 QID 2 timeout, aborting
[1369407.083395] nvme nvme0: I/O 259 QID 2 timeout, aborting
[1369407.088802] nvme nvme0: I/O 260 QID 2 timeout, aborting
...

解決策:

この問題を解決するには、タイムアウトパラメータの値を引き上げます。

タイムアウトパラメータの現在の値を表示します。
1. 永続ディスクまたはローカル SSD ボリュームで使用されている NVMe コントローラを確定します。
```
ls -l /dev/disk/by-id
```
2. ディスクの秒単位で指定された io_timeout 設定を表示します。
```
cat /sys/class/nvme/CONTROLLER_ID/NAMESPACE/queue/io_timeout
```
  次のように置き換えます。
  - CONTROLLER_ID: NVMe ディスクコントローラの ID（例えば、nvme1）
  - NAMESPACE: NVMe ディスクの名前空間（例えば、nvme1n1）
  NVMe を使用する単一ディスクが 1 つだけの場合は、次のコマンドを使用します。
```
cat /sys/class/nvme/nvme0/nvme0n1/queue/io_timeout
```
NVMe デバイスに送信される I/O オペレーションのタイムアウトパラメータの値を引き上げるには、次の行を /lib/udev/rules.d/65-gce-disk-naming.rules ファイルに追加してから、VM を再起動します。
```
KERNEL=="nvme*n*", ENV{DEVTYPE}=="disk", ATTRS{model}=="nvme_card-pd", ATTR{queue/io_timeout}="4294967295"
```

切断されたディスクが Compute インスタンスのオペレーティングシステムに引き続き表示される

Linux カーネルバージョン 6.0～6.2 を使用する VM では、Compute Engine API メソッド instances.detachDisk または gcloud compute instances detach-disk コマンドを含むオペレーションが想定どおりに機能しない場合があります。 Google Cloud コンソールではデバイスが削除されたものとして表示され、コンピューティングインスタンスのメタデータ（compute disks describe コマンド）にも、デバイスが削除されたものとして表示されます。しかし、ゲストオペレーティングシステムには、デバイスのマウントポイント、および udev ルールによって作成されたシンボリックリンクが引き続き表示されます。

エラーメッセージ:

VM 上の切断されたディスクから読み取ろうとすると、I/O エラーが発生します。

sudo head /dev/nvme0n3

head: error reading '/dev/nvme0n3': Input/output error

問題:

Linux 6.0～6.2 カーネルを使用するが、NVMe 修正プログラムのバックポートを含まないオペレーティングシステムイメージは、NVMe ディスクの切断を認識しません。

解決策:

VM を再起動して、ディスクの削除プロセスを完了します。

この問題を回避するには、この問題が発生しない Linux カーネルバージョンのオペレーティングシステムを使用します。

5.19 以前
6.3 以降

ゲスト OS で uname -r コマンドを使用すると、Linux カーネルバージョンを確認できます。

次のステップ

Persistent Disk について学習する。
ローカル SSD について学習する。
パフォーマンス要件を満たすようにディスクを構成する。
シンボリックリンクについて学習する。

NVMe ディスクのトラブルシューティング

I/O オペレーション タイムアウト エラー

切断されたディスクが Compute インスタンスのオペレーティング システムに引き続き表示される

次のステップ

I/O オペレーションタイムアウトエラー

切断されたディスクが Compute インスタンスのオペレーティングシステムに引き続き表示される