SAP 高可用性構成のトラブルシューティング

Google Cloud上の SAP 高可用性構成で問題が発生した場合、その根本原因はクラスタリングソフトウェア、SAP ソフトウェア、 Google Cloud インフラストラクチャ、またはこれらの組み合わせに存在する可能性があります。

Cloud Logging で Pacemaker ログを分析する

次の動画では、Cloud Logging を使用して Google Cloud上の SAP の高可用性構成のトラブルシューティングを行う方法を説明します。

Linux クラスタ内の障害ノードがフェイルオーバー後に正しく再起動しない

Linux 高可用性クラスタが fence_gce フェンスエージェントを使用していて、フェンシングされた VM がフェイルオーバー後にクラスタに再参加できない場合は、フェンシングされた VM の再起動時に Corosync ソフトウェアの起動を遅らせる必要があります。

問題

fence_gce エージェントは、フェイルオーバー時に障害のある Compute Engine VM をフェンシングします。これにより、Pacemaker がフェンスアクションを完了と登録する前に、クラスタが再起動して再接続されます。フェンスアクションは登録されていないため、再起動された VM は Pacemaker サービスと Corosync サービスをシャットダウンし、クラスタから離れます。

診断

これが問題かどうか確認するには:

クラスタが fence_gce エージェントを使用していることを確認します。

RHEL

pcs config

SLES

crm config show

フェンスエージェントの定義には fence_gce が含まれています。

RHEL

Stonith Devices:
Resource: STONITH-example-ha-vm1 (class=stonith type=fence_gce)
Attributes: port=example-ha-vm1 project=example-project-123456 zone=us-central1-a
Operations: monitor interval=300s timeout=120s (STONITH-example-ha-vm1-monitor-interval-60s)
Resource: STONITH-example-ha-vm2 (class=stonith type=fence_gce)
Attributes: port=example-ha-vm2 project=example-project-123456 zone=us-central1-c
Operations: monitor interval=300s timeout=120s (STONITH-example-ha-vm2-monitor-interval-60s)

SLES

primitive fence-example-ha-vm1 stonith:fence_gce \
 op monitor interval=300s timeout=120s \
 op start interval=0 timeout=60s \
 params port=example-ha-vm1 zone=us-central1-a project=example-project-123456
primitive fence-example-ha-vm2 stonith:fence_gce \
 op monitor interval=300s timeout=120s \
 op start interval=0 timeout=60s \
 params port=example-ha-vm2 zone=us-central1-c project=example-project-123456

システムログで次のメッセージを確認します。

DATESTAMP> node2 stonith-ng[1106]:  notice: Operation reboot of node2 by node1 for stonith_admin.1366@node1.c3382af8: OK
DATESTAMP> node2 stonith-ng[1106]:   error: stonith_construct_reply: Triggered assert at commands.c:2343 : request != NULL
DATESTAMP> node2 stonith-ng[1106]: warning: Can't create a sane reply
DATESTAMP> node2 crmd[1110]:    crit: We were allegedly just fenced by node1 for node1!
DATESTAMP> node2 pacemakerd[1055]: warning: Shutting cluster down because crmd[1110] had fatal failure

解決策

Corosync の起動を遅らせるように両方のクラスタノードのオペレーティングシステムを構成し、フェンスアクションで新しいプライマリノードの Pacemaker が完了登録を行う時間を確保します。また、遅延に対応するため、Pacemaker の再起動タイムアウト値を設定します。

Corosync の遅延起動を構成するには:

クラスタをメンテナンスモードにします。

RHEL

pcs property set maintenance-mode=true

SLES

crm configure property maintenance-mode="true"

root として、各クラスタノードで Corosync の起動遅延を設定します。
1. systemd ドロップインファイルを作成します。
```
systemctl edit corosync.service
```
2. このファイルに次の行を追加します。
```
[Service]
ExecStartPre=/bin/sleep 60
```
3. ファイルを保存し、エディタを終了します。
4. systemd マネージャー構成を再読み込みします。
```
systemctl daemon-reload
```
ルートとしたいずれかのクラスタノードで、再起動するまでの Pacemaker のタイムアウト値が両方のフェンスエージェントに設定されていることを確認します。
1. pcmk_reboot_timeout の値を確認します。
```
crm_resource --resource FENCE_AGENT_NAME --get-parameter=pcmk_reboot_timeout
```
  FENCE_AGENT_NAME は、フェンスエージェントの名前に置き換えます。
2. pcmk_reboot_timeout パラメータが見つからない場合、またはその値が 300 より小さい値に設定されている場合は、両方のフェンスエージェントで値を設定します。
```
crm_resource --resource FENCE_AGENT_NAME --set-parameter=pcmk_reboot_timeout --parameter-value=300
```
  FENCE_AGENT_NAME は、フェンスエージェントの名前に置き換えます。
  
  pcmk_reboot_timeout の値は、以下の合計値よりも大きい値とする必要があります。
  - Corosync token のタイムアウト
  - デフォルトでは、Corosync コンセンサスのタイムアウトは token × 1.2 です。
  - 遅延属性を含め、再起動が完了するまでの時間の長さ。
  Google Cloudの場合、ほとんどのクラスタで 300 秒あれば十分です。
3. 新しい pcmk_reboot_timeout 値を確認します。
```
crm_resource --resource FENCE_AGENT_NAME --get-parameter=pcmk_reboot_timeout
```
  FENCE_AGENT_NAME は、フェンスエージェントの名前に置き換えます。

クラスタのメンテナンスモードを終了します。

RHEL

pcs property set maintenance-mode=false

SLES

crm configure property maintenance-mode="false"

特定のノードを優先する意図しないノードアフィニティ

クラスタコマンドを使用して高可用性クラスタ内のリソースを手動で移動すると、特定のノードを優先するように自動アフィニティまたはクライアントが設定されます。

問題

SAP HANA または SAP NetWeaver の Linux Pacemaker 高可用性クラスタで、SAP HANA システムや SAP NetWeaver セントラルサービスなどのリソースが特定のクラスタノードでのみ実行され、ノード障害イベント中に想定どおりにフェイルオーバーされません。

その結果、次のような問題が発生する可能性があります。

リソースのクラスタノードへの Pacemaker コマンド（move）を発行して SAP NetWeaver ASCS サービスのフェイルオーバーをトリガーすると、リソースは開始されず、ステータス stopped が表示されます。
一方のクラスタノードに standby コマンドを実行して、すべてのリソースをもう一方のノードに強制的に移動しても、リソースが開始しません。

診断

Pacemaker ログで、特定のリソースが稼働できないことを示すメッセージを確認します。次に例を示します。
```
2021-05-24 21:39:58 node_1 pacemaker-schedulerd (native_color) info:
 Resource NW1-ASCS01 cannot run anywhere
```
Pacemaker ロケーション制約の構成を確認して、特定のクラスタノードでのリソースの実行を妨げる可能性のある制約を特定します。

Pacemaker ロケーション制約の構成を確認する手順は次のとおりです。
1. ロケーション制約を表示します。
```
cibadmin --query --scope constraints | grep rsc_location
```
2. ロケーション制約を確認します。
  - 明示的なロケーション制約: スコアが INFINITY（ノードを優先）または -INFINITY（ノードを回避）のロケーション制約を見つけます。次に例を示します。
```
<rsc_location id="loc-constraint" rsc="NW1-ASCS01" score="INFINITY" node="nw-ha-1"/>
```
    フェンスエージェント以外に、スコアが INFINITY または -INFINITY のロケーション制約があってはなりません。フェンスエージェントは、フェンシングターゲットであるノードでの動作を防ぐため、すべての HA クラスタでスコアが -INFINITY のロケーション制約に定義されています。
  - 暗黙的なロケーション制約: Pacemaker コマンドを実行してクラスタをクラスタノードに移動するか、クラスタノードでのリソースの実行を禁止すると、接頭辞が cli-ban または cli-prefer の暗黙的なロケーション制約が制約 ID に追加されます。次に例を示します。
```
<rsc_location id="cli-prefer-NW1-ASCS01" rsc="NW1-ASCS01" role="Started" node="nw-ha-2" score="INFINITY"/>
```

解決策

ロケーション制約が、次のデプロイガイドで説明されているように指定されていることを確認します。
明示的なロケーション制約を修正するには、ロケーション制約を削除します。
RHEL
```
pcs constraint remove RESOURCE_LOCATION_ID
```
SLES
```
crm configure delete RESOURCE_LOCATION_ID
```
RESOURCE_LOCATION_ID は、ロケーション制約 ID に置き換えます。
暗黙的なロケーション制約を修正するには、指定したリソースで定義されているすべての制約を削除します。

リソースの移動または禁止に使用するコマンドを実行するたびに、次のコマンドを実行して、すべての制約を削除します。
RHEL
```
pcs resource clear RESOURCE_NAME
```
SLES
```
crm resource clear RESOURCE_NAME
```
RESOURCE_NAME は、移動するリソースの名前に置き換えます。

フェンスエージェントのオペレーションエラー

フェンスエージェントからクラスタのエラーステータスが報告されました。

問題

SAP HANA または SAP NetWeaver の Linux Pacemaker 高可用性クラスタで、フェンスエージェントがクラスタのエラーステータスを報告しました。例:

Failed Resource Actions:
   STONITH-ha-node-01_monitor_300000 on ha-node-02 'unknown error' (1): call=153, status=Timed Out, exitreason='',  last-rc-change='Mon Dec 21 23:40:47 2023', queued=0ms, exec=60003ms

診断

SAP HANA または SAP NetWeaver 高可用性クラスタにデプロイされたフェンスエージェントは、Compute Engine API サーバーに定期的にアクセスして、フェンスターゲットインスタンスのステータスを確認します。API 呼び出しのレスポンスに一時的な遅延が発生したり、ネットワークの中断が発生した場合、フェンスエージェントのモニタリングオペレーションが失敗するか、タイムアウトする可能性があります。

フェンスエージェントのステータスを確認するには、次のコマンドを実行します。

RHEL

pcs status

SLES

crm status

フェンスエージェントのステータスが stopped の場合、以下の解決策のいずれかを行ってエラーを解決します。

フェンスエージェントのオペレーションエラーでフェンスエージェントが停止する可能性がありますが、Pacemaker はフェンシングイベントで停止ディレクティブを使用してフェンスエージェントを呼び出します。

解決策

フェンスエージェントのステータスが stopped の場合は、次のいずれかを行います。

次のコマンドを実行して、障害カウントを手動でリセットし、フェンスエージェントを再起動します。
RHEL
```
pcs resource cleanup FENCE_AGENT_NAME
```
SLES
```
crm resource cleanup FENCE_AGENT_NAME
```
FENCE_AGENT_NAME は、フェンスエージェントの名前に置き換えます。
フェンスエージェントのオペレーションエラーを自動的に削除するには、failure-timeout パラメータを構成します。

failure-timeout パラメータは、指定された期間が経過すると障害カウントをリセットし、オペレーションエラーをすべてクリアします。このパラメータを適用するために、クラスタを再起動したり、クラスタをメンテナンスモードにする必要はありません。

failure-timeout パラメータを構成するには、次のコマンドを実行します。
```
crm_resource --meta --resource FENCE_AGENT_NAME --set-parameter failure-timeout --parameter-value DURATION
```
次のように置き換えます。
- FENCE_AGENT_NAME: フェンスエージェントの名前。
- DURATION: 最後のオペレーションの失敗後、障害カウントがリセットされてフェンスエージェントが再起動されるまでの時間。

フェンスエージェント `gcpstonith` のサポート終了

構成でフェンスエージェント gcpstonith が有効になっています。このエージェントはサポートが終了しており、カスタマーケアから fence_gce への切り替えの必要性をお知らせしています。

問題

SUSE Linux 上の SAP HANA 用の Linux Pacemaker 高可用性クラスタで、フェンスエージェント gcpstonith が使用されています。例:

 # crm status | grep gcpstonith
   * STONITH-hana-vm1   (stonith:external/gcpstonith):   Started hana-vm2
   * STONITH-hana-vm2   (stonith:external/gcpstonith):   Started hana-vm1

診断

SAP HANA 高可用性クラスタにデプロイされたフェンスエージェントを更新して、OS バンドルの fence_gce フェンスエージェントを代わりに使用する必要があります。gcpstonith エージェントスクリプトは以前のシステムで提供されていましたが、fence_gce に置き換えられました。fence_gce は、fence-agents SUSE Linux パッケージの一部として提供されます。gcpstonith は、SUSE Linux HANA デプロイメントの一部としてのみ提供されていました。

解決策

SUSE Linux の gcpstonith から移行する手順は次のとおりです。

オペレーティングシステムに固有の次の追加パッケージをインストールします。
- SLES 15 の場合: python3-oauth2client、python3-google-api-python-client
- SLES 12 の場合: python-google-api-python-client、python-oauth2client、python-oauth2client-gce
これらのパッケージをオペレーティングシステムにインストールするには、次のコマンドを使用します。
SLES 15
```
zypper in -y python3-oauth2client python3-google-api-python-client
```
SLES 12
```
zypper in -y python-google-api-python-client python-oauth2client python-oauth2client-gce
```
fence-agents パッケージを更新して、最新バージョンがインストールされている状態にします。
```
zypper update -y fence-agents
```
クラスタをメンテナンスモードにします。
```
crm configure property maintenance-mode=true
```
クラスタからすべてのフェンシングデバイスを削除します。最後のフェンシングデバイスを削除するときに、クラスタに STONITH リソースが定義されていないことを確認するよう求められる場合があります。
```
crm configure delete FENCING_RESOURCE_PRIMARY
```
```
crm configure delete FENCING_RESOURCE_SECONDARY
```

プライマリインスタンスのフェンシングデバイスを再作成します。

crm configure primitive FENCING_RESOURCE_PRIMARY stonith:fence_gce \
 op monitor interval="300s" timeout="120s" \
 op start interval="0" timeout="60s" \
 params port="PRIMARY_INSTANCE_NAME" zone="PRIMARY_ZONE" \
 project="PROJECT_ID" \
 pcmk_reboot_timeout=300 pcmk_monitor_retries=4 pcmk_delay_max=30

セカンダリインスタンスのフェンシングデバイスを再作成します。

crm configure primitive FENCING_RESOURCE_SECONDARY stonith:fence_gce \
 op monitor interval="300s" timeout="120s" \
 op start interval="0" timeout="60s" \
 params port="SECONDARY_INSTANCE_NAME" zone="SECONDARY_ZONE" \
 project="PROJECT_ID" \
 pcmk_reboot_timeout=300 pcmk_monitor_retries=4

ロケーションの制約を設定します。

crm configure location FENCING_LOCATION_NAME_PRIMARY \
 FENCING_RESOURCE_PRIMARY -inf: "PRIMARY_INSTANCE_NAME"

crm configure location FENCING_LOCATION_NAME_SECONDARY \
 FENCING_RESOURCE_SECONDARY -inf: "SECONDARY_INSTANCE_NAME"

クラスタのメンテナンスモードを終了します。
```
crm configure property maintenance-mode=false
```

構成を確認します。

crm config show related:FENCING_RESOURCE_PRIMARY

クラスタのステータスを確認します。

# crm status | grep fence_gce
  STONITH-hana-vm1   (stonith:fence_gce):   Started hana-vm2
  STONITH-hana-vm2   (stonith:fence_gce):   Started hana-vm1

リソースエージェントが停止している

リソースエージェントの起動に失敗したため、ステータスが Stopped のままになっています。

問題

SAP HANA または SAP NetWeaver の Linux Pacemaker 高可用性クラスタで、リソースエージェントがクラスタのエラーステータスを報告しました。次に例を示します。

Failed Resource Actions:
   rsc_SAPHana_DV0_HDB00_start_0 on ha-node-02 'error' (1): call=91, status='complete', last-rc-change='Wed Oct 18 18:00:31 2023', queued=0ms, exec=19010ms

診断

実行中のリソースエージェントが失敗した場合、Pacemaker はエージェントを停止して再起動しようとします。なんらかの理由で開始オペレーションが失敗した場合、Pacemaker はリソースの障害カウントを INFINITY に設定し、別のノードでエージェントを起動しようとします。いずれかのノードでリソースエージェントが起動に失敗した場合、リソースエージェントは Stopped ステータスのままになります。

リソースエージェントのステータスを確認するには、次のコマンドを実行します。

RHEL

pcs status

SLES

crm status

次の例は、SAP HANA のノード hana-b 上でステータスが Stopped のリソースエージェントを示しています。

Full List of Resources:
  * STONITH-hana-a        (stonith:fence_gce):   Started hana-b
  * STONITH-hana-b        (stonith:fence_gce):   Started hana-a
  * Resource Group: g-primary:
    * rsc_vip_int-primary       (ocf::heartbeat:IPaddr2):        Started hana-a
    * rsc_vip_hc-primary        (ocf::heartbeat:anything):       Started hana-a
  * Clone Set: cln_SAPHanaTopology_DV0_HDB00 [rsc_SAPHanaTopology_DV0_HDB00]:
    * Started: [ hana-a hana-b ]
  * Clone Set: msl_SAPHana_DV0_HDB00 [rsc_SAPHana_DV0_HDB00] (promotable):
    * Masters: [ hana-a ]
    * Stopped: [ hana-b ]
  * STONITH-scaleup-majority    (stonith:fence_gce):   Started hana-b

解決策

リソースエージェントのステータスが Stopped の場合は、次の操作を行います。

障害カウントをリセットして、リソースエージェントを手動で起動します。
RHEL
```
pcs resource cleanup RESOURCE_AGENT_NAME
```
SLES
```
crm resource cleanup RESOURCE_AGENT_NAME
```
RESOURCE_AGENT_NAME は、リソースエージェントの名前に置き換えます。例: rsc_SAPHana_DV0_HDB00
リソースエージェントのステータスが Started になっていることを確認します。
```
crm_mon
```
それでもリソースエージェントが起動しない場合は、関連する診断情報を収集して、サポートにお問い合わせください。

仮想 IP のローカルネットワークルートに起因する VM 間の通信障害

仮想 IP のローカルネットワークルートにより、バックエンド VM と他の VM 間のネットワークトラフィックが失敗します。

問題

VM が内部パススルーネットワークロードバランサの一部である場合、ILB 仮想 IP（VIP）へのバックエンドネットワーク通信はローカルとしてルーティングされ、ループバックデバイスによって処理されます。

このループバック動作により、バックエンド VM が ILB の VIP を正常に使用して、ILB を使用して他のバックエンド VM でホストされている可能性のあるサービスに到達できなくなり、通信エラーが発生します。

たとえば、ロードバランサのバックエンドとして構成された SAP Netweaver HA クラスタ内の ASCS と ERS 間で通信エラーが発生します。

このローカルルーティングでは、トラフィックが目的の VM に到達できないため、telnet テストは Connection Refused エラーになります。

   [root@test-server-ha ~]# telnet IP_ADDRESS_OF_ILB PORT_NUMBER
   Trying IP_ADDRESS_OF_ILB...
   telnet: connect to address IP_ADDRESS_OF_ILB: Connection refused

診断

前提条件:

影響を受ける VM は、ロードバランサのバックエンドとして構成された非マネージドインスタンスグループのメンバーとして一覧表示されます。

内部ロードバランサ（ILB）内のバックエンド VM が ILB の仮想 IP（VIP）への通信を開始すると、特定のルーティング動作が発生します。

VIP は eth0 などの標準ネットワークインターフェースで構成され、ローカルルーティングテーブルに登録されていますが、カーネルはループバックインターフェース lo を使用して、このローカル VIP 宛てのパケットをルーティングします。この内部ループバックにより、パケットが送信元の VM から送信されず、ILB によって処理されることがなくなります。

個々の IP を使用してバックエンド VM 間の直接通信は機能しますが、このループバック動作により、バックエンド VM が ILB の VIP を正常に使用し、内部パススルーネットワークロードバランサを介して他のバックエンド VM でホストされているサービスに到達できなくなります。

   [root@test-server-ha ~]# ip route show table local
   local IP_ADDRESS_OF_ILB dev eth0 proto 66 kernel scope host src IP_ADDRESS_OF_ILB
   local IP_ADDRESS_OF_THE_CURRENT_NODE dev eth0 proto kernel scope host src IP_ADDRESS_OF_THE_CURRENT_NODE
   local IP_ADDRESS_OF_THE_OTHER_NODE dev eth0 proto kernel scope host src IP_ADDRESS_OF_THE_OTHER_NODE
   broadcast IP_ADDRESS dev lo proto kernel scope link src IP_ADDRESS
   local IP_ADDRESS dev lo proto kernel scope host src IP_ADDRESS
   broadcast IP_ADDRESS dev lo proto kernel scope link src IP_ADDRESS

   ip route get IP_ADDRESS_OF_ILB

このコマンドの出力には、ループバックインターフェース lo が表示されます。

   [root@test-server-ha ~]# ip route get IP_ADDRESS_OF_ILB
   local IP_ADDRESS_OF_ILB dev lo src IP_ADDRESS_OF_ILB uid 0
   cache <local>

解決策

VM 間のバックエンド通信を有効にするには、 Google Cloudで提供されているすべての Linux 公開イメージの Linux ゲスト環境に含まれる google-guest-agent の構成を変更します。

ロードバランサのバックエンド通信を有効にするには、クラスタの一部である各 VM で次の操作を行います。

エージェントを停止します。
```
sudo service google-guest-agent stop
```
編集用に /etc/default/instance_configs.cfg ファイルを開くか、作成します。
```
sudo vi /etc/default/instance_configs.cfg
```
以下のように、/etc/default/instance_configs.cfg ファイルで次の構成プロパティを指定します。セクションが存在しない場合は作成します。特に、target_instance_ips と ip_forwarding の両方のプロパティが false に設定されていることを確認します。
```
[IpForwarding]
ethernet_proto_id = 66
ip_aliases = true
target_instance_ips = false

[NetworkInterfaces]
dhclient_script = /sbin/google-dhclient-script
dhcp_command =
ip_forwarding = false
setup = true
```
ゲストエージェントサービスを開始します。
```
sudo service google-guest-agent start
```

変更を適用するには、VM を再起動するか、次の手順でローカルルートを削除します。

トラフィックを返すローカルルートを削除します。
```
sudo ip route del table local $(ip route show table local | grep "proto 66" | awk '{print $2}') dev eth0
```
上記のコマンドは、ローカルルーティングテーブルから VIP を削除するためにパイプで接続された一連の Linux コマンドです。それぞれについて説明します。

Google では、以下の方法で IP アドレスを特定します。
```
ip route show table local | grep "proto 66" | awk '{print $2}'
```
次に、実際の削除コマンドにパイプで渡します。
```
ip route del table local
```
google ゲストエージェントを再起動します。
```
systemctl google-guest-agent restart
```

この変更はサービスに影響しません。google-guest-agent を再起動すると、新しいネットワークルートが再作成され、ネットワークトラフィックに、ループバックデバイスではなく eth0 を使用して VIP にトラフィックを送信するように指示します。

変更を確認するには、次のようにします。

   ip route get IP_ADDRESS_OF_ILB

このコマンドの出力には、ループバックインターフェース lo ではなく、eth0 などのネットワークインターフェースが表示されている必要があります。

   [root@test-server-ha ~]# ip route get IP_ADDRESS_OF_ILB
   IP_ADDRESS_OF_ILB via IP_ADDRESS_OF_ILB dev eth0 src IP_ADDRESS_OF_ILB uid 0
   cache

telnet テストを試行します。

   [root@test-server-ha ~]# telnet IP_ADDRESS_OF_ILB PORT_NUMBER
   Trying IP_ADDRESS_OF_ILB...
   Connected to IP_ADDRESS_OF_ILB.
   Escape character is '^]'.

SAP 高可用性構成のトラブルシューティング コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Cloud Logging で Pacemaker ログを分析する

Linux クラスタ内の障害ノードがフェイルオーバー後に正しく再起動しない

問題

診断

RHEL

SLES

RHEL

SLES

解決策

RHEL

SLES

RHEL

SLES

特定のノードを優先する意図しないノード アフィニティ

問題

診断

解決策

RHEL

SLES

RHEL

SLES

フェンス エージェントのオペレーション エラー

問題

診断

RHEL

SLES

解決策

RHEL

SLES

フェンス エージェント gcpstonith のサポート終了

問題

診断

解決策

SLES 15

SLES 12

リソース エージェントが停止している

問題

診断

RHEL

SLES

解決策

RHEL

SLES

仮想 IP のローカル ネットワーク ルートに起因する VM 間の通信障害

問題

診断

解決策

変更を適用するには、VM を再起動するか、次の手順でローカルルートを削除します。

変更を確認するには、次のようにします。

SAP 高可用性構成のトラブルシューティング

特定のノードを優先する意図しないノードアフィニティ

フェンスエージェントのオペレーションエラー

フェンスエージェント `gcpstonith` のサポート終了

リソースエージェントが停止している

仮想 IP のローカルネットワークルートに起因する VM 間の通信障害