排查 Filestore 实例响应错误

以下部分介绍了实例可能无响应的场景,并提供了有助于解决此问题的步骤。

Filestore 实例不响应 pingtraceroute 请求

Filestore 实例不响应 pingtraceroute 请求,因为 Filestore 不允许使用 ICMP。

如需测试与 Filestore 实例的连接,您可以通过客户端运行 showmount

sudo showmount -e filestore-ip

Filestore 实例使用其导出的文件系统进行响应,例如:

Export list for 10.139.19.98:
/vol1 192.168.0.0/16,172.16.0.0/12,10.0.0.0/8

您还可以通过运行以下命令来检查客户端是否可以访问 Filestore 的 RPC 信息:

sudo rpcinfo -p <filestore-ip>

响应如下所示:

program vers proto   port  service
 100000    4   tcp    111  portmapper
 100000    3   tcp    111  portmapper
 100000    2   tcp    111  portmapper
 100000    4   udp    111  portmapper
 100000    3   udp    111  portmapper
 100000    2   udp    111  portmapper
 100024    1   udp   2046  status
 100024    1   tcp   2046  status
 100003    3   tcp   2049  nfs
 100227    3   tcp   2049
 100021    1   udp   4045  nlockmgr
 100021    3   udp   4045  nlockmgr
 100021    4   udp   4045  nlockmgr
 100021    1   tcp   4045  nlockmgr
 100021    3   tcp   4045  nlockmgr
 100021    4   tcp   4045  nlockmgr
 100005    3   udp   2050  mountd
 100005    3   tcp   2050  mountd

计划性维护

一段时间后,Filestore 会在几分钟内无响应,然后由于计划性维护事件而再次做出响应。如需了解 Filestore 的服务等级协议 (SLA),请参阅服务等级协议 (SLA) 页面。

Filestore 不支持客户定义的维护期。客户也无法使用 Filestore 的维护期安排功能。

实例在仍装载到客户端的情况下被删除

如果文件操作或 unix 命令(如 dfls 或任何读/写操作)停止响应,则 Filestore 实例可能在仍装载到客户端的情况下被删除。

检查实例是否仍然存在:

    gcloud filestore instances list

如果该实例不再列出,您可以使用与被删除实例相同的 IP 地址和文件共享名称创建新实例,从而恢复控制。创建实例后,无响应的操作会退出并报错。如果您不需要 Filestore 实例,则可以卸载文件共享并将其删除。

为防止将来再发生类似情况,在删除 Filestore 实例之前,请务必先将其卸载。

实例显示 REPAIRING 状态

Filestore 实例因用户无法控制的内部原因而处于运行状况不佳的状态,并且正在自动修复自身。在此期间,实例不可用,您无需执行任何进一步操作。

实例显示 UNAVAILABLE 状态

如果检测到 Cloud KMS 密钥状态发生变化,实例会自动停止传送数据。下面是一些示例:

  • 停用密钥或密钥版本。
  • 销毁密钥或密钥版本。
  • 修改密钥的权限。

如需了解详情,请参阅使用 CMEK 加密数据