Risoluzione dei problemi di archiviazione

Questo documento fornisce indicazioni per la risoluzione dei problemi relativi allo spazio di archiviazione.

Impossibile collegare il volume

Questo problema può verificarsi se un disco virtuale è collegato a una macchina virtuale errata, potrebbe essere dovuto al problema 32727 di Kubernetes 1.12.

L'output di gkectl diagnose cluster ha il seguente aspetto:

Checking cluster object...PASS
Checking machine objects...PASS
Checking control plane pods...PASS
Checking gke-connect pods...PASS
Checking kube-system pods...PASS
Checking gke-system pods...PASS
Checking storage...FAIL
    PersistentVolume pvc-776459c3-d350-11e9-9db8-e297f465bc84: virtual disk "[datastore_nfs] kubevols/kubernetes-dynamic-pvc-776459c3-d350-11e9-9db8-e297f465bc84.vmdk" IS attached to machine "gsl-test-user-9b46dbf9b-9wdj7" but IS NOT listed in the Node.Status
1 storage errors

Uno o più pod sono bloccati nello stato ContainerCreating con avvisi come questo:

Events:
  Type     Reason              Age               From                     Message
  ----     ------              ----              ----                     -------
  Warning  FailedAttachVolume  6s (x6 over 31s)  attachdetach-controller  AttachVolume.Attach failed for volume "pvc-776459c3-d350-11e9-9db8-e297f465bc84" : Failed to add disk 'scsi0:6'.

Per risolvere il problema:

Se un disco virtuale è collegato a una macchina virtuale sbagliata, potresti doverlo scollegare manualmente:

  1. Svuota il nodo. Consulta Svuotare in sicurezza un nodo. Potresti voler includere i flag --ignore-daemonsets e --delete-local-data nel comando kubectl down. .

  2. Spegni la VM.

  3. Modifica il volume della configurazione hardware della VM in vCenter per rimuovere il volume.

  4. Accendi la VM.

  5. Contrassegnare il nodo come non pianificabile

Volume perso

Questo problema può verificarsi se un disco virtuale è stato eliminato in modo permanente. Questo può accadere se un operatore elimina manualmente un disco virtuale o la macchina virtuale a cui è collegato. Se visualizzi un errore "non trovato", correlato al file VMDK, è probabile che il disco virtuale sia stato eliminato definitivamente.

L'output di gkectl diagnose cluster ha il seguente aspetto:

Checking cluster object...PASS
Checking machine objects...PASS
Checking control plane pods...PASS
Checking gke-connect pods...PASS
Checking kube-system pods...PASS
Checking gke-system pods...PASS
Checking storage...FAIL
    PersistentVolume pvc-52161704-d350-11e9-9db8-e297f465bc84: virtual disk "[datastore_nfs] kubevols/kubernetes-dynamic-pvc-52161704-d350-11e9-9db8-e297f465bc84.vmdk" IS NOT found
1 storage errors

Uno o più pod sono bloccati nello stato ContainerCreating:

Events:
  Type     Reason              Age                   From                                    Message
  ----     ------              ----                  ----                                    -------
  Warning  FailedAttachVolume  71s (x28 over 42m)    attachdetach-controller                 AttachVolume.Attach failed for volume "pvc-52161704-d350-11e9-9db8-e297f465bc84" : File []/vmfs/volumes/43416d29-03095e58/kubevols/
  kubernetes-dynamic-pvc-52161704-d350-11e9-9db8-e297f465bc84.vmdk was not found

Per evitare che questo problema si verifichi, gestisci le tue macchine virtuali come descritto in Ridimensionare un cluster utente e Eseguire l'upgrade dei cluster.

Per risolvere il problema, potresti dover eseguire la pulizia manuale delle risorse Kubernetes correlate:

  1. Elimina la PVC che ha fatto riferimento al volume permanente eseguendo kubectl delete pvc [PVC_NAME].

  2. Elimina il pod che ha fatto riferimento alla PVC eseguendo kubectl delete pod [POD_NAME].

  3. Ripeti il passaggio 2. Sì, davvero. Consulta il problema di Kubernetes 74374.

Scollegamento del volume CSI vSphere non riuscito

Questo problema si verifica se il privilegio CNS > Searchable non è stato concesso all'utente vSphere.

Se trovi pod bloccati nella fase ContainerCreating con avvisi FailedAttachVolume, è possibile che lo stato di annullamento di un nodo sia dovuto a un errore.

Per verificare la presenza di errori di scollegamento CSI:

kubectl get volumeattachments -o=custom-columns=NAME:metadata.name,DETACH_ERROR:status.detachError.message

L'output è simile al seguente:

NAME                                                                   DETACH_ERROR
csi-0e80d9be14dc09a49e1997cc17fc69dd8ce58254bd48d0d8e26a554d930a91e5   rpc error: code = Internal desc = QueryVolume failed for volumeID: "57549b5d-0ad3-48a9-aeca-42e64a773469". ServerFaultCode: NoPermission
csi-164d56e3286e954befdf0f5a82d59031dbfd50709c927a0e6ccf21d1fa60192d   
csi-8d9c3d0439f413fa9e176c63f5cc92bd67a33a1b76919d42c20347d52c57435c   
csi-e40d65005bc64c45735e91d7f7e54b2481a2bd41f5df7cc219a2c03608e8e7a8   

Per risolvere il problema, aggiungi il privilegio CNS > Searchable al tuo account utente vcenter. L'operazione di scollegamento viene ripetuta automaticamente fino al completamento dell'operazione.

Il driver CSI vSphere non è supportato sull'host ESXi

Questo problema si verifica quando un host ESXi nel cluster vSphere esegue una versione precedente alla versione ESXi 6.7U3.

L'output di gkectl check-config include questo avviso:

The vSphere CSI driver is not supported on current ESXi host versions.
CSI requires ESXi 6.7U3 or above. See logs for ESXi version details.

Per risolvere questo problema, esegui l'upgrade dei tuoi host ESXi alla versione 6.7U3 o successive.

Creazione del volume CSI non riuscita con NotSupported errore

Questo problema si verifica quando un host ESXi nel cluster vSphere esegue una versione precedente alla versione ESXi 6.7U3.

L'output di kubectl describe pvc include questo errore:

Failed to provision volume with StorageClass : rpc error:
code = Internal desc = Failed to create volume. Error: CnsFault error:
CNS: Failed to create disk.:Fault cause: vmodl.fault.NotSupported

Per risolvere questo problema, esegui l'upgrade dei tuoi host ESXi alla versione 6.7U3 o successive.

Impossibile collegare il volume CSI vSphere

Questo problema noto nel driver open source vSphere CSI si verifica quando un nodo viene arrestato, eliminato o non riuscito.

L'output di kubectl describe pod ha il seguente aspetto:

Events:
 Type    Reason                 From                     Message
 ----    ------             ... ----                     -------
 Warning FailedAttachVolume ... attachdetach-controller  Multi-Attach error for volume
                                                         "pvc-xxxxx"
                                                         Volume is already exclusively attached to one
                                                         node and can't be attached to another

Per risolvere il problema:

  1. Annota il nome di PersistentVolumeClaim (PVC) nell'output precedente e trova i VolumeAttachments associati alla PVC. Ad esempio:

    kubectl get volumeattachments | grep pvc-xxxxx
    

    L'output mostra i nomi degli oggetti VolumeAttachments. Ad esempio:

    csi-yyyyy   csi.vsphere.vmware.com   pvc-xxxxx   node-zzzzz ...
    
  2. Descrivi gli allegati del volume. Ad esempio:

    kubectl describe volumeattachments csi-yyyyy | grep "Deletion Timestamp"
    

    Prendi nota del timestamp di eliminazione nell'output:

    Deletion Timestamp:   2021-03-10T22:14:58Z
    
  3. Attendi il tempo specificato dal timestamp di eliminazione, quindi forza l'eliminazione dell'allegato di volume. Per farlo, modifica l'oggetto VolumeAttachment e elimina il finalizzatore. Ad esempio:

    kubectl edit volumeattachment csi-yyyyy
     Finalizers:
      external-attacher/csi-vsphere-vmware-com