Questa pagina è stata tradotta dall'API Cloud Translation.

Guida alla risoluzione dei problemi di Cassandra

Stai visualizzando la documentazione di Apigee e Apigee hybrid.
Non esiste una documentazione Apigee Edge equivalente per questo argomento.

Questo argomento descrive i passaggi che puoi eseguire per risolvere e correggere i problemi relativi al datastore Cassandra. Cassandra è un datastore persistente che viene eseguito nel componente cassandra dell'architettura di runtime ibrido. Vedi anche Panoramica configurazione del servizio di runtime.

I pod di Cassandra sono bloccati nello stato di rilascio

Sintomo

Dopo aver tentato di eseguire un aggiornamento dei pod Cassandra, il datastore segnala di essere bloccato nello stato di rilascio.

Messaggio di errore

Quando utilizzi kubectl per visualizzare gli stati dei pod, vedrai che uno o più pod Cassandra sono bloccati nello stato di rilascio:

Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Ack 57s (x7 over 24h) apigee-datastore release started

Cause possibili

Un pod bloccato nello stato di rilascio può essere causato da quanto segue:

Causa	Descrizione
Modifiche alla capacità di archiviazione	Sono stati eseguiti passaggi per modificare la capacità di archiviazione nel file `override.yaml`.
Altre modifiche alla configurazione	Sono stati apportati aggiornamenti alle proprietà di Cassandra nel file `override.yaml`, ma le modifiche non sono state applicate.

Modifiche alla capacità di archiviazione

Diagnosi

Utilizza kubectl per visualizzare lo stato attuale del pod datastore apigee:
```
kubectl get apigeeds -n apigee
```
```
NAME STATE AGE
default releasing 122d
```
Controlla se sono state apportate modifiche al file override.yaml:

Utilizzando il sistema di controllo delle versioni, confronta la versione precedente del file override.yaml con la versione attuale:
```
diff OVERRIDES_BEFORE.yaml OVERRIDES_AFTER.yaml
```
L'output di una differenza in override.yaml potrebbe mostrare il possibile problema con le dimensioni della capacità di archiviazione. Ad esempio:
```
# Overrides.yaml  before:
cassandra:
   storage:
      capacity: 500Gi

# Overrides.yaml after:
cassandra:
   storage:
      capacity: 100Gi
```
Se è stata eseguita un'operazione per modificare la capacità di archiviazione in cui sono stati saltati dei passaggi ed è stato applicato direttamente un nuovo override.yaml, questo può causare lo stato di rilascio del datastore.

Controlla statefulset per assicurarti che ce ne sia uno per apigee-cassandra-default:

kubectl describe sts -n apigee

L'output è simile al seguente:

Name:               apigee-cassandra-default
Namespace:          apigee
CreationTimestamp:  Tue, 18 Jul 2023 00:40:57 +0000
Selector:           app=apigee-cassandra,name=default
Labels:             apigee.cloud.google.com.revision=v1-2cc098050836c6b4
                    apigee.cloud.google.com.version=v1
                    apigee.cloud.google.com/platform=apigee
                    app=apigee-cassandra
                    name=default
Annotations:        <none>
Replicas:           3 desired | 3 total
Update Strategy:    RollingUpdate
  Partition:        0
Pods Status:        3 Running / 0 Waiting / 0 Succeeded / 0 Failed
Pod Template:
  Labels:       apigee.cloud.google.com/apigee_servicename=production
                apigee.cloud.google.com/billing_type=subscription
                apigee.cloud.google.com/platform=apigee
                app=apigee-cassandra
                name=default
                revision=v1
                runtime_type=hybrid
  Annotations:  apigee.cloud.google.com/pod-template-spec-hash: 2cc098050836c6b4
                prometheus.io/path: /metrics
                prometheus.io/port: 7070
                prometheus.io/scheme: https
                prometheus.io/scrape: true
  Containers:
   apigee-cassandra:
    Image:       gcr.io/apigee-release/hybrid/apigee-hybrid-cassandra:1.10.1
    Ports:       7000/TCP, 7001/TCP, 7199/TCP, 9042/TCP, 8778/TCP
    Host Ports:  7000/TCP, 7001/TCP, 7199/TCP, 9042/TCP, 8778/TCP
    Requests:
      cpu:      500m
      memory:   1Gi
    Readiness:  exec [/bin/bash -c /opt/apigee/ready-probe.sh] delay=0s timeout=5s period=10s #success=1 #failure=2
    Environment:
      POD_NAME:                  (v1:metadata.name)
      POD_IP:                    (v1:status.podIP)
      MAX_HEAP_SIZE:            512M
      HEAP_NEWSIZE:             100M
      CASSANDRA_SEEDS:          apigee-cassandra-default-0.apigee-cassandra-default.apigee.svc.cluster.local
      CASSANDRA_CLUSTER_NAME:   apigeecluster
      CASSANDRA_DC:             dc-1
      CASSANDRA_RACK:           ra-1
      CASSANDRA_OPEN_JMX:       true
      CPS_ADMIN_USER:           <set to the key 'admin.user' in secret 'apigee-datastore-default-creds'>        Optional: false
      CPS_ADMIN_PASSWORD:       <set to the key 'admin.password' in secret 'apigee-datastore-default-creds'>    Optional: false
      APIGEE_JMX_USER:          <set to the key 'jmx.user' in secret 'apigee-datastore-default-creds'>          Optional: false
      APIGEE_JMX_PASSWORD:      <set to the key 'jmx.password' in secret 'apigee-datastore-default-creds'>      Optional: false
      CASS_PASSWORD:            <set to the key 'default.password' in secret 'apigee-datastore-default-creds'>  Optional: false
      APIGEE_JOLOKIA_USER:      <set to the key 'jolokia.user' in secret 'apigee-datastore-default-creds'>      Optional: false
      APIGEE_JOLOKIA_PASSWORD:  <set to the key 'jolokia.password' in secret 'apigee-datastore-default-creds'>  Optional: false
    Mounts:
      /opt/apigee/apigee-cassandra/conf from appsfs (rw)
      /opt/apigee/customer from cwc-volume (ro)
      /opt/apigee/data from cassandra-data (rw)
      /opt/apigee/ssl from tls-volume (ro)
      /var/secrets/google from apigee-cassandra-backup (rw)
      /var/secrets/keys from apigee-cassandra-backup-key-file (rw)
  Volumes:
   cwc-volume:
    Type:        Secret (a volume populated by a Secret)
    SecretName:  config-cassandra-default
    Optional:    false
   tls-volume:
    Type:        Secret (a volume populated by a Secret)
    SecretName:  apigee-cassandra-default-tls
    Optional:    false
   appsfs:
    Type:       EmptyDir (a temporary directory that shares a pod's lifetime)
    Medium:
    SizeLimit:  <unset>
   apigee-cassandra-backup:
    Type:        Secret (a volume populated by a Secret)
    SecretName:  apigee-cassandra-backup-svc-account
    Optional:    true
   apigee-cassandra-backup-key-file:
    Type:        Secret (a volume populated by a Secret)
    SecretName:  apigee-cassandra-backup-key-file
    Optional:    true
Volume Claims:
  Name:          cassandra-data
  StorageClass:
  Labels:        <none>
  Annotations:   <none>
  Capacity:      10Gi
  Access Modes:  [ReadWriteOnce]
Events:
  Type    Reason            Age   From                    Message
  ----    ------            ----  ----                    -------
  Normal  SuccessfulCreate  47m   statefulset-controller  create Pod apigee-cassandra-default-2 in StatefulSet apigee-cassandra-default successful

Verifica la presenza di errori nel controller Apigee:

kubectl logs -f apigee-controller-manager-59cf595c77-wtwnr -n apigee-system -c manager | grep apigeedatastore

Risultati:

"error creating
apigee-cassandra object: failed to update resource
apigee/apigee-cassandra-default: StatefulSet.apps \"apigee-cassandra-default\"
is invalid: spec: Forbidden: updates to statefulset spec for fields other than
'replicas', 'template', 'updateStrategy', 'persistentVolumeClaimRetentionPolicy'
and 'minReadySeconds' are forbiddenerror creating apigee-cassandra object:
failed to update resource apigee/apigee-cassandra-default: StatefulSet.apps
\"apigee-cassandra-default\" is invalid: spec: Forbidden: updates to statefulset
spec for fields other than 'replicas', 'template', 'updateStrategy',
'persistentVolumeClaimRetentionPolicy' and 'minReadySeconds' are forbidden"

Risoluzione

Lo stato di Cassandra può essere reimpostato seguendo questi passaggi per riportarlo a uno stato di esecuzione:

Disattiva apigee-controller:

kubectl -n apigee-system edit deployments and set --enable-controllers=true to --enable-controllers=false

Riporta il datastore allo stato di esecuzione utilizzando il comando PATCH:

curl -XPATCH \-H "Accept: application/json" -H "Content-Type: application/json-patch+json" --data '[{"op": "replace", "path": "/status/nestedState", "value": ""},{"op": "replace", "path": "/status/state", "value": "running"}]' 'http://127.0.0.1:8001/apis/apigee.cloud.google.com/v1alpha1/namespaces/apigee/apigeedatastores/default/status'

Applica di nuovo il file override.yaml originale utilizzando Helm:

helm upgrade datastore apigee-datastore/ \
--namespace APIGEE_NAMESPACE \
--atomic \
-f OVERRIDES_FILE \
--dry-run=server

Assicurati di includere tutte le impostazioni mostrate, incluso --atomic in modo che l'azione venga annullata in caso di errore.

Installa il grafico:

helm upgrade datastore apigee-datastore/ \
--namespace APIGEE_NAMESPACE \
--atomic \
-f OVERRIDES_FILE

Attiva apigee-controller:

kubectl -n apigee-system edit deployments and set --enable-controllers=false to --enable-controllers=true

Attendi il ripristino del datastore e convalida utilizzando quanto segue:
```
kubectl get apigeeds --namespace apigee
```

Verifica che i deployment e i pod Apigee siano in stato di esecuzione e che apigeeds non sia più in stato di rilascio:

kubectl get ad -n apigee

kubectl get pods -n apigee

kubectl get apigeeds -n apigee

NAME      STATE     AGE
default   running   24d

Altre modifiche alla configurazione

Gli aggiornamenti apportati alle proprietà cassandra in override.yaml e le modifiche non sono state applicate. Potrebbe trattarsi di una modifica della password o delle risorse in override.yaml. o applicando erroneamente il override.yaml sbagliato a un cluster.

Diagnosi

Vedi i passaggi in Diagnosi.

Risoluzione

Vedi i passaggi in Risoluzione.

Deve raccogliere informazioni diagnostiche

Se il problema persiste anche dopo aver seguito le istruzioni riportate sopra, raccogli le seguenti informazioni diagnostiche e poi contatta l'assistenza clienti Google Cloud:

Overrides.yaml per ogni cluster nell'installazione.

Un dump di kubernetes cluster-info dall'installazione di Apigee hybrid:

Genera kubernetes cluster-info dump:

kubectl cluster-info dump -A --output-directory=/tmp/kubectl-cluster-info-dump

Comprimi utilizzando zip kubernetes cluster-info dump:

zip -r kubectl-cluster-info-dump`date +%Y.%m.%d_%H.%M.%S`.zip /tmp/kubectl-cluster-info-dump/*

I pod di Cassandra sono bloccati nello stato In attesa

Sintomo

All'avvio, i pod Cassandra rimangono nello stato In attesa.

Messaggio di errore

Quando utilizzi kubectl per visualizzare gli stati dei pod, noti che uno o più pod Cassandra sono bloccati nello stato Pending. Lo stato Pending indica che Kubernetes non è in grado di pianificare il pod su un nodo: il pod non può essere creato. Ad esempio:

kubectl get pods -n NAMESPACE

NAME                                     READY   STATUS      RESTARTS   AGE
adah-resources-install-4762w             0/4     Completed   0          10m
apigee-cassandra-default-0               0/1     Pending     0          10m
...

Cause possibili

Un pod bloccato nello stato In attesa può avere più cause. Ad esempio:

Causa	Descrizione
Risorse insufficienti	Non sono disponibili CPU o memoria sufficienti per creare il pod.
Volume non creato	Il pod è in attesa della creazione del volume permanente.
Driver CSI Amazon EBS mancante	Per le installazioni EKS, il driver CSI Amazon EBS richiesto non è installato.

Diagnosi

Utilizza kubectl per descrivere il pod e determinare l'origine dell'errore. Ad esempio:

kubectl -n NAMESPACE describe pods POD_NAME

Ad esempio:

kubectl describe pods apigee-cassandra-default-0 -n apigee

L'output potrebbe mostrare uno di questi possibili problemi:

Se il problema è dovuto a risorse insufficienti, vedrai un messaggio di avviso che indica CPU o memoria insufficienti.
Se il messaggio di errore indica che il pod ha richieste di volumi permanenti (PVC) immediate non vincolate, significa che il pod non è in grado di creare il proprio volume permanente.

Risoluzione

Risorse insufficienti

Modifica il pool di nodi Cassandra in modo che disponga di risorse di CPU e memoria sufficienti. Per ulteriori dettagli, consulta la sezione Ridimensionamento di un node pool.

Volume permanente non creato

Se identifichi un problema con il volume permanente, descrivi PersistentVolumeClaim (PVC) per determinare perché non viene creato:

Elenca le PVC nel cluster:

kubectl -n NAMESPACE get pvc

NAME                                        STATUS   VOLUME                                     CAPACITY   ACCESS MODES   STORAGECLASS   AGE
cassandra-data-apigee-cassandra-default-0   Bound    pvc-b247faae-0a2b-11ea-867b-42010a80006e   10Gi       RWO            standard       15m
...

Descrivi il PVC per il pod che non funziona. Ad esempio, il seguente comando descrive la PVC associata al pod apigee-cassandra-default-0:

kubectl apigee describe pvc cassandra-data-apigee-cassandra-default-0

Events:
  Type     Reason              Age                From                         Message
  ----     ------              ----               ----                         -------
  Warning  ProvisioningFailed  3m (x143 over 5h)  persistentvolume-controller  storageclass.storage.k8s.io "apigee-sc" not found

Tieni presente che in questo esempio l'oggetto StorageClass denominato apigee-sc non esiste. Per risolvere il problema, crea la risorsa StorageClass mancante nel cluster, come spiegato in Modificare la risorsa StorageClass predefinita.

Vedi anche Debug dei pod.

Driver CSI Amazon EBS mancante

Se l'istanza ibrida è in esecuzione su un cluster EKS, assicurati che il cluster EKS utilizzi il driver Amazon EBS Container Storage Interface (CSI). Per maggiori dettagli, consulta le Domande frequenti sulla migrazione di Amazon EBS CSI.

I pod di Cassandra sono bloccati nello stato CrashLoopBackoff

Sintomo

All'avvio, i pod Cassandra rimangono nello stato CrashLoopBackoff.

Messaggio di errore

Quando utilizzi kubectl per visualizzare gli stati dei pod, noti che uno o più pod Cassandra si trovano nello stato CrashLoopBackoff. Questo stato indica che Kubernetes non è in grado di creare il pod. Ad esempio:

kubectl get pods -n NAMESPACE

NAME                                     READY   STATUS            RESTARTS   AGE
adah-resources-install-4762w             0/4     Completed         0          10m
apigee-cassandra-default-0               0/1     CrashLoopBackoff  0          10m
...

Cause possibili

Un pod bloccato nello stato CrashLoopBackoff può avere più cause. Ad esempio:

Causa	Descrizione
Il data center è diverso dal precedente	Questo errore indica che il pod Cassandra ha un volume persistente con dati di un cluster precedente e i nuovi pod non riescono a unirsi al vecchio cluster. Ciò si verifica in genere quando i volumi permanenti obsoleti persistono dal cluster Cassandra precedente sullo stesso nodo Kubernetes. Questo problema può verificarsi se elimini e ricrei Cassandra nel cluster.
Aggiornamento di Kubernetes	Un upgrade di Kubernetes potrebbe influire sul cluster Cassandra. Ciò può accadere quando i nodi worker Anthos che ospitano i pod Cassandra vengono aggiornati a una nuova versione del sistema operativo.

Diagnosi

Controlla il log degli errori di Cassandra per determinare la causa del problema.

Elenca i pod per ottenere l'ID del pod Cassandra che non funziona:
```
kubectl get pods -n NAMESPACE
```
Controlla il log del pod non riuscito:
```
kubectl logs POD_ID -n NAMESPACE
```

Risoluzione

Cerca i seguenti indizi nel log del pod:

Il data center è diverso dal precedente

Se visualizzi questo messaggio di log:

Cannot start node if snitch's data center (us-east1) differs from previous data center

Controlla se nel cluster sono presenti PVC obsoleti o vecchi ed eliminali.

Se si tratta di una nuova installazione, elimina tutti i PVC e riprova la configurazione. Ad esempio:

kubectl -n NAMESPACE get pvc
kubectl -n NAMESPACE delete pvc cassandra-data-apigee-cassandra-default-0

L'upgrade di Anthos modifica le impostazioni di sicurezza

Controlla i log di Cassandra per questo messaggio di errore:

/opt/apigee/run.sh: line 68: ulimit: max locked memory:
  cannot modify limit: Operation not permitted

Se l'istanza ibrida è multiregionale, ritira l'istanza ibrida interessata e espandila di nuovo nella regione interessata.
Se l'istanza ibrida è una singola regione, esegui un riavvio in sequenza di ogni pod Cassandra nell'istanza ibrida.

Crea un container client per il debug

Questa sezione spiega come creare un container client da cui puoi accedere alle utilità di debug di Cassandra, ad esempio cqlsh: la shell CQL. Queste utilità consentono di eseguire query sulle tabelle Cassandra e possono essere utili per il debug.

Crea il container client

Per creare il contenitore client:

Il contenitore deve utilizzare il certificato TLS del pod apigee-cassandra-user-setup. Queste informazioni vengono archiviate come secret Kubernetes. Recupera il nome del secret che archivia questo certificato:
```
kubectl get secrets -n apigee --field-selector type=kubernetes.io/tls | grep apigee-cassandra-user-setup | awk '{print $1}'
```
Questo comando restituisce il nome del secret. Ad esempio: apigee-cassandra-user-setup-rg-hybrid-b7d3b9c-tls. Lo utilizzerai di seguito nel campo secretName del file YAML.

Apri un nuovo file e incolla la seguente specifica del pod:

apiVersion: v1
kind: Pod
metadata:
  labels:
  name: CASSANDRA_CLIENT_NAME   # For example: my-cassandra-client
  namespace: apigee
spec:
  containers:
  - name: CASSANDRA_CLIENT_NAME
    image: "gcr.io/apigee-release/hybrid/apigee-hybrid-cassandra-client:YOUR_APIGEE_HYBRID_VERSION" # For example, 1.10.5.
    imagePullPolicy: Always
    command:
    - sleep
    - "3600"
    env:
    - name: CASSANDRA_SEEDS
      value: apigee-cassandra-default.apigee.svc.cluster.local
    - name: APIGEE_DML_USER
      valueFrom:
        secretKeyRef:
          key: dml.user
          name: apigee-datastore-default-creds
    - name: APIGEE_DML_PASSWORD
      valueFrom:
        secretKeyRef:
          key: dml.password
          name: apigee-datastore-default-creds
    volumeMounts:
    - mountPath: /opt/apigee/ssl
      name: tls-volume
      readOnly: true
  volumes:
  - name: tls-volume
    secret:
      defaultMode: 420
      secretName: YOUR_SECRET_NAME    # For example: apigee-cassandra-user-setup-rg-hybrid-b7d3b9c-tls
  restartPolicy: Never

Salva il file con estensione .yaml. Ad esempio: my-spec.yaml.

Applica la specifica al tuo cluster:

kubectl apply -f YOUR_SPEC_FILE.yaml -n apigee

Accedi al container:

kubectl exec -n apigee CASSANDRA_CLIENT_NAME -it -- bash

Connettiti all'interfaccia Cassandra cqlsh con il seguente comando. Inserisci il comando esattamente come mostrato:
```
cqlsh ${CASSANDRA_SEEDS} -u ${APIGEE_DML_USER} -p ${APIGEE_DML_PASSWORD} --ssl
```

Eliminazione del pod client

Utilizza questo comando per eliminare il pod client Cassandra:

kubectl delete pods -n apigee cassandra-client

Espansione della regione configurata in modo errato: tutti i nodi Cassandra in un unico data center

Questa situazione si verifica in un'espansione multiregionale sulle piattaforme GKE e GKE On-Prem (Anthos). Cerca di evitare di creare tutti i nodi Cassandra nello stesso data center.

Sintomo

La creazione dei nodi Cassandra non riesce nel data center per la seconda regione.

Messaggio di errore

failed to rebuild from dc-1: java.lang.RuntimeException : Error while rebuilding node: Stream failed

Risoluzione

Ripara l'espansione della regione configurata in modo errato seguendo questi passaggi:

Aggiorna Cassandra replicaCount a 1 nel file overrides.yaml per il secondo data center. Ad esempio:

cassandra:
  . . .
  replicaCount: 1

Applica l'impostazione utilizzando Helm:

helm upgrade datastore apigee-datastore \
--namespace APIGEE_NAMESPACE \
--atomic \
-f 2ND_DATACENTER_OVERRIDES_FILE \
--dry-run=server

Assicurati di includere tutte le impostazioni mostrate, incluso --atomic in modo che l'azione venga annullata in caso di errore.

Installa il grafico:

helm upgrade datastore apigee-datastore \
--namespace APIGEE_NAMESPACE \
--atomic \
-f 2ND_DATACENTER_OVERRIDES_FILE

Utilizza kubectl exec per accedere al pod Cassandra rimanente con il seguente comando:
```
kubectl exec -it -n apigee apigee-cassandra-default-0 -- /bin/bash
```

Ritira il pod Cassandra rimanente con il seguente comando:

nodetool -u CASSANDRA_DB_USER -pw CASSANDRA_DB_PASSWORD decommission

Elimina i pod Cassandra dal secondo data center utilizzando Helm:
```
helm uninstall datastore -n APIGEE_NAMESPACE
```
Modifica il contesto Kubernetes in modo che corrisponda al cluster del tuo primo data center:
```
kubectl config use-context FIRST_DATACENTER_CLUSTER
```
Verifica che non ci siano nodi Cassandra in stato di inattività nel primo data center.
```
nodetool -u CASSANDRA_DB_USER -pw CASSANDRA_DB_PASSWORD status
```

Verifica che i nodi Cassandra configurati in modo errato (destinati al secondo data center) siano stati rimossi dal primo data center. Assicurati che gli indirizzi IP visualizzati nell'output dello stato di nodetool siano solo gli indirizzi IP dei pod Cassandra destinati al tuo primo data center. Ad esempio, nel seguente output l'indirizzo IP 10.100.0.39 deve essere per un pod nel tuo primo data center.

kubectl exec -it -n apigee apigee-cassandra-default-0 -- /bin/bash
nodetool -u CASSANDRA_DB_USER -pw CASSANDRA_DB_PASSWORD status

  Datacenter: dc-1
  ================
  Status=U/D (Up/Down) | State=N/L/J/M (Normal/Leaving/Joining/Moving)
  --  Address      Load      Tokens  Owns (effective)  Host ID                               Rack
  UN  10.100.0.39  4.21 MiB  256     100.0%            a0b1c2d3-e4f5-6a7b-8c9d-0e1f2a3b4c5d  ra-1

Verifica che il file overrides.yaml per il secondo data center contenga l'impostazione del nome del data center nella sezione cassandra. Ad esempio:
```
cassandra:
  datacenter: DATA_CENTER_2
  rack: "RACK_NAME" # "ra-1" is the default value.
  . . .
```
Aggiorna l'impostazione cassandra:replicaCount nel file overrides.yaml per il secondo data center con il numero desiderato. Ad esempio:
```
cassandra:
  datacenter: DATA_CENTER_2
  . . .
  replicaCount: 3
```
Nota: il valore di cassandra:replicaCount deve essere un multiplo di 3. Utilizza lo stesso valore per replicaCount che hai specificato per il primo data center.

Applica il file overrides.yaml per il secondo data center con l'argomento datastore. Ad esempio:

helm upgrade datastore apigee-datastore \
--namespace APIGEE_NAMESPACE \
--atomic \
-f 2ND_DATACENTER_OVERRIDES_FILE \
--dry-run=server

Assicurati di includere tutte le impostazioni mostrate, incluso --atomic in modo che l'azione venga annullata in caso di errore.

Installa il grafico:

helm upgrade datastore apigee-datastore \
--namespace APIGEE_NAMESPACE \
--atomic \
-f 2ND_DATACENTER_OVERRIDES_FILE

Utilizza kubectl exec per accedere a uno dei nuovi pod Cassandra nel secondo data center e verificare che siano presenti due data center:
```
 "nodetool -u CASSANDRA_DB_USER -pw CASSANDRA_DB_PASSWORD status"
```

Soluzione alternativa per il problema noto 388608440

Questa sezione spiega come verificare se l'installazione è interessata dal problema noto 388608440 e come risolverlo.

Diagnosi

Per verificare se il problema noto ti riguarda, esegui questo comando:

kubectl -n APIGEE_NAMESPACE get pods -l app=apigee-cassandra -o name | \
  xargs -i -P0 kubectl -n APIGEE_NAMESPACE -c apigee-cassandra exec {} -- \
  bash -c 'echo "{}: Found $(nodetool -u cassandra -pw $CASS_PASSWORD listsnapshots | grep -c compaction_history) leftover snapshots"'

Ad esempio:

kubectl -n apigee get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n apigee -c apigee-cassandra exec {} -- bash -c 'echo "{}: Found $(nodetool -u cassandra -pw $CASS_PASSWORD listsnapshots | grep -c compaction_history) leftover snapshots"'

pod/apigee-cassandra-default-0: Found 0 leftover snapshots
pod/apigee-cassandra-default-1: Found 0 leftover snapshots
pod/apigee-cassandra-default-2: Found 0 leftover snapshots

Se il numero di snapshot rimanenti è maggiore di 0 per uno qualsiasi dei tuoi pod Cassandra, l'installazione è interessata da questo problema.

Risoluzione

Per risolvere il problema, segui i passaggi riportati di seguito, selezionando il tipo di backup che utilizzi e la versione secondaria di Apigee Hybrid:

Backup di Cloud Storage

Assicurati di utilizzare la configurazione corretta per il backup di Cloud Storage. Alcuni problemi comuni includono, a titolo esemplificativo:
- Viene utilizzato un service account Google errato.
- Nome bucket Cloud Storage errato specificato in cassandra.backup.dbStorageBucket.
- L'API Google non è raggiungibile tramite proxy (se viene utilizzato cassandra.backup.httpproxy).
Se riscontri problemi con la configurazione, risolvili prima di procedere.

Elimina manualmente gli snapshot rimanenti utilizzando il seguente comando:

Apigee Hybrid 1.12

kubectl -n APIGEE_NAMESPACE get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n APIGEE_NAMESPACE -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot --all)"'

Ad esempio:

kubectl -n apigee get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n apigee -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot --all)"'

Apigee Hybrid 1.11

kubectl -n APIGEE_NAMESPACE get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n APIGEE_NAMESPACE -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot)"'

Ad esempio:

kubectl -n apigee get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n apigee -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot)"'

pod/apigee-cassandra-default-1: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]
pod/apigee-cassandra-default-2: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]
pod/apigee-cassandra-default-0: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]

Attiva un job di backup manuale e verifica che venga completato correttamente.
Verifica che l'archivio di backup creato dal job di backup manuale sia stato caricato correttamente nel bucket Cloud Storage cassandra.backup.dbStorageBucket specificato nel file overrides.yaml.
Verifica che il numero di snapshot rimanenti sia 0 per tutti i pod Cassandra utilizzando il comando presentato in precedenza nella sezione Diagnosi.

Backup del server remoto

Assicurati che il server di backup remoto sia integro e raggiungibile dai pod Cassandra. Consulta la sezione Risoluzione dei problemi per i passaggi per verificare la connettività SSH. Alcuni problemi comuni includono, a titolo esemplificativo:
- Il firewall di rete blocca la connessione.
- La chiave SSH non è configurata correttamente.
- Il server di backup remoto non è raggiungibile.
- Lo spazio di archiviazione gratuito sul server di backup remoto è esaurito.
Se riscontri problemi con il server di backup remoto, risolvili prima di procedere.

Elimina manualmente gli snapshot rimanenti utilizzando il seguente comando:

Apigee Hybrid 1.12

kubectl -n APIGEE_NAMESPACE get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n APIGEE_NAMESPACE -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot --all)"'

Ad esempio:

kubectl -n apigee get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n apigee -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot --all)"'

Apigee Hybrid 1.11

kubectl -n APIGEE_NAMESPACE get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n APIGEE_NAMESPACE -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot)"'

Ad esempio:

kubectl -n apigee get pods -l app=apigee-cassandra -o name | xargs -i -P0 kubectl -n apigee -c apigee-cassandra exec {} -- bash -c 'echo "{}: $(nodetool -u cassandra -pw $CASS_PASSWORD clearsnapshot)"'

pod/apigee-cassandra-default-1: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]
pod/apigee-cassandra-default-2: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]
pod/apigee-cassandra-default-0: Requested clearing snapshot(s) for [all keyspaces] with [all snapshots]

Attiva un job di backup manuale e verifica che venga completato correttamente.
Verifica che l'archivio di backup creato dal job di backup manuale sia stato caricato correttamente sul server di backup remoto.
Verifica che il numero di snapshot rimanenti sia 0 per tutti i pod Cassandra utilizzando il comando presentato in precedenza nella sezione Diagnosi.

Risorse aggiuntive

Consulta Introduzione alle guide pratiche di Apigee X e Apigee hybrid.

Guida alla risoluzione dei problemi di Cassandra Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

I pod di Cassandra sono bloccati nello stato di rilascio

Sintomo

Messaggio di errore

Cause possibili

Modifiche alla capacità di archiviazione

Diagnosi

Risoluzione

Altre modifiche alla configurazione

Diagnosi

Risoluzione

Deve raccogliere informazioni diagnostiche

I pod di Cassandra sono bloccati nello stato In attesa

Sintomo

Messaggio di errore

Cause possibili

Diagnosi

Risoluzione

Risorse insufficienti

Volume permanente non creato

Driver CSI Amazon EBS mancante

I pod di Cassandra sono bloccati nello stato CrashLoopBackoff

Sintomo

Messaggio di errore

Cause possibili

Diagnosi

Risoluzione

Il data center è diverso dal precedente

L'upgrade di Anthos modifica le impostazioni di sicurezza

Crea un container client per il debug

Crea il container client

Eliminazione del pod client

Espansione della regione configurata in modo errato: tutti i nodi Cassandra in un unico data center

Sintomo

Messaggio di errore

Risoluzione

Soluzione alternativa per il problema noto 388608440

Diagnosi

Risoluzione

Backup di Cloud Storage

Apigee Hybrid 1.12

Apigee Hybrid 1.11

Backup del server remoto

Apigee Hybrid 1.12

Apigee Hybrid 1.11

Risorse aggiuntive

Guida alla risoluzione dei problemi di Cassandra