Backup e ripristino Cassandra CSI

Puoi eseguire il backup e il ripristino dati ibridi utilizzando CSI (Container Storage Interface). Il backup CSI genera snapshot dei dischi e li archivia come criptati in spazio di archiviazione sul cloud. Il backup CSI non richiede un bucket Google Cloud Storage o un server remoto per archiviare i dati di backup.

Il backup CSI è consigliato per le istanze ibride ospitate in Google Cloud, AWS o Azure.

In questa pagina vengono descritti i passaggi per utilizzare il backup e ripristino ibrido CSI. Per una panoramica dell'ibrido eseguire il ripristino e il ripristino in generale, Panoramica del backup e ripristino di Cassandra.

Limitazioni di backup e ripristino

Tieni presente queste limitazioni quando utilizzi il backup e il ripristino di CSI:

  • Il driver CSI utilizzato dalla classe di archiviazione configurata deve supportare gli snapshot CSI. Visualizza Elenco di driver CSI per Kubernetes per informazioni sul conducente.
  • Non tutte le piattaforme sono supportate. Sono supportate solo le piattaforme Google Cloud, AWS e Azure.
  • OpenShift Container Platform non è supportato a causa dello snapshot del volume limitazioni.
  • Sono supportate solo le piattaforme cloud. Le piattaforme on-premise non sono supportate.
  • I dati di backup CSI e i dati di backup ibridi non CSI non sono compatibili. I backup non CSI non possono essere utilizzati con Il ripristino CSI e i backup CSI non possono essere utilizzati con il ripristino non CSI.
  • L'installazione e la funzionalità del driver CSI sono a carico del fornitore del driver CSI.
  • Gli utenti sono responsabili di garantire che siano disponibili risorse di cluster adeguate per il provisioning degli snapshot CSI.
  • Gli utenti sono responsabili della rimozione dei dati degli snapshot precedenti.

Configura i backup CSI

Per pianificare i backup ibridi utilizzando CSI, segui questi passaggi:

  1. Se non hai ancora configurato il backup ibrido:
    1. Esegui il seguente comando create-service-account per creare un account di servizio (SA) Google Cloud con il ruolo standard roles/storage.objectAdmin. Questo ruolo SA ti consente di scrivere dati di backup in Cloud Storage. Esegui il seguente comando nella directory appropriata per il tuo strumento di gestione:
      • Grafici Helm: $APIGEE_HELM_CHARTS_HOME/apigee-operator/etc/
      • apigeectl: HYBRID_BASE_DIRECTORY/hybrid-files/
      ./tools/create-service-account --env non-prod --dir ./service-accounts

      Questo comando crea un singolo account di servizio denominato apigee-non-prod per l'utilizzo in ambienti non di produzione e il file della chiave scaricato viene inserito nell'elenco ./service-accounts .

      Per ulteriori informazioni sugli account di servizio Google Cloud, consulta Creazione in corso e la gestione degli account di servizio.

    2. Il comando create-service-account salva un file JSON contenente chiave privata dell'account di servizio. Il file viene salvato nella stessa directory in cui viene eseguito il comando. Ti servirà il percorso di questo file nei passaggi seguenti.
  2. Apri il file overrides.yaml. Imposta i seguenti parametri, come mostrato in File di override di esempio.

    1. Imposta i parametri generali mostrati di seguito nel blocco backup. Se hai già impostato questi parametri per la soluzione di backup ibrida non CSI, puoi utilizzare gli stessi parametri per gli snapshot CSI. Consulta la tabella di riferimento delle proprietà di backup per ulteriori informazioni su ogni valore.

      Per backup:

      • abilitato: impostalo su true per abilitare i backup pianificati.
      • pullPolicy nell'immagine: imposta su Always.
      • serviceAccountPath: il percorso dell'account di servizio.
      • schedule: fornisci una pianificazione dell'espressione cron.
    2. Imposta questi parametri per il backup specifico di CSI:
      • Valori del gruppo di archiviazione Cassandra: la classe di archiviazione Cassandra configurata deve supportare gli snapshot CSI per il funzionamento del backup e del ripristino CSI. Per verificare se una classe di archiviazione supporta gli snapshot CSI, esegui il comando seguente per ottenere le classi di archiviazione disponibili:
        kubectl get sc
        Cerca "Provisioner" per ogni classe di archiviazione. I provisioner che utilizzano CSI di solito hanno un ".csi." parte del nome, ad esempio "pd.csi.storage.gke.io". Cerca il nome del provisioner in in questo elenco di driver CSI per Kubernetes. Se lo stato delle "Altre funzionalità" per il provisioner contiene: "SNAPSHOT", la classe di archiviazione che utilizza il provisioner supporta gli snapshot CSI.

        Aggiungi questi parametri al gruppo di archiviazione. Entrambi i valori sono obbligatori.

        • storageclass: il nome di una classe di archiviazione abilitata agli snapshot CSI.
        • capacity: la capacità del disco.
      • Tipo di provider cloud:

        Una volta verificata la funzionalità snapshot CSI, modifica il file di override in modo da utilizzare Backup e ripristino CSI:

        • cloudProvider: imposta cloudProvider in backup e Da restore a CSI.

Esempio di configurazione del backup

Questa sezione mostra le parti relative al backup di un file overrides.yaml di esempio.
cassandra:
  hostNetwork: false
  replicaCount: 3
  storage:
    storageclass: standard-rwo
    capacity: 100Gi
  image:
    pullPolicy: Always

  backup:
    enabled: true
    image:
      pullPolicy: Always
    serviceAccountPath: "/Users/myuser/apigee-hybrid/hybrid-files/service-accounts/mycompany-hybrid-apigee-cassandra.json"
    cloudProvider: "CSI"
    schedule: "0 * * 11 *"

Avviare un backup manuale

I backup CSI vengono generati automaticamente in base alla pianificazione cron impostata nel file overrides.yaml.

Per avviare un backup manuale dei dati CSI, utilizza questo comando:

kubectl create job -n APIGEE_NAMESPACE --from=cronjob/apigee-cassandra-backup BACKUP_POD_NAME
dove BACKUP_POD_NAME è il nome del pod di backup che verrà creato.

Verifica i backup

Un modo per verificare che un backup sia stato creato correttamente è controllare gli snapshot dei volumi sul cluster Kubernetes utilizzando questo comando:

kubectl get volumesnapshot -n APIGEE_NAMESPACE

L'output mostra l'elenco corrente degli snapshot nel cluster. Il processo di backup CSI crea di ogni disco Cassandra. Il numero di snapshot generati deve corrispondere al numero totale di snapshot di pod Cassandra nel cluster.

Ripristina un backup

Utilizza questa procedura per ripristinare un backup CSI generato in precedenza. Per informazioni generali sul ripristino dei backup e una panoramica della procedura, consulta la pagina di panoramica del ripristino.

Per avviare un ripristino di un backup CSI, segui le istruzioni per il ripristino di una singola regione ibrida non CSI, ma utilizza questi valori nel blocco restore in overrides.yaml. Consulta la tabella di riferimento delle proprietà di backup per ulteriori informazioni su ogni valore configurazione di ripristino di esempio.

  • abilitato: impostalo su true per abilitare il ripristino per il backup a cui viene fatto riferimento il timestamp snapshotTimestamp.
  • snapshotTimestamp: fornisce il timestamp di un backup CSI precedente.
  • serviceAccountPath: il percorso dell'account di servizio.
  • pullPolicy nell'immagine: imposta su Always.

Per trovare il valore snapshotTimestamp da ripristinare, esegui questo comando per ottenere il degli snapshot disponibili:

kubectl get volumesnapshot -n APIGEE_NAMESPACE
Nell'elenco restituito, i nomi degli snapshot contengono il timestamp:
pvc-us-west2-b-20220803004907-47beff0e306d8861
In questo esempio, il timestamp è 20220803004907.

Configurazione di ripristino di esempio

Questa sezione mostra le parti relative al ripristino di un file overrides.yaml di esempio.
cassandra:
  hostNetwork: false
  replicaCount: 3
  storage:
    storageclass: standard-rwo
    capacity: 100Gi
  image:
    pullPolicy: Always

  restore:
    enabled: true
    snapshotTimestamp: "20220908222130"
    serviceAccountPath: "/Users/myuser/apigee-hybrid/hybrid-files/service-accounts/mycompany-hybrid-apigee-cassandra.json"
    cloudProvider: "CSI"
    image:
      pullPolicy: Always

Esegui la migrazione al backup e al ripristino di CSI

Se non hai mai utilizzato il backup e il ripristino ibride, puoi seguire le istruzioni riportate in Configurare i backup dei set di dati di inventario per creare un nuovo backup dei set di dati di inventario senza seguire i passaggi descritti in questa sezione. Questi passaggi ti guidano nella migrazione dalla soluzione di backup e ripristino non CSI ai backup CSI.

  1. Genera un nuovo backup utilizzando il metodo di backup non CSI attualmente configurato.
  2. Modifica la configurazione del backup nel file overrides.yaml ibrido per utilizzare le sostituzioni del backup CSI come mostrato nella configurazione di backup di esempio.
  3. Applica le modifiche nel file overrides.yaml:
    helm upgrade datastore apigee-datastore/ \
      --namespace APIGEE_NAMESPACE \
      --atomic \
      -f OVERRIDES_FILE.yaml
    
  4. Verifica il job di backup:
    kubectl get cronjob -n APIGEE_NAMESPACE
  5. Al termine di un job di backup, verifica che siano stati creati gli snapshot. Il numero di gli snapshot generati devono essere equivalenti al numero di nodi Cassandra nell'istanza ibrida.
    kubectl get volumesnapshot -n APIGEE_NAMESPACE