Richiedere assistenza

L'obiettivo principale dell'assistenza di Google è quello di risolvere gli incidenti di produzione il più rapidamente possibile. Per farlo, comprendiamo la tua configurazione, analizziamo log e metriche e collaboriamo con i partner per risolvere rapidamente gli incidenti.

Google Cloud offre una varietà di pacchetti di assistenza per soddisfare le tue esigenze. Tutti i pacchetti di assistenza di Google Cloud includono il supporto per Anthos clusters on Anthos. Se hai già un pacchetto di assistenza Google Cloud, hai già supporto per Anthos e Cluster Anthos on bare metal.

Per ulteriori informazioni, consulta la documentazione dell'assistenza Google Cloud.

Requisiti per il supporto di Cluster Anthos on bare metal

Per risolvere efficacemente gli incidenti critici a livello aziendale:

Strumenti di supporto

Per risolvere un problema di Cluster Anthos on bare metal, l'assistenza Google Cloud si basa su tre informazioni:

La configurazione del tuo ambiente

Quando apri una richiesta di assistenza, l'esecuzione dei seguenti comandi fornisce informazioni chiave sulla configurazione del cluster:

  • Per tutti i tipi di cluster, esegui il comando bmctl check cluster --snapshot per acquisire informazioni su Kubernetes e sui tuoi nodi. Collega la tarball risultante alla richiesta di assistenza.

  • Per cluster di amministrazione, ibridi e autonomi, esegui il comando bmctl check cluster per controllare lo stato di integrità del cluster e dei nodi. Associa i log generati alla richiesta di assistenza. Dovrebbero trovarsi nella directory bmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP].

  • Per i cluster utente, crea prima un file YAML del controllo di integrità con il nome e lo spazio dei nomi del cluster, quindi applica il file nel cluster di amministrazione appropriato:

    1. Crea un file YAML con le seguenti proprietà di healthcheck. Di seguito sono riportati dei contenuti di esempio per un cluster denominato user1 nello spazio dei nomi cluster-user1:

      apiVersion: baremetal.cluster.gke.io/v1
      kind: HealthCheck
      metadata:
        generateName: healthcheck-
        namespace: cluster-user1
      spec:
        clusterName: user1
      
    2. Dopo aver creato il file YAML, applica la risorsa personalizzata nel cluster di amministrazione che gestisce il cluster utente con il comando kubectl. Ecco un comando di esempio che utilizza il file YAML creato nel passaggio precedente. Nell'esempio, la variabile ADMIN_KUBECONFIG specifica il percorso del file kubeconfig del cluster di amministrazione:

      kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml

      Il comando restituisce la seguente risposta:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
      
    3. Attendi il completamento del job di controllo dello stato di integrità per vedere se il job di controllo di integrità ha terminato la riconciliazione. Nel caso dell'esempio precedente, il nome del job di controllo di integrità è healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf. Ecco un test di esempio con il comando kubectl che attende 30 minuti per il completamento del job di controllo di integrità:

      kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \
          -n cluster-user1 --for=condition=Reconciling=False --timeout=30m

      Al termine, questo comando restituisce:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
      

      Puoi visualizzare i risultati del job di controllo di integrità con il seguente comando:

      kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \
          -n cluster-user1

      Il comando restituisce il seguente risultato:

      NAME                PASS   AGE
      healthcheck-7c4qf   true   17m
      
    4. Raccogli tutti i log dei pod del controllo di integrità in un file locale con il comando kubectl. Ecco un esempio che utilizza il job di controllo di integrità di esempio precedente:

      kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \
          -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \
          healthcheck-7c4qf.log

Log del cluster

Quando crei un nuovo cluster Anthos on bare metal, gli agenti Cloud Logging sono abilitati per impostazione predefinita e hanno come ambito solo i componenti a livello di sistema. Replica i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono da pod Kubernetes nei seguenti spazi dei nomi:

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • gatekeeper-system
  • cnrm-system
  • knative-serving

Puoi eseguire query sui log dalla console di Cloud Logging.

Per maggiori dettagli, consulta Logging e Monitoring.

Metriche del cluster

Oltre ai log, le metriche vengono acquisite anche dall'agente Cloud Monitoring. Replica le metriche a livello di sistema nel progetto Google Cloud associato al cluster. Le metriche a livello di sistema provengono da pod Kubernetes in esecuzione negli stessi spazi dei nomi elencati nei log.

Per maggiori dettagli, consulta Logging e Monitoring.

Come risolviamo i problemi del tuo ambiente

Ecco un esempio di un tipico incidente di assistenza:

  1. Un utente, ad esempio l'amministratore del cluster, apre una richiesta di assistenza tramite la console Google Cloud o Google Cloud Support Center e seleziona i cluster Anthos e Anthos su Bare Metal come Categoria e Componente, rispettivamente. Inserendo le informazioni richieste, associano all'output l'output dei comandi bmctl pertinenti.
  2. La richiesta di assistenza viene inoltrata a un Technical Support Engineer specializzato in Cluster Anthos on bare metal.
  3. Il tecnico dell'assistenza esamina i contenuti dello snapshot per recuperare il contesto dell'ambiente.
  4. Il tecnico dell'assistenza esamina i log e le metriche nel progetto Google Cloud, inserendo l'ID richiesta di assistenza come giustificazione aziendale, che viene registrato internamente.
  5. Il tecnico dell'assistenza risponde alla richiesta con una valutazione e un consiglio. Il tecnico dell'assistenza e l'utente continuano la risoluzione dei problemi fino a quando non trovano una soluzione.

Che cosa supporta Google?

In generale, il team di assistenza Cloud supporta tutti i componenti software forniti nell'ambito di Cluster Anthos on bare metal, oltre ad Anthos Service Mesh e Anthos Config Management. La tabella seguente fornisce ulteriori dettagli:

Supporto per Google Cloud Funzionalità non supportata
Kubernetes e il runtime del container Scelta del bilanciatore del carico da parte del cliente (bilanciamento del carico manuale)
Connect e l'agente Connect Codice cliente (consulta la sezione Assistenza per gli sviluppatori di seguito).
Operazioni, monitoraggio, logging e agenti di Google Cloud Scelta del sistema operativo da parte del cliente
Bilanciatore del carico in bundle Server fisico o virtuale, spazio di archiviazione e rete
Controller Ingress DNS esterni, DHCP e sistemi di identità
Anthos Identity Service
Anthos Service Mesh
Anthos Config Management

Criterio per il supporto delle versioni

Il supporto per Cluster Anthos on bare metal segue i Criteri di assistenza della versione di Anthos. Google supporta la versione attuale e le due versioni secondarie precedenti (n-2) di Cluster Anthos on bare metal.

La tabella seguente mostra le versioni supportate e non supportate di questo prodotto.

Versione secondaria Data di uscita Data di fine del ciclo di vita più anticipata Panche disponibili Versione di Kubernetes
1,14 (più recente) 8 dicembre 2022 8 dicembre 2023 1,14,0 versione 1.25.3-gke.1400
1,13 29 settembre 2022 29 giugno 2023 1,13,3 versione 1.24.7-gke.1700
1,13,2 versione 1.24.7-gke.300
1,13,1 versione 1.24.5-gke.400
1,13,0 versione 1.24.2-gke.1900
1,12 29 giugno 2022 29 marzo 2023 1,12,6 versione 1.23.13-gke.1700
1,12,5 versione 1.23.13-gke.1700
1,12,4 versione 1.23.11-gke.500
1,12,3 versione 1.23.10-gke.1000
1,12,2 versione 1.23.5-gke.1505
1,12,1 versione 1.23.5-gke.1505
1,12,0 versione 1.23.5-gke.1504
1.11 (non supportato) 21 marzo 2022 21 dicembre 2022 1,11,8 versione 1.22.15-gke.3300
1,11,7 versione 1.22.14-gke.500
1,11,6 versione 1.22.8-gke.204
1,11,5 versione 1.22.8-gke.204
1,11,4 versione 1.22.8-gke.204
1,11,3 versione 1.22.8-gke.203
1,11,2 versione 1.22.8-gke.200
1,11,1 versione 1.22.8-gke.200
1,11,0 versione 1.22.8-gke.200
1,10 (non supportato) 10 dicembre 2021 10 settembre 2022 1,10,8 versione 1.21.13-gke.202
1,10,7 versione 1.21.13-gke.202
1,10,6 versione 1.21.13-gke.201
1,10,5 versione 1.21.6-gke.1503
1,10,4 versione 1.21.6-gke.1503
1,10,3 versione 1.21.5-gke.1300
1,10,2 versione 1.21.5-gke.1300
1,10,1 versione 1.21.5-gke.1200
1,10,0 versione 1.21.5-gke.1200
1,9 (non supportato) 23 settembre 2021 23 giugno 2022 1,9,8 versione 1.21.13-gke.200
1,9,7 versione 1.21.6-gke.1503
1,9,6 versione 1.21.5-gke.1300
1,9,5 versione 1.21.5-gke.1300
1,9,4 versione 1.21.5-gke.1200
1,9,3 versione 1.21.5-gke.1200
1,9,2 versione 1.21.4-gke.201
1,9,1 versione 1.21.4-gke.201
1,9,0 versione 1.21.4-gke.200
1.8 (non supportato) 21 giugno 2021 21 marzo 2022 1,8,9 versione 1.20.9-gke.102
1,8,8 versione 1.20.9-gke.102
1,8,7 versione 1.20.9-gke.102
1,8,6 versione 1.20.9-gke.102
1,8,5 versione 1.20.9-gke.102
1,8,4 versione 1.20.9-gke.101
1,8,3 versione 1.20.9-gke.101
1,8,2 versione 1.20.8-gke.1500
1,8,1 versione 1.20.5-gke.1301
1,8,0 versione 1.20.5-gke.1301
1.7 (non supportato) 25 marzo 2021 25 dicembre 2021 1,7,7 versione 1.19.14-gke.2201
1,7,6 versione 1.19.14-gke.2201
1,7,5 versione 1.19.14-gke.2201
1,7,4 versione 1.19.14-gke.400
1,7,3 versione 1.19.13-gke.100
1,7,2 versione 1.19.10-gke.1602
1,7,1 versione 1.19.7-gke.1200
1,7,0 versione 1.19.7-gke.1200
1.6 (non supportato) 30 novembre 2020 30 agosto 2021 1,6,4 versione 1.18.20-gke.3000
1,6,3 versione 1.18.18-gke.100
1,6,2 versione 1.18.6-gke.6600
1,6 versione 1.18.6-gke.6600
1,6,0 versione 1.18.6-gke.6600

Funzionalità supportate

Questo documento elenca la disponibilità di caratteristiche e funzionalità per Cluster Anthos on bare metal per le release supportate. La tabella non è intesa come un elenco esaustivo, ma evidenzia alcuni dei vantaggi dell'upgrade dei cluster alla versione più recente supportata.

Le funzionalità elencate come anteprima sono regolate dai Termini delle offerte pre-GA dei Termini di servizio di Google Cloud. Il supporto e i prodotti pre-GA potrebbero avere supporto limitato e le modifiche a prodotti e funzionalità pre-GA potrebbero non essere compatibili con altre versioni pre-GA. Per ulteriori informazioni, consulta le descrizioni della fase di lancio. Le offerte in anteprima sono destinate esclusivamente all'utilizzo in ambienti di test.

Le funzionalità elencate come Disponibilità generale (GA) sono completamente supportate, aperte a tutti i clienti e pronte per l'uso in produzione.

Funzionalità/funzionalità 1.11 1,12 1,13 1.14 (più recente)
Criteri di avviso Anteprima Anteprima Anteprima Anteprima
Runtime VM Anthos Anteprima GA GA GA
Bilanciamento del carico in bundle con BGP GA GA GA GA
Audit logging di Cloud GA GA GA GA
Supporto dell'interfaccia a riga di comando di backup e ripristino del cluster GA GA GA GA
Rotazione delle autorità di certificazione (CA) del cluster GA GA GA GA
Supporto dell'interfaccia a riga di comando per la reimpostazione del nodo cluster GA GA GA GA
runtime del container containerd GA GA GA GA
IP piatto dinamico con protocollo BGP (Border Gateway Protocol) Anteprima Anteprima GA GA
Gateway NAT in uscita GA GA GA GA
Modalità IPv4 piatta (statica) GA GA GA GA
Supporto IPv6 fisso (modalità BGP) Anteprima Anteprima GA GA
Supporto del bilanciatore del carico basato su BGP per IPv6 Non disponibile Anteprima GA GA
Dual Stack IPv4/IPv6 GA GA GA GA
Assistenza KSA GA GA GA GA
raccoglitore gestito per Google Cloud Managed Service per Prometheus Non disponibile Anteprima GA GA
Connettività multi-cluster Anteprima Anteprima Anteprima Anteprima
Più NIC per pod GA GA GA GA
Gateway di connettività di rete Non disponibile Anteprima Anteprima Anteprima
Rilevatore di problemi con i nodi GA GA GA GA
Supporto del mirroring del registro Anteprima Anteprima GA GA
Networking SR-IOV GA GA GA GA
Metriche API di riepilogo Anteprima GA GA GA
Workload Identity GA GA GA GA

Modello di responsabilità condivisa

L'esecuzione di un'applicazione di produzione business-critical su Cluster Anthos on bare metal richiede più parti con responsabilità diverse. Sebbene non si tratti di un elenco esaustivo, le sezioni seguenti contengono i ruoli e le responsabilità.

Responsabilità di Google

  • Manutenzione e distribuzione del pacchetto software Cluster Anthos su Bare Metal.
  • Notifica agli utenti degli upgrade disponibili per Cluster Anthos on bare metal e produzione di script di upgrade per la versione precedente; Cluster Anthos on bare metal supporta solo gli upgrade sequenziali (ad esempio: 1.2 → 1.3 → 1.4 e non 1.2 → 1.4).
  • Utilizzo dei servizi Connect e Cloud Operations.
  • Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di eventuali problemi relativi ai componenti forniti da Google

Responsabilità dell'utente

  • Amministrazione complessiva del sistema per cluster on-premise.
  • Manutenzione di qualsiasi carico di lavoro dell'applicazione di cui è stato eseguito il deployment nel cluster.
  • Esecuzione, manutenzione e applicazione di patch all'infrastruttura di data center, inclusi networking, server, sistema operativo, archiviazione e connettività a Google Cloud.
  • Esecuzione, manutenzione e applicazione di patch ai bilanciatori del carico di rete se viene scelta l'opzione di bilanciamento del carico manuale.
  • Upgrade regolari di cluster Anthos su versioni bare metal.
  • Monitoraggio di cluster e applicazioni e risposta a eventuali incidenti.
  • Assicurare il deployment degli agenti Cloud Operations nei cluster.
  • Fornire a Google dettagli ambientali per la risoluzione dei problemi.

Assistenza per sviluppatori

Google non fornisce assistenza per i carichi di lavoro delle applicazioni in esecuzione su Cluster Anthos on bare metal. Tuttavia, offriamo il miglior supporto possibile per gli sviluppatori per assicurarci che possano eseguire facilmente applicazioni su Cluster Anthos on bare metal. Crediamo che interagire prima durante lo sviluppo possa prevenire incidenti critici più avanti nel deployment.

Questa assistenza per gli sviluppatori è disponibile per i clienti con un pacchetto di assistenza a pagamento e viene considerata una priorità P3 per i problemi che bloccano un lancio o una priorità P4 per la consulenza generale.