Richiedere assistenza

L'obiettivo di assistenza principale di Google è risolvere gli incidenti di produzione il più rapidamente possibile. Comprendere la configurazione, analizzare i log e le metriche e collaborare con i partner ci aiuta a risolvere rapidamente gli incidenti.

Google Cloud offre vari pacchetti di assistenza per soddisfare le tue esigenze di assistenza. Tutti i pacchetti di assistenza di Google Cloud includono il supporto per Anthos clusters on bare metal. Se hai già un pacchetto di assistenza Google Cloud, hai già supporto per i cluster Anthos e Anthos su Bare Metal.

Per ulteriori informazioni, consulta la documentazione dell'assistenza Google Cloud.

Requisiti per il supporto di Anthos clusters on bare metal

Per risolvere efficacemente gli incidenti critici per l'attività:

Strumenti di supporto

Per risolvere un problema relativo ad Anthos clusters on bare metal, l'assistenza Google Cloud si basa su tre informazioni:

La configurazione del tuo ambiente

Quando apri una richiesta di assistenza, l'esecuzione dei seguenti comandi fornisce informazioni chiave sulla configurazione del cluster:

  • Per tutti i tipi di cluster, esegui il comando bmctl check cluster --snapshot per acquisire informazioni su Kubernetes e sui nodi. Collega il tarball risultante alla richiesta di assistenza.

  • Per i cluster amministrativi, ibridi e autonomi, esegui il comando bmctl check cluster per controllare lo stato di integrità del cluster e dei nodi. Allega i log generati alla richiesta di assistenza. Dovrebbero esistere nella directory bmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP].

  • Per i cluster utente, prima crea un file YAML di controllo di integrità con il nome e l'area dei nomi del cluster, quindi applica il file nel cluster di amministrazione appropriato:

    1. Crea un file YAML con le seguenti proprietà healthcheck. Di seguito è riportato un esempio di contenuto per un cluster denominato user1 nello spazio dei nomi cluster-user1:

      apiVersion: baremetal.cluster.gke.io/v1
      kind: HealthCheck
      metadata:
        generateName: healthcheck-
        namespace: cluster-user1
      spec:
        clusterName: user1
      
    2. Dopo aver creato il file YAML, applica la risorsa personalizzata nel cluster di amministrazione che gestisce il cluster utente con il comando kubectl. Di seguito è riportato un comando di esempio utilizzando il file YAML creato nel passaggio precedente. Nell'esempio, la variabile ADMIN_KUBECONFIG specifica il percorso del file kubeconfig del cluster di amministrazione:

      kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml

      Il comando restituisce la seguente risposta:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
      
    3. Attendi il completamento del job di controllo di integrità per verificare se il job di controllo di integrità è stato completato. Nell'esempio precedente, il nome del job di controllo di integrità è healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf. Ecco un test di esempio con il comando kubectl che attende 30 minuti per il completamento del job di controllo di integrità:

      kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \
          -n cluster-user1 --for=condition=Reconciling=False --timeout=30m

      Al termine, questo comando restituisce:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
      

      Puoi vedere i risultati del job di controllo di integrità con il seguente comando:

      kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \
          -n cluster-user1

      Il comando restituisce il seguente risultato:

      NAME                PASS   AGE
      healthcheck-7c4qf   true   17m
      
    4. Raccogli tutti i log del pod di controllo di integrità in un file locale con il comando kubectl. Ecco un esempio di utilizzo del job di controllo di integrità precedente:

      kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \
          -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \
          healthcheck-7c4qf.log

Log del cluster

Quando crei un nuovo cluster Anthos on bare metal, gli agenti Cloud Logging sono abilitati per impostazione predefinita e hanno come ambito solo i componenti a livello di sistema. Replicherà i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono da pod Kubernetes nei seguenti spazi dei nomi:

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • gatekeeper-system
  • cnrm-system
  • knative-serving

È possibile eseguire query sui log dalla console Cloud Logging.

Per maggiori dettagli, consulta la sezione Logging e monitoraggio.

Google Cloud CLI e accesso ai cluster remoti

Se apri una richiesta di assistenza, l'assistenza clienti Google Cloud potrebbe chiederti l'accesso di sola lettura ai tuoi cluster per aiutarti a diagnosticare e risolvere i problemi in modo più efficace. Affinché il team di assistenza abbia accesso sufficiente per risolvere in remoto i problemi del cluster, assicurati di aver installato e aggiornato l'ultima versione di Google Cloud CLI. L'interfaccia a riga di comando di Google Cloud deve essere alla versione 401.0.0 o successiva per concedere all'assistenza clienti Google Cloud le autorizzazioni necessarie. Ti consigliamo di aggiornare regolarmente Google Cloud CLI per acquisire autorizzazioni aggiuntive e altri miglioramenti.

Per installare gli ultimi componenti dell'interfaccia a riga di comando gcloud, utilizza il comando gcloud components update. Per ulteriori informazioni sull'accesso di sola lettura all'assistenza clienti Google Cloud sui tuoi cluster, consulta Assistenza Google Cloud per i cluster registrati.

Metriche del cluster

Oltre ai log, l'agente Cloud Monitoring acquisisce anche le metriche. Replica le metriche a livello di sistema nel progetto Google Cloud associato al cluster. Le metriche a livello di sistema provengono da pod di Kubernetes in esecuzione negli stessi spazi dei nomi elencati nei log.

Per maggiori dettagli, consulta la sezione Logging e monitoraggio.

Come risolviamo i problemi per il tuo ambiente

Di seguito è riportato un esempio di caso di assistenza tipico:

  1. L'amministratore del cluster apre una richiesta di assistenza nella console Google Cloud o in Google Cloud Support Center e seleziona i cluster Anthos e Anthos on bare metal come Categoria e Componente, rispettivamente. Inseriscino le informazioni richieste e associano all'output l'output dei comandi bmctl pertinenti.
  2. La richiesta di assistenza viene inoltrata a un tecnico dell'assistenza tecnica specializzato in Anthos clusters on bare metal.
  3. Il tecnico del servizio di assistenza esamina il contenuto dello snapshot per ottenere il contesto dell'ambiente.
  4. Il tecnico del servizio di assistenza esamina i log e le metriche nel progetto Google Cloud, inserendo l'case ID di assistenza come giustificazione aziendale, che viene registrata internamente.
  5. Il tecnico del servizio di assistenza risponde alla richiesta con una valutazione e un consiglio. Il tecnico del servizio di assistenza e l'utente continuano a risolvere i problemi finché non trovano una soluzione.

Che cosa supporta Google?

In generale, il team di assistenza Cloud supporta tutti i componenti software forniti come parte dei cluster Anthos su Bare Metal e Anthos Service Mesh e Anthos Config Management. Per un elenco più completo di ciò che è o non è supportato, consulta la tabella seguente:

Supporto per Google Cloud Funzionalità non supportata
Kubernetes e il runtime del container Scelta del bilanciatore del carico da parte del cliente (bilanciamento del carico manuale)
Connect e l'agente Connect Codice cliente (vedi Assistenza per gli sviluppatori)
Suite operativa, monitoraggio, logging e agenti Google Cloud Scelta del sistema operativo da parte del cliente
Bilanciatore del carico in bundle Server fisico, virtuale, di archiviazione e di rete
Controller Ingress DNS esterni, DHCP e sistemi di identità
Anthos Identity Service
Anthos Service Mesh
Anthos Config Management

Norme relative all'assistenza della versione

Il supporto dei cluster Anthos su Bare Metal è conforme ai criteri di assistenza della versione di Anthos. Google supporta la versione attuale e le due versioni precedenti (n-2) di Anthos clusters on bare metal.

La tabella seguente mostra le versioni di questo prodotto supportate e non supportate.

Versione secondaria Data di uscita Data di fine del ciclo di vita meno recente patch disponibili Versione di Kubernetes
1.14 (più recente) 8 dicembre 2022 8 dicembre 2023 1,14,3 versione 1.25.6-gke.1000
1,14,2 Versione 1.25.5-gke.1001
1,14,1 Versione 1.25.5-gke.1001
1,14,0 Versione 1.25.3-gke.1400
1,13 29 settembre 2022 29 giugno 2023 1,13,6 Versione 1.24.9-gke.2500
1,13,5 Versione 1.24.9-gke.2500
1,13,4 Versione 1.24.9-gke.2500
1,13,3 versione 1.24.7-gke.1700
1,13,2 versione 1.24.7-gke.300
1,13,1 Versione 1.24.5-gke.400
1,13,0 versione 1.24.2-gke.1900
1,12 29 giugno 2022 29 marzo 2023 1,12,9 versione 1.23.17-gke.300
1,12,8 v1.23.16-gke.100
1,12,7 Versione 1.23.15-gke.2400
1,12,6 v1.23.13-gke.1700
1,12,5 v1.23.13-gke.1700
1,12,4 Versione 1.23.11-gke.500
1,12,3 v1.23.10-gke.1000
1,12,2 Versione 1.23.5-gke.1505
1,12,1 Versione 1.23.5-gke.1505
1,12,0 Versione 1.23.5-gke.1504
1.11 (non supportato) 21 marzo 2022 21 dicembre 2022 1,11,8 Versione 1.22.15-gke.3300
1,11,7 Versione 1.22.14-gke.500
1,11,6 versione 1.22.8-gke.204
1,11,5 versione 1.22.8-gke.204
1,11,4 versione 1.22.8-gke.204
1,11,3 versione 1.22.8-gke.203
1,11,2 versione 1.22.8-gke.200
1,11,1 versione 1.22.8-gke.200
1,11,0 versione 1.22.8-gke.200
1.10 (non supportato) 10 dicembre 2021 10 settembre 2022 1,10,8 versione 1.21.13-gke.202
1,10,7 versione 1.21.13-gke.202
1,10,6 versione 1.21.13-gke.201
1,10,5 versione 1.21.6-gke.1503
1,10,4 versione 1.21.6-gke.1503
1,10,3 Versione 1.21.5-gke.1300
1,10,2 Versione 1.21.5-gke.1300
1,10,1 Versione 1.21.5-gke.1200
1,10,0 Versione 1.21.5-gke.1200
1.9 (non supportato) 23 settembre 2021 23 giugno 2022 1,9,8 versione 1.21.13-gke.200
1,9,7 versione 1.21.6-gke.1503
1,9,6 Versione 1.21.5-gke.1300
1,9,5 Versione 1.21.5-gke.1300
1,9,4 Versione 1.21.5-gke.1200
1,9,3 Versione 1.21.5-gke.1200
1,9,2 versione 1.21.4-gke.201
1,9,1 versione 1.21.4-gke.201
1,9 versione 1.21.4-gke.200
1.8 (non supportato) 21 giugno 2021 21 marzo 2022 1,8,9 versione 1.20.9-gke.102
1,8,8 versione 1.20.9-gke.102
1,8,7 versione 1.20.9-gke.102
1,8,6 versione 1.20.9-gke.102
1,8,5 versione 1.20.9-gke.102
1,8,4 versione 1.20.9-gke.101
1,8,3 versione 1.20.9-gke.101
1,8,2 versione 1.20.8-gke.1500
1,8,1 versione 1.20.5-gke.1301
1,8 versione 1.20.5-gke.1301
1.7 (non supportato) 25 marzo 2021 25 dicembre 2021 1,7.7 versione 1.19.14-gke.2201
1,7.6 versione 1.19.14-gke.2201
1,7.5 versione 1.19.14-gke.2201
1,7.4 versione 1.19.14-gke.400
1,7.3 versione 1.19.13-gke.100
1,7,2 versione 1.19.10-gke.1602
1,7,1 versione 1.19.7-gke.1200
1,7 versione 1.19.7-gke.1200
1.6 (non supportato) 30 novembre 2020 30 agosto 2021 1,6,4 v1.18.20-gke.3000
1,6,3 v1.18.18-gke.100
1,6,2 versione 1.18.6-gke.6600
1,6,1 versione 1.18.6-gke.6600
1,6 versione 1.18.6-gke.6600

Funzionalità supportate

Questo documento elenca la disponibilità di caratteristiche e funzionalità per Anthos clusters on bare metal per le release supportate. La tabella non è intesa come un elenco esaustivo, ma evidenzia alcuni dei vantaggi dell'upgrade dei tuoi cluster all'ultima versione supportata.

Le funzionalità elencate come Anteprima sono coperte dai Termini delle offerte pre-GA dei Termini di servizio di Google Cloud. I prodotti e le funzionalità pre-GA potrebbero avere supporto limitato e le modifiche a tali prodotti e funzionalità potrebbero non essere compatibili con altre versioni pre-GA. Per ulteriori informazioni, consulta le descrizioni della fase di lancio. Le offerte in anteprima sono destinate esclusivamente all'utilizzo in ambienti di test.

Le funzionalità elencate come disponibilità generale (GA) sono completamente supportate, aperte a tutti i clienti e pronte per l'uso in produzione.

Funzionalità/funzionalità 1.11 1,12 1,13 1.14 (più recente)
Criteri di avviso Anteprima Anteprima Anteprima Anteprima
Runtime VM Anthos Anteprima GA GA GA
Bilanciamento del carico in bundle con BGP GA GA GA GA
Audit logging di Cloud GA GA GA GA
Supporto dell'interfaccia a riga di comando per il backup e il ripristino del cluster GA GA GA GA
Rotazione delle autorità di certificazione (CA) dei cluster GA GA GA GA
Supporto dell'interfaccia a riga di comando per il ripristino del nodo del cluster GA GA GA GA
runtime dei container containerizzati GA GA GA GA
IP piatto dinamico con protocollo BGP (Border Gateway Protocol) Anteprima Anteprima GA GA
Gateway NAT in uscita GA GA GA GA
Modalità IPv4 piatta (statica) GA GA GA GA
Supporto IPv6 piatto (modalità BGP) Anteprima Anteprima GA GA
Supporto del bilanciatore del carico basato su BGP per IPv6 Non disponibile Anteprima GA GA
Doppio stack IPv4/IPv6 GA GA GA GA
Assistenza KSA GA GA GA GA
Collector gestito per Google Cloud Managed Service per Prometheus Non disponibile Anteprima GA GA
Connettività multi-cluster Anteprima Anteprima Anteprima Anteprima
Più NIC per pod GA GA GA GA
Gateway di connettività di rete Non disponibile Anteprima Anteprima Anteprima
Rilevatore di problemi dei nodi GA GA GA GA
Supporto del mirroring del registro Anteprima Anteprima GA GA
Networking SR-IOV GA GA GA GA
Metriche API di riepilogo Anteprima GA GA GA
Workload Identity GA GA GA GA

Modello di responsabilità condivisa

L'esecuzione di un'applicazione di produzione business-critical su cluster Anthos su Bare Metal richiede a più parti di assumersi responsabilità diverse. Anche se non si tratta di un elenco completo, le seguenti sezioni elencano i ruoli e le responsabilità.

Responsabilità di Google

  • Manutenzione e distribuzione del pacchetto software Anthos clusters on bare metal.
  • Notifica agli utenti degli upgrade disponibili per Anthos clusters on bare metal e produzione di script di upgrade per la versione precedente; Anthos clusters on bare metal supporta solo gli upgrade sequenziali (ad esempio: 1.2 → 1.3 → 1.4 e non 1.2 → 1.4).
  • Utilizzo dei servizi Connect e Suite operativa di Google Cloud.
  • Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di eventuali problemi relativi ai componenti forniti da Google

Responsabilità degli utenti

  • Amministrazione complessiva del sistema per i cluster on-premise.
  • Manutenzione di qualsiasi carico di lavoro delle applicazioni di cui è stato eseguito il deployment nel cluster.
  • Esecuzione, manutenzione e applicazione di patch all'infrastruttura di data center, tra cui networking, server, sistema operativo, archiviazione e connettività a Google Cloud.
  • Esecuzione, manutenzione e applicazione di patch ai bilanciatori del carico di rete se si sceglie l'opzione del bilanciatore del carico manuale.
  • Eseguire regolarmente l'upgrade dei cluster Anthos su versioni Bare Metal.
  • Monitoraggio di cluster e applicazioni e risposta a eventuali incidenti.
  • Assicurare il deployment degli agenti Cloud Operations nei cluster.
  • Fornire a Google dettagli ambientali a scopo di risoluzione dei problemi.

Assistenza per sviluppatori

Google non supporta i carichi di lavoro delle applicazioni in esecuzione su Anthos clusters on bare metal. Tuttavia, offriamo il miglior supporto per gli sviluppatori per assicurare che gli sviluppatori possano eseguire facilmente le applicazioni su Anthos clusters on bare metal. Riteniamo che interagire in anticipo durante lo sviluppo possa prevenire incidenti critici più avanti nel deployment.

Questa assistenza per gli sviluppatori è disponibile per i clienti con un pacchetto di assistenza a pagamento e viene considerata una priorità P3 per un problema che blocca un lancio o una priorità P4 per la consulenza generale.