L'obiettivo di assistenza principale di Google è risolvere gli incidenti di produzione il più rapidamente possibile. Comprendere la configurazione, analizzare i log e le metriche e collaborare con i partner ci aiuta a risolvere rapidamente gli incidenti.
Google Cloud offre vari pacchetti di assistenza per soddisfare le tue esigenze di assistenza. Tutti i pacchetti di assistenza di Google Cloud includono il supporto per Anthos clusters on bare metal. Se hai già un pacchetto di assistenza Google Cloud, hai già supporto per i cluster Anthos e Anthos su Bare Metal.
Per ulteriori informazioni, consulta la documentazione dell'assistenza Google Cloud.
Requisiti per il supporto di Anthos clusters on bare metal
Per risolvere efficacemente gli incidenti critici per l'attività:
- Controlla che il tuo ambiente sia aggiornato e che rispetti i periodi di fine pubblicazione pubblicati. Per ulteriori informazioni, consulta la sezione Criterio di assistenza per le versioni.
- Abilitare Cloud Logging e Cloud Monitoring per i componenti di sistema. Per maggiori dettagli, consulta la sezione dedicata agli strumenti di assistenza.
Strumenti di supporto
Per risolvere un problema relativo ad Anthos clusters on bare metal, l'assistenza Google Cloud si basa su tre informazioni:
- La configurazione del tuo ambiente
- Log dai tuoi cluster
- Metriche dei tuoi cluster
La configurazione del tuo ambiente
Quando apri una richiesta di assistenza, l'esecuzione dei seguenti comandi fornisce informazioni chiave sulla configurazione del cluster:
Per tutti i tipi di cluster, esegui il comando
bmctl check cluster --snapshot
per acquisire informazioni su Kubernetes e sui nodi. Collega il tarball risultante alla richiesta di assistenza.Per i cluster amministrativi, ibridi e autonomi, esegui il comando
bmctl check cluster
per controllare lo stato di integrità del cluster e dei nodi. Allega i log generati alla richiesta di assistenza. Dovrebbero esistere nella directorybmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
.Per i cluster utente, prima crea un file YAML di controllo di integrità con il nome e l'area dei nomi del cluster, quindi applica il file nel cluster di amministrazione appropriato:
Crea un file YAML con le seguenti proprietà
healthcheck
. Di seguito è riportato un esempio di contenuto per un cluster denominatouser1
nello spazio dei nomicluster-user1
:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
Dopo aver creato il file YAML, applica la risorsa personalizzata nel cluster di amministrazione che gestisce il cluster utente con il comando
kubectl
. Di seguito è riportato un comando di esempio utilizzando il file YAML creato nel passaggio precedente. Nell'esempio, la variabileADMIN_KUBECONFIG
specifica il percorso del file kubeconfig del cluster di amministrazione:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
Il comando restituisce la seguente risposta:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
Attendi il completamento del job di controllo di integrità per verificare se il job di controllo di integrità è stato completato. Nell'esempio precedente, il nome del job di controllo di integrità è
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
. Ecco un test di esempio con il comandokubectl
che attende 30 minuti per il completamento del job di controllo di integrità:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
Al termine, questo comando restituisce:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
Puoi vedere i risultati del job di controllo di integrità con il seguente comando:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
Il comando restituisce il seguente risultato:
NAME PASS AGE healthcheck-7c4qf true 17m
Raccogli tutti i log del pod di controllo di integrità in un file locale con il comando
kubectl
. Ecco un esempio di utilizzo del job di controllo di integrità precedente:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
Log del cluster
Quando crei un nuovo cluster Anthos on bare metal, gli agenti Cloud Logging sono abilitati per impostazione predefinita e hanno come ambito solo i componenti a livello di sistema. Replicherà i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono da pod Kubernetes nei seguenti spazi dei nomi:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
È possibile eseguire query sui log dalla console Cloud Logging.
Per maggiori dettagli, consulta la sezione Logging e monitoraggio.
Metriche del cluster
Oltre ai log, l'agente Cloud Monitoring acquisisce anche le metriche. Replica le metriche a livello di sistema nel progetto Google Cloud associato al cluster. Le metriche a livello di sistema provengono da pod di Kubernetes in esecuzione negli stessi spazi dei nomi elencati nei log.
Per maggiori dettagli, consulta la sezione Logging e monitoraggio.
Come risolviamo i problemi per il tuo ambiente
Di seguito è riportato un esempio di caso di assistenza tipico:
- L'amministratore del cluster apre una richiesta di assistenza nella console Google Cloud o in Google Cloud Support Center e seleziona i cluster Anthos e Anthos on bare metal come Categoria e Componente, rispettivamente. Inseriscino le informazioni richieste e associano all'output l'output dei comandi
bmctl
pertinenti. - La richiesta di assistenza viene inoltrata a un tecnico dell'assistenza tecnica specializzato in Anthos clusters on bare metal.
- Il tecnico del servizio di assistenza esamina il contenuto dello snapshot per ottenere il contesto dell'ambiente.
- Il tecnico del servizio di assistenza esamina i log e le metriche nel progetto Google Cloud, inserendo l'case ID di assistenza come giustificazione aziendale, che viene registrata internamente.
- Il tecnico del servizio di assistenza risponde alla richiesta con una valutazione e un consiglio. Il tecnico del servizio di assistenza e l'utente continuano a risolvere i problemi finché non trovano una soluzione.
Che cosa supporta Google?
In generale, il team di assistenza Cloud supporta tutti i componenti software forniti come parte dei Anthos clusters on bare metal e Anthos Service Mesh e Anthos Config Management. Per un elenco più completo di ciò che è o non è supportato, consulta la tabella seguente:
Supporto per Google Cloud | Non supportato |
---|---|
Kubernetes e il runtime del container | Scelta del bilanciatore del carico da parte del cliente (bilanciamento del carico manuale) |
Connect e l'agente Connect | Codice cliente (vedi Assistenza per gli sviluppatori) |
Suite operativa, monitoraggio, logging e agenti Google Cloud | Scelta del sistema operativo da parte del cliente |
Bilanciatore del carico in bundle | Server fisico, virtuale, di archiviazione e di rete |
Controller Ingress | DNS esterni, DHCP e sistemi di identità |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
Norme relative all'assistenza della versione
Il supporto dei Anthos clusters on bare metal è conforme ai criteri di assistenza della versione di Anthos. Google supporta la versione attuale e le due versioni precedenti (n-2) di Anthos clusters on bare metal.
La tabella seguente mostra le versioni di questo prodotto supportate e non supportate.
Versione secondaria | Data di uscita | Data di fine del ciclo di vita meno recente | patch disponibili | Versione di Kubernetes |
---|---|---|---|---|
1.15 (più recente) | 27 aprile 2023 | 27 aprile 2024 | 1,15,3 | Versione 1.26.5-gke.2100 |
1,15,2 | Versione 1.26.5-gke.1200 | |||
1,15,1 | Versione 1.26.2-gke.1001 | |||
1,15,0 | Versione 1.26.2-gke.1001 | |||
1,14 | 8 dicembre 2022 | 8 dicembre 2023 | 1,14,7 | versione 1.25.10-gke.2100 |
1,14,6 | v1.25.10-gke.1200 | |||
1,14,5 | versione 1.25.7-gke.1000 | |||
1,14,4 | versione 1.25.7-gke.1000 | |||
1,14,3 | versione 1.25.6-gke.1000 | |||
1,14,2 | Versione 1.25.5-gke.1001 | |||
1,14,1 | Versione 1.25.5-gke.1001 | |||
1,14,0 | Versione 1.25.3-gke.1400 | |||
1,13 | 29 settembre 2022 | 17 agosto 2023 | 1,13,9 | v1.24.14-gke.1200 |
1,13,8 | versione 1.24.11-gke.1000 | |||
1,13,7 | versione 1.24.11-gke.1000 | |||
1,13,6 | Versione 1.24.9-gke.2500 | |||
1,13,5 | Versione 1.24.9-gke.2500 | |||
1,13,4 | Versione 1.24.9-gke.2500 | |||
1,13,3 | versione 1.24.7-gke.1700 | |||
1,13,2 | versione 1.24.7-gke.300 | |||
1,13,1 | Versione 1.24.5-gke.400 | |||
1,13,0 | versione 1.24.2-gke.1900 | |||
1.12 (non supportato) | 29 giugno 2022 | 29 marzo 2023 | 1,12,9 | versione 1.23.17-gke.300 |
1,12,8 | v1.23.16-gke.100 | |||
1,12,7 | Versione 1.23.15-gke.2400 | |||
1,12,6 | v1.23.13-gke.1700 | |||
1,12,5 | v1.23.13-gke.1700 | |||
1,12,4 | Versione 1.23.11-gke.500 | |||
1,12,3 | v1.23.10-gke.1000 | |||
1,12,2 | Versione 1.23.5-gke.1505 | |||
1,12,1 | Versione 1.23.5-gke.1505 | |||
1,12,0 | Versione 1.23.5-gke.1504 | |||
1.11 (non supportato) | 21 marzo 2022 | 21 dicembre 2022 | 1,11,8 | Versione 1.22.15-gke.3300 |
1,11,7 | Versione 1.22.14-gke.500 | |||
1,11,6 | versione 1.22.8-gke.204 | |||
1,11,5 | versione 1.22.8-gke.204 | |||
1,11,4 | versione 1.22.8-gke.204 | |||
1,11,3 | versione 1.22.8-gke.203 | |||
1,11,2 | versione 1.22.8-gke.200 | |||
1,11,1 | versione 1.22.8-gke.200 | |||
1,11,0 | versione 1.22.8-gke.200 | |||
1.10 (non supportato) | 10 dicembre 2021 | 10 settembre 2022 | 1,10,8 | versione 1.21.13-gke.202 |
1,10,7 | versione 1.21.13-gke.202 | |||
1,10,6 | versione 1.21.13-gke.201 | |||
1,10,5 | versione 1.21.6-gke.1503 | |||
1,10,4 | versione 1.21.6-gke.1503 | |||
1,10,3 | Versione 1.21.5-gke.1300 | |||
1,10,2 | Versione 1.21.5-gke.1300 | |||
1,10,1 | Versione 1.21.5-gke.1200 | |||
1,10,0 | Versione 1.21.5-gke.1200 | |||
1.9 (non supportato) | 23 settembre 2021 | 23 giugno 2022 | 1,9,8 | versione 1.21.13-gke.200 |
1,9,7 | versione 1.21.6-gke.1503 | |||
1,9,6 | Versione 1.21.5-gke.1300 | |||
1,9,5 | Versione 1.21.5-gke.1300 | |||
1,9,4 | Versione 1.21.5-gke.1200 | |||
1,9,3 | Versione 1.21.5-gke.1200 | |||
1,9,2 | versione 1.21.4-gke.201 | |||
1,9,1 | versione 1.21.4-gke.201 | |||
1,9 | versione 1.21.4-gke.200 | |||
1.8 (non supportato) | 21 giugno 2021 | 21 marzo 2022 | 1,8,9 | versione 1.20.9-gke.102 |
1,8,8 | versione 1.20.9-gke.102 | |||
1,8,7 | versione 1.20.9-gke.102 | |||
1,8,6 | versione 1.20.9-gke.102 | |||
1,8,5 | versione 1.20.9-gke.102 | |||
1,8,4 | versione 1.20.9-gke.101 | |||
1,8,3 | versione 1.20.9-gke.101 | |||
1,8,2 | versione 1.20.8-gke.1500 | |||
1,8,1 | versione 1.20.5-gke.1301 | |||
1,8 | versione 1.20.5-gke.1301 | |||
1.7 (non supportato) | 25 marzo 2021 | 25 dicembre 2021 | 1,7.7 | versione 1.19.14-gke.2201 |
1,7.6 | versione 1.19.14-gke.2201 | |||
1,7,5 | versione 1.19.14-gke.2201 | |||
1,7.4 | versione 1.19.14-gke.400 | |||
1,7.3 | versione 1.19.13-gke.100 | |||
1,7,2 | versione 1.19.10-gke.1602 | |||
1,7,1 | versione 1.19.7-gke.1200 | |||
1,7 | versione 1.19.7-gke.1200 | |||
1.6 (non supportato) | 30 novembre 2020 | 30 agosto 2021 | 1,6,4 | v1.18.20-gke.3000 |
1,6,3 | v1.18.18-gke.100 | |||
1,6,2 | versione 1.18.6-gke.6600 | |||
1,6,1 | versione 1.18.6-gke.6600 | |||
1,6 | versione 1.18.6-gke.6600 |
Funzionalità supportate
Questo documento elenca la disponibilità di caratteristiche e funzionalità per Anthos clusters on bare metal per le release supportate. La tabella non è intesa come un elenco esaustivo, ma evidenzia alcuni dei vantaggi dell'upgrade dei tuoi cluster all'ultima versione supportata.
Le funzionalità elencate come Anteprima sono coperte dai Termini delle offerte pre-GA dei Termini di servizio di Google Cloud. I prodotti e le funzionalità pre-GA potrebbero avere supporto limitato e le modifiche a tali prodotti e funzionalità potrebbero non essere compatibili con altre versioni pre-GA. Per ulteriori informazioni, consulta le descrizioni della fase di lancio. Le offerte in anteprima sono destinate esclusivamente all'utilizzo in ambienti di test.
Le funzionalità elencate come disponibilità generale (GA) sono completamente supportate, aperte a tutti i clienti e pronte per l'uso in produzione.
Funzionalità/funzionalità | 1.12 (non supportato) | 1,13 | 1,14 | 1.15 (più recente) |
---|---|---|---|---|
Criteri di avviso | Anteprima | Anteprima | Anteprima | Anteprima |
Runtime VM Anthos | GA | GA | GA | GA |
Gruppi di Azure Active Directory (AD) | Non disponibile | Non disponibile | GA | GA |
Autorizzazione binaria | Non disponibile | Non disponibile | Non disponibile | Anteprima |
Bilanciamento del carico in bundle con BGP | GA | GA | GA | GA |
Audit logging di Cloud | GA | GA | GA | GA |
Supporto dell'interfaccia a riga di comando per il backup e il ripristino del cluster | GA | GA | GA | GA |
Rotazione delle autorità di certificazione (CA) dei cluster | GA | GA | GA | GA |
Supporto dell'interfaccia a riga di comando per il ripristino del nodo del cluster | GA | GA | GA | GA |
runtime dei container containerizzati | GA | GA | GA | GA |
Gruppo di controllo v2 | Non disponibile | Non disponibile | Anteprima | GA |
IP piatto dinamico con protocollo BGP (Border Gateway Protocol) | Anteprima | GA | GA | GA |
Gateway NAT in uscita | GA | GA | GA | GA |
Modalità IPv4 piatta (statica) | GA | GA | GA | GA |
Supporto IPv6 piatto (modalità BGP) | Anteprima | GA | GA | GA |
Supporto del bilanciatore del carico basato su BGP per IPv6 | Anteprima | GA | GA | GA |
Doppio stack IPv4/IPv6 | GA | GA | GA | GA |
Assistenza KSA | GA | GA | GA | GA |
Collector gestito per Google Cloud Managed Service per Prometheus | Anteprima | GA | GA | GA |
Connettività multi-cluster | Anteprima | Anteprima | Anteprima | Anteprima |
Più NIC per pod | GA | GA | GA | GA |
Network Connectivity Gateway | Anteprima | Anteprima | Anteprima | Anteprima |
Rilevatore di problemi dei nodi | GA | GA | GA | GA |
Supporto del mirroring del registro | Anteprima | GA | GA | GA |
Modalità di computing sicuro (seccomp) | Anteprima | Anteprima | GA | GA |
Networking SR-IOV | GA | GA | GA | GA |
Metriche API di riepilogo | GA | GA | GA | GA |
Workload Identity | GA | GA | GA | GA |
Controlli di servizio VPC | Non disponibile | Non disponibile | Non disponibile | Anteprima |
Upgrade dei nodi paralleli | Non disponibile | Non disponibile | Anteprima | GA |
Modello di responsabilità condivisa
L'esecuzione di un'applicazione di produzione business-critical su Anthos clusters on bare metal richiede a più parti di assumersi responsabilità diverse. Anche se non si tratta di un elenco completo, le seguenti sezioni elencano i ruoli e le responsabilità.
Responsabilità di Google
- Manutenzione e distribuzione del pacchetto software Anthos clusters on bare metal.
- Notifica agli utenti degli upgrade disponibili per Anthos clusters on bare metal e produzione di script di upgrade per la versione precedente; Anthos clusters on bare metal supporta solo gli upgrade sequenziali (ad esempio: 1.2 → 1.3 → 1.4 e non 1.2 → 1.4).
- Utilizzo dei servizi Connect e Suite operativa di Google Cloud.
- Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di eventuali problemi relativi ai componenti forniti da Google
Responsabilità degli utenti
- Amministrazione complessiva del sistema per i cluster on-premise.
- Manutenzione di qualsiasi carico di lavoro delle applicazioni di cui è stato eseguito il deployment nel cluster.
- Esecuzione, manutenzione e applicazione di patch all'infrastruttura di data center, tra cui networking, server, sistema operativo, archiviazione e connettività a Google Cloud.
- Esecuzione, manutenzione e applicazione di patch ai bilanciatori del carico di rete se si sceglie l'opzione del bilanciatore del carico manuale.
- Eseguire regolarmente l'upgrade dei cluster Anthos su versioni Bare Metal.
- Monitoraggio di cluster e applicazioni e risposta a eventuali incidenti.
- Assicurare il deployment degli agenti Cloud Operations nei cluster.
- Fornire a Google dettagli ambientali a scopo di risoluzione dei problemi.
Assistenza per sviluppatori
Google non supporta i carichi di lavoro delle applicazioni in esecuzione su Anthos clusters on bare metal. Tuttavia, offriamo il miglior supporto per gli sviluppatori per assicurare che gli sviluppatori possano eseguire facilmente le applicazioni su Anthos clusters on bare metal. Riteniamo che interagire in anticipo durante lo sviluppo possa prevenire incidenti critici più avanti nel deployment.
Questa assistenza per gli sviluppatori è disponibile per i clienti con un pacchetto di assistenza a pagamento e viene considerata una priorità P3 per un problema che blocca un lancio o una priorità P4 per la consulenza generale.