L'obiettivo principale dell'assistenza di Google è quello di risolvere gli incidenti di produzione il più rapidamente possibile. Per farlo, comprendiamo la tua configurazione, analizziamo log e metriche e collaboriamo con i partner per risolvere rapidamente gli incidenti.
Google Cloud offre una varietà di pacchetti di assistenza per soddisfare le tue esigenze. Tutti i pacchetti di assistenza di Google Cloud includono il supporto per Anthos clusters on Anthos. Se hai già un pacchetto di assistenza Google Cloud, hai già supporto per Anthos e Cluster Anthos on bare metal.
Per ulteriori informazioni, consulta la documentazione dell'assistenza Google Cloud.
Requisiti per il supporto di Cluster Anthos on bare metal
Per risolvere efficacemente gli incidenti critici a livello aziendale:
- Controlla che il tuo ambiente sia aggiornato e che rientri nei periodi di fine pubblicazione pubblicati. Per ulteriori informazioni, consulta la sezione Criteri per il supporto delle versioni.
- Abilita Cloud Logging e Cloud Monitoring per i componenti di sistema. Per maggiori dettagli, consulta la sezione Strumenti di assistenza di seguito.
Strumenti di supporto
Per risolvere un problema di Cluster Anthos on bare metal, l'assistenza Google Cloud si basa su tre informazioni:
- La tua configurazione di ambiente
- Log dei tuoi cluster
- Metriche dei tuoi cluster
La configurazione del tuo ambiente
Quando apri una richiesta di assistenza, l'esecuzione dei seguenti comandi fornisce informazioni chiave sulla configurazione del cluster:
Per tutti i tipi di cluster, esegui il comando
bmctl check cluster --snapshot
per acquisire informazioni su Kubernetes e sui tuoi nodi. Collega la tarball risultante alla richiesta di assistenza.Per cluster di amministrazione, ibridi e autonomi, esegui il comando
bmctl check cluster
per controllare lo stato di integrità del cluster e dei nodi. Associa i log generati alla richiesta di assistenza. Dovrebbero trovarsi nella directorybmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
.Per i cluster utente, crea prima un file YAML del controllo di integrità con il nome e lo spazio dei nomi del cluster, quindi applica il file nel cluster di amministrazione appropriato:
Crea un file YAML con le seguenti proprietà di
healthcheck
. Di seguito sono riportati dei contenuti di esempio per un cluster denominatouser1
nello spazio dei nomicluster-user1
:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
Dopo aver creato il file YAML, applica la risorsa personalizzata nel cluster di amministrazione che gestisce il cluster utente con il comando
kubectl
. Ecco un comando di esempio che utilizza il file YAML creato nel passaggio precedente. Nell'esempio, la variabileADMIN_KUBECONFIG
specifica il percorso del file kubeconfig del cluster di amministrazione:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
Il comando restituisce la seguente risposta:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
Attendi il completamento del job di controllo dello stato di integrità per vedere se il job di controllo di integrità ha terminato la riconciliazione. Nel caso dell'esempio precedente, il nome del job di controllo di integrità è
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
. Ecco un test di esempio con il comandokubectl
che attende 30 minuti per il completamento del job di controllo di integrità:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
Al termine, questo comando restituisce:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
Puoi visualizzare i risultati del job di controllo di integrità con il seguente comando:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
Il comando restituisce il seguente risultato:
NAME PASS AGE healthcheck-7c4qf true 17m
Raccogli tutti i log dei pod del controllo di integrità in un file locale con il comando
kubectl
. Ecco un esempio che utilizza il job di controllo di integrità di esempio precedente:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
Log del cluster
Quando crei un nuovo cluster Anthos on bare metal, gli agenti Cloud Logging sono abilitati per impostazione predefinita e hanno come ambito solo i componenti a livello di sistema. Replica i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono da pod Kubernetes nei seguenti spazi dei nomi:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
Puoi eseguire query sui log dalla console di Cloud Logging.
Per maggiori dettagli, consulta Logging e Monitoring.
Metriche del cluster
Oltre ai log, le metriche vengono acquisite anche dall'agente Cloud Monitoring. Replica le metriche a livello di sistema nel progetto Google Cloud associato al cluster. Le metriche a livello di sistema provengono da pod Kubernetes in esecuzione negli stessi spazi dei nomi elencati nei log.
Per maggiori dettagli, consulta Logging e Monitoring.
Come risolviamo i problemi del tuo ambiente
Ecco un esempio di un tipico incidente di assistenza:
- Un utente, ad esempio l'amministratore del cluster, apre una richiesta di assistenza tramite la console Google Cloud o Google Cloud Support Center e seleziona i cluster Anthos e Anthos su Bare Metal come Categoria e Componente, rispettivamente. Inserendo le informazioni richieste, associano all'output l'output dei comandi
bmctl
pertinenti. - La richiesta di assistenza viene inoltrata a un Technical Support Engineer specializzato in Cluster Anthos on bare metal.
- Il tecnico dell'assistenza esamina i contenuti dello snapshot per recuperare il contesto dell'ambiente.
- Il tecnico dell'assistenza esamina i log e le metriche nel progetto Google Cloud, inserendo l'ID richiesta di assistenza come giustificazione aziendale, che viene registrato internamente.
- Il tecnico dell'assistenza risponde alla richiesta con una valutazione e un consiglio. Il tecnico dell'assistenza e l'utente continuano la risoluzione dei problemi fino a quando non trovano una soluzione.
Che cosa supporta Google?
In generale, il team di assistenza Cloud supporta tutti i componenti software forniti nell'ambito di Cluster Anthos on bare metal, oltre ad Anthos Service Mesh e Anthos Config Management. La tabella seguente fornisce ulteriori dettagli:
Supporto per Google Cloud | Funzionalità non supportata |
---|---|
Kubernetes e il runtime del container | Scelta del bilanciatore del carico da parte del cliente (bilanciamento del carico manuale) |
Connect e l'agente Connect | Codice cliente (consulta la sezione Assistenza per gli sviluppatori di seguito). |
Operazioni, monitoraggio, logging e agenti di Google Cloud | Scelta del sistema operativo da parte del cliente |
Bilanciatore del carico in bundle | Server fisico o virtuale, spazio di archiviazione e rete |
Controller Ingress | DNS esterni, DHCP e sistemi di identità |
Anthos Identity Service | |
Anthos Service Mesh | |
Anthos Config Management |
Criterio per il supporto delle versioni
Il supporto per Cluster Anthos on bare metal segue i Criteri di assistenza della versione di Anthos. Google supporta la versione attuale e le due versioni secondarie precedenti (n-2) di Cluster Anthos on bare metal.
La tabella seguente mostra le versioni supportate e non supportate di questo prodotto.
Versione secondaria | Data di uscita | Data di fine del ciclo di vita più anticipata | Panche disponibili | Versione di Kubernetes |
---|---|---|---|---|
1,14 (più recente) | 8 dicembre 2022 | 8 dicembre 2023 | 1,14,0 | versione 1.25.3-gke.1400 |
1,13 | 29 settembre 2022 | 29 giugno 2023 | 1,13,3 | versione 1.24.7-gke.1700 |
1,13,2 | versione 1.24.7-gke.300 | |||
1,13,1 | versione 1.24.5-gke.400 | |||
1,13,0 | versione 1.24.2-gke.1900 | |||
1,12 | 29 giugno 2022 | 29 marzo 2023 | 1,12,6 | versione 1.23.13-gke.1700 |
1,12,5 | versione 1.23.13-gke.1700 | |||
1,12,4 | versione 1.23.11-gke.500 | |||
1,12,3 | versione 1.23.10-gke.1000 | |||
1,12,2 | versione 1.23.5-gke.1505 | |||
1,12,1 | versione 1.23.5-gke.1505 | |||
1,12,0 | versione 1.23.5-gke.1504 | |||
1.11 (non supportato) | 21 marzo 2022 | 21 dicembre 2022 | 1,11,8 | versione 1.22.15-gke.3300 |
1,11,7 | versione 1.22.14-gke.500 | |||
1,11,6 | versione 1.22.8-gke.204 | |||
1,11,5 | versione 1.22.8-gke.204 | |||
1,11,4 | versione 1.22.8-gke.204 | |||
1,11,3 | versione 1.22.8-gke.203 | |||
1,11,2 | versione 1.22.8-gke.200 | |||
1,11,1 | versione 1.22.8-gke.200 | |||
1,11,0 | versione 1.22.8-gke.200 | |||
1,10 (non supportato) | 10 dicembre 2021 | 10 settembre 2022 | 1,10,8 | versione 1.21.13-gke.202 |
1,10,7 | versione 1.21.13-gke.202 | |||
1,10,6 | versione 1.21.13-gke.201 | |||
1,10,5 | versione 1.21.6-gke.1503 | |||
1,10,4 | versione 1.21.6-gke.1503 | |||
1,10,3 | versione 1.21.5-gke.1300 | |||
1,10,2 | versione 1.21.5-gke.1300 | |||
1,10,1 | versione 1.21.5-gke.1200 | |||
1,10,0 | versione 1.21.5-gke.1200 | |||
1,9 (non supportato) | 23 settembre 2021 | 23 giugno 2022 | 1,9,8 | versione 1.21.13-gke.200 |
1,9,7 | versione 1.21.6-gke.1503 | |||
1,9,6 | versione 1.21.5-gke.1300 | |||
1,9,5 | versione 1.21.5-gke.1300 | |||
1,9,4 | versione 1.21.5-gke.1200 | |||
1,9,3 | versione 1.21.5-gke.1200 | |||
1,9,2 | versione 1.21.4-gke.201 | |||
1,9,1 | versione 1.21.4-gke.201 | |||
1,9,0 | versione 1.21.4-gke.200 | |||
1.8 (non supportato) | 21 giugno 2021 | 21 marzo 2022 | 1,8,9 | versione 1.20.9-gke.102 |
1,8,8 | versione 1.20.9-gke.102 | |||
1,8,7 | versione 1.20.9-gke.102 | |||
1,8,6 | versione 1.20.9-gke.102 | |||
1,8,5 | versione 1.20.9-gke.102 | |||
1,8,4 | versione 1.20.9-gke.101 | |||
1,8,3 | versione 1.20.9-gke.101 | |||
1,8,2 | versione 1.20.8-gke.1500 | |||
1,8,1 | versione 1.20.5-gke.1301 | |||
1,8,0 | versione 1.20.5-gke.1301 | |||
1.7 (non supportato) | 25 marzo 2021 | 25 dicembre 2021 | 1,7,7 | versione 1.19.14-gke.2201 |
1,7,6 | versione 1.19.14-gke.2201 | |||
1,7,5 | versione 1.19.14-gke.2201 | |||
1,7,4 | versione 1.19.14-gke.400 | |||
1,7,3 | versione 1.19.13-gke.100 | |||
1,7,2 | versione 1.19.10-gke.1602 | |||
1,7,1 | versione 1.19.7-gke.1200 | |||
1,7,0 | versione 1.19.7-gke.1200 | |||
1.6 (non supportato) | 30 novembre 2020 | 30 agosto 2021 | 1,6,4 | versione 1.18.20-gke.3000 |
1,6,3 | versione 1.18.18-gke.100 | |||
1,6,2 | versione 1.18.6-gke.6600 | |||
1,6 | versione 1.18.6-gke.6600 | |||
1,6,0 | versione 1.18.6-gke.6600 |
Funzionalità supportate
Questo documento elenca la disponibilità di caratteristiche e funzionalità per Cluster Anthos on bare metal per le release supportate. La tabella non è intesa come un elenco esaustivo, ma evidenzia alcuni dei vantaggi dell'upgrade dei cluster alla versione più recente supportata.
Le funzionalità elencate come anteprima sono regolate dai Termini delle offerte pre-GA dei Termini di servizio di Google Cloud. Il supporto e i prodotti pre-GA potrebbero avere supporto limitato e le modifiche a prodotti e funzionalità pre-GA potrebbero non essere compatibili con altre versioni pre-GA. Per ulteriori informazioni, consulta le descrizioni della fase di lancio. Le offerte in anteprima sono destinate esclusivamente all'utilizzo in ambienti di test.
Le funzionalità elencate come Disponibilità generale (GA) sono completamente supportate, aperte a tutti i clienti e pronte per l'uso in produzione.
Funzionalità/funzionalità | 1.11 | 1,12 | 1,13 | 1.14 (più recente) |
---|---|---|---|---|
Criteri di avviso | Anteprima | Anteprima | Anteprima | Anteprima |
Runtime VM Anthos | Anteprima | GA | GA | GA |
Bilanciamento del carico in bundle con BGP | GA | GA | GA | GA |
Audit logging di Cloud | GA | GA | GA | GA |
Supporto dell'interfaccia a riga di comando di backup e ripristino del cluster | GA | GA | GA | GA |
Rotazione delle autorità di certificazione (CA) del cluster | GA | GA | GA | GA |
Supporto dell'interfaccia a riga di comando per la reimpostazione del nodo cluster | GA | GA | GA | GA |
runtime del container containerd | GA | GA | GA | GA |
IP piatto dinamico con protocollo BGP (Border Gateway Protocol) | Anteprima | Anteprima | GA | GA |
Gateway NAT in uscita | GA | GA | GA | GA |
Modalità IPv4 piatta (statica) | GA | GA | GA | GA |
Supporto IPv6 fisso (modalità BGP) | Anteprima | Anteprima | GA | GA |
Supporto del bilanciatore del carico basato su BGP per IPv6 | Non disponibile | Anteprima | GA | GA |
Dual Stack IPv4/IPv6 | GA | GA | GA | GA |
Assistenza KSA | GA | GA | GA | GA |
raccoglitore gestito per Google Cloud Managed Service per Prometheus | Non disponibile | Anteprima | GA | GA |
Connettività multi-cluster | Anteprima | Anteprima | Anteprima | Anteprima |
Più NIC per pod | GA | GA | GA | GA |
Gateway di connettività di rete | Non disponibile | Anteprima | Anteprima | Anteprima |
Rilevatore di problemi con i nodi | GA | GA | GA | GA |
Supporto del mirroring del registro | Anteprima | Anteprima | GA | GA |
Networking SR-IOV | GA | GA | GA | GA |
Metriche API di riepilogo | Anteprima | GA | GA | GA |
Workload Identity | GA | GA | GA | GA |
Modello di responsabilità condivisa
L'esecuzione di un'applicazione di produzione business-critical su Cluster Anthos on bare metal richiede più parti con responsabilità diverse. Sebbene non si tratti di un elenco esaustivo, le sezioni seguenti contengono i ruoli e le responsabilità.
Responsabilità di Google
- Manutenzione e distribuzione del pacchetto software Cluster Anthos su Bare Metal.
- Notifica agli utenti degli upgrade disponibili per Cluster Anthos on bare metal e produzione di script di upgrade per la versione precedente; Cluster Anthos on bare metal supporta solo gli upgrade sequenziali (ad esempio: 1.2 → 1.3 → 1.4 e non 1.2 → 1.4).
- Utilizzo dei servizi Connect e Cloud Operations.
- Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di eventuali problemi relativi ai componenti forniti da Google
Responsabilità dell'utente
- Amministrazione complessiva del sistema per cluster on-premise.
- Manutenzione di qualsiasi carico di lavoro dell'applicazione di cui è stato eseguito il deployment nel cluster.
- Esecuzione, manutenzione e applicazione di patch all'infrastruttura di data center, inclusi networking, server, sistema operativo, archiviazione e connettività a Google Cloud.
- Esecuzione, manutenzione e applicazione di patch ai bilanciatori del carico di rete se viene scelta l'opzione di bilanciamento del carico manuale.
- Upgrade regolari di cluster Anthos su versioni bare metal.
- Monitoraggio di cluster e applicazioni e risposta a eventuali incidenti.
- Assicurare il deployment degli agenti Cloud Operations nei cluster.
- Fornire a Google dettagli ambientali per la risoluzione dei problemi.
Assistenza per sviluppatori
Google non fornisce assistenza per i carichi di lavoro delle applicazioni in esecuzione su Cluster Anthos on bare metal. Tuttavia, offriamo il miglior supporto possibile per gli sviluppatori per assicurarci che possano eseguire facilmente applicazioni su Cluster Anthos on bare metal. Crediamo che interagire prima durante lo sviluppo possa prevenire incidenti critici più avanti nel deployment.
Questa assistenza per gli sviluppatori è disponibile per i clienti con un pacchetto di assistenza a pagamento e viene considerata una priorità P3 per i problemi che bloccano un lancio o una priorità P4 per la consulenza generale.