L'obiettivo di assistenza principale di Google è risolvere gli incidenti di produzione il più rapidamente possibile. Per farlo, è necessario comprendere la configurazione, analizzare i log e le metriche e collaborare con i partner per risolvere rapidamente gli incidenti.
Google Cloud offre una varietà di pacchetti di assistenza per soddisfare le tue esigenze di assistenza. Tutti i pacchetti di assistenza di Google Cloud includono il supporto per Anthos e GKE On-Prem. Se disponi già di un pacchetto di assistenza Google Cloud, hai già il supporto per Anthos e GKE On-Prem.
Per ulteriori informazioni, consulta la documentazione dell'assistenza Google Cloud.
Requisiti per l'assistenza on-prem di GKE
Per risolvere in modo efficace gli incidenti aziendali critici, devi:
- Verifica che l'ambiente sia corrente con i periodi di fine pubblicazione di assistenza (consulta i criteri per il supporto delle versioni di seguito).
- Abilitare Cloud Logging e Cloud Monitoring per i componenti di sistema (per maggiori dettagli, consulta la sezione Strumenti di assistenza).
- Quando apri una richiesta di assistenza, fornisci uno snapshot di configurazione utilizzando il comando
gkectl diagnose snapshot
.
Strumenti di supporto
Per risolvere un problema on-prem di GKE, l'assistenza di Google Cloud si basa su tre informazioni:
- La configurazione del tuo ambiente
- Log dell'amministratore e dei cluster utente
- Metriche dell'amministratore e dei cluster utente
Configurazione
Quando apri una richiesta di assistenza, ti viene chiesto di eseguire il comando gkectl diagnose snapshot --seed-config
e collegare il tarball risultante alla richiesta di assistenza. gkectl diagnose snapshot --seed-config
acquisisce
le informazioni su Kubernetes e sui nodi.
Lo strumento è altamente configurabile e include diversi scenari predefiniti. Puoi anche passare un file YAML con un insieme personalizzato di informazioni da raccogliere. Per scoprire di più, consulta la sezione Diagnosi dei cluster.
Puoi aggiungere un campo excludeWords
al file di configurazione per omettere le informazioni sensibili o riservate. Assicurati di esaminare attentamente le
informazioni acquisite dallo strumento. Le informazioni altamente riservate o sensibili non devono essere allegate alla tua richiesta di assistenza.
Log
Quando crei un nuovo cluster GKE On-Prem, gli agenti Cloud Logging sono abilitati per impostazione predefinita e hanno come ambito solo i componenti a livello di sistema. Replicherà i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono da pod di Kubernetes in esecuzione in uno dei cinque spazi dei nomi:
- kube-system
- gke-system
- gke-connect
- istio-system
- config-management-system
- knative-serving
È possibile eseguire query sui log dalla console Cloud Logging.
Per maggiori dettagli, consulta Logging e monitoraggio.
Metriche
Oltre ai log, le metriche vengono acquisite anche dall'agente Cloud Monitoring. Replica le metriche a livello di sistema nel progetto Google Cloud associato al cluster. Le metriche a livello di sistema provengono da pod di Kubernetes in esecuzione negli stessi spazi dei nomi elencati in Log.
Per maggiori dettagli, consulta Logging e monitoraggio.
Come risolviamo i problemi per il tuo ambiente
Di seguito è riportato un esempio di caso di assistenza tipico:
- Qualcuno, ad esempio l'amministratore del cluster, apre una richiesta di assistenza tramite la console Google Cloud o Google Cloud Support Center e seleziona Anthos e GKE On-Prem come Categoria e componente, rispettivamente. Inserisci le informazioni richieste e allega l'output di
gkectl diagnose snapshot
alla richiesta. - La richiesta di assistenza viene instradata a un tecnico dell'assistenza tecnica specializzato in GKE On-Prem.
- Il tecnico del servizio di assistenza esamina il contenuto dello snapshot per ottenere il contesto dell'ambiente.
- Il tecnico del servizio di assistenza esamina i log e le metriche nel progetto Google Cloud, inserendo l'case ID di assistenza come giustificazione aziendale, che viene registrata internamente.
- Il tecnico del servizio di assistenza risponde alla richiesta con una valutazione e un suggerimento. Il tecnico del servizio di assistenza e l'utente continuano a risolvere i problemi fino a quando non vengono risolti.
Partner di assistenza collaborativi
Google mantiene rapporti di assistenza collaborativa con partner selezionati per offrire un'esperienza di assistenza più fluida per GKE On-Prem. Grazie a questi rapporti, Google può collaborare a stretto contatto con il partner per conto dei suoi clienti condivisi.
Per trarre vantaggio dall'Assistenza collaborativa, devi mantenere i contratti di assistenza con Google e con il partner in questione.
Attualmente Google ha stabilito un rapporto di assistenza collaborativa con i partner specificati nella pagina Partner di assistenza collaborativa.
I dati relativi ai problemi di assistenza potrebbero essere condivisi con i partner di assistenza collaborativa, come descritto nelle linee guida per i servizi di assistenza tecnica di Google.
Che cosa supporta Google?
In genere, il team di assistenza Cloud supporta tutti i componenti software forniti come parte di GKE On-Prem. La tabella seguente fornisce ulteriori dettagli:
Assistenza GCP | Assistenza collaborativa | Non supportato |
---|---|---|
Kubernetes e il runtime del container |
VMware vSphere (vCenter Server ed ESXi) |
Prodotti VMware oltre vSphere |
Ubuntu canonico per sistema operativo guest/nodi |
Bilanciatori del carico BIG-IP F5 |
Codice cliente (vedi Assistenza per gli sviluppatori di seguito) |
Controller vCenter |
Soluzioni per l'infrastruttura e l'infrastruttura iperconvergente, come indicato nella pagina Partner di assistenza collaborativa |
Scelta del cliente del sistema operativo host |
Controller F5 |
Server fisico, spazio di archiviazione e rete |
|
Calico e criteri di rete correlati |
DNS esterno, DHCP e sistemi di identità |
|
Controller Ingress |
Calico Enterprise Edition |
|
Prometheus e Grafana |
||
Stackdriver Monitoring, Stackdriver Logging e Stackdriver Agent |
||
Federazione delle identità con provider conformi all'OIDC |
||
Hub, Connect e Connect Agent |
||
Cloud Run / Knative |
||
LoadBalancer in bundle (Seesaw) |
Norme relative all'assistenza della versione
Il supporto dei cluster Anthos su VMware segue i criteri di assistenza della versione Anthos. Google supporta la versione attuale e le due versioni secondarie precedenti di GKE On-Prem.
La tabella seguente mostra le versioni di questo prodotto supportate e non supportate.
Versione release | Data di rilascio | Data di fine del ciclo di vita meno recente |
---|---|---|
1.15 (più recente) | 2 maggio 2023 | 2 maggio 2024 |
1,14 | 21 dicembre 2022 | 21 dicembre 2023 |
1,13 | 29 settembre 2022 | 17 agosto 2023 |
1.12 (non supportato) | 7 luglio 2022 | 29 marzo 2023 |
1.11 (non supportato) | 27 aprile 2022 | 21 dicembre 2022 |
1.10 (non supportato) | 22 dicembre 2021 | 22 settembre 2022 |
1.9 (non supportato) | 29 settembre 2021 | 29 giugno 2022 |
1.8 (non supportato) | 28 giugno 2021 | 28 marzo 2022 |
1.7 (non supportato) | 25 marzo 2021 | 25 dicembre 2021 |
1.6 (non supportato) | 10 dicembre 2020 | 10 settembre 2021 |
1.5 (non supportato) | 24 settembre 2020 | 24 giugno 2021 |
1.4 (non supportato) | 25 giugno 2020 | 25 marzo 2021 |
1.3 (non supportato) | 23 marzo 2020 | 23 dicembre 2020 |
1.2 (non supportato) | 20 dicembre 2019 | 20 settembre 2020 |
1.1 (non supportato) | 26 settembre 2019 | 26 giugno 2020 |
1.0 (non supportato) | 25 luglio 2019 | 25 aprile 2020 |
Modello di responsabilità condivisa
L'esecuzione di un'applicazione di produzione business-critical su GKE on-prem richiede che più parti abbiano responsabilità diverse. Anche se non è un elenco esaustivo, le sezioni seguenti riportano i ruoli e le responsabilità.
Responsabilità di Google
- Manutenzione e distribuzione del pacchetto software GKE On-Prem, inclusi controller Kubernetes, vCenter e F5, controller Ingress, agenti Agent e Connect e
gkectl
riga di comando. - Manutenzione e distribuzione della workstation di amministrazione Ubuntu e delle immagini delle macchine nodo, incluse patch e correzioni di sicurezza regolari.
- Notifica agli utenti degli upgrade disponibili per GKE On-Prem e produzione di script di upgrade per la versione precedente; GKE On-Prem supporta solo gli upgrade sequenziali (1.2 → 1.3 → 1.4 e non 1.2 → 1.4).
- Utilizzo dei servizi Connect e Stackdriver.
- Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di eventuali problemi relativi ai componenti forniti da Google
Responsabilità degli utenti
- Amministrazione complessiva del sistema per i cluster on-premise.
- Manutenzione di qualsiasi carico di lavoro delle applicazioni di cui è stato eseguito il deployment nel cluster.
- Esecuzione, manutenzione e applicazione di patch all'infrastruttura di data center, inclusi networking, server, archiviazione e connettività a Google Cloud.
- Esecuzione, manutenzione e applicazione di patch ai bilanciatori del carico di rete e vSphere.
- Mantenimento dei contratti di assistenza con VMware e F5 (se distribuiti).
- Eseguire regolarmente l'upgrade delle versioni on-prem di GKE.
- Il test e il deployment hanno aggiornato le immagini delle macchine nodo con le patch Ubuntu.
- Monitoraggio di cluster e applicazioni e risposta a eventuali incidenti.
- Garantire che il deployment degli agenti Cloud Logging e Stackdriver venga eseguito nei cluster.
- Fornire a Google dettagli ambientali a scopo di risoluzione dei problemi.
Assistenza per sviluppatori
Google non fornisce assistenza per i carichi di lavoro delle applicazioni in esecuzione su GKE On-Prem. Tuttavia, offriamo agli sviluppatori il massimo supporto per assicurare che gli sviluppatori possano eseguire facilmente le applicazioni su GKE on-prem. Riteniamo che interagire in anticipo durante lo sviluppo possa prevenire incidenti critici più avanti nel deployment.
Questa assistenza per gli sviluppatori è disponibile per i clienti con un pacchetto di assistenza a pagamento e viene considerata un P3 per un problema che blocca un lancio o un P4 per una consulenza generale.