Assistenza

L'obiettivo principale dell'assistenza di Google è risolvere gli incidenti di produzione il più rapidamente possibile. Comprendere la configurazione, analizzare log e metriche e collaborare con i partner ci aiuta a risolvere rapidamente gli incidenti.

Google Cloud offre vari pacchetti di assistenza per venire incontro alle tue esigenze e alle esigenze aziendali. Tutti i pacchetti di assistenza Google Cloud includono il supporto per Versione Google Kubernetes Engine (GKE) Enterprise e Google Distributed Cloud. Se disponi di un account pacchetto di assistenza Google Cloud, allora hai già per GKE Enterprise e Google Distributed Cloud.

Per ulteriori informazioni, consulta documentazione dell'assistenza Google Cloud.

Requisiti per l'assistenza di Google Distributed Cloud

Per risolvere in modo efficace gli incidenti critici per l'attività:

Strumenti di assistenza

Per risolvere un incidente Google Distributed Cloud, il team di assistenza Google Cloud si basa su tre informazioni:

Configurazione dell'ambiente

Quando apri una richiesta di assistenza, l'esecuzione dei comandi seguenti fornisce informazioni informazioni sulla configurazione del cluster:

  • Per tutti i tipi di cluster, esegui il comando bmctl check cluster --snapshot per acquisire informazioni su Kubernetes e sui tuoi nodi. Allega il risultato tar alla richiesta di assistenza.

  • Per i cluster di amministrazione, ibrida e autonomi, esegui il comando bmctl check cluster per controllare lo stato di integrità del cluster e dei nodi. Allega il i log risultanti alla richiesta di assistenza. Dovrebbero esistere nel Directory bmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP].

  • Per i cluster utente, crea prima un file YAML del controllo di integrità con il cluster il nome e lo spazio dei nomi, quindi applica il file nel cluster:

    1. Crea un file YAML con le seguenti proprietà healthcheck. Ecco contenuti di esempio per un cluster denominato user1 in cluster-user1 spazio dei nomi:

      apiVersion: baremetal.cluster.gke.io/v1
      kind: HealthCheck
      metadata:
        generateName: healthcheck-
        namespace: cluster-user1
      spec:
        clusterName: user1
      
    2. Dopo aver creato il file YAML, applica la risorsa personalizzata nella che gestisce il cluster utente con il comando kubectl. Ecco un comando di esempio che utilizza il file YAML creato nella passaggio. Nell'esempio, la variabile ADMIN_KUBECONFIG specifica il percorso del file kubeconfig del cluster di amministrazione:

      kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
      

      Il comando restituisce la seguente risposta:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
      
    3. Attendi il completamento del job di controllo di integrità eseguendo un test per verificare se la riconciliazione del job di controllo di integrità è stata completata. Nel caso di esempio precedente, il nome del job di controllo di integrità healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf. Ecco un il test di esempio con il comando kubectl che attende 30 minuti per la job di controllo di integrità da completare:

      kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \
          -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
      

      Una volta completato, il comando restituisce:

      healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
      

      Puoi vedere i risultati del job di controllo di integrità con il seguente comando:

      kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \
          -n cluster-user1
      

      Il comando restituisce il seguente risultato:

      NAME                PASS   AGE
      healthcheck-7c4qf   true   17m
      
    4. Raccogli tutti i log dei pod del job di controllo di integrità in un file locale con Comando kubectl. Ecco un esempio che utilizza l'integrità del campione precedente controlla il lavoro:

      kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \
          -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \
          healthcheck-7c4qf.log
      

Log del cluster

Quando crei un nuovo cluster Google Distributed Cloud, Cloud Logging sono abilitati per impostazione predefinita e l'ambito è limitato solo ai componenti a livello di sistema. In questo modo, vengono replicati i log a livello di sistema nel progetto Google Cloud associato al cluster. I log a livello di sistema provengono dai pod Kubernetes nel seguente spazi dei nomi:

  • kube-system
  • gke-system
  • gke-connect
  • istio-system
  • config-management-system
  • gatekeeper-system
  • cnrm-system
  • knative-serving

È possibile eseguire query sui log da Cloud Logging Google Cloud.

Per ulteriori dettagli, consulta Logging e monitoraggio.

Google Cloud CLI e accesso remoto al cluster

Se apri una richiesta di assistenza, l'assistenza clienti Google Cloud potrebbe chiederti la sola lettura da remoto ai cluster per diagnosticare e risolvere i problemi in modo più efficace. Per consentire al team di assistenza di disporre dell'accesso sufficiente per risolvere i problemi del cluster da remoto, assicurati di aver installato e aggiornato l'ultima versione di Google Cloud CLI. Google Cloud CLI deve essere alla versione 401.0.0 o versioni successive per concedere all'assistenza clienti Google Cloud le autorizzazioni necessarie. I nostri suggerimenti aggiornare regolarmente Google Cloud CLI per acquisire autorizzazioni aggiuntive miglioramenti.

Per installare i componenti più recenti di gcloud CLI, utilizza il comando gcloud components update. Per maggiori informazioni informazioni su come concedere all'assistenza clienti Google Cloud l'accesso in sola lettura da remoto al tuo consulta l'articolo sull'assistenza Google Cloud per i tuoi clienti cluster.

Metriche del cluster

Oltre ai log, l'agente Cloud Monitoring acquisisce anche le metriche. Questo replica le metriche a livello di sistema nel progetto Google Cloud associato con il cluster. Le metriche a livello di sistema provengono dai pod Kubernetes in esecuzione gli stessi spazi dei nomi elencati in Log.

Per ulteriori dettagli, consulta Logging e monitoraggio.

Come risolviamo i problemi del tuo ambiente

Ecco un esempio di un tipico incidente di assistenza:

  1. L'amministratore del cluster apre una richiesta di assistenza nella console Google Cloud o nella Google Cloud Support Center e seleziona l'edizione Google Kubernetes Engine (GKE) Enterprise e Google Distributed Cloud rispettivamente come categoria e componente. Entra le informazioni richieste e allega l'output dei comandi bmctl pertinenti al caso.

  2. La richiesta di assistenza viene inoltrata a un tecnico del supporto tecnico specializzato in Google Distributed Cloud.

  3. Il tecnico del servizio di assistenza esamina i contenuti dello snapshot per ricavare contesto dell'ambiente.

  4. Il tecnico del servizio di assistenza esamina i log e le metriche in Google Cloud progetto, inserendo l'case ID di assistenza come giustificazione aziendale, viene registrato internamente.

  5. Il tecnico del servizio di assistenza risponde alla richiesta con una valutazione e un consiglio per i nostri esperti. L'ingegnere dell'assistenza e l'utente continuano la risoluzione dei problemi fino a trovare una soluzione.

Che cosa supporta Google?

In genere, il team di assistenza Cloud supporta tutti i componenti software forniti come parte di Google Distributed Cloud e Cloud Service Mesh, Policy Controller, Config Sync e Config Controller. Per un elenco più completo delle funzionalità supportate e non supportate, consulta la tabella seguente:

Supporto per Google Cloud Non supportata
Kubernetes e il runtime del container Scelta del cliente del bilanciatore del carico (bilanciamento del carico manuale)
Connect e l'agente Connect Codice cliente (vedi Assistenza per gli sviluppatori)
Operazioni, Monitoring, Logging e agenti di Google Cloud Sistema operativo scelto dal cliente
Bilanciatore del carico in bundle Server, archiviazione e rete fisici o virtuali
Controller Ingress DNS esterni, DHCP e sistemi di identità
GKE Identity Service
Cloud Service Mesh
Policy Controller
Config Sync
Config Controller

Criterio di supporto della versione

L'assistenza per Google Distributed Cloud segue Criteri di supporto di GKE Enterprise. Google supporta ogni versione secondaria di Google Distributed Cloud per la versione successiva di:

  • 12 mesi dopo il rilascio iniziale della versione secondaria.
  • La release della terza versione secondaria successiva.
di Gemini Advanced. Per le date di rilascio secondarie più recenti per GKE Enterprise e le date di fine del ciclo di vita più vecchie, vedi Periodo di assistenza di GKE Enterprise.

Per gli elenchi delle versioni di Google Distributed Cloud supportate e non supportate, vedi Controllo delle versioni.

Per informazioni sulle versioni relative agli upgrade dei cluster, consulta Regole relative alle versioni per gli upgrade.

Modello di responsabilità condivisa

Esecuzione di un'applicazione di produzione business-critical su Google Distributed Cloud e richiede che più parti abbiano responsabilità diverse. Sebbene non sia un completo, le seguenti sezioni elencano i ruoli e le responsabilità.

Responsabilità di Google

  • Manutenzione e distribuzione del pacchetto software Google Distributed Cloud.
  • Avvisare gli utenti degli upgrade disponibili per Google Distributed Cloud e produrre script di upgrade per la versione precedente; Google Distributed Cloud supporta solo gli upgrade sequenziali (esempio: 1.2 → 1.3 → 1.4 e non 1.2 → 1,4).
  • Uso dei servizi Connect e Suite operativa di Google Cloud.
  • Risolvere i problemi, fornire soluzioni alternative e correggere la causa principale di qualsiasi problemi relativi ai componenti forniti da Google

Responsabilità degli utenti

  • Amministrazione complessiva del sistema per i cluster on-premise.
  • Mantenimento dei carichi di lavoro delle applicazioni di cui è stato eseguito il deployment nel cluster.
  • Esecuzione, manutenzione e applicazione di patch all'infrastruttura del data center, inclusi il networking, i server, il sistema operativo, lo spazio di archiviazione in Google Cloud.
  • Esecuzione, manutenzione e applicazione di patch dei bilanciatori del carico di rete se carico manuale viene scelta l'opzione di bilanciamento del carico.
  • Upgrade regolari delle versioni di Google Distributed Cloud.
  • Monitoraggio del cluster e delle applicazioni e risposta a eventuali incidenti.
  • Assicurarsi che il deployment degli agenti nella suite operativa di Google Cloud venga eseguito nei cluster.
  • Fornire a Google dettagli ambientali per la risoluzione dei problemi.

Assistenza per gli sviluppatori

Google non fornisce assistenza specifica per i carichi di lavoro delle applicazioni. Tuttavia, offriamo assistenza agli sviluppatori con il best effort per garantire che i tuoi sviluppatori possono eseguire applicazioni su Google Distributed Cloud. Riteniamo che interagire prima durante lo sviluppo, possono prevenire gli incidenti critici nelle fasi successive del deployment.

L'assistenza per gli sviluppatori basata sul best effort è disponibile per i clienti con qualsiasi servizio di assistenza a pagamento di pacchetto di assistenza ed è considerato una priorità P3 per un problema che blocca un lancio, o una priorità P4 per la consulenza generale. In questa classificazione, la priorità il livello 0 è la priorità più alta.