Rilevamento automatico dei problemi

Panoramica

La funzionalità di rilevamento automatico dei problemi (AIS) fornisce informazioni rapide sui problemi in corso rilevati nel tuo cluster Hybrid. Queste informazioni includono link alla documentazione per la risoluzione dei problemi. La visualizzazione automatica dei problemi cerca solo problemi noti e comuni rilevabili dal sistema e non può rilevare tutti i problemi all'interno di un cluster.

A partire dalla versione 1.10 di Apigee Hybrid, il componente di monitoraggio del runtime di Apigee esegue automaticamente la scansione del piano di controllo e dello stato del server API Kubernetes per determinare se sono presenti problemi di configurazione. Per impostazione predefinita, la ricerca viene eseguita ogni 60 secondi. Se preferisci, puoi modificare l'intervallo o disattivare la scansione.

Quando AIS rileva un problema, crea una nuova istanza di ApigeeIssue all'interno del server dell'API Kubernetes. Queste istanze contengono informazioni sui problemi e link alla documentazione relativa ai problemi specifici.

Quando risolvi i problemi, questi vengono eliminati automaticamente dal server dell'API Kubernetes quando la scansione determina che non si verificano più.

Utilizzo della funzionalità di rilevamento automatico dei problemi.

Controlla se ci sono problemi con il comando kubectl get apigeeissues:

kubectl -n APIGEE_NAMESPACE get apigeeissues

Ad esempio:

kubectl -n APIGEE_NAMESPACE get apigeeissues

NAME                                 SEVERITY    AGE URL
vhost-missing-eg-nonprod             Error       1hr https://cloud.google.com/apigee/docs/hybrid/MISSING_ENV_GROUP
control-plane-connectivity-failure   Error       1d  https://cloud.google.com/apigee/docs/hybrid/OLD_TLS_VERSION

Per informazioni più dettagliate su un problema specifico, utilizza il comando kubectl describe con il nome del problema. Il nome deve essere preceduto da apigeeissues, ad esempio: apigeeissues vhost-missing-eg-nonprod.

kubectl -n APIGEE_NAMESPACE describe apigeeissues vhost-missing-eg-nonprod

Name:         vhost-missing-eg-nonprod
Namespace:    apigee
Labels:       
Annotations:  
API Version:  apigee.cloud.google.com/v1alpha1
Kind:         ApigeeIssue
Metadata:
  Creation Timestamp:  2022-08-25T20:41:56Z
  Managed Fields:
    API Version:  apigee.cloud.google.com/v3
  Resource Version:  12345678
  UID:               aaaaaaaa-bbbb-cccc-dddd-eeeeffffgggg
Spec:
  Severity: Error
  Reason: MISSING_ENV_GROUP
  Details: Expected envgroup "nonprod" for ApigeeRouteConfig "my-org-nonprod"
  Documentation: https://cloud.google.com/apigee/docs/hybrid/MISSING_ENV_GROUP
  Ignore: false
  IgnoreReason:
Events: 

Modificare l'intervallo di analisi

Per impostazione predefinita, Watcher esegue la scansione del piano di controllo per rilevare eventuali problemi ogni 60 secondi. Per modificare l'intervallo di scansione, specifica il nuovo intervallo in secondi con la proprietà watcher.args.issueScanInterval nel file delle sostituzioni. Ad esempio:

watcher:
  args:
    issueScanInterval: 120

Applica la configurazione.

Esegui l'upgrade del grafico apigee-env per ogni ambiente Apigee.

helm upgrade $ORG_NAME apigee-org/ \
  --namespace APIGEE_NAMESPACE \
  -f OVERRIDES_FILE

Disattivazione dell'individuazione automatica dei problemi

Puoi disattivare la visualizzazione automatica dei problemi impostando la proprietà watcher.args.enableIssueScanning su false nel file delle sostituzioni. Ad esempio:

watcher:
  args:
    enableIssueScanning: false

Applica la configurazione.

Esegui l'upgrade del grafico apigee-env per ogni ambiente Apigee.

helm upgrade $ORG_NAME apigee-org/ \
  --namespace APIGEE_NAMESPACE \
  -f OVERRIDES_FILE
La visualizzazione automatica dei problemi può fornire link direttamente alle guide alla risoluzione dei problemi, tra cui: Consulta la Introduzione alle guide pratiche di Apigee X e Apigee hybrid per una panoramica e un elenco delle guide alla risoluzione dei problemi di Apigee.