Risoluzione dei problemi relativi a proxy sidecar/webhook in Cloud Service Mesh

Questa sezione illustra i problemi comuni di Cloud Service Mesh e come risolverli. Se hai bisogno di ulteriore assistenza, vedi Ricevere assistenza.

Cloud Service Mesh contiene due webhook:

  • Il webhook di convalida garantisce che la configurazione di Istio applicata sia valida.
  • Il webhook con mutazioni imposta l'iniezione automatica di sidecar nei nuovi pod.

Un problema di configurazione in uno di questi webhook potrebbe causare l'interruzione dell'avvio dei nuovi pod o la generazione di messaggi di errore.

Problemi di iniezione di sidecar

L'iniezione Sidecar non funziona correttamente se si verifica uno dei seguenti problemi:

  • pod pianificati senza sidecar
  • I pod in cui devono essere iniettati i sidecar non vengono mai visualizzati quando si utilizza kubectl get pods, ma il set di replica corrispondente di kubectl get replicaset esiste.

Per risolvere i problemi di inserimento di sidecar, segui i passaggi riportati di seguito.

  1. Verifica che lo spazio dei nomi o il pod abbia l'etichetta di inserimento corretta.

    Se esegui Istio a revisione singola (impostazione predefinita), verifica che il tuo la specifica dello spazio dei nomi o del pod ha l'etichetta istio-injection=enabled.

    Se esegui Istio con più revisioni (per migrazioni senza tempo di inattività, piani di controllo e così via), verifica che lo spazio dei nomi o la specifica del pod siano l'etichetta istio.io/rev=REVISION appropriata, dove REVISION è il numero di revisione di Cloud Service Mesh su istiod che corrisponde alla versione Cloud Service Mesh selezionata. Per ulteriori informazioni sulle etichette di revisione, consulta Eseguire l'iniezione di proxy sidecar.

  2. Verifica che il webhook di inserimento del sidecar istio sia presente e che abbia un bundle CA.

    Il webhook di iniezione di sidecar (utilizzato per l'iniezione automatica di sidecar) richiede un bundle CA per stabilire connessioni sicure con il server API e istiod. Questo bundle CA viene applicato alla configurazione da istiod, ma a volte può essere sovrascritto (ad esempio, se si applica di nuovo la configurazione del webhook).

    Puoi verificare la presenza del bundle CA utilizzando il seguente comando. Il comando include istio-sidecar-injector-asm-1233-2, che è specifico per questa versione di Cloud Service Mesh. Assicurati di utilizzare i valori effettivi revisione se differisce.

    kubectl get mutatingwebhookconfigurations.admissionregistration.k8s.io istio-sidecar-injector-asm-1233-2 -o=jsonpath='{.webhooks[0].clientConfig.caBundle}'

    Se l'output non è vuoto, viene configurato il bundle CA. Se il pacchetto CA è mancante, riavvia istiod per eseguire nuovamente la scansione dell'webhook e reinstallare il pacchetto CA.

  3. Verifica la presenza di errori di inserimento del file collaterale.

    Se hai attivato l'iniezione, ma non visualizzi la pianificazione dei pod, controlla lo stato del livello di astrazione successivo. Ad esempio, se stai eseguendo un deployment, ma non è pianificato alcun pod, controlla lo stato degli set di replica corrispondenti utilizzando il seguente comando:

    kubectl -n my-namespace describe replicaset your-deployment-name

    Se il set di repliche è presente, controlla il log eventi nella parte inferiore della descrizione degli errori. Se l'errore riguarda l'inserimento di file collaterali, controlla istiod per un'indicazione della causa dell'errore.

  4. Se il problema persiste, potrebbe essere uno dei seguenti:

    • Configurazione errata passata all'iniettore
    • Problemi di configurazione del firewall
    • Un problema nel codice Istio

    Vedi Risoluzione dei problemi di Istio per ulteriori passaggi diagnostici.

I proxy Envoy non ricevono la configurazione da istiod

Esistono diversi problemi che possono impedire ai proxy di ricevere la configurazione da istiod.

  1. istiod non invierà la configurazione ai proxy Envoy se si verificano problemi, ad esempio un problema di RBAC che impedisce la lettura della risorsa di configurazione.

  2. L'indirizzo di rilevamento non è corretto (errori "upstream non integro")

  3. L'indirizzo di rilevamento fornito all'iniettore collaterale non è corretto. Se vedrai i log che menzionano gRPC config stream closed, no healthy upstream, verifica che l'indirizzo di rilevamento nel mesh ProxyConfig è corretta e rimanda al tuo servizio istiod.

  4. Configurazione non valida inviata al proxy. In questo caso, la configurazione viene inviata correttamente al proxy, ma non è valida. Potrai vedi messaggi ripetuti simili ai seguenti:

    Envoy proxy is NOT ready: config not received from Pilot (is Pilot running?): cds updates: 1 successful, 0 rejected; lds updates: 0 successful, 1 rejected

    In questo esempio, cds è Cluster Discovery Service (che riporta 1 aggiornamento inviato da istiod) e lds è il servizio di rilevamento listener (indica che 1 aggiornamento è stato rifiutato da istiod). Spesso vedrai un modello in cui viene spiegato il motivo del rifiuto, solitamente inizia con un avviso sulla configurazione di envoy o un avviso simile.

    Per risolvere il problema, esamina la causa della configurazione rifiutata. Una causa comune è la scarsa qualità delle risorse EnvoyFilter. Se non è evidente il motivo, invia una segnalazione di bug con un dump della configurazione del proxy.

La creazione del pod non riesce

Se noti che i pod non vengono creati correttamente, cerca un errore messaggi che potrebbero fornire indizi per il problema di base, utilizzando il seguente comando:

kubectl describe replicaset YOUR_REPLICA_SET

Messaggi di errore comuni relativi al webhook

I messaggi di errore generati dal comando kubectl apply possono fornire un suggerimento la causa principale. Consulta la tabella seguente per conoscere i messaggi di errore comuni, cause e potenziali risoluzioni.

Messaggio di errore Causa Risoluzione
net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) Potrebbe trattarsi di un problema di connettività di rete. Assicurati che le regole firewall forniscano la connettività a "istiod" sulla porta 15017.
no endpoints available for service 'istiod' Ciò può verificarsi se il pod "istiod" non è disponibile o non è pronto. Controlla i pod "istiod" per assicurarti che siano in esecuzione e pronti.
Service "istiod" not found Questo può verificarsi se il servizio "istiod" non esiste. Verifica che l'installazione di Istio sia riuscita e corretta.
x509: certificate signed by unknown authority Potrebbe trattarsi di un problema relativo al certificato webhook. Verifica che caBundle sia impostato correttamente sul webhook.
Failed to update validatingwebhookconfiguration istio-validator-asm-[version-n]-istio-system (failurePolicy=Fail, resourceVersion=[version]): Operation cannot be fulfilled on validatingwebhookconfigurations.admissionregistration.k8s.io "istio-validator-asm-[version-n]-istio-system": the object has been modified; please apply your changes to the latest version and try again. Un webhook di convalida da una versione precedente di Istio Cloud Service Mesh che è stato disinstallato potrebbe interferire con un eseguire l'upgrade o l'installazione. Verifica che tutti i webhook siano ancora presenti nel cluster e rimuovi eventuali webhook che fanno riferimento a versioni non più installate.
Error from server (InternalError): Internal error occurred: failed calling webhook "rev.namespace.sidecar-injector.istio.io": Post "https://istiod-asm-1122-0.istio-system.svc:443/inject?timeout=10s": context deadline exceeded Per i cluster privati, la porta 15017 deve essere aperta. Questo messaggio di errore indica che la porta 15017 potrebbe non essere aperta. Assicurati che le regole firewall forniscano connettività a Istiod sulla porta 15017. Per saperne di più, consulta Apertura di una porta su un cluster privato.