Configura un bilanciatore del carico delle applicazioni esterno con Ingress


Questo tutorial mostra come eseguire un'applicazione web dietro un bilanciatore del carico delle applicazioni esterno configurando la risorsa Ingress.

Questa pagina è rivolta agli esperti di networking che progettano e progettano la rete per la propria organizzazione e installano, configurano e supportano le apparecchiature di rete. Per approfondire i ruoli comuni e le attività di esempio a cui facciamo riferimento nei contenuti di Google Cloud, consulta Ruoli e attività comuni degli utenti di GKE Enterprise.

Sfondo

Google Kubernetes Engine (GKE) offre il supporto integrato di due tipi di Cloud Load Balancing per un'applicazione accessibile pubblicamente:

  1. In entrata

  2. Bilanciatore del carico di rete passthrough esterno

In questo tutorial utilizzi Ingressi.

In entrata

Quando specifichi kind: Ingress in un manifest delle risorse, indichi a GKE di creare una risorsa Ingress. Se includi annotazioni e supporti carichi di lavoro e servizi, puoi creare un controller Ingress personalizzato. In caso contrario, GKE effettua le chiamate API Google Cloud appropriate per creare un Application Load Balancer esterno. Le regole host e i corrispondenti per percorso della mappa URL del bilanciatore del carico fanno riferimento a uno o più servizi di backend, dove ogni servizio di backend corrisponde a un servizio GKE di tipo NodePort, come indicato in Ingress. I backend per ciascun servizio di backend sono gruppi di istanze o gruppi di endpoint di rete (NEG). I NEG vengono creati quando configuri il bilanciamento del carico nativo dei container come parte della configurazione di Ingress. Per ogni servizio di backend, GKE crea un controllo di integrità di Google Cloud in base alle impostazioni del probe di idoneità del carico di lavoro a cui fa riferimento il corrispondente servizio GKE.

Se esponi un servizio HTTP(S) ospitato su GKE, il bilanciamento del carico HTTP(S) è il metodo consigliato per il bilanciamento del carico.

Obiettivi

  • Creare un cluster GKE.
  • Esegui il deployment dell'applicazione web di esempio nel cluster.
  • Esponi l'app di esempio su internet dietro un bilanciatore del carico delle applicazioni esterno.

Costi

In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:

Per generare una stima dei costi basata sull'utilizzo previsto, utilizza il Calcolatore prezzi. I nuovi utenti di Google Cloud potrebbero essere idonei per una prova gratuita.

Al termine delle attività descritte in questo documento, puoi evitare la fatturazione continua eliminando le risorse che hai creato. Per ulteriori informazioni, consulta la sezione Pulizia.

Prima di iniziare

Per abilitare l'API Kubernetes Engine, segui questi passaggi:
  1. Visita la pagina di Kubernetes Engine nella console Google Cloud.
  2. Crea o seleziona un progetto.
  3. Attendi che l'API e i relativi servizi siano abilitati. L'operazione può richiedere diversi minuti.
  4. Make sure that billing is enabled for your Google Cloud project.

Installa i seguenti strumenti a riga di comando utilizzati in questo tutorial:

  • gcloud viene utilizzato per creare ed eliminare i cluster Kubernetes Engine. gcloud è incluso nell'interfaccia a riga di comando gcloud.
  • kubectl viene utilizzato per gestire Kubernetes, il sistema di orchestrazione dei cluster utilizzato da Kubernetes Engine. Puoi installare kubectl utilizzando gcloud:
    gcloud components install kubectl

Clona il codice di esempio da GitHub:

git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples
cd kubernetes-engine-samples/networking/load-balancing

Impostare i valori predefiniti per lo strumento a riga di comando gcloud

Per risparmiare tempo digitando le opzioni ID progetto e Zona Compute Engine nello strumento a riga di comando gcloud, puoi impostare i valori predefiniti:
gcloud config set project project-id
gcloud config set compute/zone compute-zone

Crea un cluster GKE

Crea un cluster GKE Autopilot:

gcloud container clusters create-auto loadbalancedcluster

Deployment di un'applicazione web

Il seguente manifest descrive un deployment che esegue l'immagine container dell'applicazione web di esempio su un server HTTP sulla porta 8080:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: web
  namespace: default
spec:
  selector:
    matchLabels:
      run: web
  template:
    metadata:
      labels:
        run: web
    spec:
      containers:
      - image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0
        imagePullPolicy: IfNotPresent
        name: web
        ports:
        - containerPort: 8080
          protocol: TCP

Applica la risorsa al cluster:

kubectl apply -f web-deployment.yaml

Esposizione del deployment all'interno del cluster

Il manifest seguente descrive un servizio che rende accessibile il deploymentweb all'interno del cluster di container:

apiVersion: v1
kind: Service
metadata:
  name: web
  namespace: default
spec:
  ports:
  - port: 8080
    protocol: TCP
    targetPort: 8080
  selector:
    run: web
  type: NodePort
  1. Applica la risorsa al cluster:

    kubectl apply -f web-service.yaml
    

    Quando crei un servizio di tipo NodePort con questo comando, GKE rende disponibile il servizio su un numero di porta elevato selezionato in modo randomico (ad es. 32640) su tutti i nodi del cluster.

  2. Verifica che il servizio sia stato creato e che sia stata allocata una porta del nodo:

    kubectl get service web
    
    Output:
    NAME      TYPE       CLUSTER-IP      EXTERNAL-IP   PORT(S)          AGE
    web       NodePort   10.35.245.219   <none>        8080:32640/TCP   5m
    

    Nell'output di esempio, la porta del nodo per il servizio web è 32640. Tieni inoltre presente che non è stato allocato alcun IP esterno per questo servizio. Poiché i nodi GKE non sono accessibili dall'esterno per impostazione predefinita, la creazione di questo servizio non rende l'applicazione accessibile da internet.

Per rendere pubblicamente accessibile l'applicazione del server web HTTP(S), devi creare una risorsa Ingress.

Creazione di una risorsa Ingress

Ingress è una risorsa Kubernetes che incapsula una raccolta di regole e configurazione per il routing del traffico HTTP(S) esterno ai servizi interni.

Su GKE, la risorsa Ingress viene implementata utilizzando Cloud Load Balancing. Quando crei un Ingress nel tuo cluster, GKE crea un bilanciatore del carico HTTP(S) e lo configura per instradare il traffico alla tua applicazione.

Il seguente manifest descrive una risorsa Ingress che indirizza il traffico al tuo servizio web:

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: basic-ingress
spec:
  defaultBackend:
    service:
      name: web
      port:
        number: 8080

Applica la risorsa al cluster:

kubectl apply -f basic-ingress.yaml

Dopo aver eseguito il deployment di questo manifest, Kubernetes crea una risorsa Ingress sul tuo cluster. Il controller Ingress di GKE crea e configura un bilanciatore del carico HTTP(S) in base alle informazioni in Ingress, instradando tutto il traffico HTTP esterno (sulla porta 80) al servizio NodePort web che hai esposto.

Visitare l'applicazione

Scopri l'indirizzo IP esterno del bilanciatore del carico che gestisce la tua applicazione eseguendo:

kubectl get ingress basic-ingress
Output:
NAME            HOSTS     ADDRESS         PORTS     AGE
basic-ingress   *         203.0.113.12    80        2m

Apri l'indirizzo IP esterno della tua applicazione in un browser e visualizza una risposta HTTP in testo normale come la seguente:

Hello, world!
Version: 1.0.0
Hostname: web-6498765b79-fq5q5

Puoi visitare la pagina Bilanciamento del carico nella console Google Cloud ed esaminare le risorse di networking create dal controller Ingress di GKE.

(Facoltativo) Configurazione di un indirizzo IP statico

Quando esponi un server web su un nome di dominio, è necessario che l'indirizzo IP esterno di un'applicazione sia un indirizzo IP statico che non cambia.

Per impostazione predefinita, GKE alloca indirizzi IP esterni effimeri per le applicazioni HTTP esposte tramite un Ingress. Gli indirizzi temporanei sono soggetti a modifica. Se prevedi di eseguire la tua applicazione per molto tempo, devi utilizzare un indirizzo IP esterno statico.

Tieni presente che dopo aver configurato un indirizzo IP statico per la risorsa Ingress, l'eliminazione di Ingress non comporta l'eliminazione dell'indirizzo IP statico associato. Assicurati di eliminare gli indirizzi IP statici che hai configurato se non prevedi di utilizzarli di nuovo.

Per configurare un indirizzo IP statico, completa i seguenti passaggi:

  1. Prenota un indirizzo IP esterno statico denominato web-static-ip:

    gcloud

    gcloud compute addresses create web-static-ip --global
    

    Config Connector

    Nota:questo passaggio richiede Config Connector. Segui le istruzioni di installazione per installare Config Connector nel cluster.

    apiVersion: compute.cnrm.cloud.google.com/v1beta1
    kind: ComputeAddress
    metadata:
      name: web-static-ip
    spec:
      location: global
    Per eseguire il deployment di questo manifest, scaricalo sulla tua macchina come compute-address.yaml ed esegui:
    kubectl apply -f compute-address.yaml

  2. Il manifest basic-ingress-static.yaml aggiunge un'annotazione su Ingress per usare la risorsa IP statica denominata web-static-ip:

    apiVersion: networking.k8s.io/v1
    kind: Ingress
    metadata:
      name: basic-ingress
      annotations:
        kubernetes.io/ingress.global-static-ip-name: "web-static-ip"
    spec:
      defaultBackend:
        service:
          name: web
          port:
            number: 8080

    Visualizza il manifest:

    cat basic-ingress-static.yaml
    
  3. Applica la risorsa al cluster:

    kubectl apply -f basic-ingress-static.yaml
    
  4. Controlla l'indirizzo IP esterno:

    kubectl get ingress basic-ingress
    

    Attendi che l'indirizzo IP della tua applicazione cambi per utilizzare l'indirizzo IP riservato della risorsa web-static-ip.

    Potrebbero essere necessari alcuni minuti per aggiornare la risorsa Ingress esistente, riconfigurare il bilanciatore del carico e propagare le regole di bilanciamento del carico in tutto il mondo. Al termine di questa operazione, GKE rilascia l'indirizzo IP temporaneo precedentemente allocato alla tua applicazione.

(Facoltativo) Pubblicazione di più applicazioni su un bilanciatore del carico

Puoi eseguire più servizi su un unico bilanciatore del carico e IP pubblico configurando le regole di routing su Ingress. Se ospiti più servizi nello stesso Ingress, puoi evitare di creare bilanciatori del carico aggiuntivi (che sono risorse fatturabili) per ogni servizio esposto a internet.

Il seguente manifest descrive un deployment con la versione 2.0 della stessa applicazione web:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: web2
  namespace: default
spec:
  selector:
    matchLabels:
      run: web2
  template:
    metadata:
      labels:
        run: web2
    spec:
      containers:
      - image: us-docker.pkg.dev/google-samples/containers/gke/hello-app:2.0
        imagePullPolicy: IfNotPresent
        name: web2
        ports:
        - containerPort: 8080
          protocol: TCP

Applica la risorsa al cluster:

kubectl apply -f web-deployment-v2.yaml

Il seguente manifest descrive un servizio che espone web2 internamente al cluster su un servizio NodePort denominato web2:

apiVersion: v1
kind: Service
metadata:
  name: web2
  namespace: default
spec:
  ports:
  - port: 8080
    protocol: TCP
    targetPort: 8080
  selector:
    run: web2
  type: NodePort

Applica la risorsa al cluster:

kubectl apply -f web-service-v2.yaml

Il seguente manifest descrive una risorsa Ingress che:

  • inoltra le richieste con percorso che inizia con /v2/ al servizio web2
  • inoltra tutte le altre richieste al servizio web
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: fanout-ingress
spec:
  rules:
  - http:
      paths:
      - path: /*
        pathType: ImplementationSpecific
        backend:
          service:
            name: web
            port:
              number: 8080
      - path: /v2/*
        pathType: ImplementationSpecific
        backend:
          service:
            name: web2
            port:
              number: 8080

Applica la risorsa al cluster:

kubectl create -f fanout-ingress.yaml

Dopo aver eseguito il deployment di Ingress, esegui kubectl get ingress fanout-ingress per trovare l'indirizzo IP pubblico del cluster.

Quindi visita l'indirizzo IP per verificare che entrambe le applicazioni siano raggiungibili sullo stesso bilanciatore del carico:

  • Visita http://<IP_ADDRESS>/ e tieni presente che la risposta contiene Version: 1.0.0 (poiché la richiesta viene indirizzata al servizio web)
  • Visita http://<IP_ADDRESS>/v2/ e tieni presente che la risposta contiene Version: 2.0.0 (poiché la richiesta viene indirizzata al servizio web2)

L'unico carattere jolly supportato per il campo path di un Ingress è il carattere *. Il carattere * deve seguire una barra (/) e deve essere l'ultimo carattere del pattern. Ad esempio, /*, /foo/* e /foo/bar/* sono pattern validi, ma *, /foo/bar* e /foo/*/bar non lo sono.

Un pattern più specifico ha la precedenza su uno meno specifico. Se hai sia /foo/* che /foo/bar/*, /foo/bar/bat viene considerato corrispondente a /foo/bar/*.

Per ulteriori informazioni sulle limitazioni dei percorsi e sulla corrispondenza dei pattern, consulta la documentazione di URL Maps.

(Facoltativo) Monitoraggio della disponibilità e della latenza del servizio

I controlli di uptime di Google Cloud eseguono il monitoraggio blackbox delle applicazioni dal punto di vista dell'utente, determinando la latenza e la disponibilità da più IP esterni all'indirizzo IP del bilanciatore del carico. In confronto, i controlli di integrità di Google Cloud eseguono un controllo interno rispetto agli IP dei pod, determinando la disponibilità a livello di istanza. I controlli sono complementari e forniscono un quadro completo della salute dell'applicazione.

Puoi creare un controllo di uptime utilizzando la console Google Cloud, l'API Cloud Monitoring o le librerie client di Cloud Monitoring. Per informazioni, consulta Gestire i controlli di uptime. Se vuoi creare un controllo di uptime utilizzando la console Google Cloud, segui questi passaggi:

  1. Vai alla pagina Servizi e Ingress nella console Google Cloud.

    Vai a Servizi e Ingress

  2. Fai clic sul nome del servizio per cui vuoi creare un controllo di uptime.

  3. Fai clic su Crea controllo di uptime.

  4. Nel riquadro Crea controllo di uptime, inserisci un titolo per il controllo di uptime, quindi fai clic su Avanti per passare alle impostazioni Destinazione.

    I campi Target del controllo di uptime vengono compilati automaticamente utilizzando le informazioni del bilanciatore del carico del servizio.

    Per una documentazione completa su tutti i campi di un controllo di uptime, consulta Creare un controllo di uptime.

  5. Fai clic su Avanti per passare alle impostazioni di Convalida della risposta.

  6. Fai clic su Avanti per passare alla sezione Avvisi e notifiche.

    Per monitorare un controllo di uptime, puoi creare un criterio di avviso o visualizzare la dashboard del controllo di uptime. Un criterio di avviso può inviarti una notifica via email o tramite un altro canale se il controllo di uptime non va a buon fine. Per informazioni generali sui criteri di avviso, consulta Introduzione agli avvisi.

    .
  7. Fai clic su Crea.

Note

Per impostazione predefinita, Ingress esegue un controllo di integrità periodico inviando una richiesta GET sul percorso / per determinare lo stato dell'applicazione e si aspetta una risposta HTTP 200. Se vuoi controllare un percorso diverso o prevedere un codice di risposta diverso, puoi utilizzare un percorso di controllo di integrità personalizzato.

Ingress supporta casi d'uso più avanzati, ad esempio:

  • Hosting virtuale basato su nome:puoi utilizzare Ingress per riutilizzare il bilanciatore del carico per più nomi di dominio e sottodomini e per esporre più servizi su un unico indirizzo IP e bilanciatore del carico. Consulta gli esempi di fanout semplice e di hosting virtuale basato su nome per scoprire come configurare Ingress per queste attività.

  • Terminazione HTTPS: puoi configurare Ingress per terminare il traffico HTTPS utilizzando Cloud Load Balancing.

Quando un Ingress viene eliminato, il controller Ingress di GKE esegue automaticamente la pulizia delle risorse associate (tranne gli indirizzi IP statici riservati).

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

  1. Elimina le regole di inoltro e i proxy di destinazione creati manualmente che fanno riferimento all'Ingress:

    Un proxy di destinazione inutilizzato che fa riferimento a una mappa URL gestita dal controller Ingress di GKE causerà l'errore di eliminazione di Ingress nelle versioni GKE 1.15.4-gke.22 e successive. Controlla la risorsa Ingress per trovare un evento con un messaggio di errore simile al seguente:

     Error during GC: error running load balancer garbage collection routine: googleapi: Error 400: The url_map resource 'projects/project-id/global/urlMaps/k8s2-um-tlw9rhgp-default-my-ingress-9ifnni82' is already being used by 'projects/project-id/global/targetHttpsProxies/k8s2-um-tlw9rhgp-default-my82-target-proxy', resourceInUseByAnotherResource
     

    Nel messaggio di errore precedente, k8s2-um-tlw9rhgp-default-my82-target-proxy è un proxy https di destinazione creato manualmente che fa ancora riferimento alla mappa URL k8s2-um-tlw9rhgp-default-my-ingress-9ifnni82 creata e gestita da un controller Ingress.

    Queste risorse frontend create manualmente (sia regola di forwarding sia il proxy target) devono essere eliminate prima di procedere con l'eliminazione di Ingress.

  2. Elimina Ingress:questo passaggio annulla l'assegnazione dell'indirizzo IP esterno temporaneo e delle risorse di bilanciamento del carico associate alla tua applicazione:

    kubectl delete ingress basic-ingress

    Se hai seguito il passaggio facoltativo per creare un Ingress per indirizzare le richieste in base al percorso, elimina l'Ingress:

    kubectl delete ingress fanout-ingress

  3. Elimina l'indirizzo IP statico:completa questo passaggio solo se hai seguito il passaggio facoltativo per creare un indirizzo IP statico.

    • Se hai seguito l'opzione 1 per convertire un indirizzo IP temporaneo esistente in IP statico, vai alla console Google Cloud per eliminare l'indirizzo IP statico.

    • Se hai seguito l'opzione 2 per creare un nuovo indirizzo IP statico, esegui il seguente comando per eliminarlo:

      gcloud compute addresses delete web-static-ip --global
  4. Elimina il cluster:questo passaggio elimina i nodi di calcolo del tuo cluster di container e altre risorse come i deployment nel cluster:

    gcloud container clusters delete loadbalancedcluster

Passaggi successivi