Scalabilità e scalabilità automatica dei servizi di runtime

Puoi scalare la maggior parte dei servizi in esecuzione in Kubernetes dalla riga di comando o in una sostituzione di configurazione. Puoi impostare i parametri di scalabilità per i servizi di runtime di Apigee hybrid nel file overrides.yaml.

Servizio Implementato come Scalabilità
Cassandra ApigeeDatastore (CRD) Consulta Scalabilità di Cassandra.
Ingress/LoadBalancer Deployment Cloud Service Mesh utilizza la scalabilità automatica orizzontale dei pod (HPA).
Logger DaemonSet I DaemonSet gestiscono le repliche di un pod su tutti i nodi, quindi si adattano alle modifiche quando esegui lo scale dei pod stessi.
MART
Apigee Connect
Watcher
ApigeeOrganization (CRD)

Per eseguire il ridimensionamento tramite configurazione, aumenta il valore della proprietà di configurazione replicaCountMin del deployment per le stanza mart, watcher e/o connectAgent. Ad esempio:

mart:
  replicaCountMax: 2
  replicaCountMin: 1

watcher:
  replicaCountMax: 2
  replicaCountMin: 1

connectAgent:
  replicaCountMax: 2
  replicaCountMin: 1

Questi deployment utilizzano un Horizontal Pod Autoscaler per la scalabilità automatica. Imposta la proprietà targetCPUUtilizationPercentage dell'oggetto Deployment sulla soglia per l'aumento di scala. Quando questo valore viene superato, Kubernetes aggiunge i pod fino al valore di replicaCountMax.

Per ulteriori informazioni sull'impostazione delle proprietà di configurazione, consulta Gestire i componenti del piano di runtime.

Runtime
Synchronizer
UDCA
ApigeeEnvironment (CRD) Per eseguire il ridimensionamento tramite configurazione, aumenta il valore della proprietà replicaCountMin per le stanza udca, synchronizer e/o runtime nel file delle sostituzioni. Ad esempio:
synchronizer:
  replicaCountMax: 10
  replicaCountMin: 1

runtime:
  replicaCountMax: 10
  replicaCountMin: 1

udca:
  replicaCountMax: 10
  replicaCountMin: 1

Nota : queste modifiche si applicano a TUTTI gli ambienti nel file delle sostituzioni. Se vuoi personalizzare la scalabilità per ogni ambiente, consulta Configurazioni avanzate di seguito.

Questi deployment utilizzano un Horizontal Pod Autoscaler per la scalabilità automatica. Imposta la proprietà targetCPUUtilizationPercentage dell'oggetto Deployment sulla soglia per l'aumento di scala. Quando questo valore viene superato, Kubernetes aggiunge i pod fino al valore di replicaCountMax.

Per ulteriori informazioni sull'impostazione delle proprietà di configurazione, consulta Gestire i componenti del piano di runtime.

Configurazioni avanzate

In alcuni scenari, potrebbe essere necessario utilizzare opzioni di ridimensionamento avanzate. Ecco alcuni scenari di esempio:

  • Impostazione di opzioni di ridimensionamento diverse per ogni ambiente. Ad esempio, env1 ha un valore minReplica pari a 5 e env2 ha un valore minReplica pari a 2.
  • Impostazione di opzioni di scalabilità diverse per ciascun componente all'interno di un ambiente. Ad esempio, se il componente udca ha un valore maxReplica pari a 5 e il componente synchronizer ha un valore maxReplica pari a 2.

L'esempio seguente mostra come utilizzare il comando kubernetes patch per modificare la proprietà maxReplicas del componente runtime:

  1. Crea le variabili di ambiente da utilizzare con il comando:
    export ENV_NAME=my-environment-name
    export ENV_RELEASE_NAME=$ENV_NAME # the Helm release name for the environment
    export APIGEE_NAMESPACE=apigee  #the namespace where Apigee is deployed
    export COMPONENT=runtime #can be udca or synchronizer
    export MAX_REPLICAS=2
    export MIN_REPLICAS=1
  2. Applica la patch. Tieni presente che questo esempio presuppone che kubectl sia in PATH:
    kubectl patch apigeeenvironment -n $APIGEE_NAMESPACE \
      $(kubectl get apigeeenvironments -n $APIGEE_NAMESPACE -o jsonpath='{.items[?(@.spec.name == "'$ENV'" )]..metadata.name}') \
      --patch "$(echo -e "spec:\n  components:\n    $COMPONENT:\n      autoScaler:\n        maxReplicas: $MAX_REPLICAS\n        minReplicas: $MIN_REPLICAS")" \
      --type merge
    
  3. Verifica la modifica:
    kubectl get hpa -n $APIGEE_NAMESPACE
    

Scalabilità basata sull'ambiente

Per impostazione predefinita, la scalabilità è descritta a livello di organizzazione. Puoi sostituire le impostazioni predefinite specificando la scalabilità specifica per l'ambiente nel file overrides.yaml, come mostrato nell'esempio seguente:

envs:
  # Apigee environment name
  - name: ENV_NAME>
    components:
    # Environment-specific scaling override
    # Otherwise, uses scaling defined at the respective root component
     runtime:
      replicaCountMin: 2
      replicaCountMax: 20

Scalabilità basata sulle metriche

Con la scalabilità basata su metriche, il runtime può utilizzare le metriche della CPU e dell'applicazione per scalare i pod apigee-runtime. L'API Horizontal Pod Autoscaler (HPA) di Kubernetes utilizza il campo hpaBehavior per configurare i comportamenti di scalabilità verso l'alto e verso il basso del servizio target. La scalabilità basata sulle metriche non è disponibile per altri componenti in un deployment ibrido.

La scalabilità può essere regolata in base alle seguenti metriche:

Metrica Misura Considerazioni
serverMainTaskWaitTime Tempo di attesa medio (in ms) della coda di elaborazione nelle istanze di runtime per le richieste proxy per elaborare i criteri. Questa metrica misura l'impatto della complessità dei criteri associati al flusso di richieste proxy.
serverNioTaskWaitTime Tempo di attesa medio (in ms) della coda di elaborazione nelle istanze di runtime per le richieste proxy a livello HTTP. Questa metrica misura l'impatto del numero e delle dimensioni del payload delle richieste e delle risposte del proxy.

L'esempio seguente della stanza runtime in overrides.yaml illustra i parametri standard (e gli intervalli consentiti) per il ridimensionamento dei pod apigee-runtime in un'implementazione ibrida:

runtime:
  # the following parameters configure metrics-based scaling
  hpaMetrics:
    serverMainTaskWaitTime: 400M # (range: 300M to 450M)
    serverNioTaskWaitTime: 400M # (range: 300M to 450M)
    targetCPUUtilizationPercentage: 75
  hpaBehavior:
    scaleDown:
      percent:
        periodSeconds: 60 # (range: 30 - 180)
        value: 20 # (range: 5 - 50)
      pods:
        periodSeconds: 60 # (range: 30 - 180)
        value: 2 # (range: 1 - 15)
      selectPolicy: Min
      stabilizationWindowSeconds: 120 # (range: 60 - 300)
    scaleUp:
      percent:
        periodSeconds: 60 # (range: 30 - 120)
        value: 20 # (range: 5 - 100)
      pods:
        periodSeconds: 60 # (range: 30 - 120)
        value: 4 # (range: 2 - 15)
      selectPolicy: Max
      stabilizationWindowSeconds: 30 # (range:  30 - 120)
  

Applica queste impostazioni aggiornando il grafico apigee-runtime per ogni ambiente. Ad esempio:

helm upgrade $ENV_RELEASE_NAME apigee-runtime/ \
  --namespace APIGEE_NAMESPACE \
  --atomic \
  --set env=$ENV_NAME \
  -f overrides.yaml

Attivare o disattivare il ridimensionamento basato su metriche

La scalabilità basata sulle metriche è attiva per impostazione predefinita. Puoi attivare o disattivare la scalabilità basata sulle metriche impostando la proprietà customAutoscaling.enabled su true o false. Applica le modifiche alla proprietà customAutoscaling.enabled aggiornando il grafico apigee-telemetry. Ad esempio:

helm upgrade telemetry apigee-telemetry/ \
  --namespace APIGEE_NAMESPACE \
  --atomic \
  -f overrides.yaml

Configurare una scalabilità più aggressiva

L'aumento dei valori percent e pods del criterio di scalabilità comporterà un criterio di scalabilità più aggressivo. Analogamente, l'aumento dei valori percent e pods in scaleDown comporterà un criterio di riduzione aggressivo. Ad esempio:

runtime:
  # ...
  hpaMetrics:
    serverMainTaskWaitTime: 400M
    serverNioTaskWaitTime: 400M
    targetCPUUtilizationPercentage: 75
  hpaBehavior:
    scaleDown:
      percent:
        periodSeconds: 60
        value: 20
      pods:
        periodSeconds: 60
        value: 4
      selectPolicy: Min
      stabilizationWindowSeconds: 120
    scaleUp:
      percent:
        periodSeconds: 60
        value: 30
      pods:
        periodSeconds: 60
        value: 5
      selectPolicy: Max
      stabilizationWindowSeconds: 30

Nell'esempio riportato sopra, il valore scaleDown.pods.value viene aumentato a 5, il valore scaleUp.percent.value viene aumentato a 30 e il valore scaleUp.pods.value viene aumentato a 5.

Configurare una scalabilità meno aggressiva

I valori di configurazione hpaBehavior possono anche essere ridotti per implementare criteri di ridimensionamento meno aggressivi. Ad esempio:

runtime:
  # ...
  hpaMetrics:
    serverMainTaskWaitTime: 400M
    serverNioTaskWaitTime: 400M
    targetCPUUtilizationPercentage: 75
  hpaBehavior:
    scaleDown:
      percent:
        periodSeconds: 60
        value: 10
      pods:
        periodSeconds: 60
        value: 1
      selectPolicy: Min
      stabilizationWindowSeconds: 180
    scaleUp:
      percent:
        periodSeconds: 60
        value: 20
      pods:
        periodSeconds: 60
        value: 4
      selectPolicy: Max
      stabilizationWindowSeconds: 30

Nell'esempio riportato sopra, scaleDown.percent.value viene ridotto a 10, scaleDown.pods.value viene ridotto a 1 e scaleUp.stablizationWindowSeconds viene aumentato a 180.

Per ulteriori informazioni sul ridimensionamento basato su metriche utilizzando il campo hpaBehavior, consulta Criteri di ridimensionamento.

Risoluzione dei problemi

Questa sezione descrive i metodi di risoluzione dei problemi relativi agli errori comuni che potresti riscontrare durante la configurazione del ridimensionamento e del ridimensionamento automatico.

L'HPA mostra unknown per i valori delle metriche

Se la scalabilità basata sulle metriche non funziona e l'HPA mostra unknown per i valori delle metriche, utilizza il seguente comando per controllare l'output dell'HPA:

kubectl describe hpa HPA_NAME

Quando esegui il comando, sostituisci HPA_NAME con il nome dell'HPA che vuoi visualizzare.

L'output mostrerà il target e l'utilizzo della CPU del servizio, a indicare che la scalabilità della CPU funzionerà in assenza di scalabilità basata su metriche. Per il comportamento dell'HPA che utilizza più parametri, consulta Eseguire il scaling in base a più metriche.