Cargas de trabajo de Kubernetes para alta disponibilidad
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta página, se recomiendan estrategias de cargas de trabajo de contenedores de Kubernetes que hacen que tu aplicación sea más tolerante a fallas en un universo de varias zonas aislado de Internet de Google Distributed Cloud (GDC). GDC admite aplicaciones en contenedores nativas de Kubernetes que se consumen y admiten ampliamente en Google Kubernetes Engine (GKE).
Esta página está dirigida a los desarrolladores que forman parte del grupo de operadores de aplicaciones y que son responsables de crear cargas de trabajo de aplicaciones para su organización. Para obtener más información, consulta Audiences for GDC air-gapped documentation.
Consideraciones de Kubernetes para apps de HA
Lograr la alta disponibilidad (HA) en Kubernetes va más allá del plano de control. También debes diseñar e implementar cargas de trabajo de contenedores en tu universo aislado de Google Distributed Cloud (GDC) de forma resiliente. Kubernetes ofrece varios mecanismos potentes para minimizar el tiempo de inactividad y proporcionar servicios de alta disponibilidad, incluso cuando se producen problemas de infraestructura o durante el mantenimiento de rutina. Los siguientes temas son estrategias clave que se deben tener en cuenta para la HA:
Mantén la disponibilidad con réplicas y el ajuste de escala automático: Debes tener suficientes instancias en ejecución de tu aplicación para proporcionar HA.
ReplicaSet: Un recurso ReplicaSet mantiene un conjunto estable de réplicas de Pod idénticas que se ejecutan en cualquier momento. Si un Pod falla o se finaliza, el controlador de ReplicaSet crea automáticamente un Pod nuevo para reemplazarlo. Consulta la documentación de Kubernetes sobre ReplicaSet para obtener más información.
Horizontal Pod Autoscaler (HPA): Si bien un ReplicaSet mantiene una cantidad fija de réplicas, el HPA ajusta automáticamente esta cantidad en función de las métricas observadas, como el uso de CPU o el uso de memoria. Esto permite que tu aplicación controle los picos de carga. Consulta la documentación de Kubernetes sobre el ajuste de escala automático horizontal de Pods para obtener más información.
Extremos estables y balanceo de cargas con servicios: Consulta la documentación de Servicios de Kubernetes para obtener más información.
Actualizaciones y reversiones correctas con implementaciones: Consulta la reversión de una implementación en la documentación de Kubernetes para obtener más información.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[],[],null,["# Kubernetes workloads for high availability\n\nThis page recommends Kubernetes container workload strategies that make your\napplication more fault tolerant in a Google Distributed Cloud (GDC) air-gapped multi-zone\nuniverse. GDC supports Kubernetes-native container\napplications that are widely consumed and supported on\nGoogle Kubernetes Engine (GKE).\n\nThis page is for developers within the application operator group, who are\nresponsible for creating application workloads for their organization. For more\ninformation, see\n[Audiences for GDC air-gapped documentation](/distributed-cloud/hosted/docs/latest/gdch/resources/audiences).\n\nKubernetes considerations for HA apps\n-------------------------------------\n\nAchieving high availability (HA) in Kubernetes goes beyond just the control\nplane. You must also design and deploy container workloads in your\nGoogle Distributed Cloud (GDC) air-gapped universe resiliently. Kubernetes offers several\npowerful mechanisms to minimize downtime and provide highly available services\neven when facing infrastructure issues or during routine maintenance. The\nfollowing topics are key strategies to consider for HA:\n| **Important:** To access the URLs listed on this page, you must connect to the internet. The URLs are provided to access outside of your air-gapped environment.\n\n- **Maintain availability with replicas and autoscale**: You must have enough\n running instances of your application to provide HA.\n\n - `ReplicaSet`: A `ReplicaSet` resource maintains a stable set of\n identical pod replicas are running at any given time. If a pod fails or is\n terminated, the `ReplicaSet` controller automatically creates a new pod to\n replace it. See\n [ReplicaSet](https://kubernetes.io/docs/concepts/workloads/controllers/replicaset/)\n Kubernetes documentation for more information.\n\n - Horizontal Pod Autoscaler (HPA): While a `ReplicaSet` maintains a fixed\n number of replicas, the HPA automatically adjusts this number based on\n observed metrics like CPU utilization or memory usage. This allows your\n application to handle load spikes. See\n [Horizontal Pod Autoscaling](https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/)\n Kubernetes documentation for more information.\n\n- **Minimize downtime with `PodDisruptionBudget` (PDB)** : See\n [Specifying a Disruption Budget for your Application](https://kubernetes.io/docs/tasks/run-application/configure-pdb/)\n Kubernetes documentation for more information.\n\n- **Spread your risk with anti-affinity rules** : See\n [Affinity and anti-affinity](https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#affinity-and-anti-affinity)\n Kubernetes documentation for more information.\n\n- **Health checks with liveness, readiness, and startup probes** : See\n [Configure Liveness, Readiness and Startup Probes](https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/)\n Kubernetes documentation for more information.\n\n- **Stable endpoints and load balancing with services** : See\n [Services](https://kubernetes.io/docs/concepts/services-networking/service/)\n Kubernetes documentation for more information.\n\n- **Graceful updates and rollbacks with deployments** : See\n [Rolling Back a Deployment](https://kubernetes.io/docs/concepts/workloads/controllers/deployment/#rolling-back-a-deployment)\n Kubernetes documentation for more information.\n\n- **Set requests and limits for resources** : See\n [Resource Management for Pods and Containers](https://kubernetes.io/docs/concepts/configuration/manage-resources-containers/)\n Kubernetes documentation for more information.\n\nWhat's next\n-----------\n\n- [Start learning about Kubernetes](/kubernetes-engine/docs/learn/get-started-with-kubernetes)\n- [Container workloads in GDC](/distributed-cloud/hosted/docs/latest/gdch/application/ao-user/containers/containers-intro)\n- [Create a cluster to run container workloads](/distributed-cloud/hosted/docs/latest/gdch/platform/pa-user/create-user-cluster)"]]