Descripción general de la configuración de alta disponibilidad

En esta página, se brinda una descripción general de la configuración de alta disponibilidad (HA) para las instancias de Cloud SQL. A fin de configurar una instancia nueva para HA, o a modo de habilitar HA en una instancia existente, consulta la sección sobre habilitar o inhabilitar la alta disponibilidad en una instancia.

Descripción general de la configuración de HA

El propósito de una configuración de HA es reducir el tiempo de inactividad cuando una zona o una instancia deja de estar disponible. Esto puede ocurrir durante una interrupción zonal o cuando una instancia se daña. Con la HA, tus datos siguen estando disponibles para aplicaciones cliente.

La configuración HA, a veces llamada clúster, proporciona redundancia de datos. Una instancia de Cloud SQL configurada para HA también se llama instancia regional y se la ubica en una zona primaria y secundaria dentro de la región configurada. Dentro de una instancia regional, la configuración se compone de una instancia primaria y una instancia en espera. A través de la replicación síncrona a los discos persistentes de cada zona, todas las operaciones de escritura realizadas en la instancia principal se replican en los discos de ambas zonas antes de que una transacción se informe como confirmada. En el caso de una falla de instancia o zona, el disco persistente se adjunta a la instancia en espera y se convierte en la nueva instancia principal. Luego, los usuarios se redirigen a la nueva instancia principal. Este proceso se denomina conmutación por error.

Después de una conmutación por error, la instancia que recibió la conmutación por error sigue siendo la instancia principal, incluso después de que la instancia original vuelva a estar en línea. Una vez que la zona o instancia que experimentó una interrupción vuelva a estar disponible, la instancia principal original se destruye y se vuelve a crear. Luego, se convierte en la nueva instancia en espera. Si ocurre una conmutación por error en el futuro, la nueva instancia principal se conmutará por error a la instancia original en la zona original.

Si necesitas tener la instancia principal en la zona que tuvo la interrupción, puedes realizar una conmutación por recuperación. Una conmutación por recuperación realiza los mismos pasos que la conmutación por error, solo en la dirección opuesta, para redirigir el tráfico de vuelta a la instancia original. Para realizar una conmutación por recuperación, usa el procedimiento de Inicia la conmutación por error.

La asistencia de disco persistente regional para Cloud SQL y la configuración de la alta disponibilidad de Cloud SQL tienen una cobertura completa del Acuerdo de Nivel de Servicio (ANS). Una instancia configurada con HA se cobra el doble del precio que una instancia independiente. Este precio incluye CPU, RAM y almacenamiento. Para obtener más información, consulta la página de precios.

Descripción general del diagrama de la configuración de HA de Cloud SQL. Descrito en el texto de abajo.

Descripción general de la conmutación por error

Si una instancia configurada con HA deja de responder, de modo automático, Cloud SQL cambia y entrega los datos desde la instancia independiente. Para ver si ocurrió una conmutación por error, revisa la historia de conmutación por error de tu registro de operaciones.

Procesamiento

El proceso siguiente ocurre de esta manera:

  • Falla la instancia principal o la zona.

    Cada segundo, la instancia principal escribe en un sistema de base de datos como una señal de monitoreo de funcionamiento. Si no se detectan varias señales de monitoreo por funcionamiento, se inicia la conmutación por error. Esto sucede si la instancia principal no responde durante 60 segundos aproximados, o si la zona que contiene la instancia principal experimenta una interrupción.

  • Ahora, la instancia independiente entrega los datos hasta la reconexión.

    A través de una dirección IP estática compartida con la instancia principal, la instancia independiente ahora entrega los datos desde la zona secundaria.

    Requisitos

    Para que Cloud SQL permita una conmutación por error, la configuración debe cumplir con estos requisitos:

    • La instancia principal debe estar en un estado operativo normal (no detenido, en mantenimiento ni en medio de una operación de instancia de Cloud SQL de larga duración, como una operación de copia de seguridad, importación o exportación).
    • La zona secundaria y la instancia en espera deben estar en buen estado. Cuando la instancia en espera no responde o se interrumpe la replicación en la zona secundaria, se bloquean las operaciones de conmutación por error. Después de que Cloud SQL repara la instancia en espera y la zona secundaria está disponible, la replicación se reanuda y Cloud SQL permite la conmutación por error.

    Copia de seguridad y restablecimiento

    Las copias de seguridad automáticas deben habilitarse para la alta disponibilidad.

    Instancias y aplicaciones

    No existe ninguna diferencia en trabajar con instancias con o sin HA, por lo que tu aplicación no necesita estar configurada de ningún modo en particular. Cuando ocurre una conmutación por error, las conexiones existentes a la instancia principal y a las réplicas de lectura se encuentran cerradas y tardarán entre 2 y 3 minutos para que se restablezcan las conexiones a la instancia principal. Las conexiones a las réplicas pueden tardar más. Tu aplicación se reconecta con la misma string de conexión o dirección IP, por lo tanto, no necesitas actualizar tu aplicación después de una conmutación por error.

    Para ver con exactitud cómo la conmutación por error afecta tus aplicaciones, inicia la conmutación por error de forma manual.

    Tiempo de inactividad por mantenimiento

    Los eventos de mantenimiento afectan a las instancias principales configuradas con HA de la misma manera que cualquier otra instancia. Es posible que las instancias principales estén inactivas durante este tiempo. A fin de minimizar el impacto en el servicio, puedes establecer un período de mantenimiento para controlar cuándo se produce el tiempo de inactividad.

    Cuando se lleva a cabo el mantenimiento de una instancia, no se realiza una conmutación por error a la instancia en espera. Las actualizaciones de mantenimiento se aplican a la instancia en espera al mismo tiempo que a la instancia principal.

    ¿Qué sigue?