Planificación de continuidad empresarial y recuperación ante desastres

Esta página se aplica a Apigee y Apigee Hybrid.

Consulta la documentación de Apigee Edge.

Apigee es una plataforma multiusuario, de autoservicio y basada en la nube que se ejecuta con una configuración completamente redundante (en vivo/en vivo) en varios centros de datos en varias regiones del mundo. Apigee usa Google  Cloud para su plataforma basada en la nube. Como parte de los servicios que creamos en Google Cloud, usamos varios centros de datos dentro de cada región y tráfico de servicios en vivo para nuestros clientes en estos centros de datos. No tenemos un centro de datos "en vivo" ni un centro de datos "en espera" (o "secundario" o de "conmutación por error"). Tenemos dos (o más) centros de datos que atienden el tráfico de los clientes de forma constante y simultánea en cada región del mundo.

Plan de BCP/DR

La planificación de continuidad empresarial y recuperación ante desastres (BCP/DR) de Apigee es un plan para toda la plataforma y no contiene tareas detalladas para clientes individuales. La plataforma está configurada para procesar solicitudes de datos del cliente, independientemente de las interrupciones y los cortes. Los datos continuarán fluyendo, incluso si un centro de datos completo está sin conexión. Si una región completa se desconecta, un cliente de una sola región podría experimentar una interrupción de los servicios de procesamiento de la API. Para los clientes que buscan más que los servicios redundantes “dentro de la región”, Apigee está disponible a nivel de centros de datos redundantes de forma global en los que se puede atender el tráfico de varias regiones o países, de modo que, si una región completa se queda sin conexión, los datos seguirán fluyendo.

Los servicios al cliente de una sola región no se transfieren automáticamente a otra debido a posibles restricciones geográficas en el procesamiento y el acceso de los datos. Los servicios de Apigee se alojan para los clientes en la región que identifica el cliente. Debido a que puede haber reglamentos específicos o compromisos de clientes con sus usuarios en las ubicaciones geográficas de los datos, los servicios no se moverán automáticamente a una región alternativa, ya que esto podría comprometer los compromisos de Google con sus clientes o los compromisos de los clientes de Google con sus clientes.

Google no comparte el plan de BCP/DR completo con ningún cliente individual, ya que contiene referencias e información sensible internas sobre nuestros clientes. Nuestra Política de Privacidad impide compartir el plan de BCP/DR de la plataforma con clientes individuales que podrían exponer los nombres de otros clientes. Ofrecemos el mismo nivel de privacidad a cada cliente.

Administración de BCP/DR

Un equipo de seguridad de la información de Google es responsable de supervisar el programa de resiliencia empresarial, mientras que un comandante de incidentes rotativo es responsable de administrar y resolver todos los incidentes. El comandante de incidentes tiene personal de ingeniería y de operaciones en todo momento, así como guías para todas las acciones que podrían realizar.

Pruebas de BCP/DR

Google realiza procesos operativos que admiten las pruebas BCP/DR de la plataforma con una cadencia más frecuente que nuestra prueba anual completa de BCP/DR. Todos los meses, realizamos movimientos de carga a partir de nuestro entorno en vivo/en vivo mientras actualizamos los sistemas que ejecutan el servicio. Este proceso implica quitar los sistemas de todo un centro de datos mientras el otro centro de datos del mismo nivel administra la carga. Durante este proceso, después de que se realizan las actualizaciones, se activa el primer centro de datos y los servicios se ejecutan o vuelven a ejecutarse para verificar que no se hayan generado problemas. Luego, el otro centro de datos del mismo nivel se desactiva para las mismas actualizaciones y se vuelve a poner en marcha. Google usa herramientas y técnicas para desviar el tráfico y enviar un pequeño porcentaje a los servicios actualizados recientemente con el fin de verificar si hay problemas o errores antes de volver al procesamiento de carga completo.

Este proceso operativo constante va más allá de las “pruebas” de resiliencia semestral de nuestro servicio que son el estándar de la industria, ya que las convierte en una tarea operativa que se realiza con mayor frecuencia.

Además de los procesos operativos descritos anteriormente, Google también realiza ejercicios de BCP/DR al menos una vez al año, en los que los miembros del equipo de ingeniería y operaciones prueban una situación de desastre real. Esto proporciona capacitación y experiencia adicionales para nuestro personal sobre nuestros planes más amplios de BCP/DR para la empresa y el servicio en sí.

Las pruebas de BCP/DR que realiza Google no usan “ejercicios de conmutación por error” ni “ubicaciones secundarias” porque todo eso está integrado en el sistema en ejecución.

Google mantiene Guías para que las usen todos los equipos de ingeniería y operaciones. Estas guías se revisan y actualizan al menos una vez al año y se usan en todos nuestros ejercicios de prueba y capacitación de BCP/DR.

Los informes anuales de prueba de BCP/DR están disponibles para los clientes. También compartimos los resultados de nuestras tareas operativas y de los informes anuales de prueba de ejercicio de DR con nuestros auditores externos, y estos se basan en esos datos para verificar si cumplimos con los requisitos de PCI, HIPAA, ISO, contractuales y otros.

Pruebas de BCP/DR de clientes

Se incentiva a los clientes a incorporar servicios de Apigee en sus planes de DR. Los clientes pueden y deben considerar cómo Apigee puede redireccionar el tráfico según sea necesario para que los clientes mantengan servicios de usuario final, incluso durante una interrupción del centro de datos del cliente o algún otro evento de desastre. Sin embargo, este nivel de pruebas está fuera del alcance del plan de DR de Apigee. Recomendamos a los clientes que realicen pruebas BCP/DR en sus propias aplicaciones y que incluyan Apigee en la prueba.

RTO/RPO

Apigee no ofrece objetivos de tiempo de recuperación ni puntos de recuperación (RPO/RTO) a clientes ni en los contratos relacionados con actividades de BCP/DR. Los ANS son el equivalente en la nube de los datos de RTO y RPO. Debido a que Apigee es un servicio redundante basado en la nube con servicios de administración y entorno de ejecución diseñados con servicios en vivo redundantes, el RTO y el RPO se pueden considerar como datos “en tiempo real”. Los clientes de una sola región reciben un mínimo de servicios redundantes en diferentes centros de datos dentro de la misma región. Los clientes que deseen niveles más altos de redundancia pueden optar por servicios multirregionales.

Plan de pandemia

Google incluye un plan de pandemia como parte del plan y los procesos generales de BCP/DR. Para las operaciones empresariales, como la asistencia, Google opera un equipo de asistencia global las 24 horas, todos los días, en varias oficinas y ubicaciones remotas. Si una pandemia en un área del mundo afecta a una de nuestras ubicaciones de asistencia, se alertará al personal de otras oficinas y se cubrirán los turnos que normalmente administra la oficina afectada. Para otros servicios empresariales, como las ventas, el personal está distribuido en todo el mundo. Todos los equipos de Google están equipados para trabajar de forma remota si es necesario. Las herramientas usadas se basan en la nube y se adaptan de forma natural a un plan de respuesta ante pandemia.

Actualizaciones

Google revisa y actualiza nuestro plan de BCP/DR al menos una vez al año. La información recopilada de los incidentes, los cambios de productos, los estándares de la industria, las actividades de análisis de riesgos y las pruebas de BCP/DB se usan para actualizar el plan.

Análisis del impacto comercial y evaluación de riesgos

Google realiza un análisis de impacto empresarial y una evaluación de riesgos cada año. Los resultados de estos análisis se priorizan y documentan en el sistema de seguimiento de errores.