Esta página se aplica a Apigee y Apigee Hybrid.
Consulta la documentación de
Apigee Edge.
Apigee es una plataforma multitenant, de autoservicio y basada en la nube que se ejecuta en una configuración totalmente redundante (activa/activa) en varios centros de datos de distintas regiones del mundo. Apigee usa Google Cloud para su plataforma basada en la nube. Como parte de los servicios que creamos en Google Cloud, usamos varios centros de datos en cada región y gestionamos el tráfico activo de nuestros clientes en estos centros de datos. No tenemos un centro de datos "activo" y otro "de reserva" (o "secundario" o "de conmutación por error"). Tenemos dos (o más) centros de datos que atienden de forma constante y simultánea el tráfico de los clientes en cada región del mundo.
Plan de continuidad de negocio y recuperación ante desastres
El plan de continuidad de la actividad y recuperación tras fallos (BCP/DR) de Apigee es un plan para toda la plataforma y no contiene tareas detalladas para clientes concretos. En su lugar, la plataforma está configurada para procesar las solicitudes de datos de clientes independientemente de las interrupciones y las averías. Los datos seguirán fluyendo aunque un centro de datos entero esté sin conexión. Si una región entera se quedara sin conexión, un cliente de una sola región podría experimentar una interrupción de los servicios de procesamiento de APIs. Para los clientes que buscan servicios redundantes que vayan más allá de la redundancia en la misma región, Apigee está disponible en un nivel de redundancia global de centros de datos redundantes en los que el tráfico se puede atender en varias regiones o países. De esta forma, si una región entera dejara de funcionar, los datos seguirían fluyendo.
Los servicios de atención al cliente de una sola región no se transfieren automáticamente a otra región debido a las posibles restricciones geográficas en el tratamiento y el acceso a los datos. Los servicios de Apigee se alojan para los clientes de la región identificada por el cliente. Como puede haber normativas específicas o compromisos de los clientes con sus usuarios sobre las ubicaciones geográficas de los datos, los servicios no se trasladarán automáticamente a otra región, ya que esto podría poner en peligro los compromisos de Google con sus clientes o los compromisos de los clientes de Google con sus clientes.
Google no comparte el plan de continuidad de negocio y recuperación ante desastres completo con ningún cliente, ya que contiene información interna sensible y referencias a nuestros clientes. Nuestra política de privacidad no permite compartir el plan de continuidad de negocio y recuperación ante desastres de la plataforma con clientes concretos, ya que podría exponer los nombres de otros clientes. Ofrecemos el mismo nivel de privacidad a todos los clientes.
Gestión de BCP/DR
Un equipo de seguridad de la información de Google se encarga de supervisar el programa de resiliencia empresarial, mientras que un jefe de incidentes rotatorio es responsable de la gestión y la resolución de todos los incidentes. El responsable de incidencias tiene personal de operaciones e ingeniería disponible en todo momento, así como manuales de procedimientos para todas las acciones que puedan ser necesarias.
Pruebas de BCP/DR
Google lleva a cabo procesos operativos que admiten pruebas de continuidad de la actividad empresarial y recuperación tras fallos de la plataforma con una frecuencia mayor que las pruebas anuales completas de continuidad de la actividad empresarial y recuperación tras fallos. Cada mes, realizamos cambios de carga en nuestro entorno activo/activo mientras actualizamos los sistemas que ejecutan el servicio. Este proceso implica desactivar todos los sistemas de un centro de datos mientras el centro de datos emparejado gestiona la carga. Durante este proceso, después de realizar las actualizaciones, se vuelve a poner en marcha el primer centro de datos y los servicios se ejecutan en directo o de nuevo para verificar que no se han producido problemas. A continuación, se desactiva el centro de datos del mismo nivel para aplicar las mismas actualizaciones y, después, se vuelve a activar. Google usa herramientas y técnicas para reducir el tráfico y enviar un pequeño porcentaje del tráfico a los servicios actualizados recientemente para comprobar si hay algún problema o error antes de volver al procesamiento de carga completa.
Este proceso operativo constante supera las pruebas de resiliencia bianuales estándar del sector de nuestro servicio, ya que se trata de una tarea operativa que se lleva a cabo con más frecuencia.
Además de los procesos operativos descritos anteriormente, Google también lleva a cabo ejercicios de continuidad de la actividad empresarial y recuperación tras fallos al menos una vez al año, en los que los miembros de los equipos de ingeniería y operaciones prueban un escenario de desastre real. De esta forma, nuestro personal recibe formación y experiencia adicionales sobre nuestros planes de continuidad de negocio y recuperación ante desastres de mayor envergadura para toda la empresa, además de sobre el propio servicio.
Las pruebas de continuidad del negocio y recuperación ante desastres que realiza Google no utilizan "ejercicios de conmutación por error" ni "ubicaciones secundarias", ya que todo eso está integrado en el sistema en funcionamiento.
Google mantiene guías de procedimientos para que las usen todos los equipos de operaciones e ingeniería. Estos manuales se revisan y actualizan al menos una vez al año, y se utilizan en todas nuestras pruebas y ejercicios de formación de los planes de continuidad de la actividad y de recuperación ante desastres.
Los clientes pueden acceder a los informes anuales de las pruebas de continuidad del negocio y recuperación ante desastres. También compartimos los resultados de nuestras tareas operativas y los informes de las pruebas anuales de recuperación ante desastres con nuestros auditores externos, que constituyen la base de la revisión que realizan los auditores para comprobar que cumplimos los requisitos de PCI, HIPAA, ISO, contractuales y de otro tipo.
Pruebas de BCP/DR de clientes
Recomendamos a los clientes que incluyan los servicios de Apigee en sus planes de recuperación ante desastres. Los clientes pueden y deben plantearse cómo puede Apigee redirigir el tráfico según sea necesario para que puedan mantener los servicios para usuarios finales incluso durante una interrupción del centro de datos del cliente u otro desastre. Sin embargo, este nivel de pruebas no está incluido en el plan de recuperación ante desastres de Apigee. Recomendamos a los clientes que realicen pruebas de continuidad del negocio y recuperación ante desastres en sus propias aplicaciones e incluyan Apigee en la prueba.
RTO/RPO
Apigee no ofrece objetivos de punto de recuperación ni de tiempo de recuperación (RPO/RTO) a los clientes ni en los contratos relacionados con las actividades de continuidad del negocio o recuperación ante desastres. Los acuerdos de nivel de servicio son el equivalente en la nube de los puntos de datos de RTO y RPO. Dado que Apigee es un servicio redundante basado en la nube con servicios de gestión y de tiempo de ejecución diseñados con servicios activos redundantes, tanto el tiempo de inactividad como la pérdida de datos pueden considerarse "en tiempo real". Los clientes de una sola región reciben un mínimo de servicios redundantes en diferentes centros de datos de la misma región. Los clientes que quieran disfrutar de niveles de redundancia más altos pueden optar por servicios multirregión.
Plan de pandemia
Google incluye un plan de pandemia como parte de los planes y procesos generales de continuidad de negocio y recuperación ante desastres. Para las operaciones empresariales, como la asistencia, Google cuenta con un equipo de asistencia global disponible las 24 horas del día en varias oficinas y ubicaciones remotas. Si una pandemia en una zona del mundo afecta a una de nuestras oficinas de asistencia, se alertará al personal de otras oficinas para que cubra los turnos que normalmente gestiona la oficina afectada. En el caso de otros servicios empresariales, como las ventas, la plantilla está distribuida por todo el mundo. Todos los equipos de Google están preparados para trabajar de forma remota si es necesario. Las herramientas utilizadas se basan en la nube y se adaptan de forma natural a un plan de respuesta ante una pandemia.
Novedades
Google revisa y actualiza nuestro plan de continuidad de la actividad empresarial y recuperación tras fallos al menos una vez al año. La información obtenida de los incidentes, los cambios en los productos, los estándares del sector, las actividades de análisis de riesgos y las pruebas de los planes de continuidad de negocio y recuperación ante desastres se utiliza para actualizar el plan.
Análisis del impacto empresarial y evaluaciones de riesgos
Google realiza un análisis de impacto empresarial y una evaluación de riesgos anualmente. Los resultados de la BIA y la RA se priorizan y documentan en el sistema de seguimiento de incidencias.