Se usó la API de Cloud Translation para traducir esta página.

Replicación

En esta página, se describe cómo se replican los datos en Spanner, los diferentes tipos de réplicas de Spanner y sus funciones en las operaciones de lectura y escritura, y los beneficios de la replicación.

Descripción general

Spanner realiza la replicación automáticamente a nivel de bytes. Como se describe en Life of Spanner Reads and Writes, aprovecha esta capacidad en el sistema de archivos subyacente en el que se basa. Spanner escribe las mutaciones de la base de datos en los archivos de este sistema de archivos, y el sistema de archivos se encarga de replicar y recuperar los archivos cuando falla una máquina o un disco.

Aunque el sistema de archivos distribuido subyacente en el que se basa Spanner ya proporciona replicación a nivel de bytes, Spanner también replica datos para proporcionar los beneficios adicionales de la disponibilidad de datos y la localidad geográfica. A alto nivel, todos los datos de Spanner se organizan en filas. Spanner crea varias copias o réplicas de estas filas y, luego, las almacena en diferentes áreas geográficas. Spanner usa un esquema de replicación síncrono basado en Paxos, en el que las réplicas de votación votan cada solicitud de escritura antes de confirmar la escritura. Esta propiedad de replicación síncrona global te permite leer los datos más actualizados de cualquier réplica de lectura y escritura o de solo lectura de Spanner.

Spanner crea réplicas de cada división de la base de datos. Una división contiene un rango de filas contiguas, en el que las filas se ordenan por clave primaria. Todos los datos de una división se almacenan a nivel físico juntos en la réplica, y Spanner entrega cada réplica por fuera de una zona de falla independiente. Para obtener más información, consulta la descripción general de los esquemas.

Los conjuntos de divisiones se almacenan y replican con Paxos. Dentro de cada conjunto de réplicas de Paxos, se elige una réplica para que actúe como líder. Las réplicas líderes controlan las escrituras, mientras que las réplicas de lectura y escritura o de solo lectura pueden atender una solicitud de lectura sin comunicarse con la líder. Si se solicita una lectura sólida, por lo general, se consulta al líder para garantizar que la réplica de solo lectura haya recibido todas las mutaciones recientes. Para supervisar la tasa de cambio y la cantidad de datos que se replican desde tu réplica principal a las réplicas entre regiones en la configuración de tu instancia, consulta Supervisa la replicación de datos.

Beneficios de la replicación de Spanner

Estos son algunos de los beneficios de la replicación de Spanner:

Disponibilidad de los datos: Tener más copias de tus datos hace que los clientes que desean leerlos tengan mejor acceso a los datos. Además, Spanner aún puede entregar operaciones de escritura, aunque algunas de las réplicas no estén disponibles, ya que solo la mayoría de las réplicas de votación son necesarias para confirmar una operación de escritura.
Localidad geográfica: Tener la capacidad de ubicar datos en diferentes regiones y continentes con Spanner significa que los datos pueden estar más cerca a nivel geográfico (y acceso más rápido) a los usuarios y servicios que los necesitan.
Experiencia de base de datos única: Spanner puede ofrecer una experiencia de base de datos única gracias a su replicación síncrona y su coherencia sólida global.
Desarrollo de aplicaciones más sencillo: Debido a que Spanner cumple con ACID y ofrece coherencia sólida global, los desarrolladores que trabajan con Spanner no tienen que agregar lógica adicional en sus aplicaciones para lidiar con la coherencia eventual, lo que facilita y agiliza el desarrollo de aplicaciones y su mantenimiento posterior.

Tipos de réplicas

Spanner tiene tres tipos de réplicas: réplicas de lectura y escritura, réplicas de solo lectura y réplicas testigo. Las regiones y las topologías de replicación que forman las configuraciones de instancias básicas son fijas:

Las configuraciones de instancias regionales básicas de una sola región solo usan réplicas de lectura y escritura.
Las configuraciones de instancias de región doble básicas usan réplicas de lectura y escritura y de testigo.
Las configuraciones de instancias multirregionales básicas usan una combinación de los tres tipos de réplicas.

Puedes crear configuraciones de instancias personalizadas y agregar réplicas de solo lectura adicionales para las configuraciones de instancias regionales y multirregionales.

En la siguiente tabla, se resumen los tipos de réplicas de Spanner y sus propiedades:

Tipo de réplica	Puede votar	Puede convertirse en líder	Entrega operaciones de lectura	Puede configurar la réplica de forma manual
Lectura y escritura	Sí	sí	sí	no
Solo lectura	No	no	sí	Sí^*
Testigo	Sí	no	no	no

^* Para obtener más información, consulta cómo crear una instancia con una configuración de instancia personalizada.

Réplicas de lectura y escritura

Las réplicas de lectura y escritura son compatibles con las operaciones de lectura y escritura. Estas réplicas realizan las acciones que se mencionan a continuación:

Conservan una copia completa de tus datos.
Entregan operaciones de lectura.
Pueden votar para confirmar una operación de escritura.
Participan en la elección de liderazgo.
Son aptas para convertirse en líderes.
Son el único tipo de réplica que se usa en las instancias regionales.

Réplicas de solo lectura

Las réplicas de solo lectura solo admiten operaciones de lectura, pero no de escritura. Estas réplicas no votan por líderes ni por la confirmación de operaciones de escritura, por lo que te permiten escalar tu capacidad de lectura sin aumentar el tamaño de quórum necesario para las operaciones de escritura. Las réplicas de solo lectura cumplen con las condiciones que se mencionan a continuación:

Mantienen una copia completa de tus datos, que se replica desde la réplica de lectura y escritura principal.
No participan en la votación para confirmar las operaciones de escritura. Por lo tanto, la ubicación de las réplicas de solo lectura nunca contribuye a la latencia de escritura.
No son aptas para convertirse en líderes.
Entregan operaciones de lectura.
Se puede escalar de forma asimétrica. Para obtener más información, consulta Ajuste de escala automático asimétrico de solo lectura.
Si es la réplica más cercana a tu aplicación, la réplica de solo lectura suele entregar operaciones de lectura inactivas sin necesidad de un viaje de ida y vuelta a la región líder, siempre que el estado de inactividad sea de al menos 15 segundos. También puedes usar lecturas dirigidas para enrutar transacciones de solo lectura y lecturas únicas a un tipo de réplica específico o a una región en una configuración de instancia multirregión. Para obtener más información, consulta Lecturas dirigidas.

Las lecturas sólidas pueden requerir un viaje de ida y vuelta a la réplica líder. El recorrido de ida y vuelta solo sirve para negociar la marca de tiempo y no enviar los datos reales del líder. La negociación de marca de tiempo es una operación eficiente de CPU en el líder y, por lo general, los datos ya están en la ruta. El sistema maneja esta comunicación de forma automática.

Para obtener más información sobre las lecturas obsoletas y las lecturas sólidas, consulta la sección Lecturas.

Réplicas de solo lectura opcionales

Puedes crear una configuración de instancia regional o multirregional personalizada y agregar réplicas opcionales de solo lectura para escalar las lecturas y admitir lecturas obsoletas de baja latencia. La réplica de solo lectura agregada debe estar en una región que no forme parte de la configuración de instancia base predefinida. Para obtener una lista de las regiones opcionales de solo lectura que puedes agregar, consulta la columna Región opcional en Configuraciones regionales disponibles y Configuraciones multirregionales disponibles. Si no ves la ubicación de la réplica de solo lectura que elegiste, puedes solicitar una nueva región de réplica de solo lectura opcional.

Todas las réplicas de solo lectura opcionales están sujetas a costos de capacidad de procesamiento, almacenamiento y replicación.

Además, agregar réplicas de solo lectura a una configuración de instancia personalizada no cambia los ANS de Spanner de la configuración de la instancia.

Si decides agregar una réplica de solo lectura a un continente diferente del de la región principal, te recomendamos que agregues un mínimo de dos réplicas de solo lectura. Esto ayuda a mantener una latencia de lectura baja en caso de que una de las réplicas de solo lectura deje de estar disponible.

Como práctica recomendada, primero prueba las cargas de trabajo de rendimiento en instancias que no sean de producción en la configuración de instancias personalizada. Puedes consultar el panel de comparación de latencia y capacidad de procesamiento entre regiones para obtener datos de latencia interregional mediana. Por ejemplo, si creas una configuración de instancia personalizada con la configuración base multirregional eur6 y una réplica opcional de solo lectura en us-east1, la latencia de lectura sólida esperada para un cliente en us-east1 es de aproximadamente 100 milisegundos debido al tiempo de ida y vuelta a la región principal en europe-west4. Las lecturas inactivas con la suficiente inactividad no generan el viaje de ida y vuelta y, por lo tanto, son mucho más rápidas. También puedes usar las estadísticas de bloqueo y las estadísticas de transacciones para identificar las transacciones que generan latencias altas.

Para obtener instrucciones sobre cómo agregar réplicas opcionales de solo lectura, consulta Crea una configuración de instancia personalizada.

Réplicas testigo

Las réplicas testigo no son compatibles con las operaciones de lectura, pero participan en la votación para confirmar operaciones de escritura. Estas réplicas facilitan la obtención de quórum para las operaciones de escritura sin los recursos de procesamiento y almacenamiento que requieren las réplicas de lectura y escritura para almacenar una copia completa de datos y entregar operaciones de lectura. Las réplicas testigo cumplen con las condiciones que se mencionan a continuación:

Se usan en instancias birregionales y multirregionales.
No conservan una copia completa de los datos.
No entregan operaciones de lectura.
Votan para confirmar las operaciones de escritura.
Participan en la elección de líder, pero no son aptas para convertirse en réplicas de líder.

El rol de las réplicas en las operaciones de escritura y lectura

En esta sección, se describe el rol de las réplicas en las operaciones de escritura y lectura de Spanner, lo que ayuda a comprender por qué Spanner usa réplicas testigo en las configuraciones birregionales y multirregionales.

En operaciones de escritura

Las solicitudes de escritura del cliente siempre se procesan primero en la réplica líder, incluso si hay una réplica no líder más cercana al cliente o si la réplica líder se encuentra en una ubicación geográfica lejos del cliente. Si usas una configuración de instancia de región doble o multirregional, y tu aplicación cliente se encuentra en una región que no es líder, Spanner usa el enrutamiento adaptado al líder para enrutar las transacciones de lectura y escritura de forma dinámica y reducir la latencia en tu base de datos. Para obtener más información, consulta Enrutamiento que tiene en cuenta al líder.

La réplica líder registra la operación de escritura entrante y la reenvía, en paralelo, a las otras réplicas que son aptas para votar en esa operación de escritura. Cada réplica apta completa su operación escritura y, luego, responde a la líder con un voto sobre si la operación de escritura debe confirmarse. La operación de escritura se confirma cuando la mayoría de las réplicas de votación (o quórum de escritura) acuerdan confirmarla. En segundo plano, todas las réplicas restantes (no testigo) registran la operación de escritura. Si una réplica de lectura y escritura o de solo lectura se retrasa en el registro de las operaciones de escritura, puede solicitar los datos faltantes a otra réplica que tenga una copia completa y actualizada de los datos.

En operaciones de lectura

Las solicitudes de lectura del cliente se pueden ejecutar o requerir la comunicación con la réplica líder, según el modo de simultaneidad de la solicitud de lectura.

Las operaciones de lectura que son parte de una transacción de lectura y escritura se entregan desde la réplica líder, porque esta mantiene los bloqueos necesarios para aplicar la serializabilidad.
Los métodos de operación de lectura única (una operación de lectura fuera del contexto de una transacción) y las operaciones de lectura en transacciones de operaciones de solo lectura pueden requerir la comunicación con la líder, según el modo de simultaneidad de la lectura. Para obtener más información sobre los modos de simultaneidad, consulta Tipos de lectura.
- Las solicitudes de lectura sólidas pueden ir a cualquier réplica de escritura y lectura o de solo lectura. Si la solicitud va a una réplica no líder, esa réplica debe comunicarse con la líder para ejecutar la operación de lectura.
- Las solicitudes de operación de lectura inactivas se envían a la réplica de lectura y escritura o de solo lectura disponible más cercana que se ajusta a la marca de tiempo de la solicitud. Esta puede ser la réplica líder si la líder es la réplica más cercana al cliente que emitió la solicitud de lectura.

Aparte: ¿Por qué usar réplicas de solo lectura y testigo?

Las configuraciones multirregionales básicas usan una combinación de réplicas de lectura y escritura, de solo lectura y testigo, mientras que las configuraciones de región doble básicas usan réplicas de lectura y escritura y testigo, y las configuraciones regionales básicas solo usan réplicas de lectura y escritura. Los motivos de esta diferencia están relacionados con las funciones diversas de las réplicas en las operaciones de escritura y las de lectura. En el caso de las operaciones de escritura, Spanner necesita una mayoría de réplicas de votación para acordar una confirmación de una mutación. En otras palabras, cada operación de escritura en una base de datos de Spanner requiere comunicación entre las réplicas de votación. Para minimizar la latencia de esta comunicación, es conveniente usar la menor cantidad posible de réplicas de votación y colocarlas lo más cerca posible entre ellas. Por eso, las configuraciones regionales básicas contienen exactamente tres réplicas de lectura y escritura, cada una en su propia zona de disponibilidad, con una copia completa de tus datos y la capacidad de votar. Si falla una réplica, las otras dos pueden seguir formando un quórum de escritura y, como las réplicas en esta configuración se encuentran en la misma región geográfica, las latencias de red son mínimas.

Las configuraciones birregionales y multirregionales básicas contienen más réplicas por diseño, y estas se encuentran en diferentes centros de datos (para que los clientes puedan leer sus datos rápidamente desde más ubicaciones). ¿Qué características deben tener estas réplicas adicionales? Todas podrían ser réplicas de lectura y escritura, pero eso sería indeseable porque agregar más réplicas de lectura y escritura a una configuración aumenta el tamaño del quórum de escritura (lo que significa latencias de red potencialmente más altas debido a que más réplicas se comunican entre sí, especialmente si las réplicas se encuentran en ubicaciones geográficamente distribuidas) y también aumenta la cantidad de almacenamiento necesario (porque las réplicas de lectura y escritura contienen una copia completa de los datos). En lugar de usar más réplicas de lectura y escritura, la configuración básica de doble región contiene una réplica testigo adicional, y las configuraciones básicas multirregionales contienen réplicas de solo lectura y réplicas testigo, que tienen menos responsabilidades que las réplicas de lectura y escritura.

Las réplicas de solo lectura no votan por líderes ni por la confirmación de operaciones de escritura, por lo que te permiten escalar tu capacidad de lectura sin aumentar el tamaño del quórum necesario para las operaciones de escritura.
Las réplicas testigo votan por líderes y por la confirmación de operaciones de escritura, pero no almacenan una copia completa de los datos, no pueden convertirse en líderes ni pueden entregar operaciones de lectura. Estas facilitan la obtención de quórums para las operaciones de escritura sin los recursos de procesamiento y almacenamiento que requieren las réplicas de lectura y escritura para almacenar una copia completa de los datos y entregar las operaciones de lectura.

Supervisa la replicación de datos

Puedes supervisar la tasa de cambio y la cantidad de datos que se replican desde tu réplica principal a las réplicas entre regiones en la configuración de tu instancia. La tasa de cambio se expresa en bytes por segundo y la cantidad de datos, en bytes. Para ello, usa la métrica de supervisión Bytes replicados en varias regiones (instance/cross_region_replicated_bytes_count).

Para ver esta métrica en la consola de Google Cloud , sigue estos pasos:

En la consola de Google Cloud , ve a Monitoring:

Ir a Monitoring
En el menú de navegación, selecciona Explorador de métricas.
En el campo Métrica, haz clic en el menú desplegable Seleccionar una métrica.
En el campo Filtrar por nombre de recurso o métrica, selecciona Instancia de Cloud Spanner > Instancia > Bytes replicados en varias regiones y, luego, haz clic en Aplicar.

Esta métrica solo está disponible en Métricas activas si hay actividad de replicación entre regiones en tu instancia. De lo contrario, aparecerá en Métricas inactivas. De forma predeterminada, la IU filtra y muestra solo las métricas activas. Borra la marca de verificación Activa para ver las métricas activas e inactivas.

En el gráfico, se muestra la tasa de cambio (en bytes por segundo) de los datos replicados en todas las instancias de Spanner dentro del intervalo de tiempo especificado.
Opcional: Para mostrar la cantidad de datos (en bytes) que se replican en lugar de la tasa de cambio, haz lo siguiente:
1. En el campo Agregación, haz clic en el menú desplegable Suma y selecciona Configurar alineador.
2. En el campo Función de alineación, haz clic en el menú desplegable Tasa y selecciona Delta.
3. Selecciona Tabla o Ambos como tipo de tabla en lugar de Gráfico.
  
  En la tabla, se muestra la cantidad de datos (en bytes) que se replicaron dentro del período especificado.
Opcional: Para ver el uso de una instancia o un atributo en particular, haz lo siguiente:
1. Usa el campo Filtro para agregar filtros, como un ID de instancia, un ID de base de datos, una región de origen, una región de destino o una etiqueta.
2. Haz clic en Agregar filtro para agregar varios filtros.

Para ver una lista completa de las métricas de Google Cloud , consulta las métricas deGoogle Cloud .

¿Qué sigue?

Obtén más información sobre la configuración de instancias.
Obtén más información para crear y administrar instancias.
Aprende a crear y administrar configuraciones de instancias.
Obtén más información sobre Google Cloud geografía y regiones.