Crea una transmisión

Descripción general

En esta sección, aprenderás a crear una transmisión. Datastream usa esta transmisión para transferir datos de una base de datos de origen de Oracle, MySQL, SQL Server (Versión preliminar) o PostgreSQL a BigQuery o Cloud Storage.

La creación de una transmisión incluye los siguientes elementos:

  • Define la configuración para la transmisión.
  • Selecciona el perfil de conexión que creaste para tu base de datos de origen de Oracle, MySQL, SQL Server (Vista previa) o PostgreSQL (el perfil de conexión de origen), o bien crea un perfil de conexión de origen si no tienes uno.
  • Especifica las tablas y los esquemas en la base de datos de origen que Datastream a fin de configurar la información sobre la base de datos de origen para la transmisión:
    • Puede transferir al destino.
    • No puede transferir al destino.
  • Determinar si Datastream reabastecerá los datos históricos, así como la transmisión de los cambios continuos al destino o la transmisión solo de los cambios a los datos. Cuando habilitas el reabastecimiento histórico, tienes la opción de especificar esquemas y tablas en la base de datos de origen que Datastream no debe reabastecer en el destino.

  • Selecciona el perfil de conexión que creaste para BigQuery o Cloud Storage (el perfil de conexión de destino) o crea uno si aún no lo hiciste.

  • Configura la información sobre el destino de la transmisión. Esta información incluye:

    • Para BigQuery:
      • Son los conjuntos de datos en los que Datastream replicará esquemas, tablas y datos de una base de datos de origen.
    • Para Cloud Storage:
      • Es la carpeta del bucket de destino al que Datastream transferirá los esquemas, las tablas y los datos de una base de datos de origen.
  • Validar la transmisión para garantizar que se ejecutará correctamente. La validación de una transmisión verifica lo siguiente:

    • Indica si la fuente está configurada correctamente para permitir que Datastream transmita datos desde ella.
    • Si la transmisión puede conectarse tanto al origen como al destino.

    • La configuración de extremo a extremo de la transmisión.

Define la configuración de la transmisión

  1. Ve a la página Transmisiones en la consola de Google Cloud.

    Ir a la página Novedades

  2. Haz clic en CREAR TRANSMISIÓN.

  3. Usa la siguiente tabla para propagar los campos de la sección Definir los detalles del flujo de la página Crear un flujo:

    CampoDescripción
    Nombre de la transmisiónIngresa el nombre visible de la transmisión.
    ID de flujoDatastream propaga este campo automáticamente según el nombre de transmisión que ingreses. Puedes conservar el ID generado automáticamente o cambiarlo.
    RegiónSelecciona la región en la que se almacena la transmisión. Las transmisiones, como todos los recursos, se guardan en una región. La selección de la región no afecta si la transmisión puede conectarse a la base de datos de origen o al destino, pero puede afectar la disponibilidad si la región experimenta tiempo de inactividad.
    Tipo de fuente

    Selecciona el tipo de perfil que especificaste cuando creaste un perfil de conexión para una base de datos de origen de Oracle, MySQL, SQL Server (Vista previa) o PostgreSQL. O bien, si no creaste un perfil de conexión para la base de datos de origen, puedes crear uno ahora.

    Tipo de destino

    Selecciona el tipo de perfil que especificaste cuando creaste un perfil de conexión para un destino de BigQuery o Cloud Storage. O bien, si no creaste un perfil de conexión para el destino, puedes crear uno ahora.

    Encriptación

    De forma predeterminada, tus datos se encriptan con una clave administrada por Google Cloud. Si quieres administrar tu encriptación, puedes usar una clave de encriptación administrada por el cliente (CMEK):

    1. Selecciona la casilla de verificación Usar una CMEK.
    2. En el menú desplegable Seleccionar una CMEK, selecciona tu CMEK.

    Si no ves tu clave, haz clic en INGRESAR NOMBRE DEL RECURSO DE CLAVE para indicar el nombre del recurso de la clave que quieres usar. Por ejemplo, puedes ingresar projects/my-project-name/locations/my-location/keyRings/my-keyring/cryptoKeys/my-key en el campo Nombre del recurso de la clave y, luego, hacer clic en GUARDAR.

  4. De manera opcional, usa etiquetas para organizar tus recursos de Datastream.

    1. Para crear una etiqueta, haz clic en AGREGAR ETIQUETA y, luego, ingresa el par clave-valor de la etiqueta.
    2. Para quitar la etiqueta, haz clic en el ícono de papelera a la derecha de la fila que contiene la etiqueta.
  5. De manera opcional, agrega políticas de alertas a tu transmisión. Las políticas de alertas definen cuándo y cómo deseas recibir notificaciones sobre fallas de transmisión.

    1. Para crear una política de alertas, haz clic en Agregar política de alertas.
    2. La página Crear política de alertas aparece en Cloud Monitoring. En esta página, definirás la política de alertas en caso de que falle la transmisión.

    Para obtener más información sobre las políticas de alertas, consulta Administra las políticas de alertas basadas en métricas.

  6. Revisa los requisitos previos que se generan automáticamente para reflejar cómo se debe preparar el entorno para una transmisión. Estos requisitos previos pueden incluir cómo configurar la base de datos de origen y cómo conectarla al destino. Es mejor completar estos requisitos previos en este paso, pero puedes hacerlo en cualquier momento antes de probar o iniciar la transmisión. Para obtener más información sobre estos requisitos previos, consulta Fuentes.

  7. Haz clic en CONTINUAR. Aparecerá el panel Definir perfil de conexión de la página Crear flujo para tu tipo de base de datos de origen.

Especifica la información sobre el perfil de conexión de origen

  1. Si creaste un perfil de conexión fuente para Oracle, MySQL, SQL Server (Vista previa) o MySQL, selecciónalo en la lista de perfiles de conexión.

    Si no creaste un perfil de conexión fuente, haz crea uno haciendo clic en CREAR PERFIL DE CONEXIÓN en la parte inferior de la lista desplegable y, luego, realiza los mismos pasos que se indican en Crear perfiles de conexión.

  2. Haz clic en EJECUTAR PRUEBA para verificar que la base de datos de origen y Datastream puedan comunicarse entre sí.

    Si la prueba falla, aparecerá el problema asociado con el perfil de conexión. Consulta la página Diagnostica problemas y consulta los pasos para solucionarlos. Realiza los cambios necesarios para corregir el problema y, luego, vuelve a probar.

  3. Haga clic en CONTINUE. Aparecerá el panel Configurar origen de transmisión de la página Crear transmisión.

Configura la información sobre la base de datos de origen de la transmisión

Configura la base de datos de origen de PostgreSQL

Si seleccionaste PostgreSQL como tu base de datos de origen, debes definir sus propiedades de replicación.

  1. En la sección Propiedades de replicación, especifica las siguientes propiedades:
    1. En el campo Nombre de la ranura de replicación, ingresa el nombre de la ranura que creaste específicamente para esta transmisión. El servidor de la base de datos usa esta ranura para enviar eventos a Datastream.
    2. En el campo Nombre de la publicación, ingresa el nombre de la publicación que creaste en la base de datos. Una publicación es un grupo de todas las tablas que quieres replicar, a partir de esta transmisión.
  2. Haz clic en Continuar. Sigue los pasos descritos en la sección Cómo configurar bases de datos de origen a continuación.

Configura bases de datos de origen

  1. En la sección Selecciona los objetos que deseas incluir, usa el menú desplegable Objetos que se incluirán para especificar las tablas y los esquemas de la base de datos de origen que Datastream puede transferir al destino.

    1. Si quieres que Datastream transfiera todas las tablas y los esquemas, selecciona Todas las tablas de todos los esquemas.
    2. Si quieres que Datastream transfiera solo tablas y esquemas específicos, selecciona Esquemas y tablas específicos y, luego, selecciona las casillas de verificación de los esquemas y tablas que deseas que extraiga.

    3. Si deseas proporcionar una definición textual de las tablas y los esquemas que deseas que Datastream transfiera, selecciona Personalizado y, luego, en el campo Criterios de coincidencia de objetos, ingresa los esquemas y tablas que deseas que extraiga Datastream.

      Si tu base de datos tiene una gran cantidad de tablas y esquemas, te recomendamos usar la opción Personalizado, ya que algunas tablas y esquemas podrían no estar incluidos en la lista de objetos para extraer.

  2. De forma opcional, expande el nodo Seleccionar objetos para excluir. En el campo Objetos que se excluirán, ingresa las tablas y los esquemas en la base de datos de origen que deseas que Datastream no extraiga. La lista Objetos que se deben excluir tiene prioridad sobre la lista Objetos que se incluirán. Si un objeto cumple con los criterios de las listas de inclusión y exclusión, el objeto se excluye de la transmisión.

  3. De manera opcional, expande el nodo Elegir modo de reabastecimiento para datos históricos y, luego, realiza una de las siguientes selecciones:
    1. Selecciona la opción Automático para transmitir todos los datos existentes, además de los cambios en los datos, de la fuente al destino.

      En el campo Objetos excluidos del reabastecimiento automático, ingresa las tablas y los esquemas de la base de datos de origen en los que quieras restringir el reabastecimiento de Datastream al destino.

    2. Selecciona la opción Manual para transmitir solo los cambios de datos al destino.
  4. Haz clic en CONTINUAR. Aparecerá el panel Definir perfil de conexión de la página Crear flujo para tu tipo de destino.

Selecciona un perfil de conexión de destino

  1. Si creaste un perfil de conexión de destino, selecciónalo en la lista de perfiles de conexión.

    Si no creaste un perfil de conexión de destino, haz clic en el siguiente para crear uno:CREAR PERFIL DE CONEXIÓN en la parte inferior de la lista desplegable y, luego, realice los mismos pasos que se indican enCrear perfiles de conexión.

  2. Haz clic en CONTINUAR. Aparecerá el panel Configurar el destino del flujo de la página Crear flujo.

Configura la información sobre el destino de la transmisión

Destino de BigQuery

  1. En Configura la conexión de Datastream a BigQuery, especifica cómo debe transmitir Datastream a un conjunto de datos de BigQuery. Selecciona una de las siguientes opciones:

    • Conjunto de datos para cada esquema: Datastream crea un conjunto de datos de BigQuery para cada esquema de origen, según el nombre del esquema.

      Si seleccionas esta opción, para cada esquema de la base de datos de origen, Datastream crea un conjunto de datos en el proyecto que contiene la transmisión.

      Además, cuando selecciones la opción Conjunto de datos para cada esquema, haz lo siguiente:

      1. En el campo Ubicación, ingresa la región en la que deseas crear el conjunto de datos nuevo.
      2. (Opcional) En el campo Prefijo, define un prefijo para el conjunto de datos que crea el flujo. La string que especifiques se agregará al nombre del esquema de origen. Por ejemplo, si el esquema se llama <mySchema>, y defines el prefijo del conjunto de datos como <myPrefix>, Datastream creará un conjunto de datos llamado <myPrefix><mySchema>.
      3. Especifica cómo quieres que se encripten tus datos en BigQuery. Para ello, selecciona una clave de encriptación administrada por Google o por el cliente.
    • Conjunto de datos único para todos los esquemas: Datastream crea todas las tablas dentro del conjunto de datos existente de BigQuery que especifiques. Cada tabla que crea Datastream se nombra usando una combinación del nombre del esquema de origen y el nombre de la tabla, separados por un guion bajo (por ejemplo, <mySchemaName>_<myTableName>).

  2. Especifica el límite de obsolescencia de los datos. Selecciona un límite para equilibrar el rendimiento y el costo de las consultas de BigQuery con la actualización de los datos. BigQuery aplica los cambios en segundo plano de manera continua o en el tiempo de ejecución de la consulta, de acuerdo con el límite de inactividad. Una inactividad más baja (datos más recientes) puede aumentar los costos de procesamiento de BigQuery.

  3. Haz clic en CONTINUAR. Aparecerá el panel Revisar detalles y crear del flujo de la página Crear flujo.

Destino de Cloud Storage

  1. De manera opcional, en el campo Prefijo de la ruta de transmisión, ingresa la carpeta del bucket de destino al que Datastream transferirá los esquemas, las tablas y los datos de una base de datos de origen.

    Por ejemplo, si deseas que Datastream transfiera datos de la base de datos de origen a la carpeta /root/example en el bucket de destino, ingresa /root/example en el campo Prefijo de ruta de acceso de la transmisión.

  2. En el campo Formato de salida, elige el formato de archivos escritos en Cloud Storage.

  3. Opcional. Si seleccionas el formato JSON, aparecerán dos casillas de verificación:

    1. Incluye un archivo de esquema de tipos unificados en la ruta de acceso del archivo: Si seleccionas esta casilla de verificación, Datastream escribirá dos archivos en Cloud Storage: un archivo de datos JSON y un archivo de esquema de Avro. El archivo de esquema tiene el mismo nombre que el archivo de datos, con una extensión .schema. Si no seleccionas esta casilla de verificación, Datastream escribirá solo el archivo de datos JSON en Cloud Storage. Esta casilla de verificación no está seleccionada de forma predeterminada.
    2. Habilitar la compresión gzip: Si seleccionas esta casilla de verificación, Datastream usará la utilidad gzip para comprimir los archivos que escribe en Cloud Storage. Si no seleccionas esta casilla de verificación, Datastream escribirá los archivos en Cloud Storage sin comprimirlos. Esta casilla de verificación está seleccionada de forma predeterminada.
  4. Haz clic en CONTINUAR. Aparecerá el panel Revisar detalles y crear del flujo de la página Crear flujo.

Crea la transmisión

  1. Verifica los detalles de la transmisión, así como los perfiles de conexión de origen y destino que la transmisión usará para transferir datos de una base de datos de origen a un destino.
  2. Haz clic en EJECUTAR VALIDACIÓN para validar la transmisión. Mediante la validación de una transmisión, Datastream verifica que la fuente esté configurada correctamente, valida que la transmisión pueda conectarse tanto al origen como al destino, y verifica la configuración de extremo a extremo de la transmisión.

    1. Si tu base de datos de origen es Oracle, Datastream realiza las siguientes verificaciones:

      VerificarDescripción
      Validez de la lista de objetosDatastream verifica que la lista de exclusiones no subsuma la lista de inclusión.
      Reenviar la conectividad del túnel SSHDatastream verifica que puede conectarse a un host de bastión a través de un túnel SSH de reenvío.
      Conectividad a la base de datos de OracleDatastream verifica que se pueda conectar a la base de datos de origen de Oracle.
      Permisos del usuario de OracleDatastream verifica que el usuario que usa para conectarse a la base de datos de origen tenga todos los permisos necesarios para recuperar esquemas, tablas y datos de la base de datos a fin de que Datastream pueda transmitir esta información al destino.
      Configuración del modo de registroDatastream verifica que el modo de registro de la base de datos de Oracle esté configurado como ARCHIVELOG.
      Configuración de registro complementariaDatastream verifica que el registro complementario esté activado para las tablas de la base de datos que se transmiten desde el origen hacia el destino.
      Configuración de los documentos de registro del archivoDatastream verifica que el registro de archivos esté configurado en la fuente y que los archivos de registro estén presentes.
      Permisos de Cloud Storage (para destinos de Cloud Storage) Datastream verifica que tenga los permisos necesarios para escribir en el bucket de destino en Cloud Storage.
    2. Si tu base de datos de origen es MySQL, Datastream realiza las siguientes verificaciones:

      VerificarDescripción
      Validez de la lista de objetosDatastream verifica que la lista de exclusiones no subsuma la lista de inclusión.
      Reenviar la conectividad del túnel SSHDatastream verifica que puede conectarse a un host de bastión a través de un túnel SSH de reenvío.
      Conectividad a la base de datos de MySQLDatastream verifica que pueda conectarse a la base de datos MySQL de origen.
      El registro binario está habilitadoDatastream verifica que los archivos de registro binarios estén configurados correctamente y que haya archivos de registro presentes.
      Configuración del formato de registro binarioDatastream verifica que el formato de registro binario de la base de datos de MySQL esté configurado como ROW.
      Permisos de replicaciónDatastream verifica que tenga permisos para replicar una base de datos de MySQL.
      Permisos de Cloud Storage (para destinos de Cloud Storage)Datastream verifica que tenga los permisos necesarios para escribir en el bucket de destino en Cloud Storage.
    3. Si tu base de datos de origen es PostgreSQL, Datastream realiza las siguientes verificaciones:

      VerificaciónDescripción
      Conectividad a la base de datos de PostgreSQLDatastream verifica que pueda conectarse a la base de datos PostgreSQL de origen.
      La decodificación lógica está habilitadaDatastream verifica que el parámetro wal_level de la base de datos de PostgreSQL esté configurado como logical.
      Configuración de ranuras de replicaciónDatastream verifica si la ranura de replicación de PostgreSQL existe y está activa, si Datastream tiene los permisos necesarios para acceder a ella y si está configurada de forma correcta.
      Configuración de la publicaciónDatastream verifica que la publicación exista y que las tablas para replicar para la transmisión estén incluidas en ella.
      Permisos de reabastecimientoDatastream verifica que existan las tablas necesarias para reabastecer los datos históricos y que tenga los permisos necesarios para leerlas.
    4. Si tu base de datos de origen es SQL Server (Vista previa), Datastream realiza las siguientes verificaciones:

      VerificaciónDescripción
      Edición de SQL ServerDatastream verifica que se admita la edición de la base de datos de SQL Server de origen. Para obtener información sobre las ediciones compatibles, consulta Versiones.
      Permisos del usuario de SQL ServerDatastream verifica que el usuario tenga los permisos necesarios para acceder a la base de datos de origen de SQL Server.
      Las CDC de SQL Server están habilitadasDatastream verifica si la CDC está habilitada para la base de datos y todas las tablas incluidas en la transmisión.
      Validaciones de bases de datos de SQL ServerDatastream verifica si la base de datos de origen está configurada correctamente, si se cumplen todos los requisitos de replicación y si no hay tipos de datos no compatibles en las columnas.
      Permisos de Cloud Storage o BigQueryDatastream verifica que el usuario tenga los permisos necesarios para escribir en el destino.
  3. Después de pasar todas las verificaciones de validación, haz clic en CREAR E INICIAR para crear la transmisión y, luego, iniciarla de inmediato o CREAR para crearla sin iniciarla de inmediato.

    Si no inicias la transmisión ahora, puedes hacer clic en COMENZAR en la página Transmisiones.

Después de crear una transmisión, puedes ver información detallada y de alto nivel sobre ella.