Lee desde varias tablas de Microsoft SQL Server


En esta página, se describe cómo leer varias tablas desde una base de datos de Microsoft SQL Server mediante la fuente de tablas múltiples. Usa la fuente de tablas múltiples cuando desees que tu canalización lea desde varias tablas. Si quieres que tu canalización lea desde una sola tabla, consulta Cómo leer desde una tabla de SQL Server.

La fuente de tablas múltiples genera datos con varios esquemas y, además, incluye un campo de nombre de tabla que indica la tabla de la que provienen los datos. Cuando uses la fuente de tablas múltiples, usa uno de los receptores de varias tablas, Tablas múltiples de BigQuery o Archivos múltiples de GCS.

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, Cloud Storage, BigQuery, and Dataproc APIs.

    Enable the APIs

  7. Crea una instancia de Cloud Data Fusion.
  8. Asegúrate de que tu base de datos de SQL Server pueda aceptar conexiones desde Cloud Data Fusion. Para hacerlo de forma segura, te recomendamos crear una instancia privada de Cloud Data Fusion.

Ve tu instancia de Cloud Data Fusion

Cuando usas Cloud Data Fusion, se usa la consola de Google Cloud y la IU independiente de Cloud Data Fusion. En la consola de Google Cloud, puedes crear un proyecto de Google Cloud, además de crear y borrar instancias de Cloud Data Fusion. En la IU de Cloud Data Fusion, puedes usar las distintas páginas, como Studio o Wrangler, para usar las funciones de Cloud Data Fusion.

  1. En la consola de Google Cloud, ve a la página de Cloud Data Fusion.

  2. Para abrir la instancia en Cloud Data Fusion Studio, haz clic en Instancias y, luego, en Ver instancia.

    Ir a Instancias

Almacena tu contraseña de SQL Server como una clave segura

Agrega tu contraseña de SQL Server como una clave segura para encriptar en tu instancia de Cloud Data Fusion. Más adelante en esta guía, te asegurarás de que tu contraseña se recupere con Cloud KMS.

  1. En la esquina superior derecha de cualquier página de Cloud Data Fusion, haz clic en Administrador del sistema.

  2. Haz clic en la pestaña Configuración.

  3. Haz clic en Make HTTP Calls.

    Configuración

  4. En el menú desplegable, selecciona PUT.

  5. En el campo Ruta de acceso, ingresa namespaces/NAMESPACE_ID/securekeys/PASSWORD.

  6. En el campo Cuerpo (Body), ingresa {"data":"SQL_SERVER_PASSWORD"}.

  7. Haga clic en Enviar.

    Contraseña

Asegúrate de que la Respuesta (Response) que recibes sea el código de estado 200.

Obtén el controlador JDBC para SQL Server

Usa Hub

  1. En la IU de Cloud Data Fusion, haga clic en Hub.

  2. En la barra de búsqueda, ingresa Microsoft SQL Server JDBC Driver.

  3. Haz clic en Microsoft SQL Server JDBC Driver.

  4. Haz clic en Descargar. Sigue los pasos de descarga que se muestran.

  5. Haz clic en Implementar. Sube el archivo JAR del paso anterior.

  6. Haz clic en Finalizar.

Uso de Studio

  1. Visita Microsoft.com.

  2. Elige la descarga y haz clic en Descargar.

  3. En la IU de Cloud Data Fusion, haz clic en Menú y navega a la página de Studio.

  4. Haga clic en Agregar.

  5. En Driver, haz clic en Upload.

  6. Sube el archivo JAR que descargaste en el paso 2.

  7. Haz clic en Siguiente.

  8. Para configurar el controlador, ingresa un Nombre.

  9. En el campo Nombre de la clase, ingresa com.microsoft.sqlserver.jdbc.SQLServerDriver.

  10. Haz clic en Finalizar.

Implementa los complementos de múltiples tablas

  1. En la IU web de Cloud Data Fusion, haz clic en Centro de noticias.

  2. En la barra de búsqueda, ingresa Multiple table plugins.

  3. Haz clic en Multiple Table Plugins.

    Contraseña
  4. Haz clic en Implementar.

  5. Haz clic en Finalizar.

  6. Haz clic en Create a pipeline.

Conéctate a SQL Server

  1. En la IU de Cloud Data Fusion, haz clic en Menú y navega a la página de Studio.

  2. En Studio, expande el menú Fuente.

  3. Haz clic en Multiple Database Tables.

    Varias tablas.
  4. Mantén el puntero sobre el nodo Multiple Database Tables y haz clic en Properties.

    Properties.
  5. En el campo Nombre de referencia, especifica el nombre de referencia que se usará para identificar la fuente de SQL Server.

  6. En el campo JDBC Connection String, ingresa la string de conexión de JDBC. Por ejemplo, jdbc:sqlserver://mydbhost:1433. Para obtener más información, consulta Compila la URL de conexión.

  7. Ingresa el Nombre del complemento de JDBC, el Nombre de usuario de la base de datos y la Contraseña de usuario de la base de datos.

  8. Haz clic en Validate.

  9. Haz clic en Cerrar.

Conéctate a BigQuery o Cloud Storage

  1. En la IU de Cloud Data Fusion, haz clic en Menú y navega a la página de Studio.

  2. Expande Receptor.

  3. Haz clic en Tabla múltiple de BigQuery o en Archivo múltiple de GCS.

  4. Conecta el nodo Varias tablas de bases de datos con Tablas múltiples de BigQuery o Archivos múltiples de GCS.

    Conecta el receptor.
  5. Mantén el puntero sobre el nodo Tabla múltiple de BigQuery o Archivo múltiple de GCS, haz clic en Propiedades y configura el receptor.

    Para obtener más información, consulta Receptor de tablas múltiples de Google BigQuery y Receptor de varios archivos de Google Cloud Storage.

  6. Haz clic en Validate.

  7. Haz clic en Cerrar.

Ejecuta una vista previa de la canalización

  1. En la IU de Cloud Data Fusion, haz clic en Menú y navega a la página de Studio.

  2. Haz clic en Vista previa.

  3. Haz clic en Ejecutar. Espera a que la vista previa finalice correctamente.

Implementa la canalización

  1. En la IU de Cloud Data Fusion, haz clic en Menú y navega a la página de Studio.

  2. Haz clic en Implementar.

Ejecuta la canalización

  1. En la IU de Cloud Data Fusion, haz clic en Menú.

  2. Haz clic en Lista.

  3. Haz clic en la canalización.

  4. En la página de detalles de la canalización, haz clic en Ejecutar.

¿Qué sigue?