Introducción a las conexiones
BigQuery te permite consultar datos que se almacenan fuera de BigQuery en servicios de Google Cloud, como Cloud Storage o Spanner, o en fuentes de terceros, como AWS o Azure. Estas conexiones externas usan la API de BigQuery Connection.
Por ejemplo, supongamos que almacenas detalles sobre los pedidos de los clientes en Cloud SQL y datos sobre ventas en BigQuery y deseas unir las dos tablas en una sola consulta. Puedes crear una conexión de Cloud SQL a la base de datos externa con la API de BigQuery Storage. Con las conexiones, nunca envíes credenciales de bases de datos como texto simple.
Una conexión se encripta y se almacena de forma segura en el servicio de conexión de BigQuery. Otorga a los usuarios acceso a las conexiones si les otorgas roles de Identity and Access Management (IAM) de conexión de BigQuery.
Tipos de conexiones
BigQuery proporciona conexiones para las siguientes fuentes de datos externas:
Tablas de BigLake: Las conexiones de BigLake ayudan a conectar las siguientes fuentes de datos externas y, al mismo tiempo, conservan la seguridad y el control de acceso de BigQuery detallados:
- Datos estructurados en Cloud Storage
- Datos no estructurados en Cloud Storage
- Amazon S3 con BigQuery Omni
- Azure Blob Storage con BigQuery Omni
Para obtener más información, consulta Introducción a las tablas de BigLake.
Consultas federadas: Las conexiones federadas establecen conexiones a las siguientes bases de datos antes de enviar la consulta. Las conexiones controlan las credenciales de la base de datos para consultas federadas.
Para obtener más información, consulta Introducción a las consultas federadas.
Funciones remotas: Las funciones remotas de BigQuery te permiten implementar funciones con cualquier lenguaje compatible en Cloud Functions o Cloud Run. Una conexión de BigQuery te permite conectarte con Cloud Functions o Cloud Run y ejecutar estas funciones.
Para obtener más información, consulta Trabaja con funciones remotas y Analiza tablas de objetos mediante funciones remotas.
Apache Spark: Los procedimientos almacenados para Apache Spark te permiten ejecutar procedimientos almacenados en Python mediante BigQuery. Una conexión de Spark te permite conectarte a Dataproc Serverless y ejecutar los procedimientos almacenados para Apache Spark.
A fin de obtener más información, consulta Trabaja con procedimientos almacenados para Apache Spark.
Registros de auditoría
BigQuery registra las solicitudes de uso y administración sobre las conexiones. Para obtener más información, consulta la descripción general de los registros de auditoría de BigQuery.
¿Qué sigue?
- Obtén información sobre cómo consultar datos almacenados:
- Consulta datos almacenados en Amazon S3.
- Consulta datos almacenados en el almacenamiento de BLOB.
- Consulta datos estructurados almacenados en Cloud Storage.
- Consulta datos no estructurados almacenados en Cloud Storage.
- Consulta los datos almacenados en Spanner.
- Consulta los datos almacenados en Cloud SQL.
- Consulta datos mediante funciones remotas.
- Consulta datos no estructurados con funciones remotas.
- Consulta datos mediante procedimientos almacenados para Apache Spark.
- Obtén más información sobre cómo administrar conexiones.
- Obtén más información sobre las tablas externas.