Introducción a las conexiones
BigQuery te permite consultar datos que se almacenan fuera de BigQuery en servicios de Google Cloud, como Cloud Storage o Spanner, o en fuentes de terceros, como AWS o Azure. Estas conexiones externas usan la API de BigQuery Connection.
Por ejemplo, supongamos que almacenas detalles sobre los pedidos de los clientes en Cloud SQL y datos sobre ventas en BigQuery y deseas unir las dos tablas en una sola consulta. Puedes crear una conexión de Cloud SQL a la base de datos externa con la API de BigQuery Storage. Con las conexiones, nunca envíes credenciales de bases de datos como texto simple.
Una conexión se encripta y se almacena de forma segura en el servicio de conexión de BigQuery. Otorga a los usuarios acceso a las conexiones si les otorgas roles de Identity and Access Management (IAM) de conexión de BigQuery.
Tipos de conexiones
BigQuery proporciona diferentes tipos de conexión para las siguientes fuentes de datos externas:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob Storage
- Recursos de Google Cloud, como modelos remotos de Vertex AI, funciones remotas y BigLake
- Spanner
- Cloud SQL
- AlloyDB para PostgreSQL
Conexiones de Amazon S3
Para crear una conexión de Amazon S3 con BigQuery Omni, consulta Conéctate a Amazon S3.
Una vez que tengas una conexión de Amazon S3 existente, puedes hacer lo siguiente:
- Crea tablas externas en Amazon S3
- Consulta los datos de Amazon S3
- Exporta resultados a Amazon S3
- Crea conjuntos de datos basados en bases de datos de AWS Glue.
Conexiones de Spark
Los procedimientos almacenados para Spark te permiten ejecutar procedimientos almacenados escritos en Python mediante BigQuery. Una conexión de Spark te permite conectarte a Dataproc Serverless y ejecutar los procedimientos almacenados para Spark.
Para crear esta conexión, consulta Crea conexiones.
Conexiones de Blob Storage
Para crear una conexión de Blob Storage con BigQuery Omni, consulta Conéctate a Blob Storage.
Una vez que tengas una conexión existente de Blob Storage, puedes hacer lo siguiente:
- Crea tablas externas basadas en el almacenamiento de Blob
- Consulta los datos de Blob Storage
- Exporta resultados a Blob Storage
Conexiones de recursos de Google Cloud
Una conexión de recursos de Google Cloud es una conexión para autorizar el acceso a otros recursos de Google Cloud, como modelos remotos de Vertex AI, funciones remotas y BigLake. Para obtener detalles sobre cómo configurar una conexión de recursos de Google Cloud, consulta Crea y configura una conexión de recursos de Cloud.
Una vez que tengas una conexión de recursos de Google Cloud existente, podrás crear los siguientes objetos de BigQuery con ella:
- Modelos remotos. Para obtener más información, consulta la instrucción CREATE MODEL para modelos remotos mediante LLMs, la instrucción CREATE MODEL para modelos remotos mediante los servicios de IA de Cloud y la instrucción CREATE MODEL para modelos remotos mediante modelos alojados en Vertex AI.
- Funciones remotas. Las funciones remotas de BigQuery te permiten implementar funciones con cualquier lenguaje compatible en funciones de Cloud Run o Cloud Run. Una conexión de funciones remotas te permite conectarte con las funciones de Cloud Run o Cloud Run y ejecutar estas funciones. Para crear una conexión de función remota de BigQuery, consulta Crea una conexión.
- Tablas de BigLake. Las conexiones de BigLake conectan las tablas de BigLake a fuentes de datos externas y, al mismo tiempo, conservan la seguridad y el control de acceso detallados de BigQuery para los datos estructurados y no estructurados en Cloud Storage.
- Tablas de objetos. Para obtener más información, consulta Introducción a las tablas de objetos.
Conexiones de Spanner
Para crear una conexión de Spanner, consulta Conéctate a Spanner.
Una vez que tengas una conexión de Spanner existente, podrás crear consultas federadas. Estas consultas pueden establecer conexiones con Spanner antes de enviar una consulta.
Conexiones de Cloud SQL
Para crear una conexión de Cloud SQL, consulta Conéctate a Cloud SQL.
Una vez que tengas una conexión de Cloud SQL existente, puedes crear consultas federadas. Estas consultas pueden establecer conexiones con Cloud SQL antes de enviar una consulta.
Conexiones de AlloyDB
Para crear una conexión de AlloyDB, consulta Conéctate a AlloyDB para PostgreSQL.
Una vez que tengas una conexión de AlloyDB existente, puedes crear consultas federadas. Estas consultas pueden establecer conexiones con AlloyDB antes de que envíes una consulta.
Registros de auditoría
BigQuery registra las solicitudes de uso y administración sobre las conexiones. Para obtener más información, consulta la descripción general de los registros de auditoría de BigQuery.
¿Qué sigue?
- Obtén más información sobre cómo administrar conexiones.
- Aprende a analizar tablas de objetos mediante funciones remotas.
- Obtén información sobre cómo consultar datos almacenados:
- Consulta datos almacenados en Amazon S3.
- Consulta datos almacenados en el almacenamiento de BLOB.
- Consulta datos estructurados almacenados en Cloud Storage.
- Consulta datos no estructurados almacenados en Cloud Storage.
- Consulta los datos almacenados en Spanner.
- Consulta los datos almacenados en Cloud SQL.
- Consulta datos almacenados en AlloyDB.
- Consulta datos mediante funciones remotas.
- Consulta datos no estructurados con funciones remotas.
- Consulta datos mediante procedimientos almacenados para Apache Spark.
- Obtén más información sobre las tablas externas.