Exportar resultados de consultas a Amazon S3
En este documento se describe cómo exportar el resultado de una consulta que se ejecuta en una tabla BigLake a tu segmento de Amazon Simple Storage Service (Amazon S3).
Para obtener información sobre cómo fluyen los datos entre BigQuery y Amazon S3, consulta Flujo de datos al exportar datos.
Limitaciones
Para ver una lista completa de las limitaciones que se aplican a las tablas de BigLake basadas en Amazon S3 y Blob Storage, consulta Limitaciones.
Antes de empezar
Asegúrate de que tienes los siguientes recursos:
- Una conexión para acceder a tu segmento de Amazon S3.
- Una tabla BigLake de Amazon S3.
- La política correcta de gestión de identidades y accesos (IAM) de Amazon Web Services (AWS):
- Debes tener el permiso
PutObject
para escribir datos en el segmento de Amazon S3. Para obtener más información, consulta Crear una política de gestión de identidades y accesos de AWS para BigQuery.
- Debes tener el permiso
- Si utilizas el modelo de precios basado en la capacidad, asegúrate de que la API BigQuery Reservation esté habilitada en tu proyecto. Para obtener información sobre los precios, consulta los precios de BigQuery Omni.
Exportar resultados de consultas
BigQuery Omni escribe en la ubicación de Amazon S3 especificada, independientemente del contenido que haya. La consulta de exportación puede sobrescribir los datos o combinar el resultado de la consulta con los datos. Te recomendamos que exportes el resultado de la consulta a un segmento de Amazon S3 vacío.
Para ejecutar una consulta, selecciona una de las siguientes opciones:
SQL
En el campo Editor de consultas, introduce una consulta de exportación de GoogleSQL. GoogleSQL es la sintaxis predeterminada en la Google Cloud consola.
.
En la Google Cloud consola, ve a la página BigQuery.
En el editor de consultas, introduce la siguiente instrucción:
EXPORT DATA WITH CONNECTION `CONNECTION_REGION.CONNECTION_NAME` OPTIONS(uri="s3://BUCKET_NAME/PATH", format="FORMAT", ...) AS QUERY
Haz los cambios siguientes:
CONNECTION_REGION
: la región en la que se creó la conexión.CONNECTION_NAME
: el nombre de la conexión que has creado con el permiso necesario para escribir en el segmento de Amazon S3.BUCKET_NAME
: el segmento de Amazon S3 en el que quieres escribir los datos.PATH
: la ruta en la que quieres escribir el archivo exportado. Debe contener exactamente un comodín*
en cualquier parte del directorio de hoja de la cadena de ruta. Por ejemplo,../aa/*
,../aa/b*c
,../aa/*bc
y../aa/bc*
. BigQuery sustituye*
por0000..N
en función del número de archivos exportados. BigQuery determina el número y el tamaño de los archivos. Si BigQuery decide exportar dos archivos,*
en el nombre del primer archivo se sustituye por000000000000
, y*
en el nombre del segundo archivo se sustituye por000000000001
.FORMAT
: los formatos admitidos sonJSON
,AVRO
,CSV
yPARQUET
.QUERY
: la consulta para analizar los datos que se almacenan en una tabla de BigLake. El conjunto de datos que contiene la tabla de BigLake usada en la consulta debe estar en la misma región de Amazon S3 que el segmento de Amazon S3 de destino.Haz clic en
Ejecutar.
Para obtener más información sobre cómo ejecutar consultas, consulta Ejecutar una consulta interactiva.
Java
Antes de probar este ejemplo, sigue las Javainstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Java de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Solución de problemas
Si recibes un error relacionado con quota failure
, comprueba si has reservado capacidad para tus consultas. Para obtener más información sobre las reservas de slots, consulta la sección Antes de empezar de este documento.
Siguientes pasos
- Consulta información sobre BigQuery Omni.
- Consulta cómo exportar datos de una tabla.
- Consulta cómo consultar datos almacenados en Amazon S3.
- Consulta cómo configurar Controles de Servicio de VPC para BigQuery Omni.