Exporta los resultados de las consultas a Amazon S3
En este documento, se describe cómo exportar el resultado de una consulta que se ejecuta en una tabla de BigLake en el bucket de Amazon Simple Storage Service (Amazon S3).
Para obtener más información sobre cómo fluyen los datos entre BigQuery y Amazon S3, consulta Flujo de datos cuando se exportan datos.
Limitaciones
Para obtener una lista completa de las limitaciones que se aplican a las tablas de BigLake basadas en Amazon S3 y Blob Storage, consulta Limitaciones.
Antes de comenzar
Asegúrate de que tienes los siguientes recursos:
- Una conexión para acceder a tu bucket de Amazon S3.
- Una tabla de Amazon S3 BigLake
- La política de Identity and Access Management (IAM) de Amazon Web Services (AWS) correcta:
- Debes tener el permiso
PutObject
para escribir datos en el bucket de Amazon S3. Para obtener más información, consulta Crea una política de IAM de AWS para BigQuery.
- Debes tener el permiso
- Si usas el modelo de precios basado en la capacidad, asegúrate de que habilitaste la API de reservas de BigQuery para tu proyecto. Para obtener más información sobre los precios, consulta Precios de BigQuery Omni.
Exportar resultados de consultas
BigQuery Omni escribe en la ubicación de Amazon S3 especificada, sin importar el contenido existente. La consulta de exportación puede reemplazar los datos existentes o combinar el resultado de la consulta con los datos existentes. Recomendamos que exportes el resultado de la consulta a un bucket vacío de Amazon S3.
Para ejecutar una consulta, selecciona una de las siguientes opciones:
SQL
En el campo Editor de consultas, ingresa una consulta de exportación de GoogleSQL. GoogleSQL es la sintaxis predeterminada en la consola de Google Cloud.
En la consola de Google Cloud, ve a la página de BigQuery.
En el editor de consultas, escribe la siguiente oración:
EXPORT DATA WITH CONNECTION `CONNECTION_REGION.CONNECTION_NAME` OPTIONS(uri="s3://BUCKET_NAME/PATH", format="FORMAT", ...) AS QUERY
Reemplaza lo siguiente:
CONNECTION_REGION
: la región en la que se creó la conexión.CONNECTION_NAME
: el nombre de conexión que creaste con el permiso necesario para escribir en el bucket de Amazon S3.BUCKET_NAME
: el bucket de Amazon S3 en el que deseas escribir los datos.PATH
: la ruta en la que deseas escribir el archivo exportado. Debe contener exactamente un comodín*
en cualquier lugar del directorio hoja de la string de ruta de acceso, por ejemplo,../aa/*
,../aa/b*c
,../aa/*bc
y../aa/bc*
. BigQuery reemplaza*
por0000..N
, según la cantidad de archivos exportados. BigQuery determina el recuento y los tamaños de archivos. Si BigQuery decide exportar dos archivos, entonces se reemplaza*
en el nombre de archivo del primer archivo por000000000000
y*
en el segundo nombre del archivo, se reemplaza por000000000001
.FORMAT
: Los formatos compatibles sonJSON
,AVRO
,CSV
yPARQUET
.QUERY
: la consulta para analizar los datos que se almacenan en una tabla de BigLake.Haz clic en
Ejecutar.
Para obtener más información sobre cómo ejecutar consultas, visita Ejecuta una consulta interactiva.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Java.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Soluciona problemas
Si obtienes un error relacionado con quota failure
, verifica si reservaste capacidad para tus consultas. Para obtener más información sobre las reservas de ranuras, consulta Antes de comenzar en este documento.
¿Qué sigue?
- Obtén información sobre BigQuery Omni.
- Obtén información sobre cómo exportar datos de tablas.
- Aprende a consultar datos almacenados en Amazon S3.
- Obtén información sobre cómo configurar los Controles del servicio de VPC para BigQuery Omni.