Introducción a los conjuntos de datos
En esta página se proporciona una descripción general de los conjuntos de datos en BigQuery.
Conjuntos de datos
Un conjunto de datos se encuentra dentro de un proyecto específico. Los conjuntos de datos son contenedores de nivel superior que se usan para organizar y controlar el acceso a tus tablas y vistas. Una tabla o una vista deben pertenecer a un conjunto de datos, por lo que debes crear al menos un conjunto de datos antes de cargar datos en BigQuery.
Usa el formato projectname.datasetname
para calificar completamente el nombre de un conjunto de datos cuando usas GoogleSQL o el formato projectname:datasetname
para calificar completamente un nombre de conjunto de datos cuando usas la herramienta de línea de comandos de bq.
Ubicación
Especificas una ubicación para almacenar tus datos de BigQuery cuando creas un conjunto de datos. Para obtener una lista de las ubicaciones de los conjuntos de datos de BigQuery, consulta Ubicaciones de BigQuery. Una vez que se crea el conjunto de datos, la ubicación no se puede cambiar , sin embargo, puedes copiar conjuntos de datos en diferentes ubicaciones, o mover (volver a crear) el conjunto de datos a una ubicación diferente de forma manual.
BigQuery procesa las búsquedas en la misma ubicación en la que se encuentra el conjunto de datos que contiene las tablas que deseas buscar. BigQuery almacena tus datos en la ubicación seleccionadade acuerdo con las Condiciones específicas del servicio.
Retención de datos
Los conjuntos de datos usan el viaje en el tiempo junto con el período de seguridad ante fallas para retener los datos borrados y modificados por un período breve, en caso de que necesites recuperarlos. Para obtener más información, consulta Retención de datos con viaje en el tiempo y seguridad ante fallas.
Modelos de facturación de almacenamiento
Se te puede facturar por el almacenamiento de datos de BigQuery en bytes lógicos o físicos (comprimidos), o en una combinación de ambos. El modelo de facturación de almacenamiento que elijas determinará los precios de almacenamiento. El modelo de facturación de almacenamiento que elijas no afecta el rendimiento de BigQuery. Sin importar el modelo de facturación que elijas, tus datos se almacenarán como bytes físicos.
El modelo de facturación de almacenamiento se establece a nivel del conjunto de datos. Si no especificas un modelo de facturación de almacenamiento cuando creas un conjunto de datos, la configuración predeterminada usará la facturación de almacenamiento lógico. Sin embargo, puedes cambiar el modelo de facturación de almacenamiento de un conjunto de datos después de crearlo. Una vez que cambies el modelo de facturación de almacenamiento de un conjunto de datos, debes esperar 14 días antes de poder volver a cambiar el modelo de facturación de almacenamiento.
Cuando cambias el modelo de facturación de un conjunto de datos, el cambio tarda 24 horas en aplicarse. Las tablas o particiones de tablas en el almacenamiento a largo plazo no se restablecen al almacenamiento activo cuando cambias el modelo de facturación de un conjunto de datos. El rendimiento de las consultas y la latencia de las consultas no se ven afectados cuando cambias el modelo de facturación de un conjunto de datos.
Los conjuntos de datos usan viajes en el tiempo y almacenamiento seguro para fallas para la retención de datos. El almacenamiento seguro ante fallas y viaje en el tiempo se cobran por separado según las tarifas de almacenamiento activo cuando usas la facturación de almacenamiento físico, pero se incluyen en la tarifa base que se te cobra cuando usas la facturación de almacenamiento lógico. Puedes modificar el período de viaje en el tiempo que usas para un conjunto de datos a fin de balancear los costos de almacenamiento físico con la retención de datos. No puedes modificar la ventana de seguridad ante fallas. Para obtener más información sobre la retención de datos del conjunto de datos, consulta Retención de datos con viajes en el tiempo y seguridad ante fallas. Para obtener más información sobre la previsión de tus costos de almacenamiento, consulta Predice la facturación de almacenamiento.
No puedes inscribir un conjunto de datos en la facturación de almacenamiento físico si tienes compromisos de ranura de tarifa plana heredados existentes en la misma región que el conjunto de datos. Esto no se aplica a los compromisos adquiridos con una edición de BigQuery.
Conjuntos de datos externos
Además de los conjuntos de datos de BigQuery, puedes crear conjuntos de datos externos, que son vínculos a fuentes de datos externas:
Ten en cuenta que los conjuntos de datos externos también se conocen como conjuntos de datos federados, y ambos términos se usan de forma indistinta.
Una vez creados, los conjuntos de datos externos contienen tablas de una fuente de datos externa a la que se hace referencia. Los datos de estas tablas no se copian en BigQuery, sino que se consultan cada vez que se usan. Para obtener más información, consulta Consultas federadas de Spanner.
Limitaciones
Los conjuntos de datos de BigQuery están sujetos a las limitaciones siguientes:
- La ubicación del conjunto de datos solo se puede configurar en el momento de la creación. Una vez que se crea un conjunto de datos, su ubicación no se puede cambiar.
- Todas las tablas a las que se hace referencia en una consulta deben almacenarse en conjuntos de datos en la misma ubicación.
Los conjuntos de datos externos no admiten el vencimiento de tablas, las réplicas, el viaje en el tiempo, la combinación predeterminada, el modo de redondeo predeterminado ni la opción para habilitar o inhabilitar el nombre de las tablas que no distingue mayúsculas de minúsculas.
Cuando copias una tabla, los conjuntos de datos que contienen la tabla de origen y la de destino deben estar en la misma ubicación.
Los nombres de los conjuntos de datos deben ser únicos para cada proyecto.
Si cambias el modelo de facturación de almacenamiento de un conjunto de datos, debes esperar 14 días antes de que puedas volver a cambiarlo.
No puedes inscribir un conjunto de datos en la facturación de almacenamiento físico si tienes compromisos de ranura de tarifa plana heredados existentes en la misma región que el conjunto de datos.
Cuotas
Para obtener más información sobre las cuotas y los límites de los conjuntos de datos, consulta la sección sobre cuotas y límites.
Precios
No se cobra por crear, actualizar o borrar un conjunto de datos.
Para obtener más información sobre los precios de BigQuery, consulta Precios.
Seguridad
Para controlar el acceso a los conjuntos de datos en BigQuery, consulta Controla el acceso a los conjuntos de datos. Para obtener información sobre la encriptación de datos, consulta Encriptación en reposo.
¿Qué sigue?
- Para obtener más información sobre la creación de conjuntos de datos, consulta Crea conjuntos de datos.
- Para obtener más información sobre cómo asignar controles de acceso a los conjuntos de datos, consulta Controla el acceso a los conjuntos de datos.