Introducción a los conjuntos de datos

En esta página se proporciona una descripción general de los conjuntos de datos en BigQuery.

Conjuntos de datos

Un conjunto de datos se encuentra dentro de un proyecto específico. Los conjuntos de datos son contenedores de nivel superior que se usan para organizar y controlar el acceso a tus tablas y vistas. Una tabla o una vista deben pertenecer a un conjunto de datos, por lo que debes crear al menos un conjunto de datos antes de cargar datos en BigQuery. Usa el formato projectname.datasetname para calificar completamente el nombre de un conjunto de datos cuando usas GoogleSQL o el formato projectname:datasetname para calificar completamente un nombre de conjunto de datos cuando usas la herramienta de línea de comandos de bq.

Ubicación

Especificas una ubicación para almacenar tus datos de BigQuery cuando creas un conjunto de datos. Para obtener una lista de las ubicaciones de los conjuntos de datos de BigQuery, consulta Ubicaciones de BigQuery. Una vez que se crea el conjunto de datos, la ubicación no se puede cambiar; sin embargo, puedes copiar conjuntos de datos en diferentes ubicaciones o mover (volver a crear) el conjunto de datos a una ubicación diferente de forma manual.

BigQuery procesa las búsquedas en la misma ubicación en la que se encuentra el conjunto de datos que contiene las tablas que deseas buscar. BigQuery almacena tus datos en la ubicación seleccionada de acuerdo con las Condiciones específicas del servicio.

Limitaciones

Los conjuntos de datos de BigQuery están sujetos a las limitaciones siguientes:

  • La ubicación del conjunto de datos solo se puede configurar en el momento de la creación. Una vez que se crea un conjunto de datos, su ubicación no se puede cambiar.
  • Todas las tablas a las que se hace referencia en una consulta deben almacenarse en conjuntos de datos en la misma ubicación.

  • Cuando copias una tabla, los conjuntos de datos que contienen la tabla de origen y la de destino deben estar en la misma ubicación.

  • Los nombres de los conjuntos de datos deben ser únicos para cada proyecto.

Cuotas

Para obtener más información sobre las cuotas y los límites de los conjuntos de datos, consulta la sección sobre cuotas y límites.

Retención de datos

Los conjuntos de datos usan el viaje en el tiempo junto con el período de seguridad ante fallas para retener los datos borrados y modificados por un período breve, en caso de que necesites recuperarlos. Para obtener más información, consulta Retención de datos con viaje en el tiempo y seguridad ante fallas.

Modelos de facturación de almacenamiento

Cuando creas un conjunto de datos, se te factura el almacenamiento que usa ese conjunto de datos con bytes lógicos como la unidad de consumo predeterminada. Sin embargo, puedes optar por usar bytes físicos para la facturación. También puedes cambiar el modelo de facturación de almacenamiento de un conjunto de datos existente para usar bytes físicos.

Cuando cambias el modelo de facturación de un conjunto de datos, el cambio tarda 24 horas en aplicarse. Las tablas o particiones de tablas en el almacenamiento a largo plazo no se restablecen al almacenamiento activo cuando cambias el modelo de facturación de un conjunto de datos. El rendimiento y la latencia de las consultas no se ven afectados cuando se cambia el modelo de facturación de un conjunto de datos.

Una vez que cambies el modelo de facturación de almacenamiento de un conjunto de datos, debes esperar 14 días antes de poder volver a cambiar el modelo de facturación de almacenamiento.

Cuando configuras tu modelo de facturación de almacenamiento para usar bytes físicos, los costos totales de almacenamiento activo que se te facturan incluyen los bytes usados para el almacenamiento de seguridad ante fallas y viaje en el tiempo. Puedes configurar el período de viaje en el tiempo para balancear los costos de almacenamiento con tus necesidades de retención de datos. Para obtener más información sobre la previsión de tus costos de almacenamiento, consulta Predice la facturación de almacenamiento.

Criterios de elegibilidad:

El modelo de facturación de almacenamiento del conjunto de datos solo está disponible para tus conjuntos de datos si tu organización no tiene ningún compromiso de ranura de tarifa plana existente ubicado en la misma región que el conjunto de datos. Tu organización puede inscribir conjuntos de datos para la facturación de almacenamiento físico cuando no hay compromisos de tarifa plana ubicados en la misma región que el conjunto de datos.

Precios

No se cobra por crear, actualizar o borrar un conjunto de datos.

Para obtener más información sobre los precios de BigQuery, consulta Precios.

Seguridad

Para controlar el acceso a los conjuntos de datos en BigQuery, consulta Controla el acceso a los conjuntos de datos. Para obtener información sobre la encriptación de datos, consulta Encriptación en reposo.

¿Qué sigue?