El futuro de los data lakehouses: abiertos e interoperables para la era de los agentes. Echa un vistazo a la entrada del blog.

Lakehouse for Apache Iceberg (antes BigLake)

Lakehouse abierto y multinube para la era de los agentes

Almacenamiento, gobernanza y rendimiento de nivel empresarial para crear casos prácticos de IA escalables, analíticos, operativos y en tiempo real en un lakehouse abierto, unificado, multimodal y multinube.

Apache Iceberg es una marca de The Apache Software Foundation.

Características

Iceberg totalmente gestionado con interoperabilidad de lectura y escritura

Las tablas de Apache Iceberg, gestionadas mediante el catálogo REST de Lakehouse Iceberg, ofrecen interoperabilidad de lectura y escritura entre BigQuery y Google Cloud Managed Service for Apache Spark, así como con motores de software libre compatibles con Iceberg, como Spark, Trino y Flink, y ahora también con motores de terceros como Snowflake y Databricks (versión preliminar). Esto te ayuda a conectar fácilmente tus tablas de Iceberg directamente a motores como BigQuery y Spark gestionado por Google para que puedas acelerar tus cargas de trabajo de IA.

La IA de Google conectada a tus datos de Iceberg en distintas nubes

Aprovecha la interconexión y el almacenamiento en caché entre nubes (versión preliminar) para acceder a los datos de S3 Iceberg de forma rápida y con baja latencia. Ejecuta BigQuery, Spark y Gemini Enterprise a través de tareas de la API de analíticas conversacionales en datos de AWS con características de precio-rendimiento comparables a las soluciones de plataformas de datos nativas. Además, la nueva federación de catálogos de Lakehouse Runtime (versión preliminar) unifica tu ecosistema a la perfección, lo que permite que BigQuery y Google Managed Spark descubran y analicen datos empresariales en Snowflake, Databricks y AWS Glue.

Agilización de la rentabilización de Iceberg

La ejecución vectorizada mejorada de BigQuery ahora está habilitada de forma predeterminada para las tablas del catálogo REST de Iceberg de Lakehouse, así como para las tablas de Iceberg y Parquet del catálogo de BigQuery. Delega el mantenimiento rutinario de Iceberg, como la compactación, el agrupamiento en clústeres y la recolección de elementos no utilizados, directamente en Google Lakehouse. Las nuevas funciones automatizadas, como la gestión de tablas, la partición, la agrupación en clústeres y la optimización basada en el historial (disponibles de forma general para las tablas de Iceberg en el catálogo de BigQuery y en versión preliminar para el catálogo de REST), mejoran la relación precio-rendimiento sin necesidad de intervención manual.

BigQuery y Spark diferenciados

Potencia las estadísticas en tiempo real con Iceberg usando la transmisión de BigQuery para la ingestión de alto rendimiento con latencia de lectura cero. Crea flujos de procesamiento complejos con transacciones de varias sentencias y replicación de datos de cambio de BigQuery en tablas de Iceberg (disponibilidad general para el catálogo de BigQuery; vista previa para el catálogo de REST). Aprovecha las analíticas multimodales, vectoriales y de grafos uniendo datos estructurados y no estructurados con BigQueryObjectRefs. Potencia las cargas de trabajo de ciencia de datos de Spark con Lightning Engine y consigue un rendimiento hasta 4,5 veces más rápido.

Contexto en tiempo real y gobernanza para los agentes

Potencia los agentes de IA con datos transaccionales en tiempo real. Transmite datos operativos desde Spanner, AlloyDB y Cloud SQL a BigQuery y a tablas de Iceberg gestionadas para analizarlos al instante. Además, puedes enviar esos datos analíticos directamente a AlloyDB o Spanner para servirlos con una latencia inferior a un milisegundo y un alto número de consultas por segundo. Consigue un gobierno unificado con linaje, elaboración de perfiles y calidad de los datos mediante la integración de Knowledge Catalog (anteriormente, Dataplex). Asigna datos transaccionales, no estructurados y de iceberg a tu lógica empresarial para que tus agentes tengan el contexto detallado que necesitan para ofrecer resultados precisos, fiables y totalmente controlados.

Cómo funciona

El catálogo REST de Lakehouse actúa como un centro de control centralizado para tus tablas de Iceberg. Proporciona acceso universal de lectura y escritura en BigQuery, Managed Service for Apache Spark, motores de OSS y partners, conectando tus datos a cualquier motor para acelerar la IA.

Usos habituales

Establecimiento y modernización del lakehouse

Moderniza tu arquitectura para que sea un lakehouse abierto y unificado

Moderniza tu base de datos con Lakehouse de Google. Migra tu Hadoop antiguo a Cloud Storage sin servidor y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo REST de Iceberg de Lakehouse elimina los silos y ofrece un tiempo de ejecución interoperable para Spark, Trino y Flink. Gracias a la compatibilidad con el catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

Tutoriales, guías de inicio rápido y experimentos

Moderniza tu arquitectura para que sea un lakehouse abierto y unificado

Moderniza tu base de datos con Lakehouse de Google. Migra tu Hadoop antiguo a Cloud Storage sin servidor y unifica los datos entre nubes consultando Iceberg y Delta Lake directamente en BigQuery. El catálogo REST de Iceberg de Lakehouse elimina los silos y ofrece un tiempo de ejecución interoperable para Spark, Trino y Flink. Gracias a la compatibilidad con el catálogo de Hive, puedes modernizar fácilmente las cargas de trabajo de Hadoop a Iceberg.

Interoperabilidad multimotor

Uso compartido de lectura y escritura fluido entre BigQuery y los motores de OSS

Trae tus pipelines de Iceberg y lee o escribe en esas tablas sin problemas usando BigQuery o Spark gestionado, mientras modernizas fácilmente con las funciones avanzadas de BigQuery. Impulsa la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de analíticas conversacionales en BigQuery que funcionen con tus datos en S3.

Tutoriales, guías de inicio rápido y experimentos

Uso compartido de lectura y escritura fluido entre BigQuery y los motores de OSS

Trae tus pipelines de Iceberg y lee o escribe en esas tablas sin problemas usando BigQuery o Spark gestionado, mientras modernizas fácilmente con las funciones avanzadas de BigQuery. Impulsa la ciencia de datos ejecutando ETL de Spark y la IA de BigQuery en las mismas tablas de Iceberg sin mover los datos. Crea agentes de analíticas conversacionales en BigQuery que funcionen con tus datos en S3.

Incorpora datos de Iceberg a flujos de trabajo de IA

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Potencia el análisis multimodal con BigQuery AI combinando tablas estructuradas de Iceberg con datos no estructurados mediante ObjectRefs de BigQuery para la inferencia de SQL único. Entrena modelos de la plataforma de agentes de Gemini Enterprise usando la función de retroceso en el tiempo para depurar la deriva de datos. Federa catálogos de REST globales en una malla de datos unificada, analiza registros a gran escala de forma asequible y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.

Tutoriales, guías de inicio rápido y experimentos

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Potencia el análisis multimodal con BigQuery AI combinando tablas estructuradas de Iceberg con datos no estructurados mediante ObjectRefs de BigQuery para la inferencia de SQL único. Entrena modelos de la plataforma de agentes de Gemini Enterprise usando la función de retroceso en el tiempo para depurar la deriva de datos. Federa catálogos de REST globales en una malla de datos unificada, analiza registros a gran escala de forma asequible y crea modelos directamente en notebooks integrados para acelerar tus flujos de trabajo de IA.

Experiencia de Spark líder en el sector

Impulsa las cargas de trabajo de ciencia de datos en todos los entornos de desarrollo

Disfruta de una experiencia fluida con Spark. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg usando IDEs unificados. La nueva extensión Antigravity para VS Code actúa como un partner de IA para generar flujos de procesamiento, depurar código y automatizar la CI/CD a partir de lenguaje natural. Además, nuestro motor vectorizado Lightning Engine acelera la ejecución de Spark hasta 4,5 veces sin necesidad de cambiar el código.

Tutoriales, guías de inicio rápido y experimentos

Impulsa las cargas de trabajo de ciencia de datos en todos los entornos de desarrollo

Disfruta de una experiencia fluida con Spark. Ejecuta SQL, Spark y Python en una sola copia de datos de Iceberg usando IDEs unificados. La nueva extensión Antigravity para VS Code actúa como un partner de IA para generar flujos de procesamiento, depurar código y automatizar la CI/CD a partir de lenguaje natural. Además, nuestro motor vectorizado Lightning Engine acelera la ejecución de Spark hasta 4,5 veces sin necesidad de cambiar el código.

Analíticas de alto rendimiento con BigQuery

Optimización del rendimiento con BigQuery

Aprovecha la escala de BigQuery sin renunciar a la flexibilidad del almacenamiento. Ejecuta transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa el tiempo de ejecución avanzado de BigQuery y la compatibilidad con el particionamiento de Iceberg para crear tablas particionadas o agrupadas que aprovechen la eliminación de bloques para ejecutar consultas de forma rápida y rentable.

Tutoriales, guías de inicio rápido y experimentos

Optimización del rendimiento con BigQuery

Aprovecha la escala de BigQuery sin renunciar a la flexibilidad del almacenamiento. Ejecuta transacciones de varias instrucciones en BigQuery para actualizar varias tablas de Iceberg como una sola unidad atómica, lo que garantiza una coherencia de nivel financiero. Usa el tiempo de ejecución avanzado de BigQuery y la compatibilidad con el particionamiento de Iceberg para crear tablas particionadas o agrupadas que aprovechen la eliminación de bloques para ejecutar consultas de forma rápida y rentable.

Inteligencia en tiempo real

Combinación de transacciones y analíticas para la IA de agentes

Impulsa los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en las tablas de Iceberg de Lakehouse. Después, usa consultas continuas de SQL para monitorizar estos datos de streaming, ejecutar inferencias de IA al instante y activar acciones posteriores, lo que te permitirá obtener información valiosa en tiempo real para tus cargas de trabajo operativas más importantes.

Tutoriales, guías de inicio rápido y experimentos

Combinación de transacciones y analíticas para la IA de agentes

Impulsa los agentes de IA basados en eventos unificando tus datos transaccionales y analíticos. Automatiza la replicación continua de CDC desde Spanner y AlloyDB directamente en las tablas de Iceberg de Lakehouse. Después, usa consultas continuas de SQL para monitorizar estos datos de streaming, ejecutar inferencias de IA al instante y activar acciones posteriores, lo que te permitirá obtener información valiosa en tiempo real para tus cargas de trabajo operativas más importantes.

Gobernanza integral del lakehouse

Gobierna tu lakehouse con Knowledge Catalog

Knowledge Catalog proporciona una capa de gobernanza unificada descubriendo automáticamente las tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de tiempo de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garanticen un control de acceso coherente a nivel de fila y de columna tanto en BigQuery como en los motores de procesamiento de código abierto.

Tutoriales, guías de inicio rápido y experimentos

Gobierna tu lakehouse con Knowledge Catalog

Knowledge Catalog proporciona una capa de gobernanza unificada descubriendo automáticamente las tablas de Iceberg en Cloud Storage y registrando sus metadatos directamente en el catálogo de tiempo de ejecución de Lakehouse. Esta integración te permite definir políticas de seguridad centralizadas que garanticen un control de acceso coherente a nivel de fila y de columna tanto en BigQuery como en los motores de procesamiento de código abierto.

Precios

Cómo funcionan los precios de Lakehouse (BigLake)	Los precios de Lakehouse (BigLake) se basan en la gestión de tablas, el almacenamiento de metadatos y el acceso a metadatos
Servicios y uso	Descripción	Precio (USD)
Gestión de tablas de Lakehouse (antes BigLake)	Recursos de computación de gestión de tablas de Lakehouse utilizados para la optimización automática del almacenamiento de tablas, lo que incluye el ajuste adaptativo del tamaño de los archivos, el agrupamiento en clústeres automático, la recolección de elementos no utilizados y la generación de metadatos de BigQuery (CMETA).	Desde 0,12 USD por DCU por hora
Almacenamiento de metadatos de Lakehouse (BigLake)	El catálogo de tiempo de ejecución de Lakehouse (antes, almacén de metadatos de BigLake) aplica cargos por los metadatos almacenados. El nivel sin coste económico incluye 1 GiB de almacenamiento de metadatos al mes.	Sin coste 1 GiB de almacenamiento de metadatos al mes
Almacenamiento de metadatos de Lakehouse (BigLake)	El catálogo de tiempo de ejecución de Lakehouse (antes BigLake Metastore) aplica cargos por los metadatos almacenados que superen el nivel sin coste de 1 GiB de almacenamiento de metadatos al mes.	Desde 0,04 USD por GiB al mes
Acceso a metadatos de Lakehouse (BigLake)	Operaciones de clase A: cargos por acceso a metadatos de Lakehouse para operaciones de escritura, actualización, listado, creación y configuración, con un nivel sin coste de 5000 operaciones al mes incluido. Operaciones específicas: Crear Registrar Listar Actualizar (incluye eliminar filas de una tabla) setIamPolicy Cuando el archivo de metadatos es superior a 1 MB Cada MB incremental se considera una operación 1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.	Desde 6,00 USD por millón de operaciones que superen las 5001 al mes por cuenta
Acceso a metadatos de Lakehouse (BigLake)	Operaciones de clase B: cargos por acceso a metadatos de Lakehouse (BigLake) para operaciones de lectura, obtención y eliminación, con un nivel sin coste económico de 50.000 operaciones al mes incluido. Operaciones específicas: Leer Eliminar getIamPolicy Cuando el archivo de metadatos es superior a 1 MB Cada MB incremental se considera una operación 1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.	Desde 0,90 USD por millón de operaciones por encima de las 50.001
Federación de catálogos de Lakehouse: actualización de metadatos	Operaciones de actualización de metadatos para actualizar los metadatos del catálogo externo (por ejemplo, Databricks Unity Catalog) con un nivel sin coste de 0 a 5001 recuentos por 1 mes y cuenta. Cuando el archivo de metadatos es superior a 1 MB Cada MB incremental se considera una operación 1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.	Desde 6,00 USD por millón de operaciones que superen las 5001 al mes por cuenta

Cómo funcionan los precios de Lakehouse (BigLake)

Los precios de Lakehouse (BigLake) se basan en la gestión de tablas, el almacenamiento de metadatos y el acceso a metadatos

Gestión de tablas de Lakehouse (antes BigLake)

Descripción

Recursos de computación de gestión de tablas de Lakehouse utilizados para la optimización automática del almacenamiento de tablas, lo que incluye el ajuste adaptativo del tamaño de los archivos, el agrupamiento en clústeres automático, la recolección de elementos no utilizados y la generación de metadatos de BigQuery (CMETA).

Precio (USD)

Starting at

0,12 USD

por DCU por hora

Almacenamiento de metadatos de Lakehouse (BigLake)

Descripción

El catálogo de tiempo de ejecución de Lakehouse (antes, almacén de metadatos de BigLake) aplica cargos por los metadatos almacenados. El nivel sin coste económico incluye 1 GiB de almacenamiento de metadatos al mes.

Precio (USD)

Sin coste

1 GiB de almacenamiento de metadatos al mes

El catálogo de tiempo de ejecución de Lakehouse (antes BigLake Metastore) aplica cargos por los metadatos almacenados que superen el nivel sin coste de 1 GiB de almacenamiento de metadatos al mes.

Descripción

Starting at

0,04 USD

por GiB al mes

Acceso a metadatos de Lakehouse (BigLake)

Descripción

Operaciones de clase A: cargos por acceso a metadatos de Lakehouse para operaciones de escritura, actualización, listado, creación y configuración, con un nivel sin coste de 5000 operaciones al mes incluido.

Operaciones específicas:

Crear
Registrar
Listar
Actualizar (incluye eliminar filas de una tabla)
setIamPolicy

Cuando el archivo de metadatos es superior a 1 MB

Cada MB incremental se considera una operación
1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.

Precio (USD)

Starting at

6,00 USD

por millón de operaciones que superen las 5001 al mes por cuenta

Operaciones de clase B: cargos por acceso a metadatos de Lakehouse (BigLake) para operaciones de lectura, obtención y eliminación, con un nivel sin coste económico de 50.000 operaciones al mes incluido.

Operaciones específicas:

Leer
Eliminar
getIamPolicy

Cuando el archivo de metadatos es superior a 1 MB

Cada MB incremental se considera una operación
1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.

Descripción

Starting at

0,90 USD

por millón de operaciones por encima de las 50.001

Federación de catálogos de Lakehouse: actualización de metadatos

Descripción

Operaciones de actualización de metadatos para actualizar los metadatos del catálogo externo (por ejemplo, Databricks Unity Catalog) con un nivel sin coste de 0 a 5001 recuentos por 1 mes y cuenta.

Cuando el archivo de metadatos es superior a 1 MB

Cada MB incremental se considera una operación
1 MB = 1 op., 2 MB = 2 ops., 5 MB = 5 ops.

Precio (USD)

Starting at

6,00 USD

por millón de operaciones que superen las 5001 al mes por cuenta

Calculadora de precios

Calcula tus costes mensuales de Lakehouse, incluidos los precios y las tarifas específicas de cada región.

Presupuesto personalizado

Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu organización.

Lakehouse for Apache Iceberg (antes BigLake)

Lakehouse abierto y multinube para la era de los agentes

Aspectos destacados del producto

Iceberg totalmente gestionado con interoperabilidad de lectura y escritura

La IA de Google conectada a tus datos de Iceberg en distintas nubes

Agilización de la rentabilización de Iceberg

BigQuery y Spark diferenciados

Contexto en tiempo real y gobernanza para los agentes

El catálogo REST de Lakehouse actúa como un centro de control centralizado para tus tablas de Iceberg. Proporciona acceso universal de lectura y escritura en BigQuery, Managed Service for Apache Spark, motores de OSS y partners, conectando tus datos a cualquier motor para acelerar la IA.

Establecimiento y modernización del lakehouse

Moderniza tu arquitectura para que sea un lakehouse abierto y unificado

Tutoriales, guías de inicio rápido y experimentos

Moderniza tu arquitectura para que sea un lakehouse abierto y unificado

Interoperabilidad multimotor

Uso compartido de lectura y escritura fluido entre BigQuery y los motores de OSS

Tutoriales, guías de inicio rápido y experimentos

Uso compartido de lectura y escritura fluido entre BigQuery y los motores de OSS

Incorpora datos de Iceberg a flujos de trabajo de IA

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Tutoriales, guías de inicio rápido y experimentos

Análisis de datos multimodales y flujos de trabajo de IA acelerados

Experiencia de Spark líder en el sector

Impulsa las cargas de trabajo de ciencia de datos en todos los entornos de desarrollo

Tutoriales, guías de inicio rápido y experimentos

Impulsa las cargas de trabajo de ciencia de datos en todos los entornos de desarrollo

Analíticas de alto rendimiento con BigQuery

Optimización del rendimiento con BigQuery

Tutoriales, guías de inicio rápido y experimentos

Optimización del rendimiento con BigQuery

Inteligencia en tiempo real

Combinación de transacciones y analíticas para la IA de agentes

Tutoriales, guías de inicio rápido y experimentos

Combinación de transacciones y analíticas para la IA de agentes

Gobernanza integral del lakehouse

Gobierna tu lakehouse con Knowledge Catalog

Tutoriales, guías de inicio rápido y experimentos

Gobierna tu lakehouse con Knowledge Catalog

Calculadora de precios

Presupuesto personalizado

Empieza tu prueba de concepto

Iniciar prueba sin coste

¿Tienes un proyecto de gran envergadura?

Tablas de Apache Iceberg totalmente gestionadas

Usar el catálogo REST de Apache Iceberg

Consultar datos de Apache Iceberg