Crear y consultar tablas de metastore desde Spark
Puedes consultar tablas de Apache Spark Iceberg en un cuaderno de BigQuery con motores de código abierto, como Spark. Estas tablas son tablas de Iceberg normales con metadatos almacenados en el metastore de BigLake. La misma tabla se puede consultar desde BigQuery y desde Spark.
Antes de empezar
- Crea una tabla de Iceberg mientras usas Spark en un cuaderno de BigQuery. El esquema de la tabla se almacena en BigLake Metastore. Por ejemplo, puedes crear la tabla con Dataproc, Google Cloud Serverless para Apache Spark o un procedimiento almacenado.
Ver y consultar una tabla
Una vez que hayas creado tus recursos de BigQuery en Spark, podrás verlos y consultarlos en laGoogle Cloud consola. En el siguiente ejemplo se muestran los pasos generales para consultar una tabla de metastore mediante Spark interactivo:
Usa el catálogo personalizado de Iceberg:
USE `CATALOG_NAME`;
Haz los cambios siguientes:
CATALOG_NAME
: el nombre del catálogo de Spark que estás usando con tu trabajo de SQL.
Crea un espacio de nombres:
CREATE NAMESPACE IF NOT EXISTS NAMESPACE_NAME;
Haz los cambios siguientes:
NAMESPACE_NAME
: el nombre del espacio de nombres que hace referencia a tu tabla de Spark.
Usa el espacio de nombres creado:
USE NAMESPACE_NAME;
Crea una tabla de Iceberg:
CREATE TABLE TABLE_NAME (id int, data string) USING ICEBERG;
Haz los cambios siguientes:
TABLE_NAME
: un nombre para tu tabla Iceberg.
Insertar una fila de una tabla:
INSERT INTO TABLE_NAME VALUES (1, "first row");
Usa la Google Cloud consola para hacer una de las siguientes acciones:
SELECT * FROM `TABLE_NAME`;
Siguientes pasos
- Configura funciones adicionales de BigLake Metastore.