Crie e consulte tabelas de metastore a partir do Spark

Pode consultar tabelas do Apache Spark Iceberg num bloco de notas do BigQuery através de motores de código aberto, como o Spark. Estas tabelas são tabelas Iceberg normais com metadados armazenados no metastore do BigLake. Pode consultar a mesma tabela a partir do BigQuery e do Spark.

Antes de começar

Veja e consulte uma tabela

Depois de criar os recursos do BigQuery no Spark, pode vê-los e consultá-los na Google Cloud consola. O exemplo seguinte mostra os passos gerais para consultar uma tabela do metastore através do Spark interativo:

  1. Use o catálogo Iceberg personalizado:

    USE `CATALOG_NAME`;

    Substitua o seguinte:

    • CATALOG_NAME: o nome do catálogo do Spark que está a usar com a sua tarefa de SQL.
  2. Crie um espaço de nomes:

    CREATE NAMESPACE IF NOT EXISTS NAMESPACE_NAME;

    Substitua o seguinte:

    • NAMESPACE_NAME: o nome do espaço de nomes que faz referência à sua tabela do Spark.
  3. Use o espaço de nomes criado:

    USE NAMESPACE_NAME;
  4. Crie uma tabela Iceberg:

    CREATE TABLE TABLE_NAME (id int, data string) USING ICEBERG;

    Substitua o seguinte:

    • TABLE_NAME: um nome para a sua tabela Iceberg.
  5. Inserir uma linha da tabela:

    INSERT INTO TABLE_NAME VALUES (1, "first row");
  6. Use a Google Cloud consola para fazer uma das seguintes ações:

     SELECT * FROM `TABLE_NAME`;

O que se segue?