Analise dados com a ajuda do Gemini

Neste tutorial, descrevemos como usar a assistência com tecnologia de IA em Gemini no BigQuery para analisar dados.

Para o exemplo deste tutorial, considere que você é um analista de dados que precisa analisar e prever as vendas de produtos de um conjunto de dados.

Neste tutorial, presume-se que você esteja familiarizado com SQL e tarefas básicas de análise de dados. O conhecimento básico dos produtos Google Cloud não é pressuposto. Se você for iniciante no BigQuery, confira os guias de início rápido do BigQuery.

Objetivos

  • Use o Gemini no BigQuery para responder a perguntas sobre como o BigQuery processa tarefas específicas de análise de dados.
  • Instrua o Gemini no BigQuery a encontrar conjuntos de dados e a explicar e gerar consultas SQL.
  • Criar um modelo de machine learning (ML) para prever futuros períodos.

Custos

Neste tutorial, usamos os seguintes produtos faturáveis do Google Cloud.

Para estimar seus custos com base na projeção de uso, use a calculadora de preços.

Antes de começar

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Verifique se o Gemini no BigQuery está configurado para seu projeto do Google Cloud.
  3. No Console do Google Cloud, acesse a página BigQuery.

    Ir para o BigQuery

  4. Criar um conjunto de dados chamado bqml_tutorial. Use o conjunto de dados para armazenar objetos de banco de dados, incluindo tabelas e modelos.

  5. Para ativar os recursos do Gemini no BigQuery necessários para concluir este tutorial, no console do clique em pen_spark Gemini na barra de ferramentas e selecione as seguintes opções:

    • Preenchimento automático
    • Geração automática
    • Explicação

Saiba mais sobre os recursos do BigQuery

Antes de começar, considere saber como o BigQuery processa consultas de dados. Para receber ajuda, você pode enviar ao Gemini no BigQuery uma declaração em linguagem natural (ou comando), como o seguinte:

  • "Como começo a usar o BigQuery?"
  • "Quais benefícios o BigQuery oferece aos analistas de dados?"
  • "Como o BigQuery processa consultas de escalonamento automático?"

O Gemini no BigQuery também pode fornecer informações sobre como analisar seus dados. Para esse tipo de ajuda, você pode enviar instruções como estas:

  • "Como criar um modelo de previsão de série temporal no BigQuery?"
  • "Como carrego diferentes tipos de dados no BigQuery?"

Acessar e analisar dados

O Gemini no BigQuery pode ajudar você a saber quais dados podem ser acessados para análise e como analisar esses dados.

Para este exemplo, considere que você precisa de ajuda com o seguinte:

  • Encontrar tabelas e conjuntos de dados de vendas para analisar.
  • Saber como as tabelas de dados e as consultas estão relacionadas em um conjunto de dados de vendas.
  • Compreender consultas complexas e escrever consultas que usam o conjunto de dados.

Encontrar dados

Antes de consultar os dados, você precisa saber quais consegue acessar. Cada produto de dados organiza e armazena dados de forma diferente.

Para receber ajuda, envie uma instrução (ou um comando) em linguagem natural para o Gemini no BigQuery, como: "Como posso saber quais conjuntos de dados e tabelas estão disponíveis para mim no BigQuery?".

  1. No Console do Google Cloud, acesse a página BigQuery.

    Ir para o BigQuery

  2. Na barra de ferramentas do console do Google Cloud, clique em spark Abrir ou fechar o chat da Gemini AI.

  3. No painel do Gemini, insira o comando How do I learn which datasets and tables are available to me in BigQuery?:

  4. Clique em send Enviar solicitação.

    Saiba como e quando o Gemini do Google Cloud usa seus dados.

    A resposta inclui várias maneiras de listar projetos, conjuntos de dados ou tabelas dentro de um conjunto de dados.

  5. Opcional: para redefinir seu histórico de chat, no painel Gemini, clique em delete Gemini e em Gemini.

Entender e gravar o SQL no BigQuery

Neste exemplo, suponha que você selecionou dados para análise e agora quer consultar esses dados. O Gemini no BigQuery pode ajudar você trabalhar com SQL, seja para entender as consultas complexas e difíceis de analisar ou gerar novas consultas SQL.

Comando para assistência do Gemini para explicar as consultas SQL

Imagine que você quer entender uma consulta complexa que outra pessoa escreveu. O Gemini no BigQuery pode explicar a consulta em linguagem simples, como a sintaxe da consulta, o esquema subjacente e o contexto comercial.

  1. No Console do Google Cloud, acesse a página BigQuery.

    Acessar o BigQuery

  2. No editor de consultas, abra ou cole a consulta que você quer que o Gemini explique. Exemplo:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Destaque a consulta e clique em auto_awesome Explicar esta consulta selecionada.

    No painel Gemini, vai aparecer uma resposta semelhante a estas:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Gere uma consulta SQL que agrupe as vendas por dia e produto

Neste exemplo, você quer gerar uma consulta que liste seus principais produtos para cada dia. Em seguida, use tabelas no conjunto de dados thelook_ecommerce e no comando do Gemini no BigQuery para gerar uma consulta para calcular vendas por item do pedido e por nome do produto.

Esse tipo de consulta costuma ser complexo, mas você pode criar uma instrução automaticamente usando o Gemini no BigQuery. Você pode fornecer um comando para gerar uma consulta SQL com base no esquema dos dados. Mesmo que você comece sem nenhum código, com conhecimento limitado do esquema de dados ou conhecimento básico da sintaxe do SQL, a assistência do Gemini pode sugerir uma ou mais instruções SQL.

Fazer um comando para que o Gemini no BigQuery gere uma consulta que liste seus principais produtos, siga estas etapas:

  1. No Console do Google Cloud, acesse a página BigQuery.

    Acessar o BigQuery

  2. No menu de navegação, clique em BigQuery Studio.

  3. Clique em Criar uma nova consulta. O painel Análises carrega automaticamente o banco de dados selecionado.

  4. No editor de consultas, insira o seguinte comando e pressione Enter:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    O caractere cerquilha (#) solicita que o Gemini no BigQuery gere SQL. O Gemini no BigQuery sugere uma consulta SQL semelhante à seguinte:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Para aceitar o código sugerido, clique em Tab e em Executar para iniciar a instrução SQL. Você também pode rolar pelas sugestões e aceitar termos específicos delas.

  6. As sugestões aparecem no painel Resultados da consulta.

Crie um modelo de previsão e visualize os resultados

Neste exemplo, você usa o BigQuery ML para fazer o seguinte:

  • Use uma consulta de tendência para criar um modelo de previsão.
  • Use o Gemini no BigQuery para explicar e ajudar você a escrever uma consulta para visualizar os resultados do modelo de previsão.

Você vai usar a seguinte consulta de exemplo com vendas reais, que são usadas como entrada para o modelo. A consulta é usada como parte da criação do modelo de ML.

  1. Para criar um modelo de ML de previsão, no editor de consultas, execute a seguinte consulta SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Você pode usar o Gemini no BigQuery para ajudar a entender essa consulta.

    Quando o modelo é criado, a guia Resultados do painel Resultados da consulta exibe uma mensagem semelhante à seguinte:

    Successfully created model named sales_forecasting_model.
    
  2. No painel Gemini, insira um comando para o Gemini no BigQuery para ajudar você a escrever uma consulta para obter uma previsão do modelo quando ele estiver concluído. Por exemplo, digite How can I get a forecast in SQL from the model?

    Com base no contexto do comando, a resposta inclui um exemplo de um modelo de ML que prevê as vendas:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    Nesta resposta, PROJECT_ID é o projeto do Google Cloud.

  3. No painel do Gemini, copie a consulta SQL.

  4. No editor de consultas, execute a consulta SQL.

Limpar

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados neste tutorial, exclua o projeto do Google Cloud criado relacionado a este tutorial. A outra opção é excluir os recursos individuais.

Excluir projeto

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Excluir o conjunto de dados

A exclusão do seu projeto vai remover todos os conjuntos de dados e tabelas no projeto. Se você preferir reutilizar o projeto, exclua o conjunto de dados criado neste tutorial:

  1. No Console do Google Cloud, acesse a página BigQuery.

    Ir para o BigQuery

  2. No menu de navegação, selecione o conjunto de dados bqml_tutorial que você criou.

  3. Para excluir o conjunto de dados, a tabela e todos os dados, clique em Excluir no conjunto de dados.

  4. Para confirmar a exclusão, na caixa de diálogo Excluir conjunto de dados, digite o nome do seu conjunto de dados (bqml_tutorial) e clique em Excluir.

A seguir