Consultar um conjunto de dados vinculado no BigQuery

Neste documento, descrevemos como criar um conjunto de dados vinculado para um bucket de registros. e como consultar e exibir registros nesse conjunto de dados. Por exemplo, é possível criar um conjunto de dados vinculado para executar consultas na Análise de dados de registros usando seus slots reservados do BigQuery. Da mesma forma, talvez você queira conjunto de dados vinculado para escrever consultas no BigQuery ou no Looker Studio que mesclam os dados de registro com outros dados da empresa.

Se você não conhece a Análise de dados de registros, confira Visão geral da Análise de dados de registros.

Quando você precisa de um conjunto de dados vinculado

Não é necessário ter um conjunto de dados vinculado do BigQuery para emitir consultas em uma visualização de registro na página Análise de registros. É possível salvar e compartilhar essas consultas e salvar os resultados em um painel personalizado.

Você precisa de um conjunto de dados do BigQuery vinculado quando quiser fazer o seguinte:

  • Mesclar dados de entrada de registro com outros conjuntos de dados do BigQuery.
  • Consulte dados de registro de outro serviço, como o Página do BigQuery Studio ou do Looker Studio.
  • melhorar o desempenho das consultas executadas na Análise de dados de registros. executando-as no seu Slots reservados do BigQuery

Um conjunto de dados vinculado do BigQuery para um bucket de registros permite Acesso de leitura do BigQuery aos dados subjacentes.

Se você executar as consultas em slots reservados do BigQuery, suas consultas estarão sujeitas preços de capacidade de computação. Além disso, se você consultar seus dados usando um serviço diferente do Log Analytics, suas consultas poderão estar sujeitas a outras cobranças com base nesse serviço. Consulte a página de preços do serviço que você está usando.

Antes de começar

Antes de usar a Análise de dados de registros, faça o seguinte:

  • Para receber as permissões necessárias a fim de usar a Log Analytics, peça que o administrador conceda a você os seguintes papéis do IAM no projeto:

    É possível restringir um principal a uma visualização de registro específica adicionando uma condição do IAM à concessão de função de acessador de visualização de registros feita no nível do projeto ou adicionando uma vinculação do IAM ao arquivo de política da visualização de registro. Para mais informações, consulte Controlar o acesso a uma visualização de registro.

    Essas são as mesmas permissões necessárias para visualizar entradas de registro na página Análise de registros. Para informações sobre outros papéis necessários para consultar visualizações em buckets definidos pelo usuário ou para consultar a visualização _AllLogs do _Default em um bucket de registros, consulte Papéis do Cloud Logging.

  • Para receber as permissões necessárias para criar e consultar conjuntos de dados vinculados, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto que armazena o bucket de registros:

  • Verifique se os buckets de registros foram atualizados para usar a Análise de dados de registros:

    1. No console do Google Cloud, acesse a página Armazenamento de registros:

      Acessar o armazenamento de registros

      Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

    2. Para cada bucket de registros que tem uma visualização de registro que você quer consultar, a garantir que A coluna Análise de dados de registros disponível exibe Abrir. Se A opção Upgrade aparece, clique em Fazer upgrade e conclua o caixa de diálogo.
  • Se você quiser consultar seus dados de registro na página Análise de dados de registros usando slots reservados do BigQuery e, se estiver usando projetos com o Service Controls de nuvem privada virtual (VPC), use a versão Enterprise do BigQuery. Para mais informações, consulte Noções básicas sobre as edições do BigQuery

Quando você quiser usar os recursos do BigQuery para analisar seus dados de registro, faça upgrade de um bucket de registro para usar a Análise de dados de registros e crie um conjunto de dados vinculado. Com essa configuração, o Logging armazena seus dados de registro, mas o BigQuery pode ler esses dados.

Console do Google Cloud

Para criar um link para um conjunto de dados do BigQuery para um do bucket de registros, faça o seguinte:

  1. No console do Google Cloud, acesse a página Armazenamento de registros:

    Acessar o armazenamento de registros

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

  2. Localize o bucket de registro e verifique se a coluna Log Analytics disponível mostra Aberto.

    Se a coluna exibir Upgrade, significa que o bucket de registros não foi para usar a Análise de dados de registros. Configure a Análise de dados de registros:

    1. Clique em Fazer upgrade.
    2. Clique em Confirmar na caixa de diálogo.

    Depois que o upgrade for concluído, prossiga para a próxima etapa.

  3. No bucket de registro, clique em Mais e em Editar bucket.

    A caixa de diálogo Editar bucket de registros é aberta.

  4. Selecione Criar um novo conjunto de dados do BigQuery vinculado a este bucket e insira o nome do novo conjunto de dados.

    O nome do conjunto de dados precisa ser exclusivo para cada projeto do Google Cloud. Se você inserir o nome de um conjunto de dados existente, receberá o seguinte erro: Dataset name must be unique in the selected region.

  5. Clique em Concluído e depois em Atualizar bucket.

    Depois que o Logging mostra o nome do conjunto de dados vinculado na página Logs Storage, pode levar alguns minutos até que o BigQuery reconheça o conjunto de dados.

gcloud

Para criar um conjunto de dados vinculado a um bucket de registros atualizado para usar a Análise de dados de registros, execute o comando gcloud logging links create:

gcloud logging links create LINK_ID --bucket=BUCKET_ID --location=LOCATION

O LINK_ID fornecido é usado como do conjunto de dados do BigQuery, e o valor desse campo deve ser exclusivo para seu projeto do Google Cloud.

O comando links create é assíncrono. O retorno de uma método assíncrono é um objeto Operation e contém informações sobre o progresso do método. Quando o método é concluído, o objeto Operation contém o status. Para mais mais informações, consulte Métodos de API assíncronos.

O comando links create leva alguns minutos para ser concluído.

Por exemplo, o comando a seguir cria um conjunto de dados vinculado ao bucket com o nome my-bucket:

gcloud logging links create mylink --bucket=my-bucket --location=global

O nome do conjunto de dados precisa ser exclusivo para cada projeto do Google Cloud. Se você tentar para criar um conjunto de dados com o mesmo nome de um conjunto de dados atual, receberá o seguinte erro:

BigQuery dataset with name "LINK_ID" already exists.

Se você tentar criar um conjunto de dados vinculado para um bucket de registros que não está atualizado para usar a Análise de dados de registros, o seguinte erro será informado:

A link can only be created for an analytics-enabled bucket.

REST

Para criar um conjunto de dados do BigQuery vinculado a um bucket de registros atualizado, use a Análise de dados de registros. Chame o método assíncrono projects.locations.buckets.links.create da API Cloud Logging.

Prepare os argumentos do método da seguinte maneira:

  1. Crie o corpo da solicitação para o comando create. O corpo da solicitação é formatado como um objeto Link.
  2. Para o parâmetro de consulta do comando, use linkId=LINK_ID. O LINK_ID fornecido é usado como o nome do conjunto de dados do BigQuery, e o valor desse campo precisa ser exclusivo para seu projeto do Google Cloud.

A resposta aos métodos assíncronos é uma Objeto Operation. Este objeto contém informações sobre o progresso do método. Quando o é concluído, o objeto Operation contém o status. Para mais informações, consulte Métodos de API assíncrona.

O método links.create leva alguns minutos para ser concluído.

O nome do conjunto de dados precisa ser exclusivo para cada projeto do Google Cloud. Se você tentar para criar um conjunto de dados com o mesmo nome de um conjunto de dados atual, receberá o seguinte erro:

BigQuery dataset with name "LINK_ID" already exists.

Se você tentar criar um conjunto de dados vinculado para um bucket de registros que não foi atualizado para usar a Análise de dados de registros, o seguinte erro será informado:

A link can only be created for an analytics-enabled bucket.

Executar consultas do BigQuery

Quando você tem um bucket de registros que usa a Análise de dados de registros e conjuntos de dados vinculados, é possível acessar e consultar esses conjuntos na página BigQuery Studio. Com essa configuração, é possível analisar conjuntos de dados usando comandos, fluxos de trabalho e conjuntos de dados disponível somente no BigQuery Studio.

Para abrir o BigQuery na Análise de dados de registros e consultar o conjunto de dados vinculado, faça o seguinte:

  1. Verifique se existe um conjunto de dados vinculado para o bucket de registros que hospeda o visualização de registros que você quer consultar:

    1. No console do Google Cloud, acesse a página Armazenamento de registros:

      Acessar o armazenamento de registros

      Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

    2. Localize o bucket de registros e verifique se o conjunto de dados vinculado do BigQuery exibe um URL. Se a entrada estiver vazia, crie um conjunto de dados vinculado. Para informações sobre essas etapas, consulte Criar um conjunto de dados vinculado do BigQuery

  2. No console do Google Cloud, acesse a página Análise de dados de registros:

    Acesse Análise de registros

    Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

  3. Na lista Visualizações de registro, encontre a visualização de registro e selecione Consulta. O O painel Consulta é preenchido com uma consulta padrão. Você também pode inserir uma consulta no painel Consulta ou editar uma consulta exibida.

  4. Na barra de ferramentas, abra o botão Run query ou Run on BigQuery e selecione Open in BigQuery.

    A página do BigQuery Studio é aberta. O FROM da consulta é modificada para especificar o caminho para a visualização do registro na um conjunto de dados vinculado usando Sintaxe do caminho da tabela.

    Também é possível editar a consulta exibida.

  5. Na página do BigQuery Studio, clique em Executar consulta.

Executar consultas da Análise de Registros nos seus slots reservados do BigQuery

Para minimizar o tempo de execução das consultas da Análise de dados de registros, executá-las nos slots reservados do BigQuery. A página Análise de dados de registros é pré-configurada para usar o serviço padrão da Análise de dados de registros, o que significa que suas consultas precisam competir por espaço limitado de slot com outras consultas. Quando não houver slots disponíveis, a execução da consulta atrasará. Você pode e eliminar esses atrasos executando suas consultas os slots reservados do BigQuery.

Para emitir uma consulta SQL para uma visualização de registro, faça o seguinte:

  1. Verifique se existe um conjunto de dados vinculado para o bucket de registros que hospeda o visualização de registros que você quer consultar:

    1. No console do Google Cloud, acesse a página Armazenamento de registros:

      Acessar o armazenamento de registros

      Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

    2. Localize o bucket de registros e verifique se o conjunto de dados vinculado do BigQuery exibe um URL. Se a entrada estiver vazia, você deverá criar um conjunto de dados vinculado. Para informações sobre essas etapas, consulte Criar um conjunto de dados vinculado do BigQuery

  2. Verifique se você configurou os slots reservados do BigQuery:

    1. Criar uma reserva com slots dedicados
    2. Criar atribuições de reserva
  3. Configure a Análise de dados de registros para executar consultas nos seus slots reservados do BigQuery:

    1. No console do Google Cloud, acesse a página Análise de dados de registros:

      Acesse Análise de registros

      Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Logging.

    2. Na lista Visualizações de registro, encontre a visualização e selecione Consulta ou insira uma consulta.

      Se o painel de consulta exibir uma mensagem de erro que faz referência ao FROM, a tabela não poderá ser resolvida em uma visualização de registro específica. Para informações sobre como resolver essa falha, consulte Erro FROM clause must contain exactly one log view.

    3. Vá para a barra de ferramentas e verifique se o botão Executar no BigQuery é exibido.

      Se a barra de ferramentas mostrar Executar consulta, clique em Configurações e selecione BigQuery.

      Se o botão Executar no BigQuery estiver desativado, você precisa criar um conjunto de dados vinculado.

    4. Execute a consulta.

      Você pode usar as opções da barra de ferramentas para formatar, limpar a consulta e abra a documentação de referência do SQL do BigQuery.

A seguir