Introdução ao BigQuery ML

Visão geral

Com o BigQuery ML, os usuários podem criar e executar modelos de aprendizado de máquina no BigQuery usando consultas SQL padrão. O BigQuery ML torna o aprendizado de máquina mais acessível ao permitir que os profissionais de SQL criem modelos usando suas respectivas ferramentas e habilidades. O BigQuery ML acelera o processo de desenvolvimento porque elimina a necessidade de movimentação de dados.

O BigQuery ML é compatível com os seguintes tipos de modelos:

  • Regressão linear: modelos usados para prever um valor numérico.
  • Regressão logística binária: modelos usados para prever uma entre duas classes, como identificar se um e-mail é spam.
  • Regressão logística multiclasse para classificação: modelos usados para prever mais de duas classes, como verificar se uma entrada é de "valor baixo", "valor médio" ou "valor alto".

A funcionalidade do BigQuery ML está disponível com o uso das seguintes ferramentas:

  • a IU da Web do BigQuery
  • ferramenta de linha de comando bq
  • API REST do BigQuery
  • Uma ferramenta externa, como um notebook Jupyter ou uma plataforma de inteligência empresarial.

O aprendizado de máquina em grandes conjuntos de dados requer programação detalhada e conhecimento de bibliotecas de ML. Esses pré-requisitos restringem o desenvolvimento de soluções a um grupo muito pequeno de pessoas dentro da empresa. Além disso, excluem desse grupo seleto os analistas de dados que, mesmo tendo capacidade de compreender os dados, têm conhecimento limitado de aprendizado de máquina e de programação.

O BigQuery ML permite que os analistas de dados usem o aprendizado de máquina por meio das próprias habilidades e das ferramentas SQL existentes. Os analistas podem usar o BigQuery ML para criar e avaliar modelos de ML no BigQuery. Eles não precisam mais exportar quantidades reduzidas de dados para planilhas ou outros aplicativos nem esperar recursos limitados, criados por equipes internas de cientistas de dados.

Vantagens do BigQuery ML

Comparado a outras abordagens que utilizam o aprendizado de máquina com armazenamento de dados na nuvem, o BigQuery ML apresenta as seguintes vantagens:

  • O BigQuery ML facilita o acesso ao aprendizado de máquina ao capacitar os analistas de dados, que são os principais usuários do armazenamento de dados, a criar e executar modelos com o uso de ferramentas e planilhas de inteligência empresarial já existentes. Isso torna possível que a tomada de decisões nas empresas passe a ser feita a partir de análises preditivas que envolvem toda a organização.
  • Não é necessário programar uma solução de aprendizado de máquina com as linguagens Python ou Java. Os modelos são treinados e acessados no BigQuery usando SQL - uma linguagem que os analistas de dados conhecem.
  • O BigQuery ML acelera o processo de desenvolvimento e inovação do modelo, eliminando a necessidade de exportar dados do local de armazenamento de dados. Em vez disso, o BigQuery ML traz o aprendizado de máquina para os dados. Exportar e reformatar os dados:

    • aumenta a complexidade do processo porque exige o uso de muitas ferramentas;
    • reduz a velocidade porque a movimentação e a formatação de grandes quantidades de dados para estruturas de aprendizado de máquina baseadas em Python leva mais tempo do que o treinamento de modelo no BigQuery;
    • exige muitas etapas no processo de exportação de dados a partir do local de armazenamento, reduzindo a possibilidade de testar os dados;
    • pode ser impedido por restrições legais (como as diretrizes HIPAA, nos EUA).

Regiões compatíveis

Assim como o BigQuery, o BigQuery ML é um recurso multirregional. O BigQuery ML é compatível com as mesmas regiões que o BigQuery.

A localidade dos dados é especificada quando você cria um conjunto de dados para armazenar modelos do BigQuery ML e dados de treinamento. O BigQuery ML processa e organiza os dados no mesmo local que o conjunto de dados de destino.

Cotas

Além dos limites específicos do BigQuery ML, as consultas que usam as funções do BigQuery ML e as instruções CREATE MODEL estão sujeitas a cotas e limites nos jobs de consulta.

Para saber mais sobre todas as cotas e limites, consulte Cotas e limites.

Preços

Os modelos do BigQuery ML são armazenados em conjuntos de dados da ferramenta, como tabelas e visualizações. Quando você cria e usa modelos no BigQuery ML, suas cobranças são determinadas pelo volume de dados usados para treinar um modelo e pelas consultas realizadas em relação aos dados.

Para mais informações sobre as cobranças do BigQuery ML, consulte o Preços do BigQuery ML. Para saber mais sobre preços de armazenamento, consulte Preços de armazenamento. Para saber mais sobre preços de consulta, consulte Preços de consulta.

Recursos

Para saber mais sobre machine learning e o BigQuery ML, consulte:

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Precisa de ajuda? Acesse nossa página de suporte.