Ciência de dados no Google Cloud

Plataforma unificada para gerenciamento de dados, análise e ferramentas de machine learning para acelerar seus fluxos de trabalho de dados para IA.

Um guia prático para ciência de dados com o Google Cloud

Por que usar o Google Cloud para ciência de dados

A plataforma unificada de dados e IA do Google Cloud

Melhore a velocidade e a agilidade da sua empresa e gere valor a curto e longo prazo.

3x


Mais econômico com movimentação de dados minimizada

4 ×


Treinamento, ajuste e implantação de modelos mais rápidos

10x


Redução do custo da IA, o que torna as metas de ROI mais alcançáveis

Ferramentas integradas para ciência de dados

Plataforma unificada para fluxos de trabalho de ciência de dados completos

Solução unificada para todo o ciclo de vida de machine learning e ciência de dados, criada em uma base de dados multimodal que garante governança unificada. Aproveite mecanismos de análise avançados como o SQL do BigQuery e o Spark e crie modelos usando o BigQuery ML ou a Vertex AI. Simplifique o desenvolvimento com o notebook do Colab Enterprise com prioridade para IA e MLOps robustos, com tecnologia de IA líder do setor.

Espaço de trabalho centralizado com notebooks que priorizam a IA

Escolha entre um conjunto de soluções de notebook para ciência de dados corporativa. O Colab Enterprise oferece um ambiente gerenciado e seguro integrado à Vertex AI e ao BigQuery. Os Vertex AI Workbenches oferecem instâncias personalizáveis do JupyterLab, enquanto as estações de trabalho do Cloud oferecem suporte a IDEs completas. As extensões também conectam ferramentas auto-hospedadas diretamente aos serviços do Google Cloud.

Agente de Ciência de Dados

Agente de ciência de dados integrado

Acelere o desenvolvimento da ciência de dados com recursos de agente que facilitam a análise, a transformação e a modelagem de ML. Comece com uma meta de alto nível em inglês simples, e o agente de ciência de dados gera um plano detalhado que abrange todos os aspectos da modelagem de ciência de dados, desde carregamento, análise detalhada, limpeza, visualização, engenharia de atributos, divisão, treinamento/otimização e avaliação de dados.

Preparação de dados assistida por IA sem silos

Aproveite uma base de dados unificada, gerenciando dados estruturados e não estruturados (imagens, documentos e outros) usando SQL para análise e funções de IA para processamento. A preparação de dados assistida por IA oferece sugestões para limpeza e transformações de dados. O Agente de engenharia de dados automatiza tarefas de engenharia de dados, incluindo ingestão e criação de pipelines, usando instruções em linguagem natural.

Agente de engenharia de dados
Dataproc gerenciado e Spark sem servidor

Processamento de dados flexível com vários mecanismos

Escolha qualquer mecanismo de processamento, seja o mecanismo SQL do BigQuery ou um framework de código aberto como o Apache Spark, para trabalhar diretamente em uma única cópia unificada de dados. Isso evita a necessidade de manter cópias de dados separadas para diferentes sistemas.

Escalonar a ciência de dados com o BigQuery DataFrames para Python

Prefere bibliotecas nativas do Python? Os DataFrames do BigQuery fornecem uma API semelhante ao pandas que traduz o código Python em SQL otimizado para execução no mecanismo do BigQuery. Isso dá a flexibilidade de usar a ferramenta certa para o trabalho, seja SQL, PySpark ou um DataFrame no estilo pandas, tudo isso trabalhando com os mesmos dados.

Vídeo sobre os DataFrames do BigQuery
BQML

Crie, treine, ajuste e execute modelos de ML

Crie, treine, avalie e implante modelos com o BigQuery ML usando SQL, eliminando a movimentação de dados. Aproveite os modelos integrados e pré-treinados ou as funções SQL que chamam o Gemini para análise/enriquecimento de dados. Para modelos personalizados, a Vertex AI oferece suporte a PyTorch, TensorFlow e outras bibliotecas de ML. A integração total permite a engenharia de atributos no BigQuery, o treinamento de modelos personalizados na Vertex AI e a inferência de volta no BigQuery usando SQL.

Gerar embeddings e ativar a pesquisa vetorial

Gerar e usar embeddings multimodais para realizar pesquisas vetoriais, permitindo a compreensão semântica e a recuperação de dados multimodais com base na similaridade. Isso permite criar sistemas sofisticados de pesquisa semântica, recomendação ou segmentação sem precisar gerenciar um banco de dados de vetores separado e especializado.

embeddings e pesquisa vetorial

Passe do modelo à produção com MLOps integrado

O BigQuery e a Vertex AI se integram para simplificar a "last mile" do MLOps. Centralize os atributos no Vertex AI Feature Store para evitar distorções entre treinamento e veiculação e trabalhos redundantes. Usar o AutoML da Vertex AI para automatizar a criação de modelos para dados tabulares. Todos os modelos, sejam do BigQuery ML ou da Vertex AI, são registrados automaticamente no Vertex AI Model Registry. A partir daí, você pode facilmente controlar as versões, avaliar e implantar os modelos, criando um ciclo de vida completo e integrado em uma única plataforma.


Google Cloud