Ferramentas para cientistas de dados

Use Big Data e machine learning em uma infraestrutura sem servidor com ferramentas e serviços fáceis de usar.

Imagem de dados do GCP para cientistas

Armazene, processe e prepare facilmente os dados para treinar e implantar modelos de machine learning com qualquer tipo de dado, de qualquer tamanho. Nossos serviços totalmente gerenciados e o software de código aberto ajudam os cientistas e engenheiros de dados a se concentrarem na transformação dos dados em informações inteligentes e acionáveis em vez de ter de lidar com clusters.

Saiba mais

Explore cursos e recursos para desenvolver seu conhecimento sobre ciência de dados e machine learning.

Educação em IA pelo Google

Receba informações e faça exercícios dos especialistas em machine learning (ML) do Google para desenvolver habilidades e aprimorar seus projetos.

Aprendizado no Kaggle

Inscreva-se em cursos gratuitos sobre machine learning e ciência de dados que priorizam habilidades práticas sobre dados em vez de apenas teoria.

Qwiklabs

Adquira experiência prática trabalhando com as tecnologias e os softwares da nuvem.

Treinamento do Google Cloud

Encontre cursos criados para profissionais de dados responsáveis por projetar, criar, analisar e otimizar soluções de Big Data.

Coursera

Aprenda ML com o Google Cloud, com experimentos práticos utilizando machine learning de ponta a ponta.

Protótipo

Conheça ferramentas e amostras que ajudam a criar protótipos com rapidez no Google Cloud.
Colaboratory

Colaboratory

O Colaboratory é um projeto de pesquisa do Google criado para ajudar a disseminar educação e pesquisa em machine learning. É um ambiente Jupyter Notebook que não exige configurações, além de ser gratuito e executado totalmente na nuvem. Os notebooks do Colaboratory podem ser compartilhados da mesma forma que Documentos ou Planilhas Google.

Acesse o guia de início rápido 
Cloud Datalab

Cloud Datalab

Explore, analise, transforme e visualize dados e crie modelos de machine learning no Google Cloud Platform. O Cloud Datalab é executado no Compute Engine e se conecta a vários serviços de nuvem com facilidade.

Saiba mais 
Veja a documentação 
Conjuntos de dados públicos

Conjuntos de dados públicos

Receba um repositório de dados abertos selecionados pelos engenheiros do Google e respaldados por especialistas em domínio do mundo todo. Use esses dados para criar e testar seus algoritmos antes da implantação ou use outros conjuntos de dados para descobrir novos insights. Os dados são hospedados no BigQuery e no Cloud Storage, o que simplifica sua criação e seu uso.

Veja a documentação 
Kaggle

Kaggle

O Kernels da Kaggle oferece um ambiente Python e de linguagem R em navegador sem custos. Tenha acesso a milhares de conjuntos de dados públicos, amostras de código de uma comunidade de cientistas de dados e recursos para colaboração.

Explore o repositório 
Procure em conjuntos de dados públicos 
Jupyter

Jupyter

Garanta uma experiência familiar de ciência de dados sem a tediosa configuração da infraestrutura usando notebooks do Jupyter com a pilha totalmente gerenciada de Big Data do Google.

Leia a postagem no blog 
Veja o tutorial 
Aprendizado profundo em nuvem

Cloud Deep Learning VM Image Beta

O Deep Learning VM Image oferece imagens pré-configuradas do Compute Engine para frameworks conhecidos de machine learning, como TensorFlow, scikit-learn e PyTorch.

Veja a documentação 

Crie

Receba ferramentas para simplificar o processo de ingestão de dados para treinamento de modelos.

Ingira

Cloud Pub/Sub

Cloud Pub/Sub

O Cloud Pub/Sub é uma base simples, confiável e escalonável para a análise de streams de grande escala e sistemas de computação voltados a eventos. Como parte da solução de análise de streams, o serviço ingere streams de eventos e os transfere ao Cloud Dataflow para processamento e ao BigQuery para análise como uma solução de armazenamento de dados.

Veja a documentação 
Acesse o GitHub 

Processe

Cloud Dataflow

Cloud Dataflow

Transforme e enriqueça dados ingeridos pelos modos de streaming e lote com a mesma confiabilidade e expressividade.

Veja a documentação 
Acesse os guias de início rápido 
Cloud Dataprep

Cloud Dataprep

O Google Cloud Dataprep é um serviço visual e inteligente de exploração, limpeza e preparo de dados estruturados e não estruturados para análise. Trata-se de um serviço sem servidor que funciona em qualquer escala. Não há infraestrutura para implantar ou gerenciar.

Veja a documentação 
Acesse os guias de início rápido

Armazene

BigQuery

BigQuery

O BigQuery é um serviço de armazenamento de dados totalmente gerenciado e compatível com 100 mil inserções de linhas de streaming por segundo, que permite análise ad hoc de dados em tempo real com SQL padrão.

Veja os tutoriais 
Acesse os guias de início rápido 
Cloud Storage

Cloud Storage

Use o Cloud Storage para armazenar seu treinador de modelo, os dados de treinamento, os modelos salvos e as entradas e saídas de predição.

Veja a documentação 
Acesse os guias de início rápido 

Explore

BigQuery

BigQuery

Receba insights dos seus dados mais rápido sem precisar copiá-los ou movê-los. O BigQuery oferece visibilidade total de todos os seus dados por meio de consultas aos dados armazenados no armazenamento gerenciado em colunas do BigQuery, no Google Cloud Storage, no Google Cloud Bigtable, no Planilhas Google e no Google Drive.

Explore os tutoriais 
Acesse os guias de início rápido 
Cloud Datalab

Cloud Datalab

O Cloud Datalab é uma ferramenta interativa desenvolvida no Jupyter (anteriormente conhecido como iPython), criada para explorar, analisar, transformar e visualizar dados, além de projetar modelos de machine learning no Google Cloud Platform. Ele é executado no Compute Engine e se conecta a vários serviços de nuvem com facilidade. Assim, você se concentra nas suas tarefas de ciência de dados.

Acesse o guia de início rápido 
Inicie o tutorial 
Cloud ML Engine

Cloud ML Engine

Adicione uma camada extra de inteligência ao seu pipeline executando os streams de eventos por meio de modelos personalizados de machine learning do TensorFlow, XGBoost ou scikit-learn.

Confira a visão geral de treinamento 
TensorFlow

TensorFlow

O TensorFlow™ é uma biblioteca de software de código aberto para computação numérica de alto desempenho. A arquitetura flexível permite uma implantação fácil de computação em uma série de plataformas (CPUs, GPUs e TPUs) e de desktops a clusters de servidores até dispositivos móveis e de borda.

Veja a documentação 
Faça o curso intensivo de ML 
Aceleradores de hardware

Aceleradores de hardware

Os aceleradores de hardware no Google Cloud oferecem a flexibilidade para escolher o acelerador certo para gerar o melhor desempenho por dólar em cargas de trabalho de machine learning. Escolha entre as opções do portfólio de aceleradores para executar suas cargas de trabalho de treinamento e predições.

Cloud TPU 
Cloud GPU 
Cloud CPU 
Atributos

Facets

Os Facets contêm duas visualizações avançadas para ajudar na compreensão e na análise de conjuntos de dados de machine learning. Tenha uma noção da forma de cada recurso no seu conjunto de dados usando o Facets Overview ou veja observações individuais usando o Facets Dive.

Explore o Facets 

Implante

Implante seus modelos de machine learning em qualquer lugar.
Kubeflow

Kubeflow

O projeto Kubeflow é dedicado a tornar as implantações de fluxos de trabalho de machine learning no Kubernetes simples, portáteis e escalonáveis. A meta não é recriar outros serviços, mas oferecer um modo simples de implantar os melhores sistemas de código aberto para machine learning em diversas infraestruturas. É possível executar o Kubeflow em qualquer lugar que execute o Kubernetes.

Leia a postagem do blog 
Kubeflow no GitHub 
Cloud ML Engine

Cloud ML Engine

O Cloud ML Engine oferece serviços de predição on-line e em lote para diferentes frameworks de machine learning. Os cientistas de dados podem implantar facilmente modelos treinados em qualquer lugar na produção sem contêineres do Docker nem qualquer mecanismo improvisado. A predição on-line é compatível com frameworks como scikit-learn, XGBoost, Keras e TensorFlow para disponibilizar modelos de classificação, regressão, clustering e redução de dimensionalidade.

Confira a visão geral de predição 

Parceiros

Encontre parceiros de machine learning do Google Cloud que tenham conhecimento aprofundado em inteligência artificial (IA) e possam ajudar você a incorporar o machine learning em uma série de necessidades e casos de uso. Você pode escolher os caminhos de desenvolvimento adequados ao seu setor e à sua necessidade. Nossos parceiros ajudam em cada etapa do desenvolvimento e da disponibilização dos modelos, preparando seus dados para o machine learning ou oferecendo as ferramentas e plataformas certas para o trabalho. Isso inclui soluções prontas de IA e desenvolvimento de modelos personalizados.
Saiba mais 

Preparação ou pré-processamento de dados

Encontre parceiros especializados em preparar os dados para o treinamento.

Figureeight Alteryx Imerit

Plataformas de ciência de dados

Encontre plataformas e ferramentas para machine learning e ciência de dados.

H2O Anaconda R studio
Google Cloud

Comece a trabalhar

Aprenda e crie

Ainda não conhece o GCP? Comece a usar qualquer produto do GCP gratuitamente com US$ 300 de crédito.

Precisa de ajuda em um projeto maior?

Nossos especialistas ajudarão você a criar a solução certa ou encontrar o parceiro ideal para suas necessidades.