Ferramentas para cientistas de dados

Use Big Data e machine learning em uma infraestrutura sem servidor com ferramentas e serviços fáceis de usar.

Imagem de dados do GCP para cientistas

Armazene, processe e prepare facilmente os dados para treinar e implantar modelos de machine learning com qualquer tipo de dado, de qualquer tamanho. Nossos serviços totalmente gerenciados e o software de código aberto ajudam os cientistas e engenheiros de dados a se concentrarem na transformação dos dados em informações inteligentes e acionáveis em vez de ter de lidar com clusters.

Saiba mais

Explore cursos e recursos para desenvolver seu conhecimento sobre ciência de dados e machine learning.

Educação em IA pelo Google

Receba informações e faça exercícios dos especialistas em machine learning (AM) do Google para desenvolver habilidades e aprimorar seus projetos.

Aprendizado no Kaggle

Inscreva-se em cursos gratuitos sobre machine learning e ciência de dados, que priorizam habilidades práticas sobre dados em relação à teoria abstrata.

Qwiklabs

Adquira experiência prática trabalhando com as tecnologias e os softwares da nuvem.

Treinamento do Google Cloud

Encontre cursos criados para profissionais de dados responsáveis por projetar, criar, analisar e otimizar soluções de Big Data.

Coursera

Aprenda ML com o Google Cloud, com experimentos práticos utilizando machine learning de ponta a ponta.

Protótipo

Conheça ferramentas e amostras que ajudam a criar protótipos com rapidez no Google Cloud.
Colaboratory

Colaboratory

O Colaboratory é um projeto de pesquisa do Google criado para ajudar a disseminar educação e pesquisa em machine learning. É um ambiente Jupyter Notebook que não exige configurações, além de ser gratuito e executado totalmente na nuvem. Notebooks do Colaboratory podem ser compartilhados da mesma forma que Documentos ou Planilhas Google.

Acesse o guia de início rápido arrow_forward
Cloud Datalab

Cloud Datalab

Explore, analise, transforme e visualize dados e crie modelos de machine learning no Google Cloud Platform. O Cloud Datalab é executado no Compute Engine e se conecta a vários serviços de nuvem com facilidade.

Saiba mais arrow_forward
Consulte a documentação arrow_forward
Conjuntos de dados públicos

Conjuntos de dados públicos

Receba um repositório de dados abertos selecionados pelos engenheiros do Google e respaldados por especialistas em domínio do mundo todo. Use esses dados para criar e testar seus algoritmos antes da implantação ou use outros conjuntos de dados para descobrir novos insights. Os dados são hospedados no BigQuery e no Cloud Storage, o que simplifica sua criação e seu uso.

Consulte a documentação arrow_forward
Kaggle

Kaggle

O Kernels da Kaggle oferece um ambiente Python e de linguagem R em navegador sem custos. Receba acesso a milhares de conjuntos de dados públicos, amostras de código de uma comunidade de cientistas de dados e recursos para colaboração.

Explore o repositório arrow_forward
Procure em conjuntos de dados públicos arrow_forward
Jupyter

Jupyter

Garanta uma experiência familiar de ciência de dados sem a configuração entediante da infraestrutura usando Jupyter Notebooks com a pilha totalmente gerenciada de Big Data do Google.

Leia o blog arrow_forward
Veja o tutorial arrow_forward
Aprendizado profundo em nuvem

Cloud Deep Learning VM Image Beta

O Deep Learning VM Image oferece imagens pré-configuradas do Compute Engine para bibliotecas conhecidas de machine learning, como TensorFlow, scikit-learn e PyTorch.

Consulte a documentação arrow_forward

Criar

Receba ferramentas para simplificar o processo de ingestão de dados para treinamento de modelos.

Ingerir

Cloud Pub/Sub

Cloud Pub/Sub

O Cloud Pub/Sub é uma base simples, confiável e escalonável para a análise de streams de grande escala e sistemas de computação voltados a eventos. Como parte da solução de análise de streams, o serviço ingere streams de eventos e os transfere ao Cloud Dataflow para processamento e ao BigQuery para análise como uma solução de armazenamento de dados.

Consulte a documentação arrow_forward
Acesse o GitHub arrow_forward

Processar

Cloud Dataflow

Cloud Dataflow

Transforme e enriqueça dados ingeridos pelos modos de streaming e lote com a mesma confiabilidade e expressividade.

Consulte a documentação arrow_forward
Acesse os guias de início rápido arrow_forward
Cloud Dataprep

Cloud Dataprep

O Google Cloud Dataprep é um serviço visual inteligente de exploração, limpeza e preparo de dados estruturados e não estruturados para análise. Trata-se de um serviço sem servidor que funciona em qualquer escala. Não há infraestrutura para implantar ou gerenciar.

Consulte a documentação arrow_forward
Acesse os guias de início rápido

Armazém

BigQuery

BigQuery

O BigQuery é um serviço de armazenamento de dados totalmente gerenciado e compatível com 100 mil inserções de linhas de streaming por segundo, que permite análise ad hoc de dados em tempo real com SQL padrão.

Veja os tutoriais arrow_forward
Acesse os guias de início rápido arrow_forward
Cloud Storage

Cloud Storage

Use o Cloud Storage para armazenar seu treinador de modelo, os dados de treinamento, os modelos salvos e as entradas e saídas de previsão.

Consulte a documentação arrow_forward
Acesse os guias de início rápido arrow_forward

Explorar

BigQuery

BigQuery

Receba insights dos seus dados mais rápido sem precisar copiá-los ou movê-los. O BigQuery oferece visão total de todos os seus dados por meio de consultas aos dados armazenados no armazenamento gerenciado em colunas do BigQuery, no Google Cloud Storage, no Google Cloud Bigtable, no Planilhas Google e no Google Drive.

Explore os tutoriais arrow_forward
Acesse os guias de início rápido arrow_forward
Cloud Datalab

Cloud Datalab

O Cloud Datalab é uma ferramenta interativa desenvolvida no Jupyter (anteriormente conhecido como iPython), criada para explorar, analisar, transformar e visualizar dados, além de projetar modelos de machine learning no Google Cloud Platform. Ele é executado no Compute Engine e se conecta a vários serviços de nuvem com facilidade. Assim, você pode se concentrar nas suas tarefas de ciência de dados.

Acesse o guia de início rápido arrow_forward
Inicie o tutorial arrow_forward
Cloud ML Engine

Cloud ML Engine

Adicione uma camada extra de inteligência ao seu canal executando os streams de eventos por TensorFlow personalizado, XGBoost ou modelos de machine learning scikit-learn.

Confira a visão geral de treinamento arrow_forward
TensorFlow

TensorFlow

O TensorFlow™ é uma biblioteca de software de código aberto para computação numérica de alto desempenho. Sua arquitetura flexível permite uma implantação fácil de computação em uma série de plataformas (CPUs, GPUs e TPUs) e de desktops para clusters de servidores e dispositivos móveis e no perímetro.

Consulte a documentação arrow_forward
Faça o curso intensivo de AM arrow_forward
Aceleradores de hardware

Aceleradores de hardware

Os aceleradores de hardware no Google Cloud oferecem a flexibilidade para escolher o acelerador certo para gerar o melhor desempenho por dólar em cargas de trabalho de machine learning. Escolha em um portfólio de aceleradores para executar suas cargas de trabalho para treinamento e previsões.

Cloud TPU arrow_forward
Cloud GPU arrow_forward
Cloud CPU arrow_forward
Atributos

Facets

Os Facets contêm duas visualizações avançadas para ajudar na compreensão e na análise de conjuntos de dados de machine learning. Tenha uma noção da forma de cada recurso no seu conjunto de dados usando o Facets Overview ou veja observações individuais usando o Facets Dive.

Explore os atributos arrow_forward

Implantar

Implante seus modelos de machine learning em qualquer lugar.
Kubeflow

Kubeflow

O projeto Kubeflow é dedicado a tornar as implantações de fluxos de trabalho de machine learning no Kubernetes simples, portáteis e escalonáveis. A meta não é recriar outros serviços, mas oferecer um modo simples de implantar os melhores sistemas de código aberto para machine learning em diversas infraestruturas. Você deve conseguir executar o Kubeflow em qualquer lugar em que execute o Kubernetes.

Leia a postagem do blog arrow_forward
Kubeflow no GitHub arrow_forward
Cloud ML Engine

Cloud ML Engine

O Cloud ML Engine oferece serviços de previsão on-line e em lote para diferentes bibliotecas de machine learning. Os cientistas de dados podem implantar facilmente modelos treinados em qualquer lugar na produção sem contêineres do Docker nem qualquer mecanismo improvisado. A previsão on-line é compatível com bibliotecas como scikit-learn, XGBoost, Keras e TensorFlow para disponibilizar modelos de classificação, regressão, clustering e redução de dimensionalidade.

Confira a visão geral de previsão arrow_forward

Parceiros

Encontre parceiros de machine learning do Google Cloud que tenham conhecimento aprofundado em inteligência artificial (IA) e possam ajudar você a incorporar o machine learning em uma série de necessidades e casos de uso. Dependendo do setor e da sua necessidade, você pode escolher caminhos de desenvolvimento preferidos. Nossos parceiros podem ajudar em cada etapa do desenvolvimento e da disponibilização dos modelos, preparando seus dados para o machine learning ou oferecendo as ferramentas e plataformas certas para o trabalho. Isso inclui soluções prontas de IA e desenvolvimento de modelos personalizados.
Saiba mais arrow_forward

Preparação ou pré-processamento de dados

Encontre parceiros especializados em preparar os dados para o treinamento.

Figureeight Alteryx Imerit

Plataformas de ciência de dados

Encontre plataformas e ferramentas para machine learning e ciência de dados.

H2O Anaconda R studio
Google Cloud

Iniciar

Aprender e criar

Novo no GCP? Comece a usar qualquer produto do GCP gratuitamente com US$ 300 de crédito.

Precisa de ajuda em um projeto maior?

Nossos especialistas ajudarão você a criar a solução certa ou encontrar o parceiro ideal para suas necessidades.