Documentação do Dataproc
Com o Dataproc, um serviço Apache Spark e Hadoop gerenciado, você pode usar ferramentas de dados de código aberto para processamento em lote, consultas, streaming e machine learning. A automação do Dataproc ajuda a criar clusters rapidamente, gerenciá-los com facilidade e economizar dinheiro desativando os clusters quando não são necessários. Com menos tempo e dinheiro gastos com administração, você pode se concentrar nos jobs e dados. Saiba mais
Recursos de documentação
Guias
-
Guias de início rápido: Console Linha de comando, Bibliotecas de cliente, APIs Explorer: criar um cluster, ou APIs Explorer: envie um job do Spark
-
Visão geral dos modelos de fluxo de trabalho do Dataproc
-
Guia de início rápido do Dataproc no GKE
-
Configurar o Dataproc Hub
-
Criar uma imagem personalizada do Dataproc
-
Gravar um job do MapReduce com o conector do BigQuery
-
Usar o conector do Cloud Storage com o Apache Spark
-