Ir para o conteúdo principal
Google Cloud
Documentação Áreas de tecnologia
  • IA e AA
  • Desenvolvimento de aplicações
  • Alojamento de aplicações
  • Computação
  • Estatísticas e pipelines de dados
  • Bases de dados
  • Distribuído, híbrido e multinuvem
  • IA generativa
  • Soluções para setores
  • Trabalhar em rede
  • Observabilidade e monitorização
  • Segurança
  • Storage
Ferramentas em vários produtos
  • Gestão de acesso e recursos
  • Gestão de custos e utilização
  • SDK Cloud da Google, linguagens, frameworks e ferramentas
  • Infraestrutura como código
  • Migração
Sites relacionados
  • Google Cloud Home
  • Avaliação gratuita e nível gratuito
  • Architecture Center
  • Blogue
  • Contactar equipa de vendas
  • Google Cloud Developer Center
  • Google Developer Center
  • Google Cloud Marketplace
  • Documentação do Google Cloud Marketplace
  • Melhoria de competências do Google Cloud
  • Google Cloud Solution Center
  • Apoio técnico do Google Cloud
  • Canal do YouTube do Google Cloud Tech
/
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어
Console Fazer login
  • Dataproc
Guias Referência Amostras Recursos
Contacte-nos Começar gratuitamente
Google Cloud
  • Documentação
    • Guias
    • Referência
    • Amostras
    • Recursos
  • Áreas de tecnologia
    • Mais
  • Ferramentas em vários produtos
    • Mais
  • Sites relacionados
    • Mais
  • Console
  • Contacte-nos
  • Começar gratuitamente
  • Descubra
  • Vista geral do produto
  • Conceitos principais
  • Componentes
    • Visão geral
    • Delta Lake
    • Docker
    • Flink
    • HBase
    • Hive WebHCat
    • Hudi
    • Icebergue
    • Jupyter
    • Porco
    • Presto
    • Ranger
      • Instale o Ranger
      • Use o Ranger com o Kerberos
      • Use o Ranger com colocação em cache e redução do âmbito
      • Faça uma cópia de segurança e restaure um esquema do Ranger
    • Solr
    • Trino
    • Zeppelin
    • Zelador de jardim zoológico
  • Serviços
  • Opções de computação
    • Tipos de máquinas
    • GPUs
    • Plataforma de CPU mínima
    • Trabalhadores secundários
    • Unidades de estado sólido locais
    • Discos de arranque
  • Controlo de versões
    • Visão geral
    • Versões de lançamento 3.0.x
    • Versões de lançamento 2.3.x
    • Versões de lançamento 2.2.x
    • Versões de lançamento 2.1.x
    • Versões de lançamento 2.0.x
    • Listas de versões de imagens de clusters
  • Perguntas frequentes
  • Começar
  • Execute o Spark no Dataproc
    • Use a consola
    • Use a linha de comandos
    • Use o Explorador de APIs REST
      • Crie um cluster
      • Execute uma tarefa do Spark
      • Atualize um cluster
      • Elimine um cluster
    • Use bibliotecas de cliente
    • Execute o Spark com o Kubernetes
  • Criar
  • Configure um projeto
  • Use modelos do Dataproc
  • Crie clusters do Dataproc
    • Crie um cluster
    • Crie um cluster de alta disponibilidade
    • Crie um cluster de grupo de nós
    • Crie um cluster parcial
    • Crie um cluster de nó único
    • Crie um cluster de inquilino único
    • Recrie um cluster
    • Crie uma imagem personalizada
  • Crie clusters do Kubernetes
    • Vista geral
    • Versões de lançamento
    • Recrie um cluster
    • Crie node pools
    • Crie uma imagem personalizada
  • Crie uma tabela Apache Iceberg com metadados no metastore do BigQuery
  • Programar
  • Apache Hadoop
  • Apache HBase
  • Apache Hive e Kafka
  • Apache Spark
    • Configurar
      • Faça a gestão das dependências do Spark
      • Personalize o ambiente do Spark
      • Ative as escritas simultâneas
      • Melhore o desempenho do Spark
      • Tune Spark
    • Ligar
      • Use o conetor do BigQuery do Spark
      • Use o conetor do Cloud Storage
      • Use o conetor do Spark Spanner
    • Executar
      • Use o HBase
      • Use a simulação de Monte Carlo
      • Use o Spark ML
      • Use o Spark Scala
  • Use blocos de notas
    • Visão geral
    • Execute um bloco de notas do Jupyter num cluster do Dataproc
    • Execute uma análise genómica num notebook
    • Use a extensão do JupyterLab para desenvolver cargas de trabalho do Spark sem servidor
  • Python
    • Configurar ambiente
    • Use bibliotecas de cliente da nuvem
  • Trino
  • Implementação
  • Executar tarefas
    • Ciclo de vida de um trabalho
    • Envie um trabalho
    • Reiniciar tarefas
    • Veja o histórico de trabalhos
  • Use modelos de fluxos de trabalho
    • Vista geral
    • Parametrização
    • Use ficheiros YAML
    • Use seletores de clusters
    • Use fluxos de trabalho inline
  • Orquestre fluxos de trabalho
    • Soluções de agendamento de fluxos de trabalho
    • Use modelos de fluxo de trabalho do Dataproc
    • Use o Cloud Composer
    • Use o Cloud Functions
    • Use o Cloud Scheduler
  • Ajuste o desempenho
    • Otimize o desempenho do Spark
    • Métricas do Dataproc
    • Crie alertas de métricas
    • Perfil de utilização de recursos
  • Gerir
  • Faça a gestão de clusters
    • Inicie e pare clusters
      • Inicie e pare um cluster manualmente
      • Agende a paragem do cluster
    • Atualize e elimine um cluster
    • Alterne clusters
    • Configure clusters
      • Defina as propriedades do cluster
      • Selecionar região
      • Selecionar zona automaticamente
      • Defina ações de inicialização
      • Dê prioridade aos tipos de VMs
      • Agende a eliminação do cluster
    • Dimensione clusters
      • Dimensione clusters
      • Escala automática de clusters
    • Faça a gestão dos dados
      • Armazenamento de dados Hadoop
      • Selecione o tipo de armazenamento
      • Coloque em cache os dados de cluster
      • Transfira dados de reprodução aleatória
    • Faça a gestão das redes
      • Configure uma rede
      • Redes de clusters do Dataproc com o Private Service Connect
  • Faça a gestão de clusters do Kubernetes
    • Dimensione clusters
    • Elimine um cluster
  • Aceda a clusters
    • Use SSH
    • Estabeleça ligação a interfaces Web
    • Use o gateway de componentes
    • Defina o acesso da força de trabalho
  • Faça a gestão de metadados e etiquetas
    • Ative a linhagem de dados do Spark
    • Ative a linhagem de dados do Hive
    • Defina metadados
    • Defina etiquetas para filtragem
    • Use etiquetas seguras
  • Estabeleça ligação ao Dataproc
    • Migre o Hadoop
    • Associe ao BigQuery
      • Conector do BigQuery
      • Conetor Hive-BigQuery
      • Exemplos de código
    • Estabeleça ligação ao Bigtable
    • Estabeleça ligação ao Cloud Storage
    • Estabeleça ligação ao Pub/Sub Lite
  • Práticas recomendadas de produção
  • Segurança e conformidade
  • Práticas recomendadas de segurança
  • Autentique utilizadores
    • Autentique-se no Dataproc
    • Autentique clusters pessoais
  • Atribua funções e autorizações
    • Funções e autorizações do Dataproc
    • Principais do Dataproc
    • IAM detalhado
    • Atribua funções para o Kubernetes
  • Crie contas de serviço
  • Clusters seguros
    • Proteja a multi-posse com o Kerberos
    • Proteja a multi-posse com contas de serviço
    • Encripte a memória
    • Faça a gestão das chaves de encriptação de dados
    • Ative o serviço de autorização do Ranger
    • Use o fornecedor de credenciais do Secret Manager
    • Crie e proteja um cluster de metastore do Hive
  • Crie restrições personalizadas
  • Assured Workloads
  • Conformidade com a FedRAMP
  • Verifique a faturação
  • Resolver problemas
  • Vista geral
  • Analise registos
    • Registos do Dataproc
    • Registos de saída de tarefas
    • Registos de auditoria
  • Resolva problemas de clusters
    • Veja os dados de diagnóstico do cluster
    • Resolva problemas de criação de clusters
    • Diagnostique clusters do Kubernetes
    • Ative o registo do Kubernetes
  • Resolva problemas de tarefas
    • Resolva problemas de tarefas
    • Resolva problemas de erros de memória
    • Resolva problemas de atrasos nas tarefas
    • Veja o histórico de trabalhos
    • Resolva problemas com modelos de fluxo de trabalho
  • IA e AA
  • Desenvolvimento de aplicações
  • Alojamento de aplicações
  • Computação
  • Estatísticas e pipelines de dados
  • Bases de dados
  • Distribuído, híbrido e multinuvem
  • IA generativa
  • Soluções para setores
  • Trabalhar em rede
  • Observabilidade e monitorização
  • Segurança
  • Storage
  • Gestão de acesso e recursos
  • Gestão de custos e utilização
  • SDK Cloud da Google, linguagens, frameworks e ferramentas
  • Infraestrutura como código
  • Migração
  • Google Cloud Home
  • Avaliação gratuita e nível gratuito
  • Architecture Center
  • Blogue
  • Contactar equipa de vendas
  • Google Cloud Developer Center
  • Google Developer Center
  • Google Cloud Marketplace
  • Documentação do Google Cloud Marketplace
  • Melhoria de competências do Google Cloud
  • Google Cloud Solution Center
  • Apoio técnico do Google Cloud
  • Canal do YouTube do Google Cloud Tech
Esta página foi traduzida pela API Cloud Translation.
  • Home
  • Documentação
  • Dataproc
  • Documentation
  • Guias

Migre o Hadoop
Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Para migrar fluxos de trabalho e dados do Apache Hadoop para o Google Cloud e o Dataproc, consulte os seguintes documentos:

  • Migrar a infraestrutura Hadoop no local para o Google Cloud
  • Migrar dados do HDFS de local para Google Cloud

Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.

Última atualização 2025-09-23 UTC.

  • Por que o Google

    • Por que escolher o Google Cloud
    • Confiança e segurança
    • Nuvem com infraestrutura moderna
    • Várias nuvens
    • Infraestrutura global
    • Clientes e estudos de caso
    • Relatórios de analistas
    • Artigos
  • Produtos e preços

    • Veja todos os produtos
    • Veja todas as soluções
    • Google Cloud para startups
    • Google Cloud Marketplace
    • Preços do Google Cloud
    • Entre em contato com a equipe de vendas.
  • Suporte

    • Community forums
    • Suporte
    • Notas da versão
    • Status do sistema
  • Recursos

    • GitHub
    • Introdução ao Google Cloud
    • Documentação do Google Cloud
    • Exemplos de código
    • Centro de arquitetura do Cloud
    • Treinamento e certificação
    • Centro para Desenvolvedores
  • Envolver

    • Blog
    • Eventos
    • X (Twitter)
    • Google Cloud no YouTube
    • Google Cloud Tech no YouTube
    • Seja um parceiro
    • Google Cloud Affiliate Program
    • Área da imprensa
  • Sobre o Google
  • Privacidade
  • Termos do site
  • Termos do Google Cloud
  • Manage cookies
  • Essa é nossa terceira década de ação climática: participe!
  • Inscreva-se para receber a newsletter do Google Cloud Inscrever-se
  • English
  • Deutsch
  • Español
  • Español – América Latina
  • Français
  • Indonesia
  • Italiano
  • Português
  • Português – Brasil
  • 中文 – 简体
  • 中文 – 繁體
  • 日本語
  • 한국어