Esta página apresenta o Cloud Data Fusion: Console, também conhecido como plano de controle. É um conjunto de APIs de operações e uma interface do console do Google Cloud permitem que você gerencie uma instância do Cloud Data Fusion. Por exemplo, usando o console, é possível criar, excluir, reiniciar ou atualizar uma instância.
Antes de começar
- Ative a API do Cloud Data Fusion.
- Entenda os custos das edições do Cloud Data Fusion.
- Entenda o controle de acesso e as contas de serviço no Cloud Data Fusion.
Cloud Data Fusion: visão geral do console
As seções a seguir descrevem aspectos importantes do console.
Instâncias
Uma instância é uma implantação exclusiva do Cloud Data Fusion. Para começar a usar o Cloud Data Fusion, crie uma instância no console do Google Cloud. É possível criar várias instâncias do Cloud Data Fusion em um único projeto do Google Cloud. É possível especificar uma região do Google Cloud para cada instância. Cada instância é um serviço do Cloud Data Fusion implantação, que contém um conjunto de serviços que lidam com o ciclo de vida orquestração, coordenação, coordenação e gerenciamento de metadados. Esses serviços são executados usando recursos de execução longa em um projeto de locatário.
Ao criar a instância, considere as opções a seguir.
Edição
Crie a instância em uma das seguintes edições do Cloud Data Fusion: Desenvolvedor, Básico ou Enterprise. Escolha a edição com base nos seguintes critérios:
- Custo
- Limites de simultaneidade para a execução de pipelines
- Disponibilidade do controle de acesso baseado em função (RBAC)
As edições são destinadas aos seguintes casos de uso:
Edição do Cloud Data Fusion | Caso de uso |
---|---|
Edição para desenvolvedores | Para desenvolvimento, testes ou integrações em pequena escala |
Edição Basic | Para produção com necessidades moderadas |
Edição Empresarial | Para pipelines de dados de grande escala e de missão crítica com RBAC |
Instância pública ou privada
Dependendo dos seus requisitos, decida se você precisa de uma instância pública ou privada. As principais diferenças entre instâncias públicas e privadas O Cloud Data Fusion consiste em conectividade de rede e segurança:
Tipo de instância do Cloud Data Fusion | Comportamento |
---|---|
Instância pública |
|
Instância particular |
|
Autorização e conta de serviço
O Cloud Data Fusion geralmente tem duas contas de serviço:
- Conta de serviço do ambiente de design
- Esta conta de serviço gerenciado pelo Google, chamada de serviço da API Cloud Data Fusion de operações, é usada no projeto de locatário do Cloud Data Fusion para acessar recursos do projeto do cliente.
- Conta de serviço no ambiente de execução
- Essa é a conta de serviço padrão do Compute Engine O Cloud Data Fusion cria para implantar jobs que acessam outros recursos do Google Cloud. Por padrão, ele é anexado a uma VM de cluster do Dataproc para permitir que o Cloud Data Fusion acesse recursos do Dataproc durante uma execução de pipeline.
Para mais informações, consulte Contas de serviço no Cloud Data Fusion.
Geração de registros e monitoramento
O Cloud Logging e o Cloud Monitoring são essenciais para ter insights sobre a integridade e o desempenho dos pipelines do Cloud Data Fusion. Você ativa o Logging e monitoramento somente quando a instância do Cloud Data Fusion é criada.
A ativação do registro e do monitoramento permite que você visualize os registros do pipeline do Cloud Data Fusion no console do Google Cloud na página Visualizador de registros.
O Monitoring fornece painéis integrados para o Cloud Data Fusion. Também é possível criar painéis personalizados para monitorar métricas específicas.
Integração de linhagem com o Dataplex
O Cloud Data Fusion oferece uma integração com o Dataplex para a linhagem. Para mais informações, consulte Conferir a linhagem no Dataplex.
Encryption
As chaves de criptografia gerenciadas pelo cliente (CMEK) permitem a criptografia de dados em repouso com uma que pode ser controlada com o Cloud Key Management Service. A CMEK fornece ao usuário controle sobre os dados gravados nos recursos internos do Google Cloud em projetos de locatário e dados gravados pelos pipelines do Cloud Data Fusion. Para mais informações, consulte Criptografia de dados gerenciada pelo cliente.
Gerenciar permissões com controle de acesso baseado em papéis (RBAC)
O Cloud Data Fusion permite controlar com o Identity and Access Management (IAM).
Para permissões granulares de ações realizadas nas operações do Cloud Data Fusion: Studio, use o RBAC. Para mais informações, consulte a visão geral do RBAC.
Upgrades de versão
O Cloud Data Fusion tem versões. É possível fazer upgrade de uma instância no console do Cloud Data Fusion. Para mais informações, consulte Controle de versão no Cloud Data Fusion.
A seguir
- Saiba mais sobre o Cloud Data Fusion: Studio.