Nesta página, apresentamos o console do Cloud Data Fusion, também conhecido como plano de controle. É um conjunto de APIs de operações e uma interface do console do Google Cloud permitem que você gerencie uma instância do Cloud Data Fusion. Por exemplo, usar o método é possível criar, excluir, reiniciar ou atualizar uma instância.
Antes de começar
- Ative a API do Cloud Data Fusion.
- Entenda os custos das edições do Cloud Data Fusion.
- Entenda o controle de acesso e as contas de serviço em o Cloud Data Fusion.
Cloud Data Fusion: visão geral do console
As seções a seguir descrevem aspectos importantes do console.
Instâncias
Uma instância é uma implantação exclusiva do Cloud Data Fusion. Para começar a usar No Cloud Data Fusion, você cria uma instância no console do Google Cloud. É possível criar várias instâncias do Cloud Data Fusion em uma projeto do Google Cloud. É possível especificar uma região do Google Cloud para cada instância. Cada instância é um serviço do Cloud Data Fusion implantação, que contém um conjunto de serviços que lidam com o ciclo de vida orquestração, coordenação, coordenação e gerenciamento de metadados. Esses serviços são executados usando recursos de longa duração projeto de locatário.
Ao criar a instância, considere as opções a seguir.
Edição
Você cria a instância em uma das seguintes edições do Cloud Data Fusion: Desenvolvedor, Básico ou Empresarial. Escolha a edição com base nos seguintes critérios:
- Custo
- Limites de simultaneidade para execução de pipeline
- Disponibilidade do controle de acesso baseado em função (RBAC)
As edições são destinadas aos seguintes casos de uso:
Edição do Cloud Data Fusion | Caso de uso |
---|---|
Edição para desenvolvedores | Para desenvolvimento, teste ou integrações em pequena escala |
Edição Basic | Para produção com necessidades moderadas |
Edição Empresarial | Para pipelines de dados essenciais e em grande escala com o RBAC |
Instância pública ou particular
Dependendo dos seus requisitos, decida se você precisa de uma instância. As principais diferenças entre instâncias públicas e privadas em O Cloud Data Fusion consiste em conectividade de rede e segurança:
Tipo de instância do Cloud Data Fusion | Comportamento |
---|---|
Instância pública |
|
Instância particular |
|
Autorização e conta de serviço
O Cloud Data Fusion geralmente tem duas contas de serviço:
- Conta de serviço de tempo de design
- Esta conta de serviço gerenciado pelo Google, chamada de serviço da API Cloud Data Fusion de operações, é usada no projeto de locatário do Cloud Data Fusion para acessar recursos do projeto do cliente.
- Conta de serviço no ambiente de execução
- Essa é a conta de serviço padrão do Compute Engine O Cloud Data Fusion cria para implantar jobs que acessam outros recursos do Google Cloud. Por padrão, ele é anexado a um Dataproc VM de cluster para permitir que o Cloud Data Fusion acesse o Dataproc recursos durante uma execução de pipeline.
Para mais informações, acesse Contas de serviço no Cloud Data Fusion.
Geração de registros e monitoramento
O Cloud Logging e o Cloud Monitoring são essenciais para receber insights sobre a integridade e o desempenho dos pipelines do Cloud Data Fusion. Você ativa o Logging e monitoramento somente quando a instância do Cloud Data Fusion é criada.
Ao ativar o Logging e o Monitoring, é possível visualizar registros de pipeline do Cloud Data Fusion no console do Google Cloud, Visualizador do Logging.
O Monitoring fornece painéis integrados para o Cloud Data Fusion. Também é possível criar painéis personalizados para monitorar métricas específicas.
Integração de linhagem com o Dataplex
O Cloud Data Fusion oferece uma integração com o Dataplex para linhagem. Para mais informações, consulte Visualizar linhagem no Dataplex.
Encryption
Com as chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês), é possível criptografar dados em repouso com que pode ser controlada com o Cloud Key Management Service. A CMEK oferece controle de usuário sobre os dados gravados nos recursos internos do Google Cloud em projetos de locatário e dados gravados pelos pipelines do Cloud Data Fusion. Para mais informações, consulte Criptografia de dados gerenciada pelo cliente.
Gerenciar permissões com o controle de acesso baseado em função (RBAC)
O Cloud Data Fusion permite controlar com o Identity and Access Management (IAM).
Para permissões granulares de ações realizadas no Cloud Data Fusion: Studio operações, use o RBAC. Para mais informações, consulte a Visão geral do RBAC.
Upgrades de versões
O Cloud Data Fusion tem versões. É possível fazer upgrade de uma instância no console do Cloud Data Fusion. Para mais informações, consulte Controle de versões no Cloud Data Fusion.
A seguir
- Saiba mais sobre o Cloud Data Fusion: Studio.