Introdução ao Cloud Data Fusion: console

Nesta página, apresentamos o console do Cloud Data Fusion, também conhecido como plano de controle. É um conjunto de APIs de operações e uma interface do console do Google Cloud permitem que você gerencie uma instância do Cloud Data Fusion. Por exemplo, usar o método é possível criar, excluir, reiniciar ou atualizar uma instância.

Antes de começar

Cloud Data Fusion: visão geral do console

As seções a seguir descrevem aspectos importantes do console.

Instâncias

Uma instância é uma implantação exclusiva do Cloud Data Fusion. Para começar a usar No Cloud Data Fusion, você cria uma instância no console do Google Cloud. É possível criar várias instâncias do Cloud Data Fusion em uma projeto do Google Cloud. É possível especificar uma região do Google Cloud para cada instância. Cada instância é um serviço do Cloud Data Fusion implantação, que contém um conjunto de serviços que lidam com o ciclo de vida orquestração, coordenação, coordenação e gerenciamento de metadados. Esses serviços são executados usando recursos de longa duração projeto de locatário.

Ao criar a instância, considere as opções a seguir.

Edição

Você cria a instância em uma das seguintes edições do Cloud Data Fusion: Desenvolvedor, Básico ou Empresarial. Escolha a edição com base nos seguintes critérios:

  • Custo
  • Limites de simultaneidade para execução de pipeline
  • Disponibilidade do controle de acesso baseado em função (RBAC)

As edições são destinadas aos seguintes casos de uso:

Edição do Cloud Data Fusion Caso de uso
Edição para desenvolvedores Para desenvolvimento, teste ou integrações em pequena escala
Edição Basic Para produção com necessidades moderadas
Edição Empresarial Para pipelines de dados essenciais e em grande escala com o RBAC

Instância pública ou particular

Dependendo dos seus requisitos, decida se você precisa de uma instância. As principais diferenças entre instâncias públicas e privadas em O Cloud Data Fusion consiste em conectividade de rede e segurança:

Tipo de instância do Cloud Data Fusion Comportamento
Instância pública
  • Conectividade de rede: usa endereços IP públicos para conectar à Internet.
  • Acesso a dados: acessa diretamente as fontes de dados no Internet pública.
. Para mais informações, consulte Criar uma instância pública.
Instância particular
  • Conectividade de rede: usa endereços IP particulares. em uma rede de nuvem privada virtual (VPC).
  • Acesso a dados: exige conexões pré-configuradas para acessar fontes de dados. As seguintes conexões são compatíveis:
    • Fontes de dados no local conectadas por VPN ou Cloud Interconnect.
    • Outros serviços do Google Cloud executados de forma particular no mesmo VPC.

Autorização e conta de serviço

O Cloud Data Fusion geralmente tem duas contas de serviço:

Conta de serviço de tempo de design
Esta conta de serviço gerenciado pelo Google, chamada de serviço da API Cloud Data Fusion de operações, é usada no projeto de locatário do Cloud Data Fusion para acessar recursos do projeto do cliente.
Conta de serviço no ambiente de execução
Essa é a conta de serviço padrão do Compute Engine O Cloud Data Fusion cria para implantar jobs que acessam outros recursos do Google Cloud. Por padrão, ele é anexado a um Dataproc VM de cluster para permitir que o Cloud Data Fusion acesse o Dataproc recursos durante uma execução de pipeline.

Para mais informações, acesse Contas de serviço no Cloud Data Fusion.

Geração de registros e monitoramento

O Cloud Logging e o Cloud Monitoring são essenciais para receber insights sobre a integridade e o desempenho dos pipelines do Cloud Data Fusion. Você ativa o Logging e monitoramento somente quando a instância do Cloud Data Fusion é criada.

Ao ativar o Logging e o Monitoring, é possível visualizar registros de pipeline do Cloud Data Fusion no console do Google Cloud, Visualizador do Logging.

O Monitoring fornece painéis integrados para o Cloud Data Fusion. Também é possível criar painéis personalizados para monitorar métricas específicas.

Integração de linhagem com o Dataplex

O Cloud Data Fusion oferece uma integração com o Dataplex para linhagem. Para mais informações, consulte Visualizar linhagem no Dataplex.

Encryption

Com as chaves de criptografia gerenciadas pelo cliente (CMEK, na sigla em inglês), é possível criptografar dados em repouso com que pode ser controlada com o Cloud Key Management Service. A CMEK oferece controle de usuário sobre os dados gravados nos recursos internos do Google Cloud em projetos de locatário e dados gravados pelos pipelines do Cloud Data Fusion. Para mais informações, consulte Criptografia de dados gerenciada pelo cliente.

Gerenciar permissões com o controle de acesso baseado em função (RBAC)

O Cloud Data Fusion permite controlar com o Identity and Access Management (IAM).

Para permissões granulares de ações realizadas no Cloud Data Fusion: Studio operações, use o RBAC. Para mais informações, consulte a Visão geral do RBAC.

Upgrades de versões

O Cloud Data Fusion tem versões. É possível fazer upgrade de uma instância no console do Cloud Data Fusion. Para mais informações, consulte Controle de versões no Cloud Data Fusion.

A seguir