Gerenciar a administração do Studio

Nesta página, explicamos os recursos de administração que o Studio do Cloud Data Fusion fornece para gerenciar configurações. O Cloud Data Fusion segue uma hierarquia, em que cada instância pode ter vários namespaces. No Studio do Cloud Data Fusion, os administradores gerenciam todos os namespaces de maneira centralizada ou individual. O Cloud Data Fusion Studio oferece os seguintes controles de sistema e namespace.

Administração de sistemas

Clique em Administrador do sistema no Cloud Data Fusion Studio para exibir as seguintes guias:

  • Guia Gerenciamento: veja o status de integridade de vários serviços do Cloud Data Fusion. Também é possível ver os registros de cada um dos serviços.
  • Guia Configuração: permite criar, visualizar e editar os seguintes controles:

Os provisionadores são responsáveis por criar, inicializar e destruir o ambiente de nuvem em que os pipelines são executados. Cada provisionador expõe um conjunto de configurações usadas para controlar o tipo de cluster criado e excluído. Provisionadores diferentes criam tipos distintos de clusters.

Cada perfil de computação tem um escopo: sistema ou usuário. É possível usar um perfil de computação do sistema para todos os namespaces dele. Existem perfis de computação do usuário em um namespace, e apenas pipelines nesse namespace podem usá-los.

Na guia Configurações do administrador do sistema, é possível criar um perfil de computação do sistema aplicado a todos os namespaces. O Cloud Data Fusion atribui um perfil de computação padrão.

Ao criar um perfil de computação, você seleciona o provisionador, que o perfil usa para criar e configurar os detalhes do ambiente de execução na nuvem.

Preferências do sistema

Preferências são configurações predefinidas que se aplicam em vários níveis no Cloud Data Fusion, incluindo o próprio sistema, namespaces, aplicativos (que contêm pipelines) e programas individuais dentro de pipelines. As preferências oferecem uma maneira de definir valores padrão para as configurações usadas com frequência. Esses padrões podem ser herdados por pipelines e programas em níveis mais baixos, reduzindo tarefas de configuração repetitivas. Para mais informações, consulte Gerenciar macros, preferências e argumentos de ambiente de execução.

Ação de chamada HTTP

A ação de chamada HTTP na página Administrador do sistema permite interagir com a própria API do Cloud Data Fusion ou possivelmente com outras APIs de serviço do Google Cloud diretamente da interface do Cloud Data Fusion Studio. No entanto, para criar pipelines de processamento de dados com fontes de dados externas, use o plug-in HTTP e o Executor de chamadas HTTP nos pipelines para uma solução mais abrangente. Ela é um pouco diferente da ação de chamada HTTP, mas os conceitos subjacentes são semelhantes.

Configurações e casos de uso

A ação de chamada HTTP é usada principalmente para tarefas administrativas ou fins de configuração no Cloud Data Fusion. Ele permite interagir com a API Cloud Data Fusion ou com outros serviços do Google Cloud que expõem uma API HTTP, diretamente do Cloud Data Fusion Studio.

Configurações

É possível definir os seguintes detalhes para uma chamada HTTP:

  • URL: o endpoint de destino do serviço da Web que você quer chamar.
  • Método: o método HTTP a ser usado, como GET, POST ou PUT.
  • (Opcional) Cabeçalhos: todos os cabeçalhos personalizados necessários para a solicitação.
  • Opcional: Body: dados a serem enviados no corpo da solicitação, como para chamadas POST e PUT.

Em seguida, execute a chamada HTTP definida e veja a resposta do serviço da Web no Cloud Data Fusion Studio.

Casos de uso
  • Testar as chamadas da API Cloud Data Fusion. É possível usar a ação de chamada HTTP para testar ou explorar as funcionalidades da API Cloud Data Fusion diretamente da interface da Web. Essa ação pode ser útil para entender o comportamento da API ou solucionar possíveis problemas.
  • Gerenciar namespaces (avançado). Embora haja uma UI dedicada para gerenciamento de namespaces, a ação de chamada HTTP pode ser usada para tarefas avançadas fazendo chamadas diretamente à API Cloud Data Fusion para criação, exclusão ou configuração de namespaces.
  • Interação com outros serviços do Google Cloud (limitado). Se outros serviços do Google Cloud que você usa tiverem uma API HTTP documentada publicamente, será possível usar a ação de chamada HTTP para interagir com esses serviços, embora esse seja um caso de uso incomum.
Considerações importantes
  • Segurança: tenha cuidado ao usar a ação de chamada HTTP, principalmente com dados confidenciais ou chamadas da API Cloud Data Fusion que possam afetar seu ambiente. Entenda as implicações de cada chamada de API antes de executá-la.
  • Limitações: a ação de chamada de HTTP serve principalmente para tarefas administrativas e fins de teste. Ele não foi projetado para criar pipelines complexos de processamento de dados que envolvam manipulação de dados no Cloud Data Fusion.
  • Alternativa para pipelines: para integrar origens de dados ou serviços externos aos pipelines de dados, use o plug-in HTTP e o executor de chamadas HTTP associado nas definições do pipeline. Isso oferece uma maneira mais robusta e controlada de gerenciar interações HTTP nos fluxos de trabalho de processamento de dados.

Administração de namespaces

Clique em Administrador de namespace no Cloud Data Fusion Studio para gerenciar as configurações do namespace específico. Para cada namespace, é possível definir os seguintes aspectos:

  • Perfis de computação: os perfis configurados no Administrador de namespaces são perfis de computação do usuário. Somente pipelines nesse namespace podem usar esses perfis de computação do usuário. Para mais informações, consulte Gerenciar perfis de computação.
  • Preferências: as preferências definidas no nível do namespace são aplicáveis ao namespace, aos aplicativos (que contêm pipelines) e a programas individuais nos pipelines. Para mais informações, consulte Gerenciar macros, preferências e argumentos de ambiente de execução.
  • Conexões: o Cloud Data Fusion permite reutilizar conexões com origens e coletores em pipelines de dados. É possível adicionar conexões na página "Administrador do namespace". Para mais informações, consulte Criar e gerenciar conexões.
  • Drivers: alguns plug-ins no Cloud Data Fusion exigem que um driver JDBC seja adicionado ao namespace. Por exemplo, antes de executar um pipeline com um plug-in de fonte em lote do MySQL, adicione o driver do MySQL compatível ao namespace. É possível fazer upload ou remover drivers JDBC para um namespace na página "Administrador de namespaces" ou diretamente do Hub. Para mais informações, consulte Drivers de plug-ins.
  • Gerenciamento de controle de origem: para gerenciar com eficiência o processo de desenvolvimento de pipelines implantados, o gerenciamento de controle de origem permite conectar um namespace ao repositório do sistema de controle de origem. Para mais informações, consulte Gerenciar pipelines usando o gerenciamento de controle de origem.
  • Conta de serviço: para controlar o acesso aos recursos do Google Cloud, os namespaces no Cloud Data Fusion usam o Agente de serviço da API Cloud Data Fusion por padrão.

Para melhorar o isolamento de dados, é possível associar uma conta de serviço personalizada do Identity and Access Management (IAM) a cada namespace. A conta de serviço do IAM personalizada, que pode ser diferente para diferentes namespaces, permite controlar o acesso aos recursos do Google Cloud entre namespaces para operações de tempo de design de pipeline no Cloud Data Fusion, como visualização de pipeline, Wrangler e validação de pipeline. Para mais informações, consulte Controle de acesso com a conta de serviço do namespace.

A seguir