Gerenciar a administração do Studio

Nesta página, explicamos os recursos de administração que o Cloud Data Fusion Studio oferece para gerenciar configurações. O Cloud Data Fusion segue uma hierarquia, em que cada instância pode ter vários namespaces. No Cloud Data Fusion Studio, os administradores podem gerenciar todos os namespaces de forma centralizada ou individualmente. O Studio do Cloud Data Fusion oferece o sistema e o namespace a seguir controles de segurança.

Administração de sistemas

Clique em Administrador do sistema no Cloud Data Fusion Studio para mostrar as seguintes guias:

  • Guia Gerenciamento: confira o status de integridade de vários serviços do Cloud Data Fusion. Também é possível conferir os registros de cada um dos serviços.
  • Na guia Configuração, crie, visualize e edite os seguintes controles:

Os provisionadores são responsáveis por criar, inicializar e destruir o ambiente de nuvem em que os pipelines são executados. Cada provisionador expõe um conjunto de configurações que são usadas para controlar o tipo de cluster que é criado e excluído. Provisionadores diferentes criam tipos distintos de clusters.

Cada perfil de computação tem um escopo: sistema ou usuário. É possível usar um perfil de computação do sistema para qualquer namespace abaixo dele. Os perfis de computação do usuário existem em um namespace, e apenas pipelines nesse namespace podem usar os perfis de computação do usuário.

Na guia Configurações do administrador do sistema, é possível criar um do Compute Engine aplicado a todos os namespaces. Cloud Data Fusion atribui um perfil de computação padrão.

Ao criar um perfil de computação, você seleciona o provisionador, que o perfil usa para criar e configurar os detalhes do ambiente de execução da nuvem.

Preferências do sistema

As preferências são configurações predefinidas que se aplicam em vários níveis no Cloud Data Fusion, incluindo o próprio sistema, namespaces, aplicativos (que contêm pipelines) e programas individuais nos pipelines. As preferências oferecem uma maneira de definir valores padrão para configurações usadas com frequência. Esses os padrões podem ser herdados por pipelines e programas em níveis mais baixos, repetitivas de configuração. Para mais informações, consulte Gerenciar macros, preferências e argumentos de ambiente de execução.

Ação de chamada HTTP

A ação de chamada HTTP na página Administrador do sistema permite interagir com a API do Cloud Data Fusion ou com outras APIs de serviço do Google Cloud diretamente na interface do Cloud Data Fusion Studio. No entanto, para criar pipelines de processamento de dados com fontes de dados externas, em vez disso, plug-in HTTP e o Executor de chamadas HTTP nos pipelines para uma solução abrangente. Ela difere um pouco da ação de chamada HTTP, mas os conceitos subjacentes são semelhantes.

Configurações e casos de uso

A ação de chamada HTTP é usada principalmente para tarefas administrativas ou fins de configuração no Cloud Data Fusion. Ele permite interagir com a API Cloud Data Fusion ou outros serviços do Google Cloud que expõem uma API HTTP diretamente do Cloud Data Fusion Studio.

Configurações

É possível definir os seguintes detalhes para uma chamada HTTP:

  • URL: o endpoint de destino do serviço da Web que você quer a chamada.
  • Método: o método HTTP a ser usado, como GET, POST ou PUT.
  • Opcional: Cabeçalhos: qualquer cabeçalho personalizado necessário para a solicitação.
  • Opcional: Body: dados a serem enviados no corpo da solicitação, como para chamadas POST e PUT.

Em seguida, execute a chamada HTTP definida e confira a resposta do serviço da Web no Cloud Data Fusion Studio.

Casos de uso
  • Testar as chamadas da API Cloud Data Fusion. É possível usar a chamada HTTP ação para testar ou explorar as funcionalidades da API Cloud Data Fusion diretamente da interface da Web. Essa ação pode ser útil para entender o comportamento da API ou solucionar possíveis problemas.
  • Gerenciar namespaces (avançado). Embora haja uma interface dedicada para o gerenciamento de namespaces, a ação de chamada HTTP pode ser usada para tarefas avançadas, fazendo chamadas diretamente para a API Cloud Data Fusion para criação, exclusão ou configuração de namespaces.
  • Interação com outros serviços do Google Cloud (limitado). Se outros serviços do Google Cloud que você usa tiverem um documento oficial API HTTP, é possível usar a ação de chamada HTTP para interagir com essas serviços, embora esse seja um caso de uso incomum.
Considerações importantes
  • Segurança: tenha cuidado ao usar a ação de chamada HTTP, principalmente com dados sensíveis ou chamadas da API Cloud Data Fusion que possam afetar seu ambiente. Entenda as implicações de cada chamada de API antes de executá-la.
  • Limitações: a ação de chamada HTTP é usada principalmente para tarefas administrativas e fins de teste. Ele não foi projetado para criar pipelines de processamento de dados complexos que envolvam a manipulação de dados no Cloud Data Fusion.
  • Alternativa para pipelines: para integrar fontes ou serviços de dados externos aos pipelines de dados, use o plug-in HTTP e o executor de chamadas HTTP associado nas definições do pipeline. Isso oferece uma maneira mais robusta e controlada de gerenciar interações HTTP nos fluxos de trabalho de processamento de dados.

Administração de namespace

Clique em Administrador do namespace no Cloud Data Fusion Studio para gerenciar as configurações de um namespace específico. Para cada namespace, pode definir os seguintes aspectos:

  • Perfis de computação: os perfis configurados no administrador de namespace são perfis de computação de usuário. Somente os pipelines nesse namespace podem usar essas permissões do Compute Engine. Para mais informações, consulte Gerenciar perfis de computação.
  • Preferências: as preferências definidas no nível do namespace são aplicáveis ao namespace, aos aplicativos (que contêm pipelines) e aos programas individuais nos pipelines. Para mais informações, consulte Gerenciar macros, preferências e argumentos de execução.
  • Conexões: o Cloud Data Fusion permite reutilizar conexões com origens e coletores em pipelines de dados. É possível adicionar conexões na página "Administrador de namespace". Para mais informações, consulte Criar e gerenciar conexões.
  • Drivers: alguns plug-ins no Cloud Data Fusion exigem um driver JDBC para que será adicionado ao namespace. Por exemplo, antes de executar um pipeline com uma plug-in de fonte em lote do MySQL, adicione o driver compatível do MySQL ao arquivo . Você pode fazer upload ou remover drivers JDBC para um namespace da Namespace Admin ou diretamente do Hub. Para mais informações, consulte Drivers de plug-in.
  • Gerenciamento de controle de origem: para gerenciar de maneira eficiente o processo de desenvolvimento de pipelines implantados, o Gerenciamento de controle de origem permite conectar um espaço de nomes ao repositório do seu sistema de controle de origem. Para mais informações, consulte Gerenciar pipelines usando o gerenciamento de controle de origem.
  • Conta de serviço: para controlar o acesso aos recursos do Google Cloud. namespaces no Cloud Data Fusion usam Agente de serviço da API Cloud Data Fusion por padrão.

Para um melhor isolamento dos dados, você pode associar um Conta de serviço do Identity and Access Management (IAM), conhecida como "Por namespace" conta de serviço) com cada namespace. A conta de serviço personalizada do IAM, que pode ser diferente para diferentes namespaces, permite controlar o acesso aos recursos do Google Cloud entre namespaces para operações de design de pipeline no Cloud Data Fusion, como visualização de pipeline, Wrangler e validação de pipeline. Para mais informações, consulte Controle de acesso com a conta de serviço do namespace.

A seguir