Administração do sistema
Clique em Administrador do sistema no Cloud Data Fusion Studio para mostrar as guias a seguir:
- Guia Gerenciamento: confira o status de integridade de vários serviços do Cloud Data Fusion. Também é possível conferir os registros de cada um dos serviços.
Na guia Configuração, crie, visualize e edite os seguintes controles:
- Namespaces: Para mais informações, consulte Controle de acesso com uma conta de serviço de namespace.
- Perfis de computação do sistema. Os perfis de computação indicam qual provisionador usar ao criar um cluster para a execução do pipeline e aplicar as configurações associadas.
Os provisionadores são responsáveis por criar, inicializar e destruir o ambiente de nuvem em que os pipelines são executados. Cada provisionador expõe um conjunto de configurações que são usadas para controlar o tipo de cluster que é criado e excluído. Diferentes provisionadores criam diferentes tipos de clusters.
Cada perfil de computação tem um escopo: sistema ou usuário. É possível usar um perfil de computação do sistema para qualquer namespace abaixo dele. Os perfis de computação do usuário existem em um namespace, e somente pipelines nesse namespace podem usar os perfis de computação do usuário.
Na guia Configurations do administrador do sistema, é possível criar um perfil de computação do sistema que é aplicado a todos os namespaces. O Cloud Data Fusion atribui um perfil de computação padrão.
Ao criar um perfil de computação, você seleciona o provisionador, que o perfil usa para criar e configurar os detalhes do ambiente de execução da nuvem.
Preferências do sistema
As preferências são configurações predefinidas que se aplicam a vários níveis do Cloud Data Fusion, incluindo o próprio sistema, namespaces, aplicativos (que contêm pipelines) e programas individuais nos pipelines. As preferências oferecem uma maneira de definir valores padrão para configurações usadas com frequência. Esses padrões podem ser herdados por pipelines e programas em níveis mais baixos, reduzindo tarefas de configuração repetitivas. Para mais informações, consulte Gerenciar macros, preferências e argumentos de execução.
Ação de chamada HTTP
A ação de chamada HTTP na página Administrador do sistema permite interagir com a API do Cloud Data Fusion ou com outras APIs de serviço Google Cloud diretamente na interface do Studio. No entanto, para criar pipelines de processamento de dados com origens externas, use o plug-in HTTP e o executor de chamadas HTTP nos pipelines para uma solução mais completa. Ela é um pouco diferente da ação de chamada HTTP, mas os conceitos subjacentes são semelhantes.
Configurações e casos de uso
A ação de chamada HTTP é usada principalmente para tarefas administrativas ou fins de configuração no Cloud Data Fusion. Ele permite interagir com a API Cloud Data Fusion ou outros serviços Google Cloud que expõem uma API HTTP diretamente do Cloud Data Fusion Studio.
Configurações
É possível definir os seguintes detalhes para uma chamada HTTP:
- URL: o endpoint de destino do serviço da Web que você quer chamar.
- Método: o método HTTP a ser usado, como
GET
,POST
ouPUT
. - Opcional: Cabeçalhos: qualquer cabeçalho personalizado necessário para a solicitação.
- Opcional: Body: dados a serem enviados no corpo da solicitação, como
para chamadas
POST
ePUT
.
Em seguida, execute a chamada HTTP definida e confira a resposta do serviço da Web no Cloud Data Fusion Studio.
Casos de uso
- Teste as chamadas da API Cloud Data Fusion. É possível usar a ação de chamada HTTP para testar ou explorar as funcionalidades da API Cloud Data Fusion diretamente na interface da Web. Essa ação pode ser útil para entender o comportamento da API ou resolver possíveis problemas.
- Gerenciar namespaces (avançado). Embora haja uma interface dedicada para o gerenciamento de namespaces, a ação de chamada HTTP pode ser usada para tarefas avançadas, fazendo chamadas diretamente para a API Cloud Data Fusion para criação, exclusão ou configuração de namespaces.
- Interagir com outros serviços Google Cloud (limitado). Se outros Google Cloud serviços que você usa tiverem uma API HTTP documentada publicamente, use a ação de chamada HTTP para interagir com esses serviços, embora esse seja um caso de uso incomum.
Considerações importantes
- Segurança: tenha cuidado ao usar a ação de chamada HTTP, principalmente com dados sensíveis ou chamadas da API Cloud Data Fusion que possam afetar seu ambiente. Entenda as implicações de cada chamada de API antes de executá-la.
- Limitações: a ação de chamada HTTP é usada principalmente para tarefas administrativas e fins de teste. Ele não foi projetado para criar pipelines de processamento de dados complexos que envolvam a manipulação de dados no Cloud Data Fusion.
- Alternativa para pipelines: para integrar fontes ou serviços de dados externos aos pipelines de dados, use o plug-in HTTP e o executor de chamadas HTTP associado nas definições do pipeline. Isso oferece uma maneira mais robusta e controlada de gerenciar interações HTTP nos fluxos de trabalho de processamento de dados.
Administração de namespace
Clique em Administrador do namespace no Cloud Data Fusion Studio para gerenciar as configurações de um namespace específico. Para cada namespace, é possível definir os seguintes aspectos:
- Perfis de computação: os perfis configurados no Administrador do namespace são perfis de computação de usuário. Somente pipelines nesse namespace podem usar esses perfis de computação do usuário. Para mais informações, consulte Gerenciar perfis de computação.
- Preferências: as preferências definidas no nível do namespace são aplicáveis ao namespace, aos aplicativos (que contêm pipelines) e aos programas individuais nos pipelines. Para mais informações, consulte Gerenciar macros, preferências e argumentos de execução.
- Conexões: o Cloud Data Fusion permite reutilizar conexões com origens e coletores em pipelines de dados. É possível adicionar conexões na página "Administrador de namespace". Para mais informações, consulte Criar e gerenciar conexões.
- Drivers: alguns plug-ins no Cloud Data Fusion exigem que um driver JDBC seja adicionado ao namespace. Por exemplo, antes de executar um pipeline com um plug-in de origem de lote do MySQL, adicione o driver MySQL compatível ao espaço de nome. É possível fazer upload ou remover drivers JDBC para um namespace na página de administrador do namespace ou diretamente do Hub. Para mais informações, consulte Drivers de plug-in.
- Gerenciamento de controle de origem: para gerenciar de maneira eficiente o processo de desenvolvimento de pipelines implantados, o Gerenciamento de controle de origem permite conectar um espaço de nomes ao repositório do sistema de controle de origem. Para mais informações, consulte Gerenciar pipelines usando o gerenciamento de controle de origem.
- Conta de serviço: para controlar o acesso a recursos Google Cloud , os namespaces no Cloud Data Fusion usam o agente de serviço da API Cloud Data Fusion por padrão.
Para um melhor isolamento de dados, é possível associar uma conta de serviço personalizada do Identity and Access Management (IAM, na sigla em inglês) (conhecida como uma conta de serviço por namespace) a cada namespace. A conta de serviço personalizada do IAM, que pode ser diferente para diferentes namespaces, permite controlar o acesso a recursos Google Cloud entre namespaces para operações de tempo de design do pipeline no Cloud Data Fusion, como visualização do pipeline, Wrangler e validação do pipeline. Para mais informações, consulte Controle de acesso com a conta de serviço do namespace.
A seguir
- Saiba mais sobre perfis de computação.
- Saiba mais sobre macros, preferências e argumentos de execução.