Configurar um pipeline de ML usando pipelines do AI Platform
Neste guia de início rápido, você verá uma introdução breve sobre o AI Platform Pipelines. Em deste guia, você vai instalar o Kubeflow Pipelines com o TensorFlow Extended em um novo Google Kubernetes Engine cluster do GKE e execute um pipeline de exemplo.
Este tópico é voltado a usuários iniciantes no AI Platform Pipelines.
Antes de começar
Antes de seguir este guia, verifique se o projeto do Google Cloud está configurado corretamente e se você tem permissões suficientes para implantar do AI Platform Pipelines.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Use as instruções a seguir para verificar se você recebeu os
papéis necessários para implantar o AI Platform Pipelines.
-
Abra uma sessão do Cloud Shell.
O Cloud Shell é aberto em um frame na parte inferior do Console do Google Cloud.
-
É necessário ter os papéis de Visualizador (
roles/viewer
) e de administrador do Kubernetes Engine (roles/container.admin
) no projeto ou outros papéis com as mesmas permissões, como Proprietário (roles/owner
) no projeto, para implantar o AI Platform Pipelines. Execute o comando a seguir no Cloud Shell para listar os principais com os papéis de Visualizador e Administrador do Kubernetes Engine.gcloud projects get-iam-policy PROJECT_ID \ --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \ --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"
Substitua PROJECT_ID pelo ID do projeto do Google Cloud.
Use a saída desse comando para verificar se sua conta tem os papéis de Visualizador e Administrador do Kubernetes Engine.
-
Se você não recebeu os papéis necessários, entre em contato com o administrador do projeto do Google Cloud para receber mais ajuda.
Saiba mais sobre como conceder papéis de gerenciamento de identidade e acesso.
-
Configurar a instância do AI Platform Pipelines
Use as instruções a seguir para configurar o AI Platform Pipelines em um novo cluster do GKE.
Abra o AI Platform Pipelines no Console do Google Cloud.
Clique em Selecionar projeto. Será exibida uma caixa de diálogo solicitando que você selecione um projeto do Google Cloud.
Selecione o projeto do Google Cloud que você quer usar com este guia de início rápido e clique em Abrir.
Na barra de ferramentas do AI Platform Pipelines, clique em Nova instância. Os pipelines do Kubeflow serão abertos no Google Cloud Marketplace.
Clique em Configurar. Será aberto um formulário para que você configure a implantação do Kubeflow Pipelines.
Clique em Criar um novo cluster, se o link for exibido. Caso não for, vá para a próxima etapa.
Selecione us-central1-a como a Zona de cluster em que o cluster do GKE será criado.
Marque Permitir acesso às seguintes APIs do Cloud para conceder acesso aos recursos do Google Cloud aos aplicativos executados no cluster do GKE. Ao marcar essa caixa, você concede ao cluster acesso ao escopo de acesso
https://www.googleapis.com/auth/cloud-platform
. Esse escopo de acesso dá acesso total aos recursos do Google Cloud ativados no projeto. Conceder ao cluster acesso aos recursos do Google Cloud dessa maneira evita que você crie um secret do Kubernetes.Clique em Criar cluster para criar cluster do GKE. Esse processo leva alguns minutos para ser concluído.
Depois que seu cluster tiver sido criado, forneça as seguintes informações:
- Namespace: selecione padrão como o namespace.
- Nome da instância do aplicativo: digite pipelines-quickstart como o nome da instância.
Clique em Implantar para implantar o Kubeflow Pipelines no novo cluster do GKE.
O processo de implantação leva vários minutos para ser concluído. Depois de concluído, vá para a próxima seção.
Executar um pipeline de exemplo
Use as instruções a seguir para executar um exemplo de pipeline na nova instância do AI Platform Pipelines.
Abra o AI Platform Pipelines no Console do Google Cloud.
Encontre o cluster do AI Platform Pipelines chamado pipelines-quickstart e, então, clique em Abrir o painel de pipelines para abrir o Kubeflow Pipelines. O painel do Kubeflow Pipelines será aberto, exibindo a página Primeiros passos.
Use a página Primeiros passos no painel para saber mais sobre os pipelines de demonstração e tutoriais fornecidos com o Kubeflow Pipelines ou para saber mais sobre como criar um pipeline.
No painel de navegação à esquerda, clique em Pipelines.
O Kubeflow Pipelines dá vários exemplos de pipelines. Clique em [Tutorial] Transmissão de dados em componentes Python. Será aberto um grafo que exibe as etapas no pipeline.
Para executar o pipeline uma vez, clique em Criar execução. No Kubeflow Pipelines, uma execução é uma execução única de um pipeline. Será aberto um formulário para você inserir os detalhes da execução.
Insira "Execução do pipeline do guia de início rápido" no Nome da execução.
Clique em Iniciar. O painel de pipelines exibirá uma lista de execuções de pipeline na página Experimentos. No Kubeflow Pipelines, é possível usar os experimentos para organizar as execuções de pipeline em grupos lógicos.
Clique na execução chamada Execução do pipeline do guia de início rápido. Será exibido o grafo da execução. Enquanto a execução estiver em andamento, o grafo será alterado à medida que cada etapa for executada.
Clique nas etapas do pipeline para explorar as entradas, saídas e registros da execução, entre outras informações.
Você executou um exemplo de pipeline na instância do AI Platform Pipelines.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Para evitar mais cobranças na sua conta do Google Cloud, use o as instruções a seguir para excluir a instância do AI Platform Pipelines e o cluster do GKE que você criou nas seções anteriores.Abra o AI Platform Pipelines no console do Google Cloud.
Marque a caixa de seleção da instância do AI Platform Pipelines chamada pipelines-quickstart.
Na barra de ferramentas do AI Platform Pipelines, clique em Excluir.
Na caixa de diálogo Excluir o Kubeflow Pipelines do cluster, selecione a caixa de seleção Excluir cluster. Marcar essa opção indica que você quer excluir o cluster do GKE criado para este guia de início rápido.
Clique em Excluir para excluir a instância do AI Platform Pipelines e o cluster do GKE.
A seguir
- Para saber mais sobre o AI Platform Pipelines e pipelines de ML, leia a introdução ao IA Platform Pipelines
- Orquestre o processo de ML como um pipeline.