Configurar um pipeline de ML usando pipelines do AI Platform

Neste guia de início rápido, você verá uma introdução breve sobre o AI Platform Pipelines. Neste guia, você instalará os pipelines do Kubeflow (em inglês) com o TensorFlow Extended (em inglês) em um novo cluster do Google Kubernetes Engine (GKE) e, então, executará um pipeline de exemplo.

Este tópico é voltado a usuários iniciantes no AI Platform Pipelines.

Antes de começar

Antes de seguir este guia, verifique se o projeto do Google Cloud está configurado corretamente e se você tem permissões suficientes para implantar do AI Platform Pipelines.

  1. Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
  2. No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

    Acessar o seletor de projetos

  3. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  4. No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

    Acessar o seletor de projetos

  5. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  6. Use as instruções a seguir para verificar se você recebeu os papéis necessários para implantar o AI Platform Pipelines.
    1. Abra uma sessão do Cloud Shell.

      Abrir o Cloud Shell

      O Cloud Shell é aberto em um frame na parte inferior do Console do Google Cloud.

    2. É necessário ter os papéis de Visualizador (roles/viewer) e de administrador do Kubernetes Engine (roles/container.admin) no projeto ou outros papéis com as mesmas permissões, como Proprietário (roles/owner) no projeto, para implantar o AI Platform Pipelines. Execute o comando a seguir no Cloud Shell para listar os principais com os papéis de Visualizador e Administrador do Kubernetes Engine.

      gcloud projects get-iam-policy PROJECT_ID \
        --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \
        --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"

      Substitua PROJECT_ID pelo ID do projeto do Google Cloud.

      Use a saída desse comando para verificar se a conta tem os papéis de Leitor e Administrador do Kubernetes Engine.

    3. Se você não tiver recebido os papéis necessários, entre em contato com o administrador do projeto do Google Cloud para receber mais ajuda.

      Saiba mais sobre como conceder papéis do Identity and Access Management.

Configurar a instância do AI Platform Pipelines

Use as instruções a seguir para configurar o AI Platform Pipelines em um novo cluster do GKE.

  1. Abra o AI Platform Pipelines no Console do Google Cloud.

    Acesse o AI Platform Pipelines

  2. Clique em Selecionar projeto. Será exibida uma caixa de diálogo solicitando que você selecione um projeto do Google Cloud.

  3. Selecione o projeto do Google Cloud que você quer usar com este guia de início rápido e clique em Abrir.

  4. Na barra de ferramentas do AI Platform Pipelines, clique em Nova instância. Os pipelines do Kubeflow serão abertos no Google Cloud Marketplace.

  5. Clique em Configurar. Será aberto um formulário para que você configure a implantação do Kubeflow Pipelines.

  6. Clique em Criar um novo cluster, se o link for exibido. Caso não for, vá para a próxima etapa.

  7. Selecione us-central1-a como a Zona de cluster em que o cluster do GKE será criado.

  8. Marque Permitir acesso às seguintes APIs do Cloud para conceder acesso aos recursos do Google Cloud aos aplicativos executados no cluster do GKE. Ao marcar essa caixa, você concede ao cluster acesso ao escopo de acesso https://www.googleapis.com/auth/cloud-platform. Esse escopo de acesso dá acesso total aos recursos do Google Cloud ativados no projeto. Conceder ao cluster acesso aos recursos do Google Cloud dessa maneira evita que você crie um secret do Kubernetes.

  9. Clique em Criar cluster para criar cluster do GKE. Esse processo leva alguns minutos para ser concluído.

  10. Depois que seu cluster tiver sido criado, forneça as seguintes informações:

    • Namespace: selecione padrão como o namespace.
    • Nome da instância do aplicativo: digite pipelines-quickstart como o nome da instância.
  11. Clique em Implantar para implantar o Kubeflow Pipelines no novo cluster do GKE.

O processo de implantação leva vários minutos para ser concluído. Depois de concluído, vá para a próxima seção.

Executar um pipeline de exemplo

Use as instruções a seguir para executar um exemplo de pipeline na nova instância do AI Platform Pipelines.

  1. Abra o AI Platform Pipelines no Console do Google Cloud.

    Acesse o AI Platform Pipelines

  2. Encontre o cluster do AI Platform Pipelines chamado pipelines-quickstart e, então, clique em Abrir o painel de pipelines para abrir o Kubeflow Pipelines. O painel do Kubeflow Pipelines será aberto, exibindo a página Primeiros passos.

  3. Use a página Primeiros passos no painel para saber mais sobre os pipelines de demonstração e tutoriais fornecidos com o Kubeflow Pipelines ou para saber mais sobre como criar um pipeline.

    No painel de navegação à esquerda, clique em Pipelines.

  4. O Kubeflow Pipelines dá vários exemplos de pipelines. Clique em [Tutorial] Transmissão de dados em componentes Python. Será aberto um grafo que exibe as etapas no pipeline.

  5. Para executar o pipeline uma vez, clique em Criar execução. No Kubeflow Pipelines, uma run é uma execução única de um pipeline. Será aberto um formulário para você inserir os detalhes da execução.

  6. Insira "Execução do pipeline do guia de início rápido" no Nome da execução.

  7. Clique em Iniciar. O painel de pipelines exibirá uma lista de execuções de pipeline na página Experimentos. No Kubeflow Pipelines, é possível usar os experimentos para organizar as execuções de pipeline em grupos lógicos.

  8. Clique na execução chamada Execução do pipeline do guia de início rápido. Será exibido o grafo da execução. Enquanto a execução estiver em andamento, o grafo será alterado à medida que cada etapa for executada.

  9. Clique nas etapas do pipeline para explorar as entradas, saídas e registros da execução, entre outras informações.

Você executou um exemplo de pipeline na instância do AI Platform Pipelines.

Limpar

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.

Para evitar mais cobranças na sua conta do Google Cloud, use as instruções a seguir para excluir a instância do AI Platform Pipelines e o cluster do GKE que você criou nas seções anteriores.

  1. Abra o AI Platform Pipelines no Console do Google Cloud.

    Acesse o AI Platform Pipelines

  2. Marque a caixa de seleção da instância do AI Platform Pipelines chamada pipelines-quickstart.

  3. Na barra de ferramentas do AI Platform Pipelines, clique em Excluir.

  4. Na caixa de diálogo Excluir o Kubeflow Pipelines do cluster, selecione a caixa de seleção Excluir cluster. Marcar essa opção indica que você quer excluir o cluster do GKE criado para este guia de início rápido.

  5. Clique em Excluir para excluir a instância do AI Platform Pipelines e o cluster do GKE.

A seguir