Introdução ao Vertex AI Workbench

As instâncias do Vertex AI Workbench são ambientes de programação baseados no Jupyter Notebook para todo o fluxo de trabalho de ciência de dados. Pode interagir com o Vertex AI e outros Google Cloud serviços a partir de um bloco de notas Jupyter de uma instância do Vertex AI Workbench.

As integrações e as funcionalidades do Vertex AI Workbench podem facilitar o acesso aos seus dados, o tratamento mais rápido dos dados, a programação de execuções de blocos de notas e muito mais.

As instâncias do Vertex AI Workbench são pré-instaladas com o JupyterLab e têm um conjunto pré-instalado de pacotes de aprendizagem avançada, incluindo suporte para as frameworks TensorFlow e PyTorch. Pode configurar instâncias apenas com CPU ou com GPU.

As instâncias do Vertex AI Workbench suportam a capacidade de sincronização com um repositório do GitHub.

As instâncias do Vertex AI Workbench estão protegidas por Google Cloud autenticação e autorização.

Acesso aos dados

Pode aceder aos seus dados sem sair da interface do utilizador do JupyterLab.

No menu de navegação do JupyterLab numa instância do Vertex AI Workbench, pode usar a integração do Cloud Storage para procurar dados e outros ficheiros aos quais tem acesso. Consulte o artigo Aceda a contentores e ficheiros do Cloud Storage a partir do JupyterLab.

Também pode usar a integração do BigQuery para procurar tabelas às quais tem acesso, escrever consultas, pré-visualizar resultados e carregar dados para o seu bloco de notas. Consulte dados de tabelas do BigQuery a partir do JupyterLab.

Executar execuções de blocos de notas

Use o executor para executar um ficheiro de bloco de notas como uma execução única ou de acordo com um agendamento. Escolha o ambiente e o hardware específicos nos quais quer que a execução seja realizada. O código do seu bloco de notas é executado no preparação personalizada do Vertex AI, o que pode facilitar a preparação distribuída, a otimização de hiperparâmetros ou o agendamento de tarefas de preparação contínua.

Pode usar parâmetros na execução para fazer alterações específicas a cada execução. Por exemplo, pode especificar um conjunto de dados diferente para usar, alterar a taxa de aprendizagem no seu modelo ou alterar a versão do modelo.

Também pode definir um bloco de notas para ser executado num horário recorrente. Mesmo quando a instância está encerrada, o Vertex AI Workbench executa o ficheiro de bloco de notas e guarda os resultados para que os possa consultar e partilhar com outras pessoas. Consulte o artigo Agende a execução de um bloco de notas.

Partilhe estatísticas

As execuções de blocos de notas são armazenadas num contentor do Cloud Storage, para que possa partilhar as suas estatísticas com outras pessoas concedendo acesso aos resultados. Consulte a secção anterior sobre a execução de execuções de blocos de notas.

Proteja a sua instância

As secções seguintes descrevem as capacidades suportadas que podem ajudar a proteger a sua instância do Vertex AI Workbench.

VPC

Pode implementar a sua instância do Vertex AI Workbench com a rede gerida pela Google predefinida, que usa uma rede VPC e uma sub-rede predefinidas. Em vez da rede predefinida, pode especificar uma rede VPC para usar com a sua instância.

Para usar o Vertex AI Workbench num perímetro de serviço, consulte o artigo Use uma instância do Vertex AI Workbench num perímetro de serviço.

Chaves de encriptação geridas pelo cliente (CMEK)

Por predefinição, Google Cloud encripta automaticamente os dados quando estão em repouso através de chaves de encriptação geridas pela Google. Se tiver requisitos regulamentares ou de conformidade específicos relacionados com as chaves que protegem os seus dados, pode usar chaves de encriptação geridas pelo cliente (CMEK) com as suas instâncias do Vertex AI Workbench. Para mais informações, consulte o artigo Chaves de encriptação geridas pelo cliente.

Computação confidencial

Pode encriptar os seus dados em utilização através da computação confidencial. Para usar a computação confidencial, ative o serviço de VM confidencial quando criar uma instância do Vertex AI Workbench. Para começar, consulte o artigo Crie uma instância com computação confidencial.

Encerramento automático para instâncias inativas

Para ajudar a gerir os custos, as instâncias do Vertex AI Workbench são encerradas após ficarem inativas durante um período específico por predefinição. Pode alterar o período ou desativar esta funcionalidade. Para mais informações, consulte o artigo Desligamento por inatividade.

Adicione ambientes conda

As instâncias do Vertex AI Workbench usam kernels com base em ambientes conda. Pode adicionar um ambiente conda à sua instância do Vertex AI Workbench, e o ambiente aparece como um kernel na interface do JupyterLab da sua instância.

A adição de ambientes conda permite-lhe usar kernels que não estão disponíveis na instância predefinida do Vertex AI Workbench. Por exemplo, pode adicionar ambientes conda para R e Apache Beam. Em alternativa, pode adicionar ambientes conda para versões anteriores específicas das frameworks disponíveis, como o TensorFlow, o PyTorch ou o Python.

Para mais informações, consulte o artigo Adicione um ambiente conda.

Contentores personalizados

Pode criar uma instância do Vertex AI Workbench com base num contentor personalizado. Comece com uma imagem de contentor de base fornecida pela Google e modifique-a de acordo com as suas necessidades. Em seguida, crie uma instância com base no seu contentor personalizado.

Para mais informações, consulte o artigo Crie uma instância com um contentor personalizado.

Integração do Dataproc

Pode processar dados rapidamente executando um bloco de notas num cluster do Dataproc. Depois de configurar o cluster, pode executar um ficheiro de bloco de notas no mesmo sem sair da interface do utilizador do JupyterLab. Para mais informações, consulte o artigo Crie uma instância com o Dataproc ativado.

Reserve recursos de VM

Use as reservas do Compute Engine para ter um elevado nível de garantia de que as suas instâncias do Vertex AI Workbench têm recursos de máquinas virtuais (VMs) suficientes para serem executadas.

As reservas são uma funcionalidade do Compute Engine. Ajudam a garantir que tem os recursos disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar deles.

Para mais informações, consulte o artigo Use reservas.

Crie instâncias com credenciais de terceiros

Pode criar e gerir instâncias do Vertex AI Workbench com credenciais de terceiros fornecidas pela Workforce Identity Federation. A federação de identidades da força de trabalho usa o seu fornecedor de identidade (IdP) externo para conceder a um grupo de utilizadores acesso a instâncias do Vertex AI Workbench através de um proxy.

O acesso a uma instância do Vertex AI Workbench é concedido através da atribuição de um principal do workforce pool à conta de serviço da instância do Vertex AI Workbench.

Para mais informações, consulte o artigo Crie uma instância com credenciais de terceiros.

Etiquetas para instâncias do Vertex AI Workbench

A VM subjacente de uma instância do Vertex AI Workbench é uma VM do Compute Engine. Pode adicionar e gerir etiquetas de recursos à sua instância do Vertex AI Workbench através da respetiva VM do Compute Engine.

Quando cria uma instância do Vertex AI Workbench, o Vertex AI Workbench anexa a etiqueta de recurso do Compute Engine vertex-workbench-instances:prod=READ_ONLY. Esta etiqueta de recurso é usada apenas para fins internos.

Para saber como gerir etiquetas para instâncias do Compute Engine, consulte o artigo Gerir etiquetas para recursos.

Limitações

Considere as seguintes limitações das instâncias do Vertex AI Workbench ao planear o seu projeto:

  • As extensões do JupyterLab de terceiros não são suportadas.

  • Quando usa o Access Context Manager e o Chrome Enterprise Premium para proteger instâncias do Vertex AI Workbench com controlos de acesso sensíveis ao contexto, o acesso é avaliado sempre que o utilizador se autentica na instância. Por exemplo, o acesso é avaliado na primeira vez que o utilizador acede ao JupyterLab e sempre que acede posteriormente, se o cookie do navegador de Internet tiver expirado.

  • A utilização de um contentor personalizado que não seja derivado do contentor base fornecido pela Google (gcr.io/deeplearning-platform-release/workbench-container:latest) aumenta os riscos de problemas de compatibilidade com os nossos serviços e não é suportada. Em alternativa, modifique o contentor base para criar um contentor personalizado que satisfaça as suas necessidades e, em seguida, crie uma instância com o contentor personalizado.

  • As instâncias do Vertex AI Workbench esperam imagens do projeto cloud-notebooks-managed. A lista de nomes de imagens está disponível na página de criação na Google Cloud consola. Embora seja possível usar imagens de máquinas virtuais (VM) personalizadas ou imagens de VM de aprendizagem profunda com instâncias do Vertex AI Workbench, o Vertex AI Workbench não oferece apoio técnico para comportamentos ou avarias inesperados quando usa essas imagens.

  • A utilização de uma imagem de blocos de notas geridos pelo utilizador ou de uma imagem de blocos de notas geridos para criar uma instância do Vertex AI Workbench não é suportada.

  • Não pode editar a VM subjacente de uma instância do Vertex AI Workbench através da Google Cloud consola ou da API Compute Engine. Para editar a VM subjacente de uma instância do Vertex AI Workbench, use o método projects.locations.instances.patch na API Notebooks ou o comando gcloud workbench instances update no Google Cloud SDK.

  • Em instâncias que usam os VPC Service Controls, a utilização do executor não é suportada.

  • Para usar aceleradores com instâncias do Vertex AI Workbench, o tipo de acelerador que quer tem de estar disponível na zona da sua instância. Para saber mais sobre a disponibilidade de aceleradores por zona, consulte o artigo Disponibilidade de regiões e zonas de GPU.

O que se segue?