Como gerenciar o ciclo de vida de uma instância do Cloud Datalab

Esta página descreve o ciclo de vida de uma instância do Cloud Datalab e as opções disponíveis para gerenciar e conservar recursos de computação.

O Cloud Datalab é executado em uma VM do Google Compute Engine com um disco permanente conectado, usado para armazenar notebooks. As VMs do Cloud Datalab estão conectadas a uma rede especial em um projeto chamado datalab-network. A configuração padrão desta rede limita as conexões recebidas às conexões SSH.

Pré-requisitos

Para usar os comandos discutidos abaixo, é necessário que você tenha:

  1. instalado o SDK do Cloud, inclusive o componente datalab
  2. autenticado com a ferramenta de linha de comando gcloud
  3. configurado a ferramenta de linha de comando gcloud para usar o projeto e a zona selecionados

Como criar uma instância

Uma instância do Cloud Datalab é criada usando o comando datalab create.

datalab create instance-name

Há várias opções de linha de comando disponíveis com este comando. Por exemplo, se você quiser criar uma instância com mais memória que a padrão, é possível transmitir na sinalização --machine-type:

datalab create --machine-type n1-highmem-2 instance-name

Para listar todas as opções disponíveis, execute:

datalab create --help

Por padrão, o comando datalab create se conecta à instância recém-criada. Para criar a instância, mas não se conectar a ela, transmita a sinalização --no-connect:

datalab create --no-connect instance-name

O comando datalab create também cria os seguintes recursos do Google Cloud Platform (se ainda não estiverem disponíveis):

  • A rede datalab-network
  • Uma regra de firewall em datalab-network que permite a entrada de conexões SSH
  • O Google Cloud Source Repository datalab-notebooks
  • O disco permanente para o armazenamento de notebooks do Cloud Datalab.

Observe que algumas das etapas acima podem precisar de permissão do proprietário (consulte o artigo Como usar o Datalab em um ambiente de equipe).

Como se conectar a uma instância

A ferramenta datalab pode criar um túnel SSH permanente para sua instância do Cloud Datalab que permite que você se conecte à instância a partir do seu navegador local como se o Cloud Datalab estivesse em execução na sua máquina local.

Para criar esta conexão, use o comando datalab connect:

datalab connect instance-name

O comando datalab connect reinicia a instância se ela não estiver em execução. O comando continua em execução até que você o interrompa (a conexão permanece disponível durante a execução do comando).

Por padrão, a porta local usada para a conexão é 8081. Para alterar para uma porta diferente, transmita a sinalização --port. Para usar a porta local 8082, por exemplo, execute o seguinte:

datalab connect --port 8082 instance-name

Como interromper uma instância

Execute o comando a seguir para interromper sua instância do Cloud Datalab e evitar custos desnecessários quando não quiser usá-lo.

datalab stop instance-name

Quando estiver pronto para usar o Cloud Datalab novamente, execute o comando datalab connect para reiniciar a instância.

Como atualizar a VM do Cloud Datalab sem excluir o disco dos blocos de notas

Para atualizar para uma nova versão do Cloud Datalab ou alterar as propriedades da VM, como tipo de máquina ou conta de serviço, é possível excluir e recriar a VM do Cloud Datalab sem perder seus notebooks armazenados no disco permanente.

datalab delete --keep-disk instance-name
datalab create instance-name

Como excluir uma instância e o disco dos notebooks

Por padrão, o comando datalab delete não exclui o disco permanente que contém seus notebooks. Isto permite a alteração fácil da VM sem a perda acidental de dados (consulte Como excluir e recriar uma instância sem excluir o disco dos notebooks).

Se você quiser excluir a VM e o disco permanente anexado, adicione a sinalização --delete-disk ao comando:

datalab delete --delete-disk instance-name

Como reduzir o uso de recursos de computação

Há uma cobrança pelas VMs do Google Compute Engine. Você será cobrado pelo tempo de execução da instância do Cloud Datalab, esteja ela em uso ou não. Você pode reduzir a cobrança gerada pela VM do Cloud Datalab interrompendo a instância quando ela não estiver em uso. Você continuará sendo cobrado pelos recursos anexados à VM, como disco permanente e endereço IP externo, exceto quando a instância da VM tiver sido interrompida.

Quando você precisar usar a instância interrompida novamente, execute datalab connect instance-name para se conectar a ela. Assim a ferramenta datalab a reiniciará antes de tentar a conexão.

Para interromper todas as cobranças associadas a uma instância do Cloud Datalab, é preciso excluir a VM e o disco permanente anexado executando o comando datalab delete com a opção --delete-disk.