Como escolher um tipo de VM

Nesta página, apresentamos as considerações a serem feitas ao escolher o tipo de máquina certo do Google Compute Engine para a instância da máquina virtual (VM, na sigla em inglês) do Cloud Datalab.

Considerações ao escolher um tipo de VM

No momento da criação de uma instância de VM do Datalab, é possível especificar um tipo de máquina do Google Compute Engine. O tipo de máquina padrão usado é n1-standard-1. É possível selecionar outro tipo de máquina com base nas características de desempenho e custo, de modo a atender às necessidades de análise de dados. Eis algumas considerações importantes na seleção de um tipo de máquina:

  • Cada bloco de notas usa um kernel de Python para executar o código em um processo próprio. Por exemplo, se N blocos de notas estiverem abertos, existirão pelo menos N processos correspondentes aos blocos.
  • Cada kernel é do tipo single-thread. A menos que você esteja executando vários blocos de notas simultaneamente, ter vários núcleos pode não trazer benefícios significativos.
  • Dependendo do seu padrão de uso e da quantidade de dados processados, selecionar uma máquina com memória adicional pode ser muito vantajoso.
  • A execução é cumulativa. Ao executar três células de notebook do Cloud Datalab sequencialmente, há um acúmulo do estado correspondente, incluindo a memória alocada para as estruturas de dados utilizadas nessas células.
  • Processar muitos dados na memória (por exemplo, ao usar DataFrames do Pandas) resulta na alocação proporcional da memória. Quando a execução de um notebook for concluída, encerre a sessão clicando no ícone sessions-icon na barra superior. Talvez seja necessário redimensionar a janela para que ele seja exibido.
  • O Cloud Datalab usa um arquivo de troca baseado em disco como sobrecarga para outros requisitos de memória. No entanto, isso pode desacelerar o processamento. O ideal é estimar as necessidades de memória e escolher um tipo de máquina que atenda à quantidade mínima estimada.

Como escolher um tipo de máquina

Será preciso escolher um tipo de máquina para sua instância de VM do Cloud Datalab durante o processo de criação da instância. Consulte datalab create --machine-type para mais informações. Veja um exemplo:

datalab create --machine-type n1-highmem-2 instance-name