Este guia explica como personalizar o Cloud Datalab adicionando bibliotecas do Python à instância da VM do Cloud Datalab.
Como adicionar bibliotecas do Python a uma instância do Cloud Datalab
O Cloud Datalab conta com um conjunto de bibliotecas. O objetivo das bibliotecas inclusas é oferecer suporte a cenários de análise, transformação e visualização de dados comuns. É possível adicionar mais bibliotecas do Python usando um dos três mecanismos a seguir:
Opção 1: adicione uma célula de código em um notebook e instale a biblioteca usando conda, substituindo
lib-name
e executando a célula:!conda install -y lib-name
Esta é a personalização mais fácil para necessidades individuais. Ela também envolve manutenção mínima, visto que a imagem subjacente do Cloud Datalab é atualizada sem a necessidade de executar novamente a célula de código.Opção 1.5: use o pip em vez do conda. As bibliotecas devem ser instaladas via conda quando possível, mas algumas só estão disponíveis via pip. Nesses casos, crie uma célula de código conforme acima, mas altere o conteúdo para o seguinte:
!pip install lib-name
Opção 2: crie um novo notebook e adicione uma célula de código com o conteúdo a seguir, substituindo conda por pip, se necessário, e substituindo
lib-name
. Lembre-se de remover-y
se estiver usando pip.%%bash echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh cat /content/datalab/.config/startup.sh
Execute a célula e reinicie a instância do Cloud Datalab clicando no ícone da contano canto superior direito do notebook do Cloud Datalab ou da página de listagem dos notebooks no seu navegador, selecionando Sobre o Datalab,
e depois clique na opção Reiniciar servidor na caixa de diálogo Sobre o Google Cloud Datalab.
Opção 3: herde do contêiner do Cloud Datalab Docker usando um mecanismo de personalização do Docker. Em comparação com as opções listadas acima, esta é muito mais pesada. No entanto, ela fornece flexibilidade máxima para usuários que pretendem personalizar muito o contêiner para uso por uma equipe ou organização. Para utilizar esse mecanismo, você precisa criar seu próprio contêiner, chamado "Dockerfile-extended-example" no exemplo abaixo, seguindo a documentação do Docker. Consulte também o exemplo de personalização no repositório do Cloud Datalab no GitHub.
EmDockerfile-extended-example.in
:FROM datalab ... pip install lib-name ...
Esta abordagem requer que você assuma o trabalho adicional de criar e manter sua própria imagem conforme o contêinerdatalab
subjacente evolui. Portanto, o uso dela é recomendável somente se os outros mecanismos descritos acima não atenderem às suas necessidades.