Como adicionar bibliotecas Python a uma instância do Cloud Datalab

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Este guia explica como personalizar o Cloud Datalab adicionando bibliotecas do Python à instância da VM do Cloud Datalab.

Como adicionar bibliotecas do Python a uma instância do Cloud Datalab

O Cloud Datalab conta com um conjunto de bibliotecas. O objetivo das bibliotecas inclusas é oferecer suporte a cenários de análise, transformação e visualização de dados comuns. É possível adicionar mais bibliotecas do Python usando um dos três mecanismos a seguir:

  • Opção 1: adicione uma célula de código em um notebook e instale a biblioteca usando conda, substituindo lib-name e executando a célula:

    !conda install -y lib-name
    
    Esta é a personalização mais fácil para necessidades individuais. Ela também envolve manutenção mínima, visto que a imagem subjacente do Cloud Datalab é atualizada sem a necessidade de executar novamente a célula de código.

  • Opção 1.5: use o pip em vez do conda. As bibliotecas devem ser instaladas via conda quando possível, mas algumas só estão disponíveis via pip. Nesses casos, crie uma célula de código conforme acima, mas altere o conteúdo para o seguinte:

    !pip install lib-name
    

  • Opção 2: crie um novo notebook e adicione uma célula de código com o conteúdo a seguir, substituindo conda por pip, se necessário, e substituindo lib-name. Lembre-se de remover -y se estiver usando pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Execute a célula e reinicie a instância do Cloud Datalab clicando no ícone da conta user-icon no canto superior direito do notebook do Cloud Datalab ou da página de listagem dos notebooks no seu navegador, selecionando Sobre o Datalab,
    e depois clique na opção Reiniciar servidor na caixa de diálogo Sobre o Google Cloud Datalab.

  • Opção 3: herde do contêiner do Cloud Datalab Docker usando um mecanismo de personalização do Docker. Em comparação com as opções listadas acima, esta é muito mais pesada. No entanto, ela fornece flexibilidade máxima para usuários que pretendem personalizar muito o contêiner para uso por uma equipe ou organização. Para utilizar esse mecanismo, você precisa criar seu próprio contêiner, chamado "Dockerfile-extended-example" no exemplo abaixo, seguindo a documentação do Docker. Consulte também o exemplo de personalização no repositório do Cloud Datalab no GitHub.

    Em Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Esta abordagem requer que você assuma o trabalho adicional de criar e manter sua própria imagem conforme o contêiner datalab subjacente evolui. Portanto, o uso dela é recomendável somente se os outros mecanismos descritos acima não atenderem às suas necessidades.