Ajouter des bibliothèques Python à une instance Cloud Datalab

Ce guide explique comment personnaliser Cloud Datalab en ajoutant des bibliothèques Python à votre instance de VM Cloud Datalab.

Ajouter des bibliothèques Python à une instance Cloud Datalab

Cloud Datalab comprend un ensemble de bibliothèques. Ces bibliothèques sont compatibles avec des scénarios courants d’analyse, de transformation et de visualisation des données. Vous pouvez ajouter des bibliothèques Python supplémentaires à l'aide de l'une des trois méthodes suivantes :

  • Option 1 : ajoutez une cellule de code dans un notebook et installez la bibliothèque à l'aide de conda, en remplaçant lib-name et en exécutant la cellule :

    !conda install -y lib-name
    
    Il s'agit du moyen le plus simple de personnaliser Cloud Datalab pour répondre à des besoins particuliers. Cette méthode ne requiert pratiquement pas de maintenance, car l'image Cloud Datalab sous-jacente est mise à jour pour éviter de réexécuter la cellule de code.

  • Option 1.5 : utilisez pip au lieu de conda. Les bibliothèques doivent être installées à l'aide de conda dans la mesure du possible, mais certaines bibliothèques ne sont disponibles que via pip. Pour ces bibliothèques, créez une cellule de code comme ci-dessus et modifiez le contenu comme suit :

    !pip install lib-name
    

  • Option 2 : créez un notebook et ajoutez une cellule de code avec le contenu suivant, en indiquant pip à la place de conda si nécessaire et en remplaçant lib-name. N'oubliez pas de supprimer -y si vous utilisez pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Exécutez la cellule, puis redémarrez l'instance Cloud Datalab. Pour cela, cliquez sur l'icône de compte user-icon dans l'angle supérieur droit du notebook Cloud Datalab ou de la page répertoriant les notebooks dans votre navigateur, et sélectionnez About Datalab (À propos de Datalab).
    Cliquez ensuite sur l'option Restart Server (Redémarrer le serveur) dans la boîte de dialogue About Datalab (À propos de Google Cloud Datalab).

  • Option 3 : héritez du conteneur Docker Cloud Datalab à l'aide d'un mécanisme de personnalisation Docker. Cette option est beaucoup plus lourde que celles énumérées ci-dessus. Cependant, elle offre une flexibilité maximale à ceux qui envisagent de personnaliser considérablement le conteneur destiné à être utilisé par une équipe ou une organisation. Pour utiliser ce mécanisme, vous devez créer votre propre conteneur (nommé "Dockerfile-extended-example" ci-dessous) en suivant les instructions de la documentation Docker. Consultez également l'exemple de personnalisation dans le dépôt GitHub Cloud Datalab.

    Dans Dockerfile-extended-example.in :

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Cette approche vous oblige à créer et à gérer votre propre image à mesure que le conteneur datalab sous-jacent évolue. Par conséquent, il est recommandé d'utiliser cette approche uniquement si les autres méthodes décrites ci-dessus ne répondent pas à vos besoins.