Python-Bibliotheken zu einer Cloud Datalab-Instanz hinzufügen

In dieser Anleitung wird gezeigt, wie Sie Cloud Datalab anpassen, indem Sie Python-Bibliotheken zu einer Cloud Datalab-VM-Instanz hinzufügen.

Python-Bibliotheken zu einer Cloud Datalab-Instanz hinzufügen

Cloud Datalab umfasst eine Reihe von Bibliotheken. Die enthaltenen Bibliotheken sollen allgemeine Datenanalyse-, Transformations- und Visualisierungsszenarien unterstützen. Sie haben drei Möglichkeiten, um zusätzliche Python-Bibliotheken hinzuzufügen:

  • Option 1: Fügen Sie eine Codezelle in ein Notebook ein und installieren Sie die Bibliothek mit conda. Führen Sie anschließend die Codezelle aus und geben Sie für lib-name Ihren Bibliotheksnamen an:

    !conda install -y lib-name
    
    Dies ist die einfachste Möglichkeit für individuelle Anpassungen. Der Wartungsaufwand ist gering, wenn das zugrunde liegende Cloud Datalab-Image aktualisiert wird, da die erneute Ausführung der Codezelle problemlos möglich ist.

  • Option 1.5: Verwenden Sie pip anstelle von conda. Bibliotheken sollten nach Möglichkeit über conda installiert werden, einige Bibliotheken sind jedoch nur über pip verfügbar. Erstellen Sie in diesen Fällen eine Codezelle wie oben, verwenden Sie jedoch folgenden Inhalt:

    !pip install lib-name
    

  • Option 2: Erstellen Sie ein neues Notebook und fügen Sie eine Codezelle mit dem folgenden Inhalt hinzu, wobei Sie für lib-name Ihren Bibliotheksnamen angeben und bei Bedarf conda durch pip ersetzen: Denken Sie daran, bei pip -y zu entfernen.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Führen Sie die Zelle aus und starten Sie die Cloud Datalab-Instanz neu. Klicken Sie dazu rechts oben im Cloud Datalab-Notebook oder auf der Seite mit der Notebookliste im Browser auf das Kontosymbol Nutzersymbol und wählen Sie Informationen zu Datalab aus.
    Klicken Sie dann im Dialogfeld Informationen zu Google Cloud Datalab auf die Option Server neu starten.

  • Option 3: Übernehmen Sie die Bibliotheken aus dem Cloud Datalab Docker-Container mit einem Docker-Anpassungsverfahren. Diese Option ist im Vergleich zu den oben aufgeführten Optionen wesentlich komplexer. Wenn der Container für die Verwendung durch ein Team oder eine Organisation umfassend angepasst werden soll, bietet diese Option jedoch eine maximale Flexibilität. Für dieses Verfahren müssen Sie einen eigenen Container – im Folgenden als "Dockerfile-extended-example" bezeichnet – erstellen. Dies wird in der Docker-Dokumentation beschrieben. Außerdem wird auf das Anpassungsbeispiel im Cloud Datalab GitHub-Repository verwiesen.

    In Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Bei dieser Lösung müssen Sie zusätzlich ein eigenes Image erstellen und verwalten, da sich der zugrunde liegende datalab-Container ändert. Deshalb wird diese Lösung nur empfohlen, wenn die anderen oben beschriebenen Vorgehensweisen für Ihre Anforderungen nicht ausreichend sind.