Aggiunta di librerie Python a un'istanza Cloud Datalab

Questa guida spiega come personalizzare Cloud Datalab aggiungendo le librerie Python all'istanza VM di Cloud Datalab.

Aggiunta di librerie Python a un'istanza Cloud Datalab

Cloud Datalab include un set di librerie. Le librerie incluse sono destinate a supportare scenari comuni di analisi, trasformazione e visualizzazione dei dati. Puoi aggiungere altre librerie Python utilizzando uno dei seguenti tre meccanismi:

  • Opzione 1: aggiungi una cella di codice in un blocco note e installa la libreria utilizzando conda, sostituendo lib-name ed eseguendo la cella:

    !conda install -y lib-name
    
    Questo è il modo più semplice per personalizzare per esigenze individuali e prevede una manutenzione minima, in quanto l'immagine Cloud Datalab sottostante viene aggiornata, perché la ripetizione della cella di codice è banale.

  • Opzione 1.5: usa pip anziché conda. Le librerie devono essere installate tramite conda, quando possibile, ma alcune librerie sono disponibili solo tramite pip. In questi casi, crea una cella di codice come sopra, ma modifica i contenuti come segue:

    !pip install lib-name
    

  • Opzione 2: crea un nuovo blocco note e aggiungi una cella di codice con i seguenti contenuti, sostituendo conda con pip se necessario e sostituendo lib-name. Ricorda di rimuovere -y se utilizzi pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Esegui la cella, quindi riavvia l'istanza di Cloud Datalab facendo clic sull'icona dell'account icona utente nell'angolo in alto a destra della pagina del blocco note o del blocco note del browser nel tuo browser, selezionando Informazioni su Datalab,
    e facendo clic sull'opzione Riavvia il server nella finestra di dialogo Informazioni su Google Cloud Datalab.

  • Opzione 3: eredita dal container Docker di Cloud Datalab utilizzando un meccanismo di personalizzazione Docker. Questa opzione è molto più complessa rispetto alle altre opzioni elencate sopra. Tuttavia, offre la massima flessibilità a coloro che intendono personalizzare il contenitore per l'utilizzo da parte di un team o un'organizzazione. Per utilizzare questo meccanismo devi creare il tuo container, denominato "Dockerfile-extended-example", di seguito, seguendo la documentazione di Docker. Vedi anche l'esempio di personalizzazione nel repository GitHub di Cloud Datalab.

    Tra Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Questo approccio richiede un ulteriore lavoro di creazione e manutenzione della tua immagine man mano che il container datalab sottostante si evolve. Pertanto, ti consigliamo di utilizzare questo approccio solo se gli altri meccanismi sopra descritti non soddisfano le tue esigenze.