Aggiunta di librerie Python a un'istanza Cloud Datalab

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Questa guida spiega come personalizzare Cloud Datalab aggiungendo librerie Python all'istanza VM di Cloud Datalab.

Aggiunta di librerie Python a un'istanza Cloud Datalab

Cloud Datalab include un set di librerie. Le librerie incluse sono pensate per supportare scenari comuni di analisi, trasformazione e visualizzazione dei dati. Puoi aggiungere altre librerie Python utilizzando uno dei tre meccanismi seguenti:

  • Opzione 1: aggiungi una cella di codice in un blocco note e installa la libreria utilizzando conda, sostituendo lib-name ed eseguendo la cella:

    !conda install -y lib-name
    
    Questo è il modo più semplice per eseguire la personalizzazione in base alle singole esigenze e richiede la manutenzione minima perché l'immagine Cloud Datalab sottostante viene aggiornata perché il reesecuzione della cella di codice è banale.

  • Opzione 1.5: utilizza pip invece di conda. Le librerie devono essere installate tramite conda quando possibile, ma alcune librerie sono disponibili solo tramite pip. In questi casi, crea una cella di codice come sopra, ma modifica i contenuti come segue:

    !pip install lib-name
    

  • Opzione 2: crea un nuovo blocco note e aggiungi una cella di codice con i contenuti seguenti, sostituendo conda con pip se necessario e sostituendo lib-name. Ricorda di rimuovere -y se usi pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Esegui la cella, quindi riavvia l'istanza di Cloud Datalab facendo clic sull'icona dell'account icona utente nell'angolo in alto a destra della pagina di elenco del blocco note o del blocco note di Cloud nel browser, selezionando Informazioni su Datalab,
    e quindi facendo clic sull'opzione Riavvia il server dalla finestra di dialogo Informazioni su Google Cloud Datalab.

  • Opzione 3: eredita dal container Docker di Cloud Datalab utilizzando un meccanismo di personalizzazione Docker. Questa opzione è molto più complessa rispetto alle altre opzioni elencate sopra. Tuttavia, offre la massima flessibilità per chi vuole personalizzare il container in modo significativo affinché sia utilizzato da un team o da un'organizzazione. Per utilizzare questo meccanismo devi creare il tuo container (denominato "Dockerfile-extended-example", di seguito) seguendo la documentazione di Docker. Vedi anche l'esempio di personalizzazione nel repository GitHub di Cloud Datalab.

    Tra Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Questo approccio richiede l'esecuzione di ulteriori operazioni di creazione e gestione della tua immagine man mano che il container datalab sottostante si evolve. Pertanto, ti consigliamo di utilizzare questo approccio solo se gli altri meccanismi descritti in precedenza non soddisfano le tue esigenze.