Agrega bibliotecas de Python a una instancia de Cloud Datalab

En esta guía, se explica cómo personalizar Cloud Datalab mediante la adición de bibliotecas de Python a la instancia de VM de Cloud Datalab.

Agrega bibliotecas de Python a una instancia de Cloud Datalab

Cloud Datalab incluye un conjunto de bibliotecas cuyo fin es permitir la compatibilidad con situaciones comunes de análisis, transformación y visualización de datos. Puedes agregar bibliotecas de Python adicionales mediante uno de los siguientes tres mecanismos:

  • Opción 1. Agrega una celda de código en un notebook y, luego, instala la biblioteca mediante Conda, para ello, reemplaza lib-name y ejecuta la celda:

    !conda install -y lib-name
    
    Esta es la forma más sencilla de realizar una personalización en función de las necesidades individuales; además, implica un mantenimiento mínimo, puesto que la imagen subyacente de Cloud Datalab se actualiza. Esto sucede debido a que volver a ejecutar la celda de código no es importante.

  • Opción 1.5: Usa pip en vez de Conda. Las bibliotecas se deben instalar con Conda siempre que sea posible, pero algunas solo están disponibles mediante pip. En estos casos, crea una celda de código según lo anterior, pero cambia el contenido de la siguiente manera:

    !pip install lib-name
    

  • Opción 2. Crea un notebook nuevo y agrega una celda de código con el siguiente contenido, para ello, reemplaza Conda con pip, si es necesario, y sustituye lib-name. Recuerda quitar -y si usas pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Ejecuta la celda y, luego, reinicia la instancia de Cloud Datalab. Para ello, haz clic en el ícono de la cuenta user-icon en la esquina superior derecha del notebook de Cloud Datalab o la página con la lista de los notebooks en el navegador y selecciona About Datalab (Acerca de Datalab),
    . Luego, haz clic en la opción Restart Server (Reiniciar el servidor) del cuadro de diálogo About Google Cloud Datalab (Acerca de Google Cloud Datalab).

  • Opción 3. Hereda desde el contenedor de Docker de Cloud Datalab mediante el mecanismo de personalización de Docker. Esta opción es mucho más pesada en comparación con las opciones anteriores. Sin embargo, ofrece la mayor flexibilidad para quienes pretenden personalizar el contenedor de forma considerable a fin de que lo use un equipo o una organización. Si quieres usar este mecanismo, debes compilar un contenedor propio, que se denomina “Dockerfile-extended-example” más adelante. Para ello, sigue la documentación de Docker. Además, consulta el ejemplo de personalización en el repositorio de GitHub de Cloud Datalab.

    En Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Para este enfoque, es necesario que realices el trabajo adicional de compilar y mantener tu propia imagen a medida que evoluciona el contenedor datalab. Por lo tanto, solo se recomienda que lo uses si los otros mecanismos descritos con anterioridad no satisfacen tus necesidades.