Agregar bibliotecas de Python a una instancia de Cloud Datalab

En esta guía, se explica cómo personalizar Cloud Datalab mediante la adición de bibliotecas de Python a la instancia de VM de Cloud Datalab.

Agregar bibliotecas de Python a una instancia de Cloud Datalab

Cloud Datalab incluye un conjunto de bibliotecas cuyo fin es permitir la compatibilidad con situaciones comunes de análisis, transformación y visualización de datos. Puedes agregar bibliotecas de Python adicionales con uno de los siguientes tres mecanismos:

  • Opción 1: Agregar una celda de código en un notebook y, luego, instalar la biblioteca con Conda, mediante el reemplazo de lib-name y la ejecución de la celda:

    !conda install -y lib-name
    
    Esta es la forma más sencilla de personalizar en función de las necesidades individuales, además implica un mantenimiento mínimo, puesto que la imagen subyacente de Cloud Datalab se actualiza, debido a que volver a ejecutar la celda de código no es importante.

  • Opción 1.5: Usa pip en vez de Conda. Las bibliotecas se deben instalar con Conda siempre que sea posible, pero algunas solo están disponibles mediante pip. En estos casos, crea una celda de código según lo anterior, pero cambia el contenido de la siguiente manera:

    !pip install lib-name
    

  • Opción 2: Crea un notebook nuevo y agrega una celda de código con el siguiente contenido, reemplaza Conda con pip si es necesario y sustituye lib-name. Recuerda quitar -y si usas pip.

    %%bash
    echo "conda install -y lib-name" >> /content/datalab/.config/startup.sh
    cat /content/datalab/.config/startup.sh
    
    Ejecuta la celda y reinicia la instancia de Cloud Datalab. Para ello, haz clic en el ícono de la cuenta user-icon de la esquina superior derecha del notebook de Cloud Datalab o en la página con la lista de notebooks en el navegador y selecciona About Datalab (Acerca de Datalab).
    Luego, haz clic en la opción Restart Server (Reiniciar servidor) del diálogo About Google Cloud Datalab (Acerca de Google Cloud Datalab).

  • Opción 3: Hereda desde el contenedor de Docker de Cloud Datalab con el mecanismo de personalización de Docker. Esta opción es mucho más pesada en comparación con las opciones anteriores. Sin embargo, ofrece la mayor flexibilidad para quienes pretenden personalizar el contenedor de forma considerable a fin de que lo use un equipo o una organización. Si quieres usar este mecanismo, debes compilar un contenedor propio, que se denomina “Dockerfile-extended-example” más adelante. Para ello, sigue la documentación de Docker. Además, consulta el ejemplo de personalización en el repositorio de GitHub de Cloud Datalab.

    En Dockerfile-extended-example.in:

    FROM datalab
    ...
    pip install lib-name
    ...
    
    Para este enfoque, es necesario que realices el trabajo adicional de compilar y mantener tu propia imagen a medida que evoluciona el contenedor datalab. Por lo tanto, solo se recomienda que lo uses si los otros mecanismos descritos anteriormente no satisfacen tus necesidades.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Documentación de Cloud Datalab
¿Necesitas ayuda? Visita nuestra página de asistencia.