Agregar bibliotecas de Python a una instancia de Cloud Datalab
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta guía, se explica cómo personalizar Cloud Datalab mediante la adición de bibliotecas de Python a la instancia de VM de Cloud Datalab.
Agregar bibliotecas de Python a una instancia de Cloud Datalab
Cloud Datalab incluye un conjunto de bibliotecas
cuyo fin es permitir la compatibilidad con situaciones comunes de análisis, transformación y visualización de datos. Puedes agregar bibliotecas de Python adicionales mediante uno de los siguientes tres mecanismos:
Opción 1: Agrega una celda de código a un notebook y, luego, instala la biblioteca mediante Conda, sustituyendo lib-name y ejecutando la celda:
!conda install -y lib-name
Esta es la forma más sencilla de personalizar en función de las necesidades individuales, además implica un mantenimiento mínimo, puesto que la imagen subyacente de Cloud Datalab se actualiza, debido a que volver a ejecutar la celda de código no es importante.
Opción 1.5: Usa pip en vez de Conda. Las bibliotecas se deben instalar con Conda siempre que sea posible, pero algunas solo están disponibles mediante pip. En estos casos, crea una celda de código según lo anterior, pero cambia el contenido de la siguiente manera:
!pip install lib-name
Opción 2. Crea un notebook nuevo y agrega una celda de código con el siguiente contenido, para ello, reemplaza Conda con pip, si es necesario, y sustituye lib-name. Recuerda quitar -y si usas pip.
Ejecuta la celda y, luego, reinicia la instancia de Cloud Datalab. Para ello, haz clic en el ícono de la cuenta ubicado en la esquina superior derecha del notebook de Cloud Datalab o la página con la lista de los notebooks en el navegador, selecciona Acerca de Datalab y, luego, y, luego, haz clic en la opción Reiniciar servidor del diálogo Acerca de Google Cloud Datalab.
Opción 3: Hereda desde el contenedor de Docker de Cloud Datalab con el mecanismo de personalización de Docker. Esta opción es mucho más pesada en comparación con las opciones anteriores. Sin embargo, ofrece la mayor flexibilidad para quienes pretenden personalizar el contenedor de forma considerable a fin de que lo use un equipo o una organización. Si quieres usar este mecanismo, debes compilar un contenedor propio, que se denomina “Dockerfile-extended-example” más adelante. Para ello, sigue la documentación de Docker.
Además, consulta el ejemplo de personalización en el repositorio de GitHub de Cloud Datalab.
En Dockerfile-extended-example.in:
FROM datalab
...
pip install lib-name
...
Para este enfoque, es necesario que realices el trabajo adicional de compilar y mantener tu propia imagen a medida que evoluciona el contenedor datalab.
Por lo tanto, solo se recomienda que lo uses si los otros mecanismos descritos con anterioridad no satisfacen tus necesidades.