Administrar el ciclo de vida de una instancia de Cloud Datalab

En esta página, se describe el ciclo de vida de una instancia de Cloud Datalab y las opciones disponibles para administrar y optimizar el uso de los recursos de procesamiento.

Cloud Datalab se ejecuta en una VM de Google Compute Engine con un disco persistente conectado que se usa para almacenar notebooks. Las VM de Cloud Datalab se conectan a una red especial dentro de un proyecto llamado datalab-network. Según la configuración predeterminada, las conexiones entrantes en esta red se limitan a las conexiones SSH.

Requisitos previos

Antes de usar los comandos que se analizan a continuación, debes realizar las siguientes acciones:

  1. Instala el SDK de Cloud, incluido el componente datalab.
  2. Autentica con la herramienta de línea de comandos de gcloud.
  3. Configura la herramienta de línea de comandos de gcloud para que use el proyecto y la zona que seleccionaste.

Crear una instancia

Las instancias de Cloud Datalab se crean con el comando datalab create.

datalab create instance-name

Este comando permite usar varias opciones de la línea de comandos. Por ejemplo, si deseas crear una instancia con más memoria que la predeterminada, puedes pasar la marca --machine-type:

datalab create --machine-type n1-highmem-2 instance-name

Para enumerar todas las opciones disponibles, ejecuta el siguiente comando:

datalab create --help

Según la configuración predeterminada, el comando datalab create se conecta con la instancia recién creada. Para crear la instancia sin conectarte a ella, pasa la marca --no-connect de la siguiente manera:

datalab create --no-connect instance-name

Además, el comando datalab create crea los siguientes recursos de Google Cloud Platform (si es que aún no están disponibles):

  • La red datalab-network
  • Una regla de firewall en datalab-network que admite las conexiones SSH entrantes
  • El Google Cloud Source Repository datalab-notebooks
  • El disco persistente para almacenar notebooks de Cloud Datalab

Ten en cuenta que algunos de los pasos anteriores pueden requerir permisos de propietario (consulta Usar Cloud Datalab en un entorno de equipo).

Conectarse a una instancia

La herramienta datalab permite crear un túnel SSH persistente hacia la instancia de Cloud Datalab, para conectarse con la instancia desde el navegador local, como si Cloud Datalab se estuviera ejecutando en la máquina local.

Usa el comando datalab connect para crear esta conexión, de la siguiente manera:

datalab connect instance-name

El comando datalab connect permite reiniciar la instancia si esta no se está ejecutando. Además, seguirá ejecutándose hasta que lo detengas (la conexión estará disponible mientras el comando se esté ejecutando).

Según la configuración predeterminada, el puerto local que usa la conexión es el 8081. Pasa la marca --port para cambiar el puerto. Por ejemplo, para usar el puerto local 8082, ejecuta el siguiente comando:

datalab connect --port 8082 instance-name

Detener una instancia

Para detener la instancia de Cloud Datalab y evitar incurrir en costos innecesarios cuando dejas de usar la herramienta, ejecuta el siguiente comando:

datalab stop instance-name

Ejecuta el comando datalab connect a fin de reiniciar la instancia cuando estés listo para volver a usar Cloud Datalab.

Actualizar la VM de Cloud Datalab sin borrar el disco de los notebooks

Para actualizar a una versión nueva de Cloud Datalab o cambiar las propiedades de la VM, como el tipo de máquina o la cuenta de servicio, puedes borrar y, luego, recrear la VM de Cloud Datalab sin perder los notebooks almacenados en el disco persistente.

datalab delete --keep-disk instance-name
datalab create instance-name

Borrar una instancia y el disco de los notebooks

Según la configuración predeterminada, el comando datalab delete no borra el disco persistente donde se almacenan los notebooks. Gracias a esto, puedes cambiar fácilmente la VM sin perder tus datos de forma accidental (consulta Borrar y recrear una instancia sin borrar el disco de los notebooks).

Agrega la marca --delete-disk al comando, si quieres borrar la VM y el disco persistente conectado, de la siguiente manera:

datalab delete --delete-disk instance-name

Disminuir el uso de los recursos de procesamiento

Las VM de Google Compute Engine generan costos. El tiempo de ejecución de las instancias de Cloud Datalab se cobra sin importar si las estás usando o no. Puedes detener la instancia cuando no la estés usando y así disminuir los cargos que genera la VM de Cloud Datalab. Se seguirán generando cobros por los recursos conectados a la VM (como el disco persistente y la dirección IP externa), pero la instancia de VM en sí no incurrirá en cargos mientras está detenida.

Ejecuta datalab connect instance-name para conectarte a la instancia detenida cuando tengas que volver a usarla, la herramienta datalab reiniciará la instancia antes de intentar conectarse a ella.

Para dejar de incurrir en todos los cargos asociados con una instancia de Cloud Datalab, debes borrar la VM y el disco persistente conectado mediante el comando datalab delete y la opción --delete-disk.

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Documentación de Cloud Datalab
Si necesitas ayuda, visita nuestra página de asistencia.