Administra el ciclo de vida de una instancia de Cloud Datalab

En esta página, se describen el ciclo de vida de una instancia de Cloud Datalab y las opciones disponibles para administrar y optimizar el uso de los recursos de procesamiento.

Cloud Datalab se ejecuta en una VM de Google Compute Engine con un disco persistente conectado que se usa para almacenar notebooks. Las VM de Cloud Datalab están conectadas a una red especial en un proyecto llamado datalab-network. La configuración predeterminada de esta red limita las conexiones entrantes a conexiones SSH.

Requisitos previos

Antes de usar los comandos que se analizan a continuación, debes realizar las siguientes acciones:

  1. Instala el SDK de Cloud, incluido el componente datalab.
  2. Autentica con la herramienta de línea de comandos de gcloud.
  3. Configura la herramienta de línea de comandos de gcloud para usar el proyecto y la zona seleccionados.

Crea una instancia

Las instancias de Cloud Datalab se crean con el comando datalab create.

datalab create instance-name

Este comando permite usar varias opciones de la línea de comandos. Por ejemplo, si deseas crear una instancia con más memoria que la predeterminada, puedes pasar la marca --machine-type:

datalab create --machine-type n1-highmem-2 instance-name

Para enumerar todas las opciones disponibles, ejecuta el siguiente comando:

datalab create --help

De forma predeterminada, el comando datalab create se conecta a la instancia recién creada. Para crear la instancia, pero no conectarte a ella, pasa la marca --no-connect:

datalab create --no-connect instance-name

El comando datalab create también crea los siguientes recursos de Google Cloud Platform (si aún no están disponibles):

  • La red datalab-network
  • Una regla de firewall en datalab-network que permite conexiones SSH entrantes
  • El datalab-notebooks de Google Cloud Source Repository
  • El disco persistente para almacenar notebooks de Cloud Datalab

Ten en cuenta que algunos de los pasos anteriores pueden requerir permisos de propietario (consulta Usa Cloud Datalab en un entorno de equipo).

Conéctate a una instancia

Con la herramienta datalab, puedes crear un túnel SSH persistente hacia tu instancia de Cloud Datalab que te permita conectarte a la instancia desde el navegador local como si Cloud Datalab se estuviera ejecutando en tu máquina local.

Usa el comando datalab connect para crear esta conexión, como se indica a continuación:

datalab connect instance-name

El comando datalab connect reinicia la instancia si no está en ejecución. Además, seguirá ejecutándose hasta que lo detengas (la conexión estará disponible mientras el comando se esté ejecutando).

Según la configuración predeterminada, el puerto local que usa la conexión es el 8081. Para cambiar a un puerto diferente, pasa la marca --port. Por ejemplo, para usar el puerto local 8082, ejecuta el siguiente comando:

datalab connect --port 8082 instance-name

Detén una instancia

Para detener la instancia de Cloud Datalab y evitar incurrir en costos innecesarios cuando dejas de usar la herramienta, ejecuta el siguiente comando:

datalab stop instance-name

Cuando estés listo para volver a usar Cloud Datalab, ejecuta el comando datalab connect a fin de reiniciar la instancia.

Actualiza la VM de Cloud Datalab sin borrar el disco de los notebooks

Para actualizar a una versión nueva de Cloud Datalab o cambiar las propiedades de la VM, como el tipo de máquina o la cuenta de servicio, puedes borrar y, luego, volver a crear la VM de Cloud Datalab sin perder los notebooks almacenados en el disco persistente.

datalab delete --keep-disk instance-name
datalab create instance-name

Borra una instancia y el disco de los notebooks

Según la configuración predeterminada, el comando datalab delete no borra el disco persistente en el que se almacenan los notebooks. Gracias a esto, puedes cambiar con facilidad la VM sin perder tus datos por accidente (consulta Borra y vuelve a crear una instancia sin borrar el disco de los notebooks).

Si deseas borrar la VM y el disco persistente conectado, agrega la marca --delete-disk al comando:

datalab delete --delete-disk instance-name

Disminuye el uso de los recursos de procesamiento

Las VM de Google Compute Engine generan costos. El tiempo de ejecución de las instancias de Cloud Datalab se cobra sin importar si las estás usando o no. Puedes detener la instancia cuando no la uses y así disminuir los cargos que genera la VM de Cloud Datalab. Se seguirán aplicando cargos por los recursos conectados a la VM (como el disco persistente y la dirección IP externa), pero la instancia de VM en sí no generará cargos mientras está detenida.

Cuando necesites volver a usar la instancia detenida, ejecuta datalab connect instance-name para conectarte a la instancia; la herramienta datalab reiniciará la instancia antes de intentar conectarse.

Para dejar de generar todos los cargos asociados con una instancia de Cloud Datalab, debes borrar la VM y el disco persistente conectado mediante la ejecución del comando datalab delete con la opción --delete-disk.