Introducción a los notebooks administrados

Las instancias de notebooks administrados de Vertex AI Workbench son entornos administrados por Google con integraciones y capacidades que te ayudan a configurar y trabajar en un entorno de producción de extremo a extremo basado en notebooks de Jupyter.

Las instancias de notebooks administrados se empaquetan previamente con JupyterLab y tienen un conjunto preinstalado de paquetes de aprendizaje profundo, incluida la compatibilidad con los frameworks de TensorFlow y PyTorch. Las instancias de notebooks administrados admiten aceleradores de GPU y la capacidad de sincronizarse con un repositorio de GitHub. Las instancias de notebooks administrados están protegidas por la autenticación y la autorización de Google Cloud.

Infraestructura de procesamiento administrada por Google

Una instancia de notebook de Vertex AI Workbench es una infraestructura de procesamiento basada en notebooks Jupyter administrada por Google.

Cuando creas una instancia de notebooks administrados, se implementa como una instancia de máquina virtual (VM) administrada por Google en un proyecto de usuario.

Tu instancia de notebooks administrados incluye muchos entornos de framework de ciencia de datos comunes, como TensorFlow y PyTorch. También puedes agregar tus propias imágenes de contenedor personalizadas a la instancia de notebooks administrados. Estos entornos están disponibles como kernels en los que puedes ejecutar tu archivo de notebook.

Cuando ejecutas un notebook en uno de los kernels, Vertex AI Workbench inicia el contenedor correspondiente, crea una sesión de Jupyter y usa esa sesión de Jupyter para ejecutar el notebook en el contenedor.

Esta infraestructura de procesamiento administrada por Google incluye integraciones y capacidades que te ayudan a implementar flujos de trabajo de ciencia de datos y aprendizaje automático de principio a fin. Consulta las siguientes secciones para obtener más detalles.

Usar contenedores personalizados

Puedes agregar imágenes de contenedor de Docker personalizadas a la instancia de notebooks administrados para ejecutar el código de notebook en un entorno personalizado según tus necesidades.

Estos contenedores personalizados están disponibles para usarse directamente desde la interfaz de usuario de JupyterLab, junto con los frameworks preinstalados. Para obtener más información, consulta Agrega un contenedor personalizado a una instancia de notebooks administrados.

Flujo de trabajo basado en notebooks

Las instancias de notebooks administrados te permiten realizar tareas orientadas al flujo de trabajo sin salir de la interfaz de usuario de JupyterLab.

Controla tu hardware y el framework desde JupyterLab

En una instancia de notebooks administrados, la interfaz de usuario de JupyterLab es donde especificas los recursos de procesamiento en los que se ejecutará el código. Por ejemplo, puedes configurar cuántas CPU virtuales o GPU deseas, cuánta RAM deseas y en qué framework deseas ejecutar el código. Primero, puedes escribir tu código y, luego, elegir cómo ejecutarlo sin salir de JupyterLab o reiniciar tu instancia. Para realizar pruebas rápidas de código, puedes reducir la escala de tu hardware verticalmente y, luego, escalarlo de nuevo para ejecutar tu código en relación con más datos.

Acceso a los Datos

Puedes acceder a tus datos sin salir de la interfaz de usuario JupyterLab.

Desde el menú de navegación de JupyterLab en una instancia de notebooks administrada, puedes usar la integración de Cloud Storage para explorar datos y otros archivos a los que tienes acceso. Consulta Accede a los buckets y archivos de Cloud Storage desde JupyterLab.

También puedes usar la integración de BigQuery para explorar tablas a las que tienes acceso, escribir consultas, obtener una vista previa de los resultados y cargar datos en tu notebook. Ve a Consulta datos en tablas de BigQuery desde JupyterLab.

Realiza ejecuciones de notebooks

Usa el ejecutor para ejecutar un archivo de notebook como una ejecución única o según un programa. Elige el entorno y el hardware específicos en los que deseas que se realice la ejecución. El código de tu notebook se ejecutará en el entrenamiento personalizado de Vertex AI, lo que facilita el entrenamiento distribuido, la optimización de hiperparámetros o la programación de trabajos de entrenamiento continuo. Ve a Ejecuta archivos de notebook con el ejecutor.

Puedes usar parámetros en la ejecución para realizar cambios específicos en cada ejecución. Por ejemplo, puedes especificar que se use un conjunto de datos diferente, cambiar la tasa de aprendizaje de tu modelo o cambiar la versión del modelo.

También puedes configurar un notebook para que se ejecute según una programación recurrente. Incluso mientras la instancia esté cerrada, Vertex AI Workbench ejecutará el archivo del notebook y guardará los resultados para que los puedas ver y compartirlos con otras personas.

Comparte estadísticas

Las ejecuciones de notebooks ejecutadas se almacenan en un bucket de Cloud Storage, por lo que puedes compartir las estadísticas con otras personas si otorgas acceso a los resultados. Consulta la sección anterior sobre la realización de ejecuciones de notebooks.

Protege tu instancia

Puedes implementar tu instancia de notebooks administrados con la red administrada por Google predeterminada, que usa una red VPC y una subred de VPC predeterminadas. En lugar de la red predeterminada, puedes especificar una red de VPC para usar con la instancia. Para obtener más información, consulta Configura una red. Puedes usar los Controles del servicio de VPC a fin de proporcionar seguridad adicional para tus instancias de notebooks administrados.

Para usar notebooks administrados dentro de un perímetro de servicio, consulta Usa una instancia de notebooks administrados dentro de un perímetro de servicio.

De forma predeterminada, Google Cloud encripta los datos cuando están en reposo de manera automática mediante claves de encriptación administradas por Google. Si tienes requisitos normativos o de cumplimiento específicos relacionados con las claves que protegen los datos, puedes usar claves de encriptación administradas por el cliente (CMEK) para tus instancias de notebooks administrados por el usuario. Para obtener más información, consulta Usa claves de encriptación administradas por el cliente.

Cierre automático para instancias inactivas

Para ayudar a administrar los costos, las instancias de notebooks administrados, de forma predeterminada, se cierran después de estar inactivos durante un período específico. Puedes cambiar la cantidad de tiempo o desactivar esta función. Para obtener más información, consulta Cierre inactivo.

Integración en Dataproc

Puede procesar datos rápidamente si ejecuta un notebook en un clúster de Dataproc. Después de configurar su clúster, puede ejecutar un archivo de notebook en él sin salir de la interfaz de usuario de JupyterLab. Para obtener más información, consulta Ejecuta una instancia de notebooks administrados en un clúster de Dataproc.

Limitaciones

Ten en cuenta las siguientes limitaciones de los notebooks administrados cuando planifiques tu proyecto:

  • Las instancias de notebooks administrados son administradas por Google y, por lo tanto, son menos personalizables que las instancias de notebooks administradas por el usuario de Vertex AI. Las instancias de notebooks administrados por el usuario pueden ser más ideales para los usuarios que necesitan tener mucho control sobre su entorno. Para obtener más información, consulta Introducción a los notebooks administrados por el usuario.

  • No se admiten las extensiones de terceros de JupyterLab.

  • El complemento JupyterLab de Dataproc no es compatible con notebooks administrados, pero puedes usarlo en instancias de Vertex AI Workbench. Consulta Crea una instancia con Dataproc habilitado.

  • Las instancias de notebooks administrados no permiten que los usuarios tengan acceso sudo.

  • Cuando usas Access Context Manager y BeyondCorp Enterprise para proteger las instancias de notebooks administrados con controles de acceso adaptado al contexto, el acceso se evalúa cada vez que el usuario se autentica en la instancia. Por ejemplo, se evalúa el acceso la primera vez que el usuario accede a JupyterLab y, cada vez que accede a él, si la cookie de su navegador web caducó.

  • Para usar aceleradores con instancias de notebooks administrados, el tipo de acelerador que deseas debe estar disponible en la zona de la instancia. Para obtener información sobre la disponibilidad del acelerador por zona, consulta Disponibilidad por zonas y regiones de GPU.

¿Qué sigue?