Introducción a las instancias de Vertex AI Workbench

Las instancias de Vertex AI Workbench son entornos de desarrollo basados en notebooks de Jupyter para todo el flujo de trabajo de la ciencia de datos. Puedes interactuar con Vertex AI y otros servicios de Google Cloud desde el notebook de Jupyter de una instancia de Vertex AI Workbench.

Las integraciones y funciones de Vertex AI Workbench pueden facilitar el acceso a tus datos, procesarlos más rápido, programar ejecuciones de notebooks y mucho más.

Las instancias de Vertex AI Workbench se empaquetan previamente con JupyterLab y tienen un conjunto preinstalado de paquetes de aprendizaje profundo, incluida la compatibilidad con los frameworks de TensorFlow y PyTorch. Puedes configurar instancias solo para CPU o instancias habilitadas para GPU.

Las instancias de Vertex AI Workbench admiten la capacidad de sincronizar con un repositorio de GitHub. Las instancias de Vertex AI Workbench están protegidas por la autenticación y la autorización de Google Cloud.

Acceso a los datos

Puedes acceder a tus datos sin salir de la interfaz de usuario JupyterLab.

Desde el menú de navegación de JupyterLab en una instancia de Vertex AI Workbench administrada, puedes usar la integración de Cloud Storage para explorar datos y otros archivos a los que tienes acceso. Consulta Accede a los buckets y archivos de Cloud Storage desde JupyterLab.

También puedes usar la integración de BigQuery para explorar tablas a las que tienes acceso, escribir consultas, obtener una vista previa de los resultados y cargar datos en tu notebook. Ve a Consulta datos en tablas de BigQuery desde JupyterLab.

Realiza ejecuciones de notebooks

Usa el ejecutor para ejecutar un archivo de notebook como una ejecución única o según un programa. Elige el entorno y el hardware específicos en los que deseas que se realice la ejecución. El código de tu notebook se ejecutará en el entrenamiento personalizado de Vertex AI, lo que facilita el entrenamiento distribuido, la optimización de hiperparámetros o la programación de trabajos de entrenamiento continuo.

Puedes usar parámetros en la ejecución para realizar cambios específicos en cada ejecución. Por ejemplo, puedes especificar que se use un conjunto de datos diferente, cambiar la tasa de aprendizaje de tu modelo o cambiar la versión del modelo.

También puedes configurar un notebook para que se ejecute según una programación recurrente. Incluso mientras la instancia esté cerrada, Vertex AI Workbench ejecutará el archivo del notebook y guardará los resultados para que los puedas ver y compartirlos con otras personas.

Comparte estadísticas

Las ejecuciones de notebooks ejecutadas se almacenan en un bucket de Cloud Storage, por lo que puedes compartir las estadísticas con otras personas si otorgas acceso a los resultados. Consulta la sección anterior sobre la realización de ejecuciones de notebooks.

Protege tu instancia

Puedes implementar tu instancia de Vertex AI Workbench con la red administrada por Google predeterminada, que usa una red VPC y una subred de VPC predeterminadas. En lugar de la red predeterminada, puedes especificar una red de VPC para usar con la instancia.

De forma predeterminada, Google Cloud encripta los datos cuando están en reposo de manera automática mediante claves de encriptación administradas por Google. Si tienes requisitos normativos o de cumplimiento específicos relacionados con las claves que protegen los datos, puedes usar claves de encriptación administradas por el cliente (CMEK) con tus instancias de Vertex AI Workbench. Para obtener más información, consulta Claves de encriptación administradas por el cliente.

Cierre automático para instancias inactivas

Para ayudar a administrar los costos, las instancias de Vertex AI Workbench se cierran de forma predeterminada después de estar inactivas durante un período específico. Puedes cambiar la cantidad de tiempo o desactivar esta función. Para obtener más información, consulta Cierre inactivo.

Agrega entornos conda

Las instancias de Vertex AI Workbench usan kernels basados en entornos conda. Puedes agregar un entorno conda a tu instancia de Vertex AI Workbench, y el entorno aparecerá como un kernel en la interfaz de JupyterLab de tu instancia.

Agregar entornos conda te permite usar kernels que no están disponibles en la instancia predeterminada de Vertex AI Workbench. Por ejemplo, puedes agregar entornos conda para R y Apache Beam. O puedes agregar entornos conda para versiones anteriores específicas de los frameworks disponibles, como TensorFlow, PyTorch o Python.

Para obtener más información, consulta Agrega un entorno conda.

Integración en Dataproc

Puede procesar datos rápidamente si ejecuta un notebook en un clúster de Dataproc. Después de configurar tu clúster, puedes ejecutar un archivo de notebook en él sin salir de la interfaz de usuario de JupyterLab. Si deseas obtener más información, consulta Crea una instancia con Dataproc habilitado.

Limitaciones

Ten en cuenta las siguientes limitaciones de Vertex AI Workbench cuando planifiques tu proyecto:

  • No se admiten las extensiones de JupyterLab de terceros.

  • Cuando usas Access Context Manager y BeyondCorp Enterprise para proteger las instancias de Vertex AI Workbench con controles de acceso adaptado al contexto, el acceso se evalúa cada vez que el usuario se autentica en la instancia. Por ejemplo, se evalúa el acceso la primera vez que el usuario accede a JupyterLab y, cada vez que accede a él, si la cookie de su navegador web caducó.

  • No se admite el uso de contenedores personalizados con instancias de Vertex AI Workbench. En su lugar, agrega un entorno conda a la instancia.

  • Aunque el uso de imágenes de máquina virtual (VM) personalizadas o VM personalizadas de aprendizaje profundo con instancias de Vertex AI Workbench es posible, Vertex AI Workbench no proporciona ningún tipo de asistencia para comportamientos inesperados ni mal funcionamiento en las imágenes personalizadas.

  • No se admite el uso de una imagen de notebooks administrados por el usuario o de notebooks administrados para crear una instancia de Vertex AI Workbench.

  • No puedes editar la VM subyacente de una instancia de Vertex AI Workbench mediante la consola de Google Cloud o la API de Compute Engine. Para editar la VM subyacente de una instancia de Vertex AI Workbench, usa el método projects.locations.instances.patch en la API de Notebooks o gcloud workbench instances update comando en el SDK de Google Cloud.

  • No se admite el uso del executor en las instancias que usan los Controles del servicio de VPC.

  • No se admite la modificación de etiquetas de red de instancias de Vertex AI Workbench.

  • Para usar aceleradores con instancias de Vertex AI Workbench, el tipo de acelerador que deseas debe estar disponible en la zona de la instancia. Para obtener información sobre la disponibilidad del acelerador por zona, consulta Disponibilidad por zonas y regiones de GPU.

¿Qué sigue?