Introducción a Vertex AI Workbench

Las instancias de Vertex AI Workbench son entornos de desarrollo basados en cuadernos de Jupyter para todo el flujo de trabajo de la ciencia de datos. Puedes interactuar con Vertex AI y otros Google Cloud servicios desde un cuaderno de Jupyter de una instancia de Vertex AI Workbench.

Las integraciones y las funciones de Vertex AI Workbench pueden facilitarte el acceso a tus datos, el procesamiento de datos más rápido, la programación de ejecuciones de cuadernos y más.

Las instancias de Vertex AI Workbench incluyen JupyterLab y un paquete preinstalado de paquetes de aprendizaje profundo, incluida la compatibilidad con los frameworks TensorFlow y PyTorch. Puedes configurar instancias solo con CPU o con GPU.

Las instancias de Vertex AI Workbench admiten la sincronización con un repositorio de GitHub.

Las instancias de Vertex AI Workbench están protegidas por Google Cloud autenticación y autorización.

Acceso a los datos

Puedes acceder a tus datos sin salir de la interfaz de usuario de JupyterLab.

En el menú de navegación de JupyterLab de una instancia de Vertex AI Workbench, puedes usar la integración de Cloud Storage para buscar datos y otros archivos a los que tengas acceso. Consulta Acceder a archivos y segmentos de Cloud Storage desde JupyterLab.

También puedes usar la integración de BigQuery para buscar las tablas a las que tienes acceso, escribir consultas, previsualizar resultados y cargar datos en tu cuaderno. Consulta Consultar datos en tablas de BigQuery desde JupyterLab.

Ejecutar cuadernos

Usa el ejecutor para ejecutar un archivo de cuaderno una sola vez o de forma programada. Elige el entorno y el hardware específicos en los que quieras que se ejecute. El código de tu cuaderno se ejecutará en el entrenamiento personalizado de Vertex AI, lo que puede facilitar el entrenamiento distribuido, la optimización de hiperparámetros o la programación de tareas de entrenamiento continuo.

Puedes usar parámetros en la ejecución para hacer cambios específicos en cada ejecución. Por ejemplo, puedes especificar otro conjunto de datos, cambiar la tasa de aprendizaje de tu modelo o cambiar la versión del modelo.

También puedes configurar un cuaderno para que se ejecute de forma periódica. Aunque tu instancia esté cerrada, Vertex AI Workbench ejecutará tu archivo de cuaderno y guardará los resultados para que puedas consultarlos y compartirlos con otros usuarios. Consulta Programar la ejecución de un cuaderno.

Compartir estadísticas

Las ejecuciones de cuadernos se almacenan en un segmento de Cloud Storage, por lo que puedes compartir tus estadísticas con otros usuarios dándoles acceso a los resultados. Consulta la sección anterior sobre cómo ejecutar cuadernos.

Proteger una instancia

En las siguientes secciones se describen las funciones compatibles que pueden ayudarte a proteger tu instancia de Vertex AI Workbench.

VPC

Puedes desplegar tu instancia de Vertex AI Workbench con la red predeterminada gestionada por Google, que usa una red VPC y una subred predeterminadas. En lugar de la red predeterminada, puedes especificar una red de VPC para usarla con tu instancia.

Para usar Vertex AI Workbench en un perímetro de servicio, consulta Usar una instancia de Vertex AI Workbench en un perímetro de servicio.

Claves de encriptado gestionadas por el cliente (CMEK)

De forma predeterminada, Google Cloud cifra automáticamente los datos en reposo con claves de cifrado gestionadas por Google. Si tienes requisitos de cumplimiento o normativos específicos relacionados con las claves que protegen tus datos, puedes usar claves de cifrado gestionadas por el cliente (CMEK) con tus instancias de Vertex AI Workbench. Para obtener más información, consulta el artículo Claves de cifrado gestionadas por el cliente.

Confidential Computing

Puedes cifrar tus datos en uso mediante Confidential Computing. Para usar Confidential Computing, habilita el servicio de máquinas virtuales confidenciales al crear una instancia de Vertex AI Workbench. Para empezar, consulta el artículo Crear una instancia con Confidential Computing.

Apagado automático de instancias inactivas

Para ayudar a gestionar los costes, las instancias de Vertex AI Workbench se cierran de forma predeterminada tras un periodo de inactividad específico. Puedes cambiar el tiempo o desactivar esta función. Para obtener más información, consulta Apagado por inactividad.

Añadir entornos de conda

Las instancias de Vertex AI Workbench usan kernels basados en entornos de conda. Puedes añadir un entorno de conda a tu instancia de Vertex AI Workbench. El entorno aparecerá como un kernel en la interfaz de JupyterLab de tu instancia.

Si añades entornos de conda, podrás usar kernels que no estén disponibles en la instancia predeterminada de Vertex AI Workbench. Por ejemplo, puedes añadir entornos de conda para R y Apache Beam. También puedes añadir entornos de conda para versiones anteriores específicas de los frameworks disponibles, como TensorFlow, PyTorch o Python.

Para obtener más información, consulta Añadir un entorno de conda.

Contenedores personalizados

Puedes crear una instancia de Vertex AI Workbench basada en un contenedor personalizado. Empieza con una imagen de contenedor base proporcionada por Google y modifícala según tus necesidades. A continuación, crea una instancia basada en tu contenedor personalizado.

Para obtener más información, consulta Crear una instancia con un contenedor personalizado.

Integración de Dataproc

Puedes procesar datos rápidamente ejecutando un cuaderno en un clúster de Dataproc. Una vez que hayas configurado el clúster, podrás ejecutar un archivo de cuaderno en él sin salir de la interfaz de usuario de JupyterLab. Para obtener más información, consulta Crear una instancia con Dataproc.

Reservar recursos de VM

Usa reservas de Compute Engine para asegurarte de que tus instancias de Vertex AI Workbench tienen suficientes recursos de máquina virtual para ejecutarse.

Las reservas son una función de Compute Engine. Te ayudan a asegurarte de que tienes los recursos disponibles para crear máquinas virtuales con el mismo hardware (memoria y vCPUs) y recursos opcionales (GPUs y discos SSD locales) cuando los necesites.

Para obtener más información, consulta Usar reservas.

Crear instancias con credenciales de terceros

Puedes crear y gestionar instancias de Vertex AI Workbench con credenciales de terceros proporcionadas por la federación de identidades de la fuerza de trabajo. La federación de identidades de Workforce usa tu proveedor de identidades (IdP) externo para conceder acceso a un grupo de usuarios a instancias de Vertex AI Workbench a través de un proxy.

El acceso a una instancia de Vertex AI Workbench se concede asignando un principal de grupo de trabajadores a la cuenta de servicio de la instancia de Vertex AI Workbench.

Para obtener más información, consulta Crear una instancia con credenciales de terceros.

Etiquetas de instancias de Vertex AI Workbench

La VM subyacente de una instancia de Vertex AI Workbench es una VM de Compute Engine. Puedes añadir y gestionar etiquetas de recursos en tu instancia de Vertex AI Workbench a través de su VM de Compute Engine.

Cuando creas una instancia de Vertex AI Workbench, Vertex AI Workbench adjunta la etiqueta de recurso de Compute Engine vertex-workbench-instances:prod=READ_ONLY. Esta etiqueta de recurso solo se usa con fines internos.

Para obtener más información sobre cómo gestionar etiquetas de instancias de Compute Engine, consulta el artículo Gestionar etiquetas de recursos.

Limitaciones

Ten en cuenta las siguientes limitaciones de las instancias de Vertex AI Workbench al planificar tu proyecto:

  • No se admiten extensiones de JupyterLab de terceros.

  • Cuando usas Access Context Manager y Chrome Enterprise Premium para proteger las instancias de Vertex AI Workbench con controles de acceso basados en el contexto, el acceso se evalúa cada vez que el usuario se autentica en la instancia. Por ejemplo, el acceso se evalúa la primera vez que el usuario accede a JupyterLab y cada vez que lo hace después si la cookie de su navegador web ha caducado.

  • Si usas un contenedor personalizado que no se deriva del contenedor base proporcionado por Google (gcr.io/deeplearning-platform-release/workbench-container:latest), aumentan los riesgos de que haya problemas de compatibilidad con nuestros servicios y no se ofrece asistencia. En su lugar, modifica el contenedor base para crear un contenedor personalizado que se ajuste a tus necesidades y, a continuación, crea una instancia con el contenedor personalizado.

  • Las instancias de Vertex AI Workbench esperan imágenes del proyecto cloud-notebooks-managed. La lista de nombres de imágenes está disponible en la página de creación de la Google Cloud consola. Aunque es posible usar imágenes de máquina virtual (VM) personalizadas o imágenes de VM de aprendizaje profundo con instancias de Vertex AI Workbench, Vertex AI Workbench no ofrece asistencia para comportamientos o fallos inesperados al usar esas imágenes.

  • No se puede usar una imagen de notebooks gestionados por el usuario o una imagen de notebooks gestionados para crear una instancia de Vertex AI Workbench.

  • No puedes editar la VM subyacente de una instancia de Vertex AI Workbench mediante la Google Cloud consola o la API de Compute Engine. Para editar la VM subyacente de una instancia de Vertex AI Workbench, usa el método projects.locations.instances.patch de la API Notebooks o el comando gcloud workbench instances update del SDK de Google Cloud.

  • En las instancias que usan Controles de Servicio de VPC, no se admite el uso de executor.

  • Para usar aceleradores con instancias de Vertex AI Workbench, el tipo de acelerador que quieras usar debe estar disponible en la zona de tu instancia. Para obtener información sobre la disponibilidad de aceleradores por zona, consulta Disponibilidad de regiones y zonas de GPU.

Siguientes pasos