Esta página se ha traducido con Cloud Translation API.

Ejecutar un flujo de procesamiento

Vertex AI Pipelines te permite ejecutar flujos de procesamiento de aprendizaje automático (AA) que se han creado con el SDK de Kubeflow Pipelines o TensorFlow Extended sin servidor. En este documento se describe cómo ejecutar un flujo de procesamiento de aprendizaje automático.

También puedes crear ejecuciones de la canalización con plantillas prediseñadas en la galería de plantillas. Para obtener más información sobre la galería de plantillas, consulta el artículo sobre cómo usar una plantilla prediseñada de la galería de plantillas](/vertex-ai/docs/pipelines/use-template-gallery).

Puedes usar Vertex AI Experiments para monitorizar, analizar y comparar las ejecuciones de tus flujos de trabajo asociándolas a un experimento o a una ejecución de experimento. Si comparas los parámetros, las salidas y las métricas de rendimiento de las ejecuciones de la canalización, puedes identificar la configuración que mejor se adapte a tu caso práctico. Para obtener más información, consulta Introducción a los experimentos de Vertex AI.

Antes de empezar

Antes de ejecutar un flujo de trabajo con Vertex AI Pipelines, sigue estas instrucciones para configurar tuGoogle Cloud proyecto y tu entorno de desarrollo:

Crea un flujo de procesamiento.
Para ejecutar una canalización con el SDK de Vertex AI para Python, instala el SDK de Vertex.
- Instala el SDK de Vertex AI.

Crear una ejecución de un flujo de procesamiento

Sigue estas instrucciones para ejecutar una canalización de aprendizaje automático mediante la consola Google Cloud o Python.

Consola

Sigue estas instrucciones para ejecutar un flujo de procesamiento de aprendizaje automático mediante la consola Google Cloud .

En la Google Cloud consola, en la sección Vertex AI, ve a la página Pipelines.

Ir a Pipelines
En la lista desplegable Región, selecciona la región en la que quieres crear la ejecución de la canalización.
Haz clic en Crear ejecución para abrir el panel Crear ejecución de la canalización.
En la sección Detalles de la ejecución, haz lo siguiente:
1. Haga clic en Ejecutar fuente. Se encuentran disponibles las siguientes opciones:
  - Seleccionar entre los flujos de procesamiento de datos existentes: para crear una ejecución de un flujo de procesamiento de datos a partir de una plantilla, haga clic en Seleccionar entre los flujos de procesamiento de datos existentes e introduzca los siguientes detalles:
    1. Seleccione el repositorio que contenga el archivo de definición de la canalización o del componente.
    2. Seleccione la pipeline o el componente y la versión.
    3. Especifica un nombre de ejecución para identificar de forma única la ejecución de la canalización.
  - Seleccionar una canalización de la galería de plantillas: para crear una ejecución de canalización basada en una plantilla de canalización creada por Google en la galería de plantillas, haga clic en Seleccionar una canalización de la galería de plantillas e introduzca los siguientes detalles:
    1. En la lista Pipeline de la galería de plantillas, seleccione la plantilla de pipeline.
    2. Opcional: Modifica el Nombre de ejecución predeterminado que identifica de forma única la ejecución de la canalización.
    Nota: En estas instrucciones se describe cómo crear una ejecución de una canalización con la interfaz predeterminada de la página Crear ejecución de canalización, que incluye las secciones Detalles de la ejecución y Configuración del tiempo de ejecución. En algunas plantillas de la galería de plantillas, esta página tiene secciones adicionales. Por ejemplo, la plantilla AutoML para clasificación o regresión tabular también incluye las secciones Método de entrenamiento, Opciones de entrenamiento y Computación y precios.
  - Subir archivo: para subir una definición de canalización compilada, haz clic en Subir archivo e introduce los siguientes detalles:
    1. Haz clic en Buscar para abrir el selector de archivos. Ve al archivo YAML de la canalización compilada que quieras ejecutar, selecciona la canalización y haz clic en Abrir.
    2. En Nombre del flujo de procesamiento o del componente se muestra el nombre especificado en la definición del flujo de procesamiento de forma predeterminada. También puedes especificar otro nombre de flujo de procesamiento.
    3. Especifica un nombre de ejecución para identificar de forma única la ejecución de la canalización.
  - Importar desde Cloud Storage: para importar un archivo de definición de una canalización desde Cloud Storage, haga clic en Importar desde Cloud Storage e introduzca los siguientes detalles:
    1. Haz clic en Buscar para ir al segmento de Cloud Storage que contiene el objeto de definición de la canalización, selecciona el archivo y, a continuación, haz clic en Seleccionar.
      
      También puedes introducir el URI de Cloud Storage o la URL HTTP/HTTPS del archivo de definición de la canalización.
    2. Especifica el nombre del componente o del flujo de procesamiento.
    3. Especifica un nombre de ejecución para identificar de forma única la ejecución de la canalización.
2. Opcional: Para programar ejecuciones periódicas de la canalización, especifica la Programación de ejecución de la siguiente manera:
  1. Selecciona Recurrente.
  2. En Hora de inicio, especifica cuándo se activará la programación.
    - Para programar la primera ejecución inmediatamente después de crear la programación, selecciona Inmediatamente.
    - Para programar la primera ejecución para que se produzca a una hora y una fecha específicas, selecciona Activado.
  3. En el campo Frecuencia, especifica la frecuencia con la que se programarán y ejecutarán las ejecuciones de la canalización. Para ello, usa una expresión de programación cron basada en cron de Unix.
  4. En Finaliza, especifica cuándo termina la programación.
    - Para indicar que la programación crea ejecuciones de la canalización indefinidamente, selecciona Nunca.
    - Para indicar que la programación finaliza en una fecha y hora concretas, selecciona Activado y especifica la fecha y la hora de finalización de la programación.
  5. Opcional: Para especificar que la ejecución de la canalización use una cuenta de servicio personalizada, una clave de cifrado gestionada por el cliente (CMEK) o una red de VPC emparejada, haz clic en Opciones avanzadas y sigue estas instrucciones:
    - Para especificar una cuenta de servicio, selecciona una en la lista desplegable Cuenta de servicio.
      
      Si no especificas ninguna cuenta de servicio, Vertex AI Pipelines ejecutará tu flujo de procesamiento con la cuenta de servicio predeterminada de Compute Engine.
      
      Más información sobre cómo configurar una cuenta de servicio para usarla con Vertex AI Pipelines
    - Para usar una CMEK, selecciona Usar una clave de cifrado gestionada por el cliente. Aparecerá la lista desplegable Seleccionar una clave gestionada por el cliente. En la lista desplegable Seleccionar una clave gestionada por el cliente, elija la clave que quiera usar.
    - Para usar una red de VPC emparejada en esta ejecución de la canalización, introduce el nombre de la red de VPC en el cuadro Red de VPC emparejada.
3. Haz clic en Continuar.
En la sección Configuración del tiempo de ejecución, configura la ejecución de la canalización de la siguiente manera:
1. En Ubicación de Cloud Storage, haz clic en Examinar para seleccionar el segmento de Cloud Storage en el que se almacenarán los artefactos de salida de la canalización y, a continuación, haz clic en Seleccionar.
2. Opcional: Para configurar la política de errores y la caché de la ejecución de la canalización, haz clic en Opciones avanzadas y sigue estas instrucciones:
  - En Política de errores, especifica la política de errores de toda la canalización. Más información sobre las políticas de errores en la canalización
    - Para configurar la canalización de forma que siga programando tareas después de que falle una, selecciona Ejecutar todos los pasos hasta completarlos. Esta opción está seleccionada de forma predeterminada.
    - Para configurar el flujo de procesamiento de forma que falle cuando falle una tarea, selecciona Falla esta ejecución en cuanto falle un paso.
  - En Configuración de la caché, especifique la configuración de la caché de toda la canalización.
    - Para usar la configuración de la caché a nivel de tarea en la tarea de la canalización, selecciona No anular la configuración de la caché a nivel de tarea.
    - Para activar el almacenamiento en caché de todas las tareas de la canalización y anular cualquier configuración de caché a nivel de tarea, selecciona Habilitar la lectura de la caché en todos los pasos (más rápido).
    - Para desactivar el almacenamiento en caché de todas las tareas de la canalización y anular cualquier configuración de caché a nivel de tarea, selecciona Inhabilitar la lectura de la caché en todos los pasos (más rápido).
3. Opcional: Si tu flujo de trabajo tiene parámetros, en Parámetros de flujo de trabajo, especifica los parámetros de ejecución del flujo de trabajo.
Para crear la ejecución de la canalización, haz clic en Enviar.

SDK de Vertex AI para Python

Sigue estas instrucciones para ejecutar una canalización de aprendizaje automático con el SDK de Vertex AI para Python. Antes de ejecutar el siguiente código de ejemplo, debes configurar la autenticación.

Configurar la autenticación

Para configurar la autenticación, debes crear una clave de cuenta de servicio y definir una variable de entorno para la ruta a la clave de cuenta de servicio.

Crea una cuenta de servicio:
1. En la Google Cloud consola, ve a la página Crear cuenta de servicio.
  
  Ir a Crear cuenta de servicio
2. En el campo Nombre de cuenta de servicio, escribe un nombre.
3. Opcional: En el campo Descripción de la cuenta de servicio, escribe una descripción.
4. Haz clic en Crear.
5. Haz clic en el campo Selecciona un rol. En Todos los roles, selecciona Vertex AI > Usuario de Vertex AI.
6. Haz clic en Hecho para crear la cuenta de servicio.
  
  No cierres la ventana del navegador. Lo usarás en el siguiente paso.
Crea una clave de cuenta de servicio para la autenticación:
1. En la Google Cloud consola, haz clic en la dirección de correo de la cuenta de servicio que has creado.
2. Haz clic en Teclas.
3. Haz clic en Añadir clave y, a continuación, en Crear clave.
4. Haz clic en Crear. Se descargará un archivo de clave JSON en tu ordenador.
5. Haz clic en Cerrar.
Concede a tu nueva cuenta de servicio acceso a la cuenta de servicio que usas para ejecutar las canalizaciones.
1. Haz clic en para volver a la lista de cuentas de servicio.
2. Haz clic en el nombre de la cuenta de servicio que usas para ejecutar las canalizaciones. Se abrirá la página Detalles de la cuenta de servicio.
  
  Si has seguido las instrucciones de la guía para configurar tu proyecto para Vertex AI Pipelines, esta es la misma cuenta de servicio que creaste en la sección Configurar una cuenta de servicio con permisos granulares. De lo contrario, Vertex AI usará la cuenta de servicio predeterminada de Compute Engine para ejecutar los flujos de trabajo. La cuenta de servicio predeterminada de Compute Engine tiene un nombre como el siguiente: PROJECT_NUMBER-compute@developer.gserviceaccount.com
3. Haz clic en la pestaña Permisos.
4. Haz clic en Conceder acceso. Aparecerá el panel Añadir principales.
5. En el cuadro Nuevos principales, introduce la dirección de correo de la cuenta de servicio que has creado en un paso anterior.
6. En la lista desplegable Rol, selecciona Cuentas de servicio > Usuario de cuenta de servicio.
7. Haz clic en Guardar.
Define la variable de entorno GOOGLE_APPLICATION_CREDENTIALS en la ruta del archivo JSON que contiene la clave de tu cuenta de servicio. Esta variable solo se aplica a la sesión de shell actual, por lo que, si abres una nueva sesión, tendrás que volver a definirla.

Ejemplo: Linux o macOS

Sustituye [PATH] por la ruta del archivo JSON que contiene la clave de tu cuenta de servicio.
```
export GOOGLE_APPLICATION_CREDENTIALS="[PATH]"
```
Por ejemplo:
```
export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"
```
Ejemplo: Windows

Sustituye [PATH] por la ruta del archivo JSON que contiene la clave de tu cuenta de servicio y [FILE_NAME] por el nombre del archivo.

Con PowerShell:
```
$env:GOOGLE_APPLICATION_CREDENTIALS="[PATH]"
```
Por ejemplo:
```
$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\[FILE_NAME].json"
```
Con el símbolo del sistema:
```
set GOOGLE_APPLICATION_CREDENTIALS=[PATH]
```