Agrega una ejecución de canalización para experimentar

Puedes usar la consola de Google Cloud o el SDK de Vertex AI para Python a fin de agregar una canalización a un experimento o a una ejecución de experimento.

Consola de Google Cloud

Usa las siguientes instrucciones para ejecutar una canalización de AA y asociarla con un experimento y, de forma opcional, una ejecución de experimento con la consola de Google Cloud. Las ejecuciones de experimentos solo se pueden crear a través del SDK de Vertex AI para Python (consulta Crea y administra ejecuciones de experimentos).
  1. En la sección Vertex AI de la consola de Google Cloud, ve a la página Canalizaciones.
    Ir a Pipelines
  2. En la lista desplegable Región, selecciona la región en la que deseas crear una ejecución de canalización.
  3. Haz clic en Crear ejecución para abrir el panel Crear ejecución de canalización.
  4. Especifica los siguientes detalles de Ejecución.
    • En el campo File, haz clic en Choose para abrir el selector de archivos. Navega hasta el archivo JSON de canalización compilado que deseas ejecutar, selecciona la canalización y haz clic en Abrir.
    • El Nombre de la canalización es la configuración predeterminada para el nombre que especificaste en la definición de la canalización. De manera opcional, especifica un Nombre de la canalización diferente.
    • Especifica un nombre de ejecución para identificar de manera única la ejecución de esta canalización.
  5. Para especificar que esta ejecución de canalización use una cuenta de servicio personalizada, una clave de encriptación administrada por el cliente o una red de VPC con intercambio de tráfico, haz clic en Opciones avanzadas (opcional).
    Usa las siguientes instrucciones para configurar las opciones avanzadas como, por ejemplo, una cuenta de servicio personalizada.
    • Para especificar una cuenta de servicio, selecciona una cuenta de servicio de la lista desplegable Cuenta de servicio.
      Si no especificas una cuenta de servicio, Vertex AI Pipelines ejecuta la canalización con la cuenta de servicio predeterminada de Compute Engine.
      Obtén más información sobre cómo configurar una cuenta de servicio para que se use con Vertex AI Pipelines.
    • Para usar una clave de encriptación administrada por el cliente (CMEK), selecciona Usar una clave de encriptación administrada por el cliente. Aparecerá la lista desplegable Selecciona una clave administrada por el cliente. En la lista desplegable Selecciona una clave administrada por el cliente, selecciona la clave que deseas usar.
    • Para usar una red de VPC con intercambio de tráfico en la ejecución de esta canalización, ingresa el nombre de la red de VPC en el cuadro Red de VPC con intercambio de tráfico.
  6. Haga clic en Continuar.
    Aparece la ubicación Cloud Storage y el panel Parámetros de canalización.
    • Obligatorio: Ingresa el directorio de salida de Cloud Storage, por ejemplo, gs://location_of_directory.
    • Especifica los parámetros que deseas usar para esta ejecución de canalización (opcional).
  7. Haz clic en Submit para crear la ejecución de la canalización.
  8. Luego de que se envía la canalización, aparece en la tabla de la consola de Google Cloud de la canalización.
  9. En la fila asociada a tu canalización, haz clic en  Ver más > Agregar al experimento.
    • Selecciona un Experimento existente o crea uno nuevo.
    • Opcional: Si las Ejecuciones del experimento están asociadas con el Experimento, aparecen en el menú desplegable. Selecciona una Ejecución de experimento existente.
  10. Haz clic en Guardar.

Compara una ejecución de canalización con ejecuciones de experimentos con la consola de Google Cloud

  1. En la consola de Google Cloud, ve a la página Experimentos.
    <a{: class="button button-primary" l10n-attrs-original-order="href,target,class,track-name,track-type" l10n-encrypted-href="V3Ae1hvcBOij4KvUNiRrMltigmNHgUGOXn/QVSGplOhBlpxunv8WHL3F/z3VuS9rwbZOYpOQCXa+v4aZ0dt03w==" target="console" track-name="consoleLink" track-type="tasks" }="">Ir a experimentos.
    En la página Experimentos, aparece una lista de experimentos. </a{:>
  2. Selecciona el experimento al que deseas agregar la ejecución de tu canalización.
    Aparecerá una lista de ejecuciones.
  3. Selecciona las ejecuciones que deseas comparar y, luego, haz clic en Comparar
    .
  4. Haz clic en el botón Agregar ejecución. Aparecerá una lista de ejecuciones.
  5. Selecciona la ejecución de la canalización que deseas agregar. Se agregará la ejecución.

SDK de Vertex AI para Python {:#sdk-add-pipeline-run}

En los ejemplos siguientes, se usa la API de PipelineJob.

Asocia una ejecución de canalización con un experimento

En este ejemplo, se muestra cómo asociar una ejecución de canalización con un experimento. Cuando desees comparar las ejecuciones de canalizaciones, debes asociar tus ejecuciones de canalización con un experimento. Consulta init en la documentación de referencia del SDK de Vertex AI para Python.

Python

def log_pipeline_job_to_experiment_sample(
    experiment_name: str,
    pipeline_job_display_name: str,
    template_path: str,
    pipeline_root: str,
    project: str,
    location: str,
    parameter_values: Optional[Dict[str, Any]] = None,
):
    aiplatform.init(project=project, location=location)

    pipeline_job = aiplatform.PipelineJob(
        display_name=pipeline_job_display_name,
        template_path=template_path,
        pipeline_root=pipeline_root,
        parameter_values=parameter_values,
    )

    pipeline_job.submit(experiment=experiment_name)

  • experiment_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
  • pipeline_job_display_name: El nombre definido por el usuario de esta canalización.
  • template_path: La ruta de acceso del archivo JSON o YAML PipelineJob o PipelineSpec. Puede ser una ruta local o un URI de Cloud Storage. Ejemplo: "gs://project.name"
  • pipeline_root: La raíz de los resultados de la canalización. La configuración predeterminada debe ser un bucket en etapa de pruebas.
  • parameter_values: La asignación de nombres de parámetros de entorno de ejecución a sus valores que controlan la ejecución de la canalización.
  • project: El ID del proyecto. Puedes encontrar estos ID en la página de bienvenida de la consola de Google Cloud.
  • location: Consulta Lista de ubicaciones disponibles.

Asocia una ejecución de canalización con una ejecución de experimento

En el ejemplo proporcionado, se asocia la ejecución de una canalización con una ejecución de experimento.

Casos de uso:

  • Cuando realizas el entrenamiento de modelos locales y, luego, ejecutas la evaluación en ese modelo (la evaluación se realiza a través de una canalización). En este caso, te recomendamos escribir las métricas de evaluación de la ejecución de la canalización en una ExperimentRun.
  • Cuando se vuelve a ejecutar la misma canalización varias veces. Por ejemplo, si cambias los parámetros de entrada o si un componente falla y necesitas volver a ejecutarlo.

Cuando asocias una ejecución de canalización a una ejecución de experimento, los parámetros y las métricas no se muestran de manera automática y deben registrarse de forma manual con las APIs de Logging.

Nota: Cuando el parámetro opcional resume se especifica como TRUE, se reanuda la ejecución que se inició antes. Cuando no se especifica, resume se establece de forma predeterminada en FALSE y se crea una ejecución nueva.

Consulta init, start_run y log en la documentación de referencia del SDK de Vertex AI para Python.

Python

def log_pipeline_job_sample(
    experiment_name: str,
    run_name: str,
    pipeline_job: aiplatform.PipelineJob,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

    aiplatform.log(pipeline_job=pipeline_job)

  • experiment_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
  • run_name: Especifica un nombre de ejecución.
  • pipeline_job: Un PipelineJob de Vertex AI
  • project: El ID del proyecto. Puedes encontrarlos en la página de bienvenida de la consola de Google Cloud.
  • location: Consulta Lista de ubicaciones disponibles

Visualiza la lista de ejecuciones de canalizaciones en la consola de Google Cloud

  1. En la sección Vertex AI de la consola de Google Cloud, ve a la página Canalizaciones.

    Ir a la página Canalizaciones

  2. Asegúrate de estar en el proyecto correcto.

  3. En la columna Experimento y Ejecución de experimento, aparecen una lista de experimentos y ejecuciones asociadas con las ejecuciones de canalizaciones de tu proyecto.

Lista de experimentos de Vertex AI

Codelab

¿Qué sigue?

Muestra de notebook relevante