Registra de forma automática los datos en una ejecución de experimento

El registro automático es una función del SDK de Vertex AI que registra automáticamente los parámetros y las métricas de las ejecuciones de entrenamiento de modelos en Vertex AI Experiments. Esto puede ahorrar tiempo y esfuerzo, ya que elimina la necesidad de registrar estos datos de forma manual. Por el momento, el registro automático solo admite el registro de parámetros y métricas.

Registro automático de datos

Existen dos opciones para registrar datos de forma automática en Vertex AI Experiments.

  1. Permite que el SDK de Vertex cree los recursos de ExperimentRun de forma automática.
  2. Especifica el recurso ExperimentRun en el que deseas que se escriban los parámetros y las métricas registrados automáticamente
    .

Creados automáticamente

El SDK de Vertex AI para Python controla la creación de recursos ExperimentRun. Los recursos ExperimentRun creados de forma automática tendrán un nombre de ejecución con el siguiente formato: {ml-framework-name}-{timestamp}-{uid}; por ejemplo: “tensorflow-2023-01-04-16-09-20-86a88”.

En el siguiente ejemplo, se usa el método init, de las funciones de paquetes aiplatform.

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_auto_run_creation_sample(
    experiment_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    # Your model training code goes here

    aiplatform.autolog(disable=True)

  • experiment_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
  • experiment_tensorboard: (Opcional) Proporciona un nombre para tu instancia de Vertex AI TensorBoard.
  • project: El ID del proyecto. Puedes encontrar estos IDs en la página de bienvenida de la consola de Google Cloud.
  • location: Consulta Lista de ubicaciones disponibles

Especificado por el usuario

Proporciona tus propios nombres de ExperimentRun, y ten métricas y parámetros de varias ejecuciones de entrenamiento de modelos registradas en la misma ExperimentRun. Cualquier métrica desde el modelo hasta la ejecución actual llama a aiplatform.start_run("your-run-name") hasta que se llama a aiplatform.end_run().

En el siguiente ejemplo, se usa el método init, de las funciones de paquetes aiplatform.

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_manual_run_creation_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    aiplatform.start_run(run=run_name)

    # Your model training code goes here

    aiplatform.end_run()

    aiplatform.autolog(disable=True)

  • experiment_name: Proporciona el nombre del experimento.
  • run_name: Proporciona un nombre para tu experimento. Para encontrar tu lista de experimentos en la consola de Google Cloud, selecciona Experimentos en la barra de navegación de secciones.
  • project: El ID del proyecto. Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud.
  • location: Consulta Lista de ubicaciones disponibles
  • experiment_tensorboard: (Opcional) Proporciona un nombre para tu instancia de Vertex AI TensorBoard.

El registro automático del SDK de Vertex AI usa el registro automático de MLFlow en su implementación. Las métricas y los parámetros de evaluación de los siguientes frameworks se registran en ExperimentRun cuando el registro automático está habilitado.

  • Fastai
  • Gluon
  • Keras
  • LightGBM
  • Pytorch Lightning
  • Scikit-learn
  • Spark
  • Statsmodels
  • XGBoost

Visualiza métricas y parámetros registrados automáticamente

Usa el SDK de Vertex AI para Python a fin de comparar ejecuciones y obtener datos de ejecuciones. La consola de Google Cloud proporciona una forma fácil de comparar estas ejecuciones.

Muestra de notebook relevante

Entrada de blog