创建和管理实验运行作业

使用 Python 版 Vertex AI SDK 创建和管理实验运行作业。您可以使用 Google Cloud 控制台删除实验运行作业。

Python 版 Vertex AI SDK

以下示例使用 aiplatform 软件包函数中的 initstart_runend_run,以及 ExperimentClass 中的 delete

创建并启动运行作业

Python

from typing import Optional, Union

from google.cloud import aiplatform


def create_experiment_run_sample(
    experiment_name: str,
    run_name: str,
    experiment_run_tensorboard: Optional[Union[str, aiplatform.Tensorboard]],
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, tensorboard=experiment_run_tensorboard)

  • experiment_name:提供实验的名称。要找到实验列表,您可以在 Google Cloud 控制台的板块导航栏中选择“实验”。
  • run_name:指定与当前会话关联的运行作业名称。 请参阅 Vertex AI SDK 参考文档中的 start_run
  • experiment_run_tensorboard:可选。用于启用和存储使用 log_time_series_metrics 记录到此实验的时序指标的 TensorBoard 资源。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到这些 ID。
  • location:请参阅可用位置列表

结束运行作业

Python

from google.cloud import aiplatform


def end_experiment_run_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

    aiplatform.end_run()

  • experiment_name:提供实验的名称。要找到实验列表,您可以在 Google Cloud 控制台的板块导航栏中选择“实验”。
  • run_name:指定运行作业名称。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到此信息。
  • location:请参阅可用位置列表

恢复运行作业

Python

from google.cloud import aiplatform


def resume_experiment_run_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

  • experiment_name:提供实验的名称。要找到实验列表,您可以在 Google Cloud 控制台的板块导航栏中选择“实验”。
  • run_name:指定要恢复的运行作业的名称。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到此信息。
  • location:请参阅可用位置列表

删除运行作业

Python

from typing import Union

from google.cloud import aiplatform


def delete_experiment_run_sample(
    run_name: str,
    experiment: Union[str, aiplatform.Experiment],
    project: str,
    location: str,
    delete_backing_tensorboard_run: bool = False,
):
    experiment_run = aiplatform.ExperimentRun(
        run_name=run_name, experiment=experiment, project=project, location=location
    )

    experiment_run.delete(delete_backing_tensorboard_run=delete_backing_tensorboard_run)

  • experiment:此实验的名称或实例。要找到实验列表,您可以在 Google Cloud 控制台的板块导航栏中选择“实验”。
  • run_name:指定要删除的运行作业的名称。
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到此信息。
  • location:请参阅可用位置列表
  • delete_backing_tensorboard_run:是否删除存储此运行作业的时序指标的 Vertex AI TensorBoard 运行作业。

管理状态

Python

from typing import Union

from google.cloud import aiplatform


def update_experiment_run_state_sample(
    run_name: str,
    experiment: Union[str, aiplatform.Experiment],
    project: str,
    location: str,
    state: aiplatform.gapic.Execution.State,
) -> None:
    experiment_run = aiplatform.ExperimentRun(
        run_name=run_name,
        experiment=experiment,
        project=project,
        location=location,
    )

    experiment_run.update_state(state)

  • run_name:与实验关联的运行作业名称
  • experiment_name:实验的名称。要找到实验列表,您可以在 Google Cloud 控制台的板块导航栏中选择实验
  • project:您的项目 ID。 您可以在 Google Cloud 控制台的欢迎页面中找到这些项目 ID。
  • location:请参阅可用位置列表
  • statestate 的可能值(在 Google Cloud 控制台中显示为“状态”)如下:
    • aiplatform.gapic.Execution.State.CACHED
    • aiplatform.gapic.Execution.State.CANCELLED
    • aiplatform.gapic.Execution.State.COMPLETE
    • aiplatform.gapic.Execution.State.FAILED
    • aiplatform.gapic.Execution.State.NEW
    • aiplatform.gapic.Execution.State.RUNNING

Google Cloud 控制台

请按照以下步骤删除实验运行作业
  1. 在 Google Cloud 控制台中,前往实验页面。
    前往“实验”
  2. 在实验详情页面中,点击与要删除的实验运行关联的实验的名称。此时会显示实验运行作业页面,其中包含该实验的所有实验运行作业的列表。
  3. 选中与要删除的运行作业关联的复选框。此时会显示删除按钮。
  4. 点击删除
    • 或者,您也可以点击与实验运行作业位于同一行的 选项菜单,然后选择删除

查看实验运行作业列表和运行作业详情

Google Cloud 控制台可以直观呈现与这些运行作业相关的数据。

后续步骤