Puedes subir registros existentes a tu instancia de Vertex AI TensorBoard que se crearon mediante un entrenamiento local, un entrenamiento fuera de Vertex AI, que creó un colega, que son registros de ejemplo o que se crearon con una instancia de Vertex AI TensorBoard diferente. Los registros se pueden compartir entre varias instancias de Vertex AI TensorBoard.
Vertex AI TensorBoard ofrece Google Cloud CLI y el SDK de Vertex AI para Python para subir registros de TensorBoard. Puedes subir registros desde cualquier entorno que pueda conectarse a Google Cloud.
SDK de Vertex AI para Python
Supervisión continua
Para la supervisión continua, llama a aiplatform.start_upload_tb_log
al comienzo del entrenamiento.
El SDK abre un nuevo subproceso para la carga. Este subproceso supervisa si hay datos nuevos en el directorio y los sube a tu experimento de Vertex AI TensorBoard.
Cuando se complete el entrenamiento, llama a end_upload_tb_log
para finalizar el subproceso del cargador.
Ten en cuenta que, después de llamar a start_upload_tb_log()
, tu subproceso se mantendrá activo, incluso si se genera una excepción. Para asegurarte de que el subproceso se cierre, coloca cualquier código después de start_upload_tb_log()
y antes de end_upload_tb_log()
en una sentencia try
, y llama a end_upload_tb_log()
en finally
.
Python
tensorboard_experiment_name
: Es el nombre del experimento de TensorBoard al que se subirá.logdir
: Es la ubicación del directorio para verificar los registros de TensorBoard.tensorboard_id
: Es el ID de la instancia de TensorBoard. Si no se establece, se usa eltensorboard_id
enaiplatform.init
.project
: . Puedes encontrar el ID del proyecto en la página de bienvenida de la Google Cloud consola Google Cloud .location
: Es la ubicación en la que se encuentra tu instancia de TensorBoard.experiment_display_name
: Es el nombre visible del experimento.run_name_prefix
: Si está presente, todos los experimentos creados por esta invocación tendrán este valor como prefijo en su nombre.description
: Una descripción de cadena para asignar al experimento.
Registro único
Sube registros de TensorBoard
Llama a aiplatform.upload_tb_log
para realizar una carga única de los registros de TensorBoard.
Esto sube los datos existentes en el directorio de registro y, luego, los muestra de inmediato.
Python
tensorboard_experiment_name
: Es el nombre del experimento de TensorBoard.logdir
: Es la ubicación del directorio para verificar los registros de TensorBoard.tensorboard_id
: Es el ID de la instancia de TensorBoard. Si no se establece, se usa eltensorboard_id
enaiplatform.init
.project
: . Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud .location
: Es la ubicación en la que se encuentra tu instancia de TensorBoard.experiment_display_name
: Es el nombre visible del experimento.run_name_prefix
: Si está presente, todos los experimentos creados por esta invocación tendrán este valor como prefijo en su nombre.description
: Una descripción de cadena para asignar al experimento.verbosity
: El nivel de verbosidad de las estadísticas, un número entero. Valores admitidos: 0 - No se imprimen estadísticas de carga. 1 - Imprime estadísticas de carga mientras se suben datos (predeterminado).
Sube registros de perfil
Llama a aiplatform.upload_tb_log
para subir los registros de perfil de TensorBoard a un experimento.
Python
experiment_name
: Es el nombre del experimento de TensorBoard.logdir
: Es la ubicación del directorio para verificar los registros de TensorBoard.project
: . Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud .location
: La ubicación en la que se encuentra tu instancia de TensorBoard.run_name_prefix
: En el caso de los datos del perfil, este es el prefijo de ejecución. El formato del directorio dentro de LOG_DIR debe coincidir con el siguiente:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
allowed_plugins
: Es una lista de complementos adicionales que se permitirán. Para subir datos de perfil, se debe incluir"profile"
CLI
- (Opcional) Crea un entorno virtual dedicado para instalar la CLI de Python del cargador de Vertex AI TensorBoard.
python3 -m venv PATH/TO/VIRTUAL/ENVIRONMENT source PATH/TO/VIRTUAL/ENVIRONMENT/bin/activate
PATH/TO/VIRTUAL/ENVIRONMENT
: Es tu entorno virtual dedicado.
- Instala el paquete de Vertex AI TensorBoard mediante el SDK de Vertex AI
pip install -U pip pip install google-cloud-aiplatform[tensorboard]
- Sube registros de TensorBoard.
- Datos de series temporales y BLOB
tb-gcp-uploader --tensorboard_resource_name \
TENSORBOARD_RESOURCE_NAME
\ --logdir=LOG_DIR
\ --experiment_name=TB_EXPERIMENT_NAME
--one_shot=True - Datos de perfil
tb-gcp-uploader \ --tensorboard_resource_name
TENSORBOARD_RESOURCE_NAME
\ --logdir=LOG_DIR
--experiment_name=TB_EXPERIMENT_NAME
\ --allowed_plugins="profile" --run_name_prefix=RUN_NAME_PREFIX
\ --one_shot=True
- Datos de series temporales y BLOB
TENSORBOARD_RESOURCE_NAME
: El nombre del recurso de TensorBoard que se usa para identificar por completo la instancia de Vertex AI TensorBoard.LOG_DIR
: Es la ubicación de los registros de eventos, que se encuentra en el sistema de archivos local o en Cloud Storage.TB_EXPERIMENT_NAME
: Es el nombre del experimento de TensorBoard, por ejemplo,test-experiment
.RUN_NAME_PREFIX
: En el caso de los datos del perfil, este es el prefijo de ejecución. El formato del directorio dentro deLOG_DIR
debe coincidir con el siguiente:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
De forma predeterminada, la CLI del cargador se ejecuta de forma indefinida, supervisa los cambios en LOG_DIR
y sube los registros recién agregados. --one_shot=True
inhabilita el comportamiento. Ejecuta tb-gcp-uploader --help
para más información.