Questa pagina è stata tradotta dall'API Cloud Translation.

Specifica la configurazione della macchina per un passaggio della pipeline

I componenti della pipeline di Kubeflow sono funzioni factory che creano i passaggi della pipeline. Ogni componente descrive gli input, gli output e l'implementazione del componente. Ad esempio, train_op è un componente nel seguente esempio di codice.

Ad esempio, un componente di addestramento potrebbe prendere un file CSV come input e usarlo per addestrare un modello. Impostando i parametri del tipo di macchina nel passaggio della pipeline, puoi gestire i requisiti di ogni passaggio della pipeline. Se hai due passaggi di addestramento e un passaggio esegue l'addestramento su un file di dati di grandi dimensioni e il secondo passaggio esegue l'addestramento su un file di dati di piccole dimensioni, puoi allocare più memoria e CPU alla prima attività e meno risorse alla seconda.

Per impostazione predefinita, il componente verrà eseguito come Vertex AI CustomJob utilizzando una macchina e2-standard-4, con CPU a 4 core e 16 GB di memoria. Per saperne di più sulla selezione di una delle risorse macchina specifiche per Google Cloudelencate in Tipi di macchine, consulta Richiedere risorse macchina Google Cloud con Vertex AI Pipelines.

Il seguente esempio mostra come impostare le impostazioni di configurazione di CPU, memoria e GPU per un passaggio:

from kfp import dsl

@dsl.pipeline(name='custom-container-pipeline')
def pipeline():
  generate = generate_op()
  train = (
    train_op(
      training_data=generate.outputs['training_data'],
      test_data=generate.outputs['test_data'],
      config_file=generate.outputs['config_file'])
    .set_cpu_limit('CPU_LIMIT')
    .set_memory_limit('MEMORY_LIMIT')
    .add_node_selector_constraint(SELECTOR_CONSTRAINT)
    .set_accelerator_type(ACCELERATOR_TYPE)
    .set_accelerator_limit(ACCELERATOR_LIMIT))

Sostituisci quanto segue:

CPU_LIMIT: il limite massimo di CPU per questo operatore. Questo valore stringa può essere un numero (valore intero per il numero di CPU) o un numero seguito da "m", che significa 1/1000. Puoi specificare al massimo 96 CPU.
MEMORY_LIMIT: Il limite massimo di memoria per questo operatore. Questo valore stringa può essere un numero o un numero seguito da "K" (kilobyte), "M" (megabyte) o "G" (gigabyte). Sono supportati al massimo 624 GB.

Nota: Vertex AI Pipelines non supporta la chiamata di set_memory_request su un operatore; devi utilizzare set_memory_limit per richiedere una quantità specifica di memoria.
SELECTOR_CONSTRAINT: ogni vincolo è un'etichetta di coppia chiave-valore. Affinché il container possa essere eseguito su un nodo, il nodo deve avere ogni vincolo come etichetta. Ad esempio: 'cloud.google.com/gke-accelerator', 'NVIDIA_TESLA_T4'

Sono disponibili i seguenti vincoli:
- NVIDIA_GB200⁺ (include GPUDirect-RDMA)
- NVIDIA_B200^* (include GPUDirect-RDMA)
- NVIDIA_H100_MEGA_80GB^* (include GPUDirect-TCPXO)
- NVIDIA_H100_80GB
- NVIDIA_H200_141GB^* (include GPUDirect-RDMA)
- NVIDIA_A100_80GB
- NVIDIA_TESLA_A100 (NVIDIA A100 da 40 GB)
- NVIDIA_TESLA_P4
- NVIDIA_TESLA_P100
- NVIDIA_TESLA_T4
- NVIDIA_TESLA_V100
- NVIDIA_L4
- TPU_V2
- TPU_V3
ACCELERATOR_TYPE: il tipo di acceleratore. Per saperne di più sulle GPU disponibili e su come configurarle, consulta GPU. Per saperne di più sui tipi di TPU disponibili e su come configurarli, consulta TPU. Per saperne di più, consulta il riferimento al parametro accelerator_type.
ACCELERATOR_LIMIT: il limite dell'acceleratore (GPU o TPU) per l'operatore. Puoi specificare un numero intero positivo. Per saperne di più sulle GPU disponibili e su come configurarle, consulta GPU. Per saperne di più sulle TPU disponibili e su come configurarle, consulta la sezione TPU.

Nota :alcuni acceleratori sono disponibili solo in località specifiche. Per ulteriori informazioni, consulta la sezione Utilizzare gli acceleratori.

CustomJob supporta tipi di macchine specifici che ti limitano a un massimo di 96 CPU e 624 GB di memoria. In base alla configurazione di CPU, memoria e acceleratore che specifichi, Vertex AI Pipelines seleziona automaticamente la corrispondenza più vicina tra i tipi di macchine supportati.