Monta una condivisione NFS per l'addestramento personalizzato

Puoi configurare i tuoi job di addestramento personalizzato per montare condivisioni di file system di rete (NFS) nel container su cui viene eseguito il tuo codice. In questo modo i tuoi job possono accedere ai file remoti come se fossero locali, consentendo una velocità effettiva elevata e una bassa latenza.

Questa guida mostra come montare una condivisione NFS durante l'esecuzione di un job di addestramento personalizzato.

Prima di iniziare

  1. Crea una condivisione NFS in un Virtual Private Cloud (VPC). La condivisione deve essere accessibile senza autenticazione.

    Puoi utilizzare un'istanza Filestore come condivisione NFS. Se utilizzi Filestore, seleziona accesso privato ai servizi come modalità di connessione quando crei un'istanza. Per un esempio, vedi Creare istanze nella documentazione di Filestore.

  2. Segui le istruzioni riportate in Configurare il peering di rete VPC per eseguire il peering di Vertex AI con il VPC che ospita la condivisione NFS.

Informazioni NFS per l'addestramento personalizzato

Quando crei un job di addestramento personalizzato che monta una condivisione NFS, devi specificare quanto segue:

  • Il nome della rete a cui Vertex AI può accedere. Il modo in cui specifichi il nome della rete varia a seconda del tipo di job di addestramento personalizzato. Per maggiori dettagli, vedi Eseguire l'addestramento personalizzato.

  • La configurazione NFS nel campo WorkerPoolSpec. Includi i seguenti campi:

    Campo Descrizione
    nfsMounts.server L'indirizzo IP del server NFS. Deve essere un indirizzo privato nel tuo VPC.
    nfsMounts.path Il percorso di condivisione NFS. Deve essere un percorso assoluto che inizia con /.
    nfsMounts.mountPoint Il punto di montaggio locale. Deve essere un nome di directory UNIX valido. Ad esempio, se il punto di montaggio locale è sourceData, specifica il percorso /mnt/nfs/sourceData dall'istanza VM di addestramento.

    Per saperne di più, consulta Dove specificare le risorse di computing.

Esempio: crea un job personalizzato utilizzando gcloud CLI

  1. Segui i passaggi descritti in Creare un'applicazione di addestramento Python per un container predefinito al fine di creare un'applicazione di addestramento da eseguire su Vertex AI.

  2. Crea un file denominato config.yaml che descriva le impostazioni di montaggio di rete e NFS per il job di addestramento. Utilizza il formato seguente:

    network: projects/PROJECT_NUMBER/global/networks/NETWORK_NAME
    workerPoolSpecs:
        - machineSpec:
            machineType: MACHINE_TYPE
          replicaCount: 1
          pythonPackageSpec:
            executorImageUri: PYTHON_PACKAGE_EXECUTOR_IMAGE_URI or PRE_BUILT_CONTAINER_IMAGE_URI
            packageUris:
              -  PYTHON_PACKAGE_URIS
            pythonModule: PYTHON_MODULE
          nfsMounts:
            - server: NFS_SERVER_IP
              path: NFS_SHARE_NAME
              mountPoint: LOCAL_FOLDER
    

    Sostituisci quanto segue:

    • PROJECT_NUMBER: l'ID del tuo progetto Google Cloud.

    • NETWORK_NAME: il nome del tuo VPC privato o condiviso.

    • MACHINE_TYPE: l'identificatore del tipo di macchina virtuale.

    • PYTHON_PACKAGE_EXECUTOR_IMAGE_URI or PRE_BUILT_CONTAINER_IMAGE_URI: l'URI di un'immagine container inArtifact Registry che eseguirà il pacchetto Python fornito. Vertex AI fornisce un'ampia gamma di immagini esecutore con pacchetti preinstallati per soddisfare i vari casi d'uso degli utenti.

    • PYTHON_PACKAGE_URIS: un elenco separato da virgole di URI di Cloud Storage che specificano i file dei pacchetti Python che compongono il programma di addestramento e i pacchetti dipendenti. Il numero massimo di URI del pacchetto è 100.

    • PYTHON_MODULE: il nome del modulo Python da eseguire dopo l'installazione dei pacchetti.

    • NFS_SERVER_IP: l'indirizzo IP del server NFS.

    • NFS_SHARE_NAME: il percorso di condivisione NFS, ovvero un percorso assoluto che inizia con /.

    • LOCAL_FOLDER: il punto di montaggio locale (nome della directory UNIX).

    Assicurati che il nome della rete sia formattato correttamente e che la condivisione NFS esista nella rete specificata.

  3. Crea il tuo job personalizzato e passa il file config.yaml al parametro --config.

    gcloud ai custom-jobs create \
      --region=LOCATION \
      --display-name=JOB_NAME \
      --config=config.yaml
    

    Sostituisci quanto segue:

    • LOCATION: specifica la regione in cui creare il job.

    • JOB_NAME: un nome per il job personalizzato.

Limitazioni

  • Devi montare la condivisione NFS utilizzando un indirizzo IP interno al VPC; non è consentito utilizzare URL pubblici.

  • I job di addestramento montano le condivisioni NFS senza autenticazione e non andranno a buon fine se sono richiesti nome utente e password.

    Per proteggere i dati, imposta le autorizzazioni sulla condivisione NFS. Se utilizzi Filestore, consulta il controllo dell'accesso nella documentazione di Filestore.

  • Non puoi eseguire contemporaneamente due job di addestramento che montano condivisioni NFS da reti VPC diverse. Ciò è dovuto alla limitazione del peering di rete.