Addestramento PyTorch efficiente con i dati cloud

Vertex AI Neural Architecture Search non ha requisiti che descrivono come progettare gli allenatori. Pertanto, scegli qualsiasi framework di addestramento per creare l'addestratore.

Per l'addestramento di PyTorch con grandi quantità di dati, la best practice è utilizzare il paradigma di addestramento distribuito e leggere i dati da Cloud Storage. Consulta il post del blog Addestramento PyTorch efficiente con Vertex AI per scoprire metodi per migliorare le prestazioni dell'addestramento. Puoi ottenere un miglioramento complessivo del rendimento di sei volte con i dati su Cloud Storage utilizzando WebDataset e scegliendo le strategie di addestramento distribuito DistributedDataParallel o FullyShardedDataParallel. Le prestazioni dell'addestramento che utilizzano i dati su Cloud Storage sono simili a quelle che utilizzano i dati su un disco locale.

L'esempio di classificazione MNasNet precompilato ha incorporato questi metodi nella pipeline di addestramento.