Preparação eficiente do PyTorch com dados na nuvem

O Vertex AI Neural Architecture Search não tem requisitos que descrevam como conceber os seus formadores. Por conseguinte, escolha quaisquer frameworks de preparação para criar o preparador.

Para a preparação do PyTorch com grandes quantidades de dados, a prática recomendada é usar o paradigma de preparação distribuída e ler dados do Cloud Storage. Consulte a publicação no blogue Formação eficiente do PyTorch com o Vertex AI para ver métodos de melhoria do desempenho da formação. Pode observar uma melhoria geral do desempenho 6 vezes superior com dados no armazenamento na nuvem através da utilização de WebDataset e da escolha de DistributedDataParallel ou FullyShardedDataParallel estratégias de preparação distribuídas. O desempenho da preparação com dados no Cloud Storage é semelhante ao desempenho da preparação com dados num disco local.

O exemplo de classificação MNasNet pré-criado incorporou estes métodos no respetivo pipeline de preparação.