É possível usar um conjunto de dados gerenciado para fornecer os dados de origem usados para treinar o AutoML e modelos personalizados na Vertex AI. Um conjunto de dados gerenciado é necessário para o AutoML e é opcional para treinamento personalizado.
Criar um conjunto de dados gerenciado para modelos do AutoML
É possível criar conjuntos de dados gerenciados para treinar modelos do AutoML usando o console do Google Cloud ou a API Vertex AI. As instruções sobre como fazer isso variam um pouco de acordo com o tipo de dados e o objetivo do modelo. Comece preparando seus dados de treinamento.
Imagem
Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos de imagem do AutoML:
Tabular
Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos tabulares do AutoML:
Textos
.Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos de texto do AutoML:
- Modelos de classificação de texto
- Modelos de extração de entidades de texto
- Modelos de análise de sentimento em texto
Vídeo
Saiba como criar um conjunto de dados gerenciado para os seguintes tipos de modelos de vídeo do AutoML:
- Modelos de reconhecimento de ação em vídeo
- Modelos de classificação de vídeo
- Modelos de rastreamento de objetos em vídeo
Criar um conjunto de dados gerenciado para modelos treinados personalizados
As instruções sobre como criar um conjunto de dados gerenciado para treinar modelos personalizados são as mesmas, independentemente do tipo de dados ou do objetivo do modelo.
Para mais detalhes, consulte Usar conjuntos de dados gerenciados.
Ver conjuntos de dados gerenciados usando o serviço Data Catalog do Dataplex
O Data Catalog é um serviço de metadados escalonável e totalmente gerenciado no Dataplex que fornece um local centralizado para pesquisar conjuntos de dados em projetos e regiões.
Para detalhes, consulte a visão geral Usar o Data Catalog para pesquisar recursos de modelo e conjunto de dados.