Vertex AI pour les utilisateurs d'AutoML

Cette page fournit une comparaison entre les anciens produits AutoML et AutoML sur Vertex AI pour aider les anciens utilisateurs d'AutoML à comprendre comment utiliser Vertex AI.

Consultez les tableaux qui s'appliquent à votre cas d'utilisation et passez en revue les modifications susceptibles d'avoir un impact sur votre workflow.

Utilisation générale

Ces différences s'appliquent à tous les utilisateurs de l'IA Vertex.

Operation	Ancien AutoML	Vertex AI
Déploiement du modèle	Déployez un modèle directement pour le rendre disponible pour les prédictions en ligne.	Créez un objet de point de terminaison qui fournit des ressources permettant de diffuser des prédictions en ligne. Déployez ensuite le modèle sur le point de terminaison. Pour demander des prédictions, appelez la méthode `predict()`.
Utilisez un numéro de projet ou un ID de projet	Certaines parties de la documentation d'AutoML montrent des exemples utilisant `project-number`, tandis que d'autres incluent des exemples utilisant `project-id`.	`project-number` et `project-id` fonctionnent tous deux dans l'IA Vertex.

Utilisateurs d'AutoML Natural Language

AutoML Natural Language utilise le type de données text dans Vertex AI.

Opération	AutoML Natural Language	Vertex AI
Formats de données d'entraînement	Vous pouvez utiliser des fichiers CSV pour inclure des extraits de texte intégrés ou pour faire référence à des documents. Pour l'extraction d'entités, vous pouvez utiliser un fichier CSV ou JSON Lines pour faire référence à des documents (aucune compatibilité avec le texte intégré).	Vous pouvez utiliser des fichiers CSV ou JSON Lines, à l'exception de l'extraction d'entités textuelles, pour inclure des extraits de texte intégrés ou pour faire référence à des documents de type `TXT`. L'extraction d'entités n'accepte que les fichiers JSON Lines.
Importation d'un ensemble de données	Vous spécifiez comment diviser les données en vue d'une utilisation ML (pour ENTRAÎNEMENT, TEST et VALIDATION) à l'aide d'un fichier CSV.	Spécifiez les valeurs d'utilisation de ML dans une colonne facultative pour CSV, sur la même ligne que les données, ou en tant que tag dans JSON Lines dans le même objet JSON que les données. Si vous ne spécifiez pas de valeurs d'utilisation de ML, vos données sont automatiquement divisées pour l'entraînement, les tests et la validation. Pour l'analyse des sentiments, les fichiers CSV doivent inclure la valeur maximale du sentiment dans la dernière colonne de chaque ligne.
Annotations d'ensembles de données	Les annotations sont ajoutées à l'ensemble de données au moment de l'importation ou à l'aide de la console Google Cloud. Si vous souhaitez utiliser vos données pour un autre ensemble de données avec un objectif différent, vous devez créer un ensemble de données avec des annotations différentes.	Les annotations sont regroupées dans un objet `AnnotationSet`. Vous pouvez utiliser différents ensembles d'annotations avec le même ensemble de données.
Coûts de stockage	Vous ne payez pas de frais pour les ensembles de données chargés dans la mémoire de stockage interne.	Lorsque vous créez un ensemble de données, les données sont chargées dans Cloud Storage dans votre projet. Ce stockage vous est facturé. En savoir plus
Ajout d'étiquettes aux données	Chargez vos instructions d'étiquetage dans une mémoire de stockage interne et ajoutez-les à la requête de création de tâche. Les annotations sont des objets autonomes.	Vous devez utiliser une URL pour fournir des instructions d'étiquetage. Les annotations font partie de l'objet `Dataset` et ne peuvent pas être manipulées à l'aide de l'API.

Utilisateurs d'AutoML Vision et d'AutoML Video Intelligence

Dans Vertex AI, AutoML Vision et AutoML Video utilisent respectivement les types de données image et vidéo.

Opération	AutoML Vision et AutoML Video	Vertex AI
Format d'entrée des données	Le format JSON Lines n'est pas accepté.	Le format JSON Lines est compatible avec votre source de données.
Importation de données (vidéo uniquement)	Vous spécifiez l'utilisation de ML (ENTRAÎNEMENT, TEST) pour les vidéos à l'aide d'un fichier CSV à deux niveaux.	Spécifiez les valeurs d'utilisation de ML dans une colonne facultative pour CSV, sur la même ligne que les données, ou en tant que tag dans JSON Lines dans le même objet JSON que les données. Si vous ne spécifiez pas de valeurs d'utilisation de ML, vos données sont automatiquement divisées pour l'entraînement, les tests et la validation.
Annotations d'ensembles de données	Les annotations sont ajoutées à l'ensemble de données au moment de l'importation ou à l'aide de la console Google Cloud. Si vous souhaitez utiliser vos données pour un autre ensemble de données avec un objectif différent, vous devez créer un ensemble de données avec des annotations différentes.	Les annotations sont regroupées dans un objet `AnnotationSet`. Vous pouvez utiliser différents ensembles d'annotations avec le même ensemble de données.
Coûts de stockage	Vous ne payez pas de frais pour les ensembles de données chargés dans la mémoire de stockage interne.	Lorsque vous créez un ensemble de données, les données sont chargées dans Cloud Storage dans votre projet. Ce stockage vous est facturé. En savoir plus
Ajout d'étiquettes aux données	Chargez vos instructions d'étiquetage dans une mémoire de stockage interne et ajoutez-les à la requête de création de tâche. Les annotations sont des objets autonomes.	Vous devez utiliser une URL pour fournir des instructions d'étiquetage. Les annotations font partie de l'objet `Dataset` et ne peuvent pas être manipulées à l'aide de l'API.

Utilisateurs d'AutoML Tables

AutoML Tables utilise le type de données tabulaires dans Vertex AI.

Operation	AutoML Tables	Vertex AI
Création d'ensemble de données	Les données sont importées dans la mémoire de stockage interne et les mises à jour ultérieures de la source de données n'affectent pas l'ensemble de données AutoML.	La source de données est référencée plutôt que d'être importée et les mises à jour ultérieures de la source de données sont reflétées si un modèle entraîné à partir de cette source est réentraîné.
Examen du schéma	Lorsque vous importez des données dans un ensemble de données, des statistiques sont automatiquement générées.	Vous devez lancer manuellement la génération de statistiques pour votre ensemble de données.
Examen du schéma	Lorsque vous créez un ensemble de données, vous examinez son schéma pour vous assurer que chaque caractéristique est correctement définie. Les futurs modèles entraînés à partir de cet ensemble de données utiliseront cette conception de schémas sauf si vous la modifiez explicitement.	Lorsque vous entraînez un modèle à partir d'un ensemble de données, Vertex AI crée des transformations par défaut pour chaque caractéristique, que vous pouvez remplacer si elles ne sont pas adaptées à vos données et à votre objectif. Les transformations pour les types de données horodatage et numérique peuvent échouer en raison de données non valides, auquel cas vous pouvez indiquer si vous souhaitez invalider la ligne entière ou uniquement cette colonne.
Diffusion de prédictions à partir d'un modèle exporté	Les prédictions d'un modèle de régression exporté ne renvoient pas d'intervalle de prédiction.	Des intervalles de prédiction sont renvoyés pour les prédictions des modèles de régression exportés.
Importance des fonctionnalités	Vertex Explainable AI offre des fonctionnalités semblables à AI Explanations pour AutoML Tables. Vous pouvez utiliser l'importance des caractéristiques globales pour votre modèle ou l'importance des caractéristiques (attributions des caractéristiques) pour les prédictions de votre modèle.

Utilisateurs de l'API

Pour en savoir plus sur l'API, consultez la documentation de référence sur l'API Vertex AI.

Opération ou entité	Ancien AutoML	Vertex AI
Création de modèle	Pour créer un modèle, utilisez la méthode `model.create()` qui renvoie une opération de longue durée.	Vous devez créer un objet `TrainingPipeline` qui renvoie une tâche d'entraînement.
Utiliser la bibliothèque cliente	Il existe un client API pour l'API.	Il existe différents clients API pour chaque ressource API.
Effectuer une requête de prédiction	Vous demandez des prédictions en appelant la méthode `predict()` sur le modèle.	Pour demander des prédictions, appelez la méthode `predict()` sur la ressource de point de terminaison.
Point de terminaison de prédiction en ligne	`automl.googleapis.com`, `eu-automl.googleapis.com` et certains produits sont également compatibles.	Dans la commande suivante, remplacez `REGION` par la région dans laquelle se trouve le modèle de prédiction. `REGION-aiplatform.googleapis.com`. Exemple : `us-central1-aiplatform.googleapis.com`
Fichiers de schéma et de définition	Toutes les entrées dans les requêtes et les réponses sont définies par le service d'API. Les formats de données sont prédéfinis.	Certains champs de requête et de réponse sont définis dans les fichiers de schéma et de définition. Les formats de données sont définis à l'aide de fichiers de schéma prédéfinis. Cela offre plus de flexibilité pour l'API et les formats de données.
Nom d'hôte	`automl.googleapis.com`	`aiplatform.googleapis.com`
Nom d'hôte régional	Il n'est pas obligatoire pour tous les produits. Exemple : `eu-automl.googleapis.com`	Obligatoire. Exemple : `us-central1-aiplatform.googleapis.com`

Étape suivante

Découvrez les types de modèles AutoML.