Vertex AI pour les utilisateurs d'AutoML

Cette page fournit une comparaison entre les anciens produits AutoML et AutoML sur Vertex AI pour aider les anciens utilisateurs d'AutoML à comprendre comment utiliser Vertex AI.

Consultez les tableaux qui s'appliquent à votre cas d'utilisation et passez en revue les modifications susceptibles d'avoir un impact sur votre workflow.

Utilisation générale

Ces différences s'appliquent à tous les utilisateurs de l'IA Vertex.

Operation Ancien AutoML Vertex AI
Déploiement du modèle Déployez un modèle directement pour le rendre disponible pour les prédictions en ligne. Créez un objet de point de terminaison qui fournit des ressources permettant de diffuser des prédictions en ligne. Déployez ensuite le modèle sur le point de terminaison. Pour demander des prédictions, appelez la méthode predict().
Utilisez un numéro de projet ou un ID de projet Certaines parties de la documentation d'AutoML montrent des exemples utilisant project-number, tandis que d'autres incluent des exemples utilisant project-id. project-number et project-id fonctionnent tous deux dans l'IA Vertex.

Utilisateurs d'AutoML Natural Language

AutoML Natural Language utilise le type de données text dans Vertex AI.

Opération AutoML Natural Language Vertex AI
Formats de données d'entraînement Vous pouvez utiliser des fichiers CSV pour inclure des extraits de texte intégrés ou pour faire référence à des documents. Pour l'extraction d'entités, vous pouvez utiliser un fichier CSV ou JSON Lines pour faire référence à des documents (aucune compatibilité avec le texte intégré). Vous pouvez utiliser des fichiers CSV ou JSON Lines, à l'exception de l'extraction d'entités textuelles, pour inclure des extraits de texte intégrés ou pour faire référence à des documents de type TXT. L'extraction d'entités n'accepte que les fichiers JSON Lines.
Importation d'un ensemble de données Vous spécifiez comment diviser les données en vue d'une utilisation ML (pour ENTRAÎNEMENT, TEST et VALIDATION) à l'aide d'un fichier CSV. Spécifiez les valeurs d'utilisation de ML dans une colonne facultative pour CSV, sur la même ligne que les données, ou en tant que tag dans JSON Lines dans le même objet JSON que les données. Si vous ne spécifiez pas de valeurs d'utilisation de ML, vos données sont automatiquement divisées pour l'entraînement, les tests et la validation.
Pour l'analyse des sentiments, les fichiers CSV doivent inclure la valeur maximale du sentiment dans la dernière colonne de chaque ligne.
Annotations d'ensembles de données Les annotations sont ajoutées à l'ensemble de données au moment de l'importation ou à l'aide de la console Google Cloud. Si vous souhaitez utiliser vos données pour un autre ensemble de données avec un objectif différent, vous devez créer un ensemble de données avec des annotations différentes. Les annotations sont regroupées dans un objet AnnotationSet. Vous pouvez utiliser différents ensembles d'annotations avec le même ensemble de données.
Coûts de stockage Vous ne payez pas de frais pour les ensembles de données chargés dans la mémoire de stockage interne. Lorsque vous créez un ensemble de données, les données sont chargées dans Cloud Storage dans votre projet. Ce stockage vous est facturé. En savoir plus
Ajout d'étiquettes aux données Chargez vos instructions d'étiquetage dans une mémoire de stockage interne et ajoutez-les à la requête de création de tâche. Les annotations sont des objets autonomes. Vous devez utiliser une URL pour fournir des instructions d'étiquetage. Les annotations font partie de l'objet Dataset et ne peuvent pas être manipulées à l'aide de l'API.

Utilisateurs d'AutoML Vision et d'AutoML Video Intelligence

Dans Vertex AI, AutoML Vision et AutoML Video utilisent respectivement les types de données image et vidéo.

Opération AutoML Vision et AutoML Video Vertex AI
Format d'entrée des données Le format JSON Lines n'est pas accepté. Le format JSON Lines est compatible avec votre source de données.
Importation de données (vidéo uniquement) Vous spécifiez l'utilisation de ML (ENTRAÎNEMENT, TEST) pour les vidéos à l'aide d'un fichier CSV à deux niveaux. Spécifiez les valeurs d'utilisation de ML dans une colonne facultative pour CSV, sur la même ligne que les données, ou en tant que tag dans JSON Lines dans le même objet JSON que les données. Si vous ne spécifiez pas de valeurs d'utilisation de ML, vos données sont automatiquement divisées pour l'entraînement, les tests et la validation.
Annotations d'ensembles de données Les annotations sont ajoutées à l'ensemble de données au moment de l'importation ou à l'aide de la console Google Cloud. Si vous souhaitez utiliser vos données pour un autre ensemble de données avec un objectif différent, vous devez créer un ensemble de données avec des annotations différentes. Les annotations sont regroupées dans un objet AnnotationSet. Vous pouvez utiliser différents ensembles d'annotations avec le même ensemble de données.
Coûts de stockage Vous ne payez pas de frais pour les ensembles de données chargés dans la mémoire de stockage interne. Lorsque vous créez un ensemble de données, les données sont chargées dans Cloud Storage dans votre projet. Ce stockage vous est facturé. En savoir plus
Ajout d'étiquettes aux données Chargez vos instructions d'étiquetage dans une mémoire de stockage interne et ajoutez-les à la requête de création de tâche. Les annotations sont des objets autonomes. Vous devez utiliser une URL pour fournir des instructions d'étiquetage. Les annotations font partie de l'objet Dataset et ne peuvent pas être manipulées à l'aide de l'API.

Utilisateurs d'AutoML Tables

AutoML Tables utilise le type de données tabulaires dans Vertex AI.

Operation AutoML Tables Vertex AI
Création d'ensemble de données Les données sont importées dans la mémoire de stockage interne et les mises à jour ultérieures de la source de données n'affectent pas l'ensemble de données AutoML. La source de données est référencée plutôt que d'être importée et les mises à jour ultérieures de la source de données sont reflétées si un modèle entraîné à partir de cette source est réentraîné.
Examen du schéma Lorsque vous importez des données dans un ensemble de données, des statistiques sont automatiquement générées. Vous devez lancer manuellement la génération de statistiques pour votre ensemble de données.
Examen du schéma Lorsque vous créez un ensemble de données, vous examinez son schéma pour vous assurer que chaque caractéristique est correctement définie. Les futurs modèles entraînés à partir de cet ensemble de données utiliseront cette conception de schémas sauf si vous la modifiez explicitement. Lorsque vous entraînez un modèle à partir d'un ensemble de données, Vertex AI crée des transformations par défaut pour chaque caractéristique, que vous pouvez remplacer si elles ne sont pas adaptées à vos données et à votre objectif. Les transformations pour les types de données horodatage et numérique peuvent échouer en raison de données non valides, auquel cas vous pouvez indiquer si vous souhaitez invalider la ligne entière ou uniquement cette colonne.
Diffusion de prédictions à partir d'un modèle exporté Les prédictions d'un modèle de régression exporté ne renvoient pas d'intervalle de prédiction. Des intervalles de prédiction sont renvoyés pour les prédictions des modèles de régression exportés.
Importance des fonctionnalités Vertex Explainable AI offre des fonctionnalités semblables à AI Explanations pour AutoML Tables. Vous pouvez utiliser l'importance des caractéristiques globales pour votre modèle ou l'importance des caractéristiques (attributions des caractéristiques) pour les prédictions de votre modèle.

Utilisateurs de l'API

Pour en savoir plus sur l'API, consultez la documentation de référence sur l'API Vertex AI.

Opération ou entité Ancien AutoML Vertex AI
Création de modèle Pour créer un modèle, utilisez la méthode model.create() qui renvoie une opération de longue durée. Vous devez créer un objet TrainingPipeline qui renvoie une tâche d'entraînement.
Utiliser la bibliothèque cliente Il existe un client API pour l'API. Il existe différents clients API pour chaque ressource API.
Effectuer une requête de prédiction Vous demandez des prédictions en appelant la méthode predict() sur le modèle. Pour demander des prédictions, appelez la méthode predict() sur la ressource de point de terminaison.
Point de terminaison de prédiction en ligne automl.googleapis.com, eu-automl.googleapis.com et certains produits sont également compatibles. Dans la commande suivante, remplacez REGION par la région dans laquelle se trouve le modèle de prédiction.
REGION-aiplatform.googleapis.com. Exemple :
us-central1-aiplatform.googleapis.com
Fichiers de schéma et de définition Toutes les entrées dans les requêtes et les réponses sont définies par le service d'API. Les formats de données sont prédéfinis. Certains champs de requête et de réponse sont définis dans les fichiers de schéma et de définition. Les formats de données sont définis à l'aide de fichiers de schéma prédéfinis. Cela offre plus de flexibilité pour l'API et les formats de données.
Nom d'hôte automl.googleapis.com aiplatform.googleapis.com
Nom d'hôte régional Il n'est pas obligatoire pour tous les produits. Exemple :
eu-automl.googleapis.com
Obligatoire. Exemple :
us-central1-aiplatform.googleapis.com

Étape suivante