Le service d'étiquetage de données AI Platform est un service couvert par les obligations de Google définies dans l'Avenant relatif au traitement des données dans le cloud.
Le service d'étiquetage de données AI Platform vous permet de travailler avec des étiqueteurs humains afin de générer des étiquettes très précises pour un ensemble de données que vous pouvez utiliser dans des modèles de machine learning.
L'étiquetage de vos données d'entraînement constitue la première étape du cycle de développement du machine learning. Pour entraîner un modèle de machine learning, fournissez des échantillons de données représentatifs que vous souhaitez classer ou analyser, ainsi que l'algorithme de machine learning pour gérer chaque échantillon. Par exemple, pour entraîner un modèle capable d'identifier des fleurs dans des images, vous devez étiqueter des objets tels que tournesols, roses et tulipes dans l'ensemble de données d'images. Pour entraîner un modèle capable d'identifier les noms de maladies dans des documents médicaux, vous devez mettre en surbrillance des mots liés à la maladie dans l'ensemble de données de documents.
Pour commencer à étiqueter les données dans le service d'étiquetage de données AI Platform, créez trois ressources pour les étiqueteurs humains :
- Un ensemble de données contenant les échantillons de données représentatifs à étiqueter
- Un ensemble d'étiquettes répertoriant toutes les étiquettes possibles dans l'ensemble de données
- Un ensemble d'instructions pour guider les étiqueteurs humains dans leurs tâches d'étiquetage
Une fois ces ressources créées, vous les envoyez dans le cadre d'une demande d'étiquetage. Les étiqueteurs humains commencent à annoter les éléments de l'ensemble de données en fonction de vos instructions. Une fois que les étiqueteurs ont terminé, vous pouvez exporter les ensembles de données correctement étiquetés et les utiliser dans le développement du machine learning.
En savoir plus sur les tarifs du service d'étiquetage de données