Servicio de etiquetado de datos de AI Platform

El Servicio de etiquetado de datos de AI Platform está cubierto por las obligaciones de Google establecidas en el Apéndice de procesamiento de datos de Cloud.

El Servicio de etiquetado de datos de AI Platform te permite trabajar con etiquetadores manuales a fin de generar etiquetas de alta precisión para una colección de datos que puedes usar en modelos de aprendizaje automático.

Etiquetar los datos de entrenamiento es el primer paso del ciclo de desarrollo del aprendizaje automático. Para entrenar un modelo de aprendizaje automático, proporciona las muestras de datos representativas que desees clasificar o analizar, junto con el algoritmo de aprendizaje automático para procesar cada muestra. Por ejemplo, para entrenar un modelo que pueda identificar flores en la imagen, necesitas que los objetos como girasoles, rosas y tulipanes se etiqueten en el conjunto de datos de la imagen. Para entrenar un modelo que pueda identificar los nombres de las enfermedades en los documentos médicos, debes destacar las palabras relacionadas con enfermedades en el conjunto de datos del documento.

Para iniciar el etiquetado de datos en el Servicio de etiquetado de datos de AI Platform, crea tres recursos para los etiquetadores manuales:

  • Un conjunto de datos que contenga las muestras de datos representativos para etiquetar
  • Un conjunto de etiquetas que enumere todas las etiquetas posibles en el conjunto de datos
  • Un conjunto de instrucciones para guiar a los etiquetadores manuales en las tareas de etiquetado

Una vez que hayas creado estos recursos, los envías como parte de una solicitud de etiquetado. Los etiquetadores manuales comienzan a anotar los elementos en el conjunto de datos de acuerdo con tus instrucciones. Después de que los etiquetadores manuales terminan el etiquetado, puedes exportar conjuntos de datos bien etiquetados y usar los conjuntos de datos en el desarrollo del aprendizaje automático.

Obtén información sobre los precios del Servicio de etiquetado de datos.