Vertex AI para usuarios de AutoML

En esta página, se proporcionan comparaciones entre los productos de AutoML heredado y AutoML en Vertex AI para ayudar a los usuarios de AutoML heredado a comprender cómo usar Vertex AI.

Verifica las tablas que se aplican a tu caso de uso y revisa los cambios que es probable que afecten tu flujo de trabajo.

Uso general

Estas diferencias se aplican a todos los usuarios de Vertex AI.

Operación AutoML heredado Vertex AI
Implementación del modelo Implementa un modelo directamente a fin de que esté disponible para las predicciones en línea. Crea un objeto de Endpoint que proporcione recursos para entregar predicciones en línea. Luego, implementa el modelo en el extremo. Para solicitar predicciones, llama al método predict().
Usa el número o ID del proyecto En algunas partes de la documentación de AutoML, se muestran ejemplos que usan project-number y otros que usan project-id. project-number y project-id funcionan en Vertex AI.

Usuarios de AutoML Natural Language

AutoML Natural Language utiliza el tipo de datos text en Vertex AI.

Operación AutoML Natural Language Vertex AI
Formatos de datos de entrenamiento Puedes usar archivos CSV para incluir fragmentos de texto intercalado o hacer referencia a documentos. Para la extracción de entidades, puedes usar un archivo CSV o JSON Lines a fin de hacer referencia a documentos (sin compatibilidad de texto en línea). Puedes usar archivos CSV o de líneas JSONL, excepto para la extracción de entidades de texto, a fin de incluir fragmentos de texto en línea o para hacer referencia a documentos de tipo TXT. La extracción de entidades solo admite archivos de líneas JSON.
Importación de conjuntos de datos Especifica cómo dividir tus datos para el uso del AA (para TRAIN, TEST y VALIDATION) con un archivo CSV. Especifica los valores de uso del AA en una columna opcional para CSV, en la misma fila de los datos o como una etiqueta en líneas JSONL en el mismo objeto JSON que los datos. Si no especificas los valores de uso del AA, los datos se dividirán de forma automática para el entrenamiento, las pruebas y la validación.
Para el análisis de opiniones, los archivos CSV deben incluir el valor máximo de la opinión en la última columna de cada fila.
Anotación de conjuntos de datos Las anotaciones se agregan al conjunto de datos en el momento de la importación o mediante la consola de Google Cloud. Si quieres usar tus datos para otro conjunto de datos con un objetivo diferente, debes crear un conjunto de datos nuevo con anotaciones diferentes. Las anotaciones se agrupan como un objeto AnnotationSet. Puedes usar diferentes conjuntos de anotaciones con el mismo conjunto de datos.
Costos de almacenamiento No se generan costos por los conjuntos de datos que se carguen en el almacenamiento interno. Cuando creas un conjunto de datos, tus datos se cargan en Cloud Storage en tu proyecto. Se te cobra por este almacenamiento. Más información
Etiquetado de datos Carga las instrucciones de etiquetado en el almacenamiento interno y, luego, inclúyelas en la solicitud de creación de tareas. Las anotaciones son objetos independientes. Proporciona instrucciones de etiquetado mediante una URL. Las anotaciones son parte del objeto Dataset y no se pueden manipular mediante la API.

Usuarios de AutoML Vision y AutoML Video Intelligence

En Vertex AI, AutoML Vision y AutoML Video usa los tipos de datos image y video, respectivamente.

Operación AutoML Vision y AutoML Video Vertex AI
Formato de ingreso de datos No se admite el formato de líneas JSON. El formato de líneas JSON es compatible con la fuente de datos.
Importación de datos (solo video) Especifica el uso del AA (TRAINING, TEST) para los videos que usan un archivo CSV de dos niveles. Especifica los valores de uso del AA en una columna opcional para CSV, en la misma fila de los datos o como una etiqueta en líneas JSONL en el mismo objeto JSON que los datos. Si no especificas valores de uso del AA, los datos se dividirán automáticamente para el entrenamiento, las pruebas y la validación.
Anotación de conjuntos de datos Las anotaciones se agregan al conjunto de datos en el momento de la importación o mediante la consola de Google Cloud. Si quieres usar tus datos para otro conjunto de datos con un objetivo diferente, debes crear un conjunto de datos nuevo con anotaciones diferentes. Las anotaciones se agrupan como un objeto AnnotationSet. Puedes usar diferentes conjuntos de anotaciones con el mismo conjunto de datos.
Costos de almacenamiento No se generan costos por los conjuntos de datos que se carguen en el almacenamiento interno. Cuando creas un conjunto de datos, tus datos se cargan en Cloud Storage en tu proyecto. Se te cobra por este almacenamiento. Más información
Etiquetado de datos Carga las instrucciones de etiquetado en el almacenamiento interno y, luego, inclúyelas en la solicitud de creación de tareas. Las anotaciones son objetos independientes. Proporciona instrucciones de etiquetado mediante una URL. Las anotaciones son parte del objeto Dataset y no se pueden manipular mediante la API.

Usuarios de AutoML Tables

AutoML Tables usa el tipo de datos tabular en Vertex AI.

Operación AutoML Tables Vertex AI
Creación del conjunto de datos Los datos se importan al almacenamiento interno. Las actualizaciones posteriores de la fuente de datos no afectan el conjunto de datos de AutoML. Se hace referencia a la fuente de datos en lugar de a la importación. Las actualizaciones posteriores de la fuente de datos se reflejan si se vuelve a entrenar un modelo entrenado con esa fuente de datos.
Revisión del esquema Cuando importas datos a un conjunto de datos, las estadísticas sobre tus datos se generan automáticamente. Debes iniciar manualmente la generación de estadísticas para tu conjunto de datos.
Revisión del esquema Cuando creas un conjunto de datos, revisa su esquema y asegúrate de que cada conjunto de atributos sea correcto. Los modelos futuros entrenados a partir de ese conjunto de datos usarán este diseño de esquema, a menos que lo cambies de forma explícita. Cuando entrenas un modelo a partir de un conjunto de datos, Vertex AI crea transformaciones predeterminadas para cada atributo, que puedes anular si no son correctas para tus datos y tu objetivo. Las transformaciones en la marca de tiempo y el tipo de datos numéricos pueden fallar debido a datos no válidos. Puedes especificar si deseas que se invalide toda la fila o solo esa columna.
Entrega predicciones desde un modelo exportado Las predicciones de un modelo de regresión exportado no muestran un intervalo de predicción. Se muestran intervalos de predicción para las predicciones de los modelos de regresión exportados.
Importancia de los atributos Vertex Explainable AI proporciona una funcionalidad similar a AI Explanations para AutoML Tables. Puedes usar la importancia de los atributos globales para tu modelo o la importancia de las funciones (atribuciones de atributos) para las predicciones de tu modelo.

Usuarios de la API

Para obtener información detallada sobre la API, consulta la documentación de referencia de la API de Vertex AI.

Operación o entidad AutoML heredado Vertex AI
Creación de modelos Para crear un modelo, usa el método model.create(), que muestra una operación de larga duración. Crea un objeto TrainingPipeline, que muestre un trabajo de entrenamiento.
Usa la biblioteca cliente Hay un cliente de API para la API. Existen diferentes clientes de API para cada recurso de API.
Solicita predicciones Para solicitar predicciones, llama al método predict() en el modelo. Solicita predicciones con una llamada al método predict() en el recurso de extremo.
Extremo de predicción en línea automl.googleapis.com y algunos productos también admiten eu-automl.googleapis.com A continuación, reemplaza REGION por la región en la que se encuentra tu modelo de predicción.
REGION-aiplatform.googleapis.com. Por ejemplo:
us-central1-aiplatform.googleapis.com
Archivos de esquema y definición El servicio de API define todas las entradas de las solicitudes y respuestas. Los formatos de datos están predefinidos. Algunos campos de solicitud y respuesta se definen en archivos de esquema y de definición. Los formatos de datos se definen mediante archivos de esquema predefinidos. Este proceso ofrece flexibilidad para la API y los formatos de datos.
Nombre de host automl.googleapis.com aiplatform.googleapis.com
Nombre de host regional No es obligatorio para todos los productos. Por ejemplo:
eu-automl.googleapis.com
Obligatorio Por ejemplo:
us-central1-aiplatform.googleapis.com

¿Qué sigue?