El servicio de texto de AutoML está obsoleto. En esta página se comparan AutoML Text y Gemini para ayudar a los usuarios de AutoML Text a entender cómo usar Gemini.
Consulta las tablas que se apliquen a tu caso práctico y revisa los cambios que probablemente afecten a tu flujo de trabajo.
Uso general
Estas diferencias se aplican a todos los usuarios de Gemini.
Operación | Texto de AutoML | Gemini |
---|---|---|
Formatos de datos de entrenamiento | Puedes usar archivos CSV o JSON Lines, excepto para la extracción de entidades de texto, para
incluir fragmentos de texto insertados o para hacer referencia a documentos de tipo
TXT . La extracción de entidades solo admite archivos JSON Lines. |
Solo puedes usar archivos JSON Line. Cada línea del archivo debe representar un ejemplo de entrenamiento. Puedes descargar un conjunto de datos de ejemplo para ajustar los modelos de Gemini. Los archivos deben almacenarse en Cloud Storage. |
Anotación de conjuntos de datos |
Las anotaciones se agrupan en un objeto AnnotationSet .
Puedes usar diferentes conjuntos de anotaciones con el mismo conjunto de datos.
|
Las anotaciones de conjuntos de datos no se pueden usar con Gemini. |
Importación de conjuntos de datos | Puede especificar los valores de uso de aprendizaje automático en una columna opcional de un archivo CSV, en la misma fila que los datos, o como una etiqueta en JSON Lines, en el mismo objeto JSON que los datos. Si no especificas valores de uso de aprendizaje automático, tus datos se dividirán automáticamente para la preparación, las pruebas y la validación. En el caso del análisis de sentimiento, los archivos CSV deben incluir el valor máximo del sentimiento en la última columna de cada fila. |
Debes tener dos archivos JSONL independientes, uno para el entrenamiento y otro para la validación. El archivo de validación es opcional. El archivo de validación debe tener entre 10 y 256 ejemplos. |
Costes de almacenamiento | Cuando creas un conjunto de datos, los datos se cargan en Cloud Storage en tu proyecto. Se te cobrará por dicho almacenamiento. Más información | Cuando creas un conjunto de datos, los datos se cargan en Cloud Storage en tu proyecto. Se te cobrará por dicho almacenamiento. Más información |
Etiquetado de datos |
Para proporcionar instrucciones de etiquetado, debes usar una URL. Las anotaciones forman parte del objeto Dataset y no se pueden manipular mediante la API.
|
El etiquetado de datos no se puede usar con Gemini. |
Despliegue de modelo |
Crea un objeto Endpoint, que proporciona recursos para
servir inferencias online. A continuación, despliega el modelo en el endpoint.
Para solicitar inferencias, llama al método
predict() .
|
Después de ajustar Gemini, el modelo se almacena en Vertex AI Model Registry y se crea un endpoint automáticamente. Las inferencias online del modelo ajustado se pueden solicitar mediante el SDK de Python, la API REST o la consola. Para solicitar inferencias, primero debes obtener el endpoint ajustado y, después, usar el método generate_content() .
|
Usar el número o el ID de proyecto |
Tanto project-number como project-id funcionan en Vertex AI.
|
Gemini usa project-id . |
Puntuaciones de confianza | El texto de AutoML admite puntuaciones de confianza. | Gemini no admite puntuaciones de confianza. |
Usuarios de la API
Para obtener información detallada sobre la API, consulta la documentación de referencia de la API Vertex AI Generative AI Tuning.
Operación o entidad | Texto de AutoML | Gemini |
---|---|---|
Creación de modelos |
Crea un objeto TrainingPipeline , que devuelve una tarea de entrenamiento.
|
Crea un trabajo de ajuste fino supervisado que devuelve el trabajo de ajuste. |
Usar la biblioteca cliente | Hay diferentes clientes de API para cada recurso de API. | Puedes crear un trabajo de ajuste fino supervisado para Gemini con el SDK de Python, la API REST o la consola. |
Solicitar inferencias |
Para solicitar inferencias, llama al método predict() del recurso Endpoint.
|
Para solicitar inferencias, primero debes obtener el endpoint ajustado y, a continuación, usar el método generate_content .
|
Endpoint de inferencia online | En el siguiente ejemplo, sustituye REGION por la región en la que se encuentra tu modelo de inferencia.REGION-aiplatform.googleapis.com .
Por ejemplo:us-central1-aiplatform.googleapis.com |
En el siguiente ejemplo, sustituye TUNING_JOB_REGION por la región en la que se ejecuta tu trabajo de ajuste.TUNING_JOB_REGION-aiplatform.googleapis.com .
Por ejemplo:us-central1-aiplatform.googleapis.com |
Archivos de esquema y de definición | Algunos campos de solicitud y respuesta se definen en archivos de esquema y de definición. Los formatos de datos se definen mediante archivos de esquema predefinidos. Esto permite que la API y los formatos de datos sean flexibles. | El cuerpo de la solicitud, los parámetros del modelo y el cuerpo de la respuesta son los mismos que con los modelos de Gemini sin ajustar. Consulta ejemplos de solicitudes. |
Nombre de host | aiplatform.googleapis.com |
aiplatform.googleapis.com |
Nombre de host regional | Obligatorio. Por ejemplo:us-central1-aiplatform.googleapis.com |
Obligatorio. Por ejemplo:us-central1-aiplatform.googleapis.com |
Siguientes pasos
Para empezar a ajustar modelos, consulta Ajuste de modelos de texto de Gemini.