Gemini para usuarios del modelo de texto de AutoML

En esta página, se proporcionan comparaciones entre el modelo de texto de AutoML y Gemini para ayudar a los usuarios del modelo de texto de AutoML a comprender cómo usar Gemini.

Verifica las tablas que se aplican a tu caso de uso y revisa los cambios que es probable que afecten tu flujo de trabajo.

Uso general

Estas diferencias se aplican a todos los usuarios de Gemini.

Operación Texto de AutoML Gemini
Formatos de datos de entrenamiento Puedes usar archivos CSV o de líneas JSON, excepto para la extracción de entidades de texto, para incluir fragmentos de texto intercalados o para hacer referencia a documentos de tipo TXT. La extracción de entidades solo admite archivos de líneas JSON. Solo puedes usar archivos de líneas JSON. Cada línea del archivo debe representar un ejemplo de entrenamiento único. Puedes descargar un conjunto de datos de muestra para ajustar los modelos de Gemini. Los archivos deben almacenarse en Cloud Storage.
Anotación de conjuntos de datos Las anotaciones se agrupan como un objeto AnnotationSet. Puedes usar diferentes conjuntos de anotaciones con el mismo conjunto de datos. Las anotaciones de conjuntos de datos no se pueden aplicar con Gemini.
Importación de conjuntos de datos Especifica los valores de uso del AA en una columna opcional para CSV, en la misma fila de los datos o como una etiqueta en líneas JSONL en el mismo objeto JSON que los datos. Si no especificas los valores de uso del AA, los datos se dividirán de forma automática para el entrenamiento, las pruebas y la validación.
Para el análisis de opiniones, los archivos CSV deben incluir el valor máximo de la opinión en la última columna de cada fila.
Debes tener dos archivos JSONL separados, uno para el entrenamiento y otro para la validación. El archivo de validación es opcional. El archivo de validación debe tener entre 10 y 256 ejemplos.
Costos de almacenamiento Cuando creas un conjunto de datos, tus datos se cargan en Cloud Storage en tu proyecto. Se te cobra por este almacenamiento. Obtén más información. Cuando creas un conjunto de datos, tus datos se cargan en Cloud Storage en tu proyecto. Se te cobra por este almacenamiento. Más información
Etiquetado de datos Proporciona instrucciones de etiquetado mediante una URL. Las anotaciones son parte del objeto Dataset y no se pueden manipular con la API. El etiquetado de datos no se aplica con Gemini.
Implementación del modelo Crea un objeto de Endpoint que proporcione recursos para entregar predicciones en línea. Luego, implementa el modelo en el extremo. Para solicitar predicciones, llama al método predict(). Después de ajustar Gemini, el modelo se almacena en Vertex AI Model Registry y se crea un extremo automáticamente. Las predicciones en línea del modelo ajustado se pueden solicitar con el SDK de Python, la API de REST o la consola. Para solicitar predicciones, primero recupera el extremo ajustado y, luego, usa el método generate_content().
Usa el número o ID del proyecto project-number y project-id funcionan en Vertex AI. Gemini usa project-id.

Usuarios de la API

Para obtener información detallada sobre la API, consulta la documentación de referencia de la API de ajuste con IA generativa en Vertex AI.

Operación o entidad Texto de AutoML Gemini
Creación de modelos Crea un objeto TrainingPipeline, que muestre un trabajo de entrenamiento. Creas un trabajo de ajuste fino supervisado que muestra el trabajo de ajuste.
Usa la biblioteca cliente Existen diferentes clientes de API para cada recurso de API. Puedes crear un trabajo de ajuste supervisado para Gemini con el SDK de Python, la API de REST o la consola.
Solicita predicciones Solicita predicciones con una llamada al método predict() en el recurso de extremo. Para solicitar predicciones, primero recupera el extremo ajustado y, luego, usa el método generate_content.
Extremo de predicción en línea A continuación, reemplaza REGION por la región en la que se encuentra tu modelo de predicción.
REGION-aiplatform.googleapis.com. Por ejemplo:
us-central1-aiplatform.googleapis.com
A continuación, reemplaza TUNING_JOB_REGION por la región en la que se ejecuta tu trabajo de ajuste.
TUNING_JOB_REGION-aiplatform.googleapis.com. Por ejemplo:
us-central1-aiplatform.googleapis.com
Archivos de esquema y definición Algunos campos de solicitud y respuesta se definen en archivos de esquema y de definición. Los formatos de datos se definen mediante archivos de esquema predefinidos. Este proceso ofrece flexibilidad para la API y los formatos de datos. El cuerpo de la solicitud, los parámetros del modelo y el cuerpo de la respuesta son los mismos que con los modelos de Gemini no ajustados. Consulta las solicitudes de muestra.
Nombre de host aiplatform.googleapis.com aiplatform.googleapis.com
Nombre de host regional Obligatorio. Por ejemplo:
us-central1-aiplatform.googleapis.com
Obligatorio. Por ejemplo:
us-central1-aiplatform.googleapis.com

¿Qué sigue?