Obtén más información para comenzar a usar el servicio de evaluación de IA generativa con la consola de Google Google Cloud .
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Otorgar acceso.
-
En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.
- En la lista Seleccionar un rol, elige uno.
- Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
- Haz clic en Guardar.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Otorgar acceso.
-
En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.
- En la lista Seleccionar un rol, elige uno.
- Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
- Haz clic en Guardar.
-
En la consola de Google Cloud , ve a la página Gen AI Evaluation.
Haz clic en Nueva evaluación para abrir la página de evaluación.
En Define evaluation dataset, selecciona una opción:
Subir archivo: Haz clic en Subir para subir un archivo CSV o JSONL. El conjunto de datos debe contener instrucciones o registros para usar en una plantilla de instrucciones y, de manera opcional, respuestas del modelo, con un máximo de 200 filas.
Generar datos: Ingresa una Plantilla de instrucción para guiar al servicio de evaluación de IA generativa en la generación de un conjunto de datos. Las variables que definas en tu plantilla de instrucciones se generarán y propagarán en el conjunto de datos. Para obtener más información, consulta Cómo usar plantillas de instrucciones.
Define variables para generar: Especifica las variables que se generarán y las descripciones de las variables para guiar la generación. Si es necesario, haz clic en Agregar otra descripción de la variable.
Ingresa la Cantidad de muestras que se generarán.
Haz clic en Generar y obtener una vista previa del conjunto de datos para mostrar un conjunto de datos generado en función de tu plantilla de instrucciones y variables. Para ajustar el conjunto de datos, puedes agregar más detalles a las descripciones de las variables y hacer clic en Volver a generar.
Usar registros del modelo: Usa la instantánea de instrucciones y respuestas del tráfico registrado del modelo seleccionado. Solo puedes usar esta opción si tienes habilitados los registros de solicitud-respuesta en un modelo implementado en Vertex AI. Si acabas de habilitar el registro, espera a que se acumulen suficientes muestras.
Selecciona el modelo y la región desde la que deseas registrar el tráfico. Ya debes haber habilitado el registro en el modelo y la región seleccionados.
Ingresa un Recuento de muestreo.
(Opcional) Habilita Filtrar por plantilla de instrucciones para usar solo los registros que coincidan con tu Plantilla de instrucciones. Esto puede ser útil si usas los modelos seleccionados para una variedad de casos de uso y deseas evaluar uno específico.
En Define model responses to evaluate, selecciona una opción:
From dataset (solo disponible si seleccionaste Upload file para Define evaluation dataset): Si deseas usar uno de los campos del conjunto de datos subido como respuesta, selecciona una columna de respuesta.
From model (Desde el modelo; solo disponible si seleccionaste Usar registros del modelo para Definir el conjunto de datos de evaluación): Si usas los registros del modelo como el conjunto de datos de evaluación, el servicio de evaluación de IA generativa usa las respuestas del modelo de los registros del modelo.
Modelo de llamada: Selecciona un modelo. El servicio de evaluación de IA generativa ejecuta instrucciones en el modelo seleccionado y usa las respuestas para la evaluación.
(Opcional) En el caso de las métricas de evaluación generadas automáticamente, puedes especificar instrucciones personalizadas para guiar las rúbricas generadas a partir de cada instrucción. Por ejemplo,
Evaluate the dataset on cultural sensitivity to the countries {name}
. Para obtener más información, consulta Define tus métricas de evaluación.En Nombre y directorio de salida, ingresa lo siguiente:
Nombre de la evaluación: Ingresa un nombre para la evaluación.
Ruta de acceso a los datos privados de salida: Ingresa el nombre de un bucket de Cloud Storage en el que quieras almacenar tu evaluación o haz clic en Explorar para elegir el bucket.
Haz clic en Evaluar.
En la consola de Google Cloud , ve a la página Gen AI Evaluation.
Haz clic en el nombre de la evaluación.
Para cada instrucción en tu conjunto de datos de evaluación, se muestra la respuesta del modelo junto con los resultados de la evaluación.
Evalúa tu modelo
Para evaluar tu modelo, haz lo siguiente:
Cómo ver los resultados de tu evaluación
Para ver el resultado de una evaluación, sigue estos pasos: