Hier erfahren Sie, wie Sie mit dem Gen AI Evaluation Service in der Google Google Cloud Console beginnen.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
IAM aufrufen - Wählen Sie das Projekt aus.
- Klicken Sie auf Zugriffsrechte erteilen.
-
Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Das ist in der Regel die E‑Mail-Adresse eines Google-Kontos.
- Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
- Klicken Sie auf Weitere Rolle hinzufügen, wenn Sie weitere Rollen zuweisen möchten.
- Klicken Sie auf Speichern.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Make sure that you have the following role or roles on the project: Storage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
IAM aufrufen - Wählen Sie das Projekt aus.
- Klicken Sie auf Zugriffsrechte erteilen.
-
Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Das ist in der Regel die E‑Mail-Adresse eines Google-Kontos.
- Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
- Klicken Sie auf Weitere Rolle hinzufügen, wenn Sie weitere Rollen zuweisen möchten.
- Klicken Sie auf Speichern.
-
Rufen Sie in der Google Cloud Console die Seite „Gen AI Evaluation“ auf.
Klicken Sie auf Neue Bewertung, um die Bewertungsseite zu öffnen.
Wählen Sie für Auswertungs-Dataset definieren eine Option aus:
Datei hochladen: Klicken Sie auf Hochladen, um eine CSV- oder JSONL-Datei hochzuladen. Das Dataset sollte entweder Prompts oder Datensätze enthalten, die in einer Promptvorlage verwendet werden sollen, und optional Modellantworten mit maximal 200 Zeilen.
Daten generieren: Geben Sie eine Prompt-Vorlage ein, um den Gen AI Evaluation Service beim Generieren eines Datasets zu unterstützen. Variablen, die Sie in Ihrer Promptvorlage definieren, werden generiert und in das Dataset eingefügt. Weitere Informationen finden Sie unter Prompt-Vorlagen verwenden.
Zu generierende Variablen definieren: Geben Sie die zu generierenden Variablen und Beschreibungen der Variablen an, um die Generierung zu steuern. Klicken Sie bei Bedarf auf Weitere Variablenbeschreibung hinzufügen.
Geben Sie die Anzahl der zu generierenden Beispiele ein.
Klicken Sie auf Dataset generieren und in der Vorschau ansehen, um ein Dataset zu generieren, das auf Ihrer Promptvorlage und Ihren Variablen basiert. Wenn Sie das Dataset anpassen möchten, können Sie den Variablenbeschreibungen weitere Details hinzufügen und auf Neu generieren klicken.
Modell-Logs verwenden: Verwenden Sie den Snapshot von Prompts und Antworten aus dem protokollierten Traffic des ausgewählten Modells. Sie können diese Option nur verwenden, wenn Sie das Logging von Anfragen/Antworten für ein bereitgestelltes Modell in Vertex AI aktiviert haben. Wenn Sie das Logging gerade erst aktiviert haben, warten Sie, bis genügend Stichproben gesammelt wurden.
Wählen Sie das Modell und die Region aus, aus der Sie Traffic protokollieren möchten. Sie müssen das Logging für das ausgewählte Modell und die ausgewählte Region bereits aktiviert haben.
Geben Sie eine Anzahl der Stichproben ein.
Optional: Aktivieren Sie Nach Prompt-Vorlage filtern, um nur Logs zu verwenden, die Ihrer Prompt-Vorlage entsprechen. Das kann nützlich sein, wenn Sie die ausgewählten Modelle für verschiedene Anwendungsfälle verwenden und einen bestimmten Anwendungsfall bewerten möchten.
Wählen Sie für Zu bewertende Modellantworten definieren eine Option aus:
Aus Dataset (nur verfügbar, wenn Sie für Bewertungs-Dataset definieren die Option Datei hochladen ausgewählt haben): Wenn Sie eines der Felder im hochgeladenen Dataset als Antwort verwenden möchten, wählen Sie eine Antwortspalte aus.
Aus Modell (nur verfügbar, wenn Sie für Bewertungs-Dataset definieren die Option Modelllogs verwenden ausgewählt haben): Wenn Sie Modelllogs als Bewertungs-Dataset verwenden, verwendet der Gen AI Evaluation Service die Modellantworten aus den Modelllogs.
Modell für Anrufe: Wählen Sie ein Modell aus. Der Gen AI Evaluation Service führt Prompts für das ausgewählte Modell aus und verwendet die Antworten für die Bewertung.
Optional: Für Automatisch generierte Bewertungsstatistiken können Sie benutzerdefinierte Anweisungen angeben, um die aus den einzelnen Prompts generierten Bewertungsschemata zu optimieren. Beispiel:
Evaluate the dataset on cultural sensitivity to the countries {name}
Weitere Informationen finden Sie unter Evaluierungsmesswerte definieren.Geben Sie für Name und Ausgabeverzeichnis Folgendes ein:
Name der Bewertung: Geben Sie einen Namen für die Bewertung ein.
Ausgabepfad für private Daten: Geben Sie den Namen eines Cloud Storage-Bucket ein, in dem Sie die Bewertung speichern möchten, oder klicken Sie auf „Durchsuchen“, um den Bucket auszuwählen.
Klicken Sie auf Bewerten.
Rufen Sie in der Google Cloud Console die Seite „Gen AI Evaluation“ auf.
Klicken Sie auf den Namen der Bewertung.
Für jeden Prompt in Ihrem Bewertungs-Dataset wird die Antwort des Modells zusammen mit den Bewertungsergebnissen angezeigt.
Modell bewerten
So bewerten Sie Ihr Modell:
Bewertungsergebnisse ansehen
So rufen Sie ein Bewertungsergebnis auf: