Blocchi note di valutazione

Forniamo diversi esempi di come puoi utilizzare l'IA generativa su Vertex AI di valutazione per eseguire valutazioni sui tuoi modelli di AI generativa.

Valuta i tuoi modelli in tempo reale

Il servizio di valutazione rapida Vertex AI ti consente di valutare di modelli di AI generativa in tempo reale. Per scoprire come utilizzare la valutazione rapida, consulta Esegui una valutazione rapida.

Valuta e ottimizza la progettazione dei modelli di prompt

Utilizza l'SDK di valutazione rapida per valutare l'effetto del prompt engineering. Esamina la statistiche corrispondenti a ogni modello di prompt per capire in che modo le differenze dei prompt influisce sui risultati della valutazione.

Valutare e selezionare gli LLM utilizzando metriche di benchmark

Utilizza l'SDK di valutazione rapida per assegnare un punteggio sia a Gemini Pro che a Text Bison basati su un set di dati di benchmark e su un'attività.

Valuta e seleziona le impostazioni di generazione dei modelli

Utilizzare l'SDK di valutazione rapida per regolare la temperatura di Gemini Pro in un'attività di riepilogo e per valutare quality, fluency, safety e verbosity.

Definisci le metriche

Utilizza l'SDK di valutazione rapida per valutare più modelli di prompt con il tuo e metriche personalizzate.

Valutare l'uso degli strumenti e le chiamate di funzione

Utilizza l'SDK di valutazione rapida per definire una funzione API e uno strumento per modello Gemini. Puoi usare l'SDK anche per valutare l'uso degli strumenti la qualità delle chiamate di funzione in Gemini.

Valuta le risposte generate da RAG per la risposta alle domande

Utilizzare l'SDK di valutazione rapida per valutare un'attività di risposta alle domande da Risposte generate dalla Retrieval Augmented Generation (RAG).

Valuta un LLM in Vertex AI Model Registry rispetto a un modello di terze parti

Utilizza AutoSxS per valutare le risposte tra due modelli e stabilire un vincitore. Tu può fornire le risposte o generarle utilizzando Vertex AI Batch Previsioni.

Verifica l'allineamento dello strumento di valutazione automatica rispetto a un set di dati con preferenze umane

Utilizza AutoSxS per verificare il livello di allineamento delle valutazioni dei classificatori automatici a un insieme di persone le valutazioni che fornisci per una determinata attività. Determina se AutoSxS è sufficiente per il tuo caso d'uso o se necessita di un'ulteriore personalizzazione.

Valuta le catene Langchain

Utilizza l'SDK di valutazione rapida per valutare le catene Langchain. Prepara il impostare la catena Langchain ed eseguire la valutazione.

Passaggi successivi