Versioni e ciclo di vita del modello di generazione di risposte

Vertex AI Search offre più versioni del modello tra cui scegliere quando si generano le risposte. Puoi scegliere le versioni del modello quando utilizzi la funzionalità di ricerca riassunti, nonché risposte e domande aggiuntive.

Modelli disponibili

Vertex AI Search utilizza due tipi di modelli per i casi d'uso di domande e risposte:

  • Modelli LLM di Vertex AI che sono stati testati su attività di risposta alle domande
  • Modelli di Vertex AI Search basati su LLM Vertex AI e ulteriormente addestrati per affrontare attività di domanda e risposta

I modelli Vertex AI Search condividono la stessa data di ritiro dei modelli Vertex AI LLM di base. Il modello LLM di base è disponibile per sei mesi dalla data di rilascio della versione successiva del modello, in base alle norme sul ciclo di vita dei modelli Vertex AI. Prima delle date di interruzione, lascia un tempo sufficiente per la migrazione ai nuovi modelli.

La tabella seguente elenca le specifiche della versione del modello. Quando imposti una specifica del modello, l'API utilizza il modello specificato per generare le risposte.

Versione del modello Generic Sanità
Descrizione Finestra di contesto Data di interruzione Descrizione Finestra di contesto Data di interruzione
stable

La scelta predefinita del modello se la versione del modello non è impostata.

La specifica del modello stable rimanda a gemini-1.5-flash-001/answer_gen/v1.

Il modello designato come stable cambia periodicamente come nuovo la disponibilità di modelli e versioni.

128.000 N/D

La scelta predefinita del modello se la versione del modello non è impostata.

La specifica del modello stable rimanda a gemini-1.5-flash-001/answer_gen/v1.

Il modello designato come stable cambia periodicamente come nuovo la disponibilità di modelli e versioni.

128.000 N/D
gemini-1.0-pro-001/answer_gen/v1

Rimanda al modello gemini-1.0-pro-001.

Il modello viene bloccato dopo il rilascio.

32.000 15 febbraio 2025 Non disponibile
gemini-1.0-pro-002/answer_gen/v1

Una ricerca Vertex AI Search basata su gemini-1.0-pro-002 modello con addestramento aggiuntivo per affrontare attività di domanda e risposta.

Il modello è bloccato dopo il rilascio.

32 carati 9 aprile 2025

Un modello Vertex AI Search basato su gemini-1.0-pro-002 model con addestramento aggiuntivo per gestire le attività di domanda e risposta.

Il modello viene bloccato dopo il rilascio.

32 carati 9 aprile 2025
gemini-1.5-flash-001/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva per gestire le attività di domanda e risposta.

Il modello viene bloccato dopo il rilascio.

128.000 24 maggio 2025

Un modello di Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazioni aggiuntive per affrontare le attività di domande e risposta.

Il modello è bloccato dopo il rilascio.

128.000 24 maggio 2025
gemini-1.5-flash-001/answer_gen/v2

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-001 con ottimizzazione aggiuntiva (versione 2) su dati strutturati e non strutturati combinati per rispondere a domande.

Il modello è bloccato dopo il rilascio.

128.000 24 maggio 2025 Non disponibile
gemini-1.5-flash-002/answer_gen/v1

Un modello Vertex AI Search basato sul modello gemini-1.5-flash-002 con ottimizzazione aggiuntiva per gestire le attività di domanda e risposta.

Il modello è bloccato dopo il rilascio.

128.000 24 set 2025 Non disponibile
text-bison@002/answer_gen/v1

Un modello Vertex AI Search basato sul modello text-bison@002 con addestramento aggiuntivo per affrontare attività di domande e risposte.

Il modello è bloccato dopo il rilascio.

8K 9 ottobre 2024 Non disponibile
medlm-medium/answer_gen/v1 Non disponibile I modelli MedLM sono stati addestrati su informazioni web pubblicamente disponibili su larga scala, set di dati pubblici e set di dati privati concessi in licenza anonimizzati con informazioni sanitarie e mediche. 32 carati 16 novembre 2024
preview

La specifica del modello di anteprima fa riferimento al modello gemini-1.5-pro-002 più recente. Il modello di anteprima è soggetto a modifiche senza preavviso. Se utilizzi questo modello, potresti notare delle modifiche nelle risposte quando il modello cambia. Se vuoi una maggiore coerenza nelle risposte, seleziona un modello specifico.

128 carati N/D medlm-medium/answer_gen/v1 32 carati N/D

Passaggi successivi