Questa pagina fornisce informazioni sui modelli di IA generativa precedenti su Vertex AI. I modelli di una famiglia di modelli legacy non vengono più aggiornati con nuove versioni stabili. Quando tutte le versioni stabili di un modello legacy raggiungono le date di ritiro, la famiglia di modelli non è più supportata.
Modelli API PaLM
La tabella seguente riassume i modelli precedenti dell'API PaLM:
Nome modello | Descrizione | Proprietà del modello | Assistenza per l'ottimizzazione |
---|---|---|---|
PaLM 2 per Text ( text-bison ) |
Ottimizzato per seguire le istruzioni del linguaggio naturale ed è adatto a varie attività linguistiche, come classificazione, riassunto, ed estrazione. | Numero massimo di token di input: 8192 Numero massimo di token di output: 1024 Dati di addestramento: fino a febbraio 2023 |
Supervisionato: Sì RLHF: Sì (Anteprima) Distillazione: No |
PaLM 2 per Text (text-unicorn ) |
Il modello di testo più avanzato della famiglia di modelli PaLM da utilizzare con compiti di linguaggio naturale complessi. | Numero massimo di token di input: 8192 Numero massimo di token di output: 1024 Dati di addestramento: fino a febbraio 2023 |
Supervisionato: no RLHF: No Distillazione: Sì (Anteprima) |
PaLM 2 per Text 32k ( text-bison-32k ) |
Ottimizzato per seguire le istruzioni del linguaggio naturale ed è adatto a in una varietà di attività relative alle lingue. | Numero massimo di token (input + output): 32.768 Numero massimo di token di output: 8192 Dati di addestramento: fino ad agosto 2023 |
Supervisionato: Sì RLHF: No Distillazione: No |
PaLM 2 per Chat ( chat-bison ) |
Ottimizzato per casi d'uso di conversazioni in più passaggi. | Numero massimo di token di input: 8192 Numero massimo di token di output: 2048 Dati di addestramento: fino a febbraio 2023 Numero massimo di turni : 2500 |
Supervisionata: Sì RLHF: No Distillazione: No |
PaLM 2 per Chat 32k ( chat-bison-32k ) |
Ottimizzato per casi d'uso di conversazioni in più passaggi. | Token massimi (input + output): 32.768 Token di output massimi: 8.192 Dati di addestramento: fino ad agosto 2023 Giri massimi: 2500 |
Supervisionato: Sì RLHF: No Distillazione: No |
Modelli delle API Codey
La tabella seguente riassume i modelli legacy delle API Codey. Tieni presente che il
code-gecko
modello di completamento del codice non è un modello precedente.
Nome modello | Descrizione | Proprietà del modello | Assistenza per l'ottimizzazione |
---|---|---|---|
Codey per la generazione del codice ( code-bison ) |
Un modello ottimizzato per generare codice in base a una descrizione in linguaggio naturale del codice desiderato. Ad esempio, può generare il test delle unità di una funzione. | Numero massimo di token di input: 6144 Numero massimo di token di output: 1024 |
Supervisionata: Sì RLHF: No Distillazione: No |
Codey per la generazione del codice 32k ( code-bison-32k ) |
Un modello ottimizzato per generare codice in base a una descrizione in linguaggio naturale del codice desiderato. Ad esempio, può generare un test di unità per una funzione. | Numero massimo di token (input + output): 32.768 Numero massimo di token di output: 8192 |
Supervisionato: Sì RLHF: No Distillazione: No |
Codey for Codey Chat ( codechat-bison ) |
Un modello ottimizzato per il chatbot che aiutano con domande relative al codice. | Numero massimo di token di input: 6144 Numero massimo di token di output: 1024 |
Supervisionata: Sì RLHF: No Distillazione: No |
Codey for Codey Chat 32k ( codechat-bison-32k ) |
Un modello ottimizzato per le conversazioni con i chatbot che aiuta a rispondere alle domande relative al codice. | Numero massimo di token (input + output): 32.768 Numero massimo di token di output: 8192 |
Supervisionata: Sì RLHF: No Distillazione: No |
Supporto dei linguaggi
API Vertex AI PaLM e API Codey i modelli precedenti supportano le seguenti lingue:
- Arabo (
ar
) - Bengali (
bn
) - Bulgaro (
bg
) - Cinese semplificato e tradizionale (
zh
) - Croato (
hr
) - Ceco (
cs
) - Danese (
da
) - Olandese (
nl
) - Inglese (
en
) - Estone (
et
) - Finlandese (
fi
) - Francese (
fr
) - Tedesco (
de
) - Greco (
el
) - Ebraico (
iw
) - Hindi (
hi
) - Ungherese (
hu
) - Indonesiano (
id
) - Italiano (
it
) - Giapponese (
ja
) - Coreano (
ko
) - Lettone (
lv
) - Lituano (
lt
) - Norvegese (
no
) - Polacco (
pl
) - Portoghese (
pt
) - Rumeno (
ro
) - Russo (
ru
) - Serbo (
sr
) - Slovacco (
sk
) - Sloveno (
sl
) - Spagnolo (
es
) - Swahili (
sw
) - Svedese (
sv
) - Thailandese (
th
) - Turco (
tr
) - Ucraino (
uk
) - Vietnamita (
vi
)
Data di interruzione del modello precedente
La seguente tabella mostra la data di ritiro dei modelli precedenti:
modello chat-bison | Data di uscita | Data di interruzione |
---|---|---|
chat-bison@002 | 6 dicembre 2023 | 9 aprile 2025 |
modello chat-bison-32k | Data di uscita | Data di interruzione |
---|---|---|
chat-bisonte-32k@002 | 4 dicembre 2023 | 9 aprile 2025 |
modello code-bison | Data di uscita | Data di ritiro |
---|---|---|
codice-bison@002 | 6 dicembre 2023 | 9 aprile 2025 |
Modello code-bison-32k | Data di uscita | Data di interruzione |
---|---|---|
codice-bison-32k@002 | 4 dicembre 2023 | 9 aprile 2025 |
codechat-bison model | Data di uscita | Data di interruzione |
---|---|---|
codechat-bison@002 | 6 dicembre 2023 | 9 aprile 2025 |
modello codechat-bison-32k | Data di uscita | Data di ritiro |
---|---|---|
codechat-bison-32k@002 | 4 dicembre 2023 | 9 aprile 2025 |
modello text-bison | Data di uscita | Data di interruzione |
---|---|---|
text-bison@002 | 6 dicembre 2023 | 9 aprile 2025 |
Modello text-bison-32k | Data di uscita | Data di ritiro |
---|---|---|
text-bison-32k@002 | 4 dicembre 2023 | 9 aprile 2025 |
modello text-unicorn | Data di uscita | Data di ritiro |
---|---|---|
text-unicorn@001 | 30 novembre 2023 | 9 aprile 2025 |
Modelli precedenti che supportano la velocità effettiva sottoposta a provisioning
Questa tabella mostra i modelli precedenti che supportano la portata pianificata, misurata in caratteri al secondo, incrementi minimi di acquisto e tassi di burndown.
Modello | Velocità effettiva per GSU | Incremento minimo di acquisto di GSU | Tassi di burndown |
---|---|---|---|
text-bison , chat-bison ,
code-bison codechat-bison |
4000 | 1 | 1 carattere di input = 1 carattere 1 carattere di output = 2 caratteri |
text-unicorn |
400 | 1 | 1 carattere di input = 1 carattere 1 carattere di output = 3 caratteri |