本页面介绍 Vertex AI 上的旧版生成式 AI 模型。旧版模型系列中的模型不再使用新的稳定版本进行更新。当旧版模型的所有稳定版都达到终止日期后,该模型系列将不再受支持。
PaLM API 模型
下表总结了 PaLM API 旧版模型:
| 模型名称 | 说明 | 模型属性 | 调优支持 |
|---|---|---|---|
| PaLM 2 for Text ( text-bison) |
专门为了遵循自然语言指令而进行了微调,适用于各种语言任务,例如分类、摘要和提取。 | 输入词元数上限:8192 输出词元数上限:1024 训练数据:截至 2023 年 2 月 |
监督式:是 RLHF:是 (预览) 蒸馏:否 |
PaLM 2 for Text (text-unicorn) |
PaLM 系列模型中最先进的文本模型,可用于复杂的自然语言任务。 | 输入词元数上限:8192 输出词元数上限:1024 训练数据:截至 2023 年 2 月 |
监督式:否 RLHF:否 蒸馏:是 (预览版) |
| PaLM 2 for Text 32k ( text-bison-32k) |
经过微跳以遵循自然语言指令,适用于各种语言任务。 | 词元数上限(输入 + 输出):32,768 输出词元数上限:8,192 训练数据:截至 2023 年 8 月 |
监督式:是 RLHF:否 蒸馏:否 |
| PaLM 2 for Chat ( chat-bison) |
已针对多轮对话应用场景进行微调。 | 输入词元数上限:8192 输出词元数上限:2048 训练数据:截至 2023 年 2 月 最大轮数:2500 |
监督式:是 RLHF:否 蒸馏:否 |
| PaLM 2 for Chat 32k ( chat-bison-32k) |
已针对多轮对话应用场景进行微调。 | 词元数上限(输入 + 输出):32,768 输出词元数上限:8,192 训练数据:截至 2023 年 8 月 最大轮数:2500 |
监督式:是 RLHF:否 蒸馏:否 |
Codey API 模型
下表总结了 Codey API 旧版模型。请注意,code-gecko 代码补全模型不是旧版模型。
| 模型名称 | 说明 | 模型属性 | 调优支持 |
|---|---|---|---|
| Codey for Code Generation ( code-bison) |
该模型经过调优,可根据所需代码的自然语言描述生成代码。例如,它可以为函数生成单元测试。 | 输入词元数上限:6144 输出词元数上限:1024 |
监督式:是 RLHF:否 蒸馏:否 |
| Codey for Code Generation 32k ( code-bison-32k) |
该模型经过调优,可根据所需代码的自然语言描述生成代码。例如,它可以为函数生成单元测试。 | 词元数上限(输入 + 输出):32,768 输出词元数上限:8,192 |
监督式:是 RLHF:否 蒸馏:否 |
| Codey for Code Chat ( codechat-bison) |
针对聊天机器人对话进行了微调的模型,有助于解决与代码相关的问题。 | 输入词元数上限:6144 输出词元数上限:1024 |
监督式:是 RLHF:否 蒸馏:否 |
| Codey for Code Chat 32k ( codechat-bison-32k) |
针对聊天机器人对话进行了微调的模型,有助于解决与代码相关的问题。 | 词元数上限(输入 + 输出):32,768 输出词元数上限:8,192 |
监督式:是 RLHF:否 蒸馏:否 |
语言支持
Vertex AI PaLM API 和 Codey API 旧版模型支持以下语言:
- 阿拉伯语 (
ar) - 孟加拉语 (
bn) - 保加利亚语 (
bg) - 简体中文和繁体中文 (
zh) - 克罗地亚语 (
hr) - 捷克语 (
cs) - 丹麦语 (
da) - 荷兰语 (
nl) - 英语 (
en) - 爱沙尼亚语 (
et) - 芬兰语 (
fi) - 法语 (
fr) - 德语 (
de) - 希腊语 (
el) - 希伯来语 (
iw) - 印地语 (
hi) - 匈牙利语 (
hu) - 印度尼西亚语 (
id) - 意大利语 (
it) - 日语 (
ja) - 韩语 (
ko) - 拉脱维亚语 (
lv) - 立陶宛语 (
lt) - 挪威语 (
no) - 波兰语 (
pl) - 葡萄牙语 (
pt) - 罗马尼亚语 (
ro) - 俄语 (
ru) - 塞尔维亚语 (
sr) - 斯洛伐克语 (
sk) - 斯洛维尼亚语 (
sl) - 西班牙语 (
es) - 斯瓦希里语 (
sw) - 瑞典语 (
sv) - 泰语 (
th) - 土耳其语 (
tr) - 乌克兰语 (
uk) - 越南语 (
vi)
旧版模型终止日期
下表显示了旧版模型的终止日期:
| chat-bison 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| chat-bison@002 | 2023 年 12 月 6 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| chat-bison-32k 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| chat-bison-32k@002 | 2023 年 12 月 4 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| code-bison 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| code-bison@002 | 2023 年 12 月 6 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| code-bison-32k 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| code-bison-32k@002 | 2023 年 12 月 4 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| codechat-bison 模型 | 发布日期 | 终止日期 |
|---|---|---|
| codechat-bison@002 | 2023 年 12 月 6 日 | 2025 年 4 月 9 日 |
| codechat-bison-32k 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| codechat-bison-32k@002 | 2023 年 12 月 4 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| text-bison 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| text-bison@002 | 2023 年 12 月 6 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| text-bison-32k 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| text-bison-32k@002 | 2023 年 12 月 4 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
| text-unicorn 模型 | 发布日期 | 终止日期 | 建议的升级 |
|---|---|---|---|
| text-unicorn@001 | 2023 年 11 月 30 日 | 2025 年 4 月 9 日 | gemini-2.0-flash |
支持预配吞吐量的旧版模型
下表显示了支持预配吞吐量的旧版模型,预配吞吐量以每秒字符数、最小购买增量和消耗率为计量单位。
| 模型 | 每个 GSU 的吞吐量 | 最小 GSU 购买增量 | 消耗率 |
|---|---|---|---|
text-bison、chat-bison、code-bison、codechat-bison |
4000 | 1 | 1 个输入字符 = 1 个字符 1 个输出字符 = 2 个字符 |
text-unicorn |
400 | 1 | 1 个输入字符 = 1 个字符 1 个输出字符 = 3 个字符 |