本页面记录了 Vertex AI 上的生成式 AI 和 Vertex AI Model Garden 的正式版更新。您可以定期查看本页面,了解有关新增功能、功能更新、bug 修复、已知问题和功能弃用的公告。
2024 年 3 月 19 日
Vertex AI 上的 Anthropic Claude 3 Sonnet 和 Claude 3 Haiku 模型在 Vertex AI 中正式发布。
Anthropic 提供的托管式模型 Claude 3 Haiku 和 Claude 3 Sonnet 可在 Vertex AI 上使用。如需在 Vertex AI 上使用 Claude 模型,请直接向 Vertex AI API 端点发送请求。如需了解详情,请参阅使用 Anthropic 中的 Claude 模型以及 Model Garden 中的 Claude 模型卡片:
2024 年 2 月 21 日
Gemma 开放式模型可供使用。
Gemma 模型是一系列轻量级开放式模型,它基于创建 Gemini 模型所用的研究和技术构建而成,可在硬件、移动设备或托管服务上运行。如需了解详情,请参阅使用 Gemma 开放模型和 Gemma Model Garden 卡片。
2024 年 2 月 15 日
Vertex AI Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 模型
Vertex AI Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 多模态语言模型已发布正式版 (GA)。以下区域也提供这些模型:europe-west1、europe-west2、europe-west3、europe-west4 和 europe-west9。
如需了解详情,请参阅以下主题:
2024 年 2 月 9 日
多模态嵌入视频支持已发布正式版
视频数据的嵌入现已使用多模态嵌入模型 (multimodalembedding
) 正式发布。如需了解详情,请参阅产品文档。
此功能产生的费用取决于您使用的具体模式。如需了解详情,请参阅价格。
2024 年 2 月 7 日
Model Garden 更新:
功能
添加了以下模型:
- Stable Diffusion XL LCM:潜在一致性模型 (LCM) 可通过更少的步骤更快创建高质量的图片,从而增强潜在 Diffusion 模型中的文本转图片生成。
- LLaVA 1.5:部署 LLaVA 1.5 模型。
- PyTorch-ZipNeRF:Pytorch-ZipNeRF 模型是 Pytorch 框架中最先进的 ZipNeRF 算法实现,专门用于根据 2D 图像进行高效准确的 3D 重建。
- LLaMA 2(量化):Meta 的 Llama 2 模型的量化版本。
- WizardLM:WizardLM 是 Microsoft 开发的大语言模型 (LLM),通过调整 Evol-Instruct 方法对复杂指令进行微调。
- WizardCoder:WizardCoder 是 Microsoft 开发的大语言模型 (LLM),通过调整 Evol-Instruct 方法以适应代码域来对复杂指令进行微调。
- AutoGluon:利用 AutoGluon,您可以为表格数据训练和部署高准确率的机器学习模型和深度学习模型。
- Lama (Large mask inpainting):使用 Large Mask Inpainting 和快速傅立叶卷积 (FFC)、高感受野感知损失和大型训练掩膜,可以实现高分辨率的图像修复。
改动
- 为 Llama 2 添加了一键调优按钮,以及专用的部署、调优、量化和评估笔记本。
- 为具有预训练 OSS 工件(包括
Salesforce/blip-image-captioning-base
和timbrooks/instruct-pix2pix
)的 20 多个模型添加了一键部署按钮。 - 支持 CodeLlaMA70b,提供笔记本和一键部署按钮。
- 为 Mistral 模型添加了调优笔记本。
- 为 Stable Video Diffusion Img2Vid XT 添加了服务笔记本(用于研究目的)。
2024 年 1 月 12 日
textembedding-gecko
和 textembedding-gecko-multilingual
模型的模型调优已发布正式版。您可以使用监督式微调来调优 textembedding-gecko
模型。如需了解详情,请参阅调整文本嵌入。
2024 年 1 月 8 日
AutoSxS 并排评估 LLM
该预览版自动并排评估 (AutoSxS) 工具可用于对 LLM 或预生成预测的性能进行 A/B 测试。它与真人评估者相当,但速度更快,可以按需使用,并且更经济实惠。
2024 年 1 月 5 日
Vertex AI 上的生成式 AI 区域扩展
12 个额外的 Google Cloud 区域提供用于批量预测和模型评估的 Vertex AI 上的生成式 AI 功能。
2023 年 12 月 18 日
Model Garden 更新:
- 支持在 Vertex AI 中使用监督式调优所使用的数据集格式对 OpenLLaMA 模型进行超参数调优和自定义数据集。
- 支持对 falcon-instruct 模型进行 GPTQ 转换。
- 为 Stable Diffusion XL 笔记本添加了 Latent Consistent 模型和仅用于研究的 SDXL-Turbo 模型。
- 在 Mistral 笔记本中添加了 Mixtral 8x7B 模型。
2023 年 12 月 13 日
Vertex AI Gemini Pro 和 Gemini Pro Vision 模型
Vertex AI Gemini Pro 和 Gemini Pro Vision 多模态语言模型目前发布了预览版。如需了解详情,请参阅以下主题:
Imagen 2 正式版
Imagen 的 005 版图片生成模型 (imagegeneration@005
) 已发布正式版,可用于图片生成任务。此模型版本是图片生成任务的默认版本。如需了解详情,请参阅产品文档。
如需了解 Imagen 模型和版本的一般信息,请参阅 Imagen 模型版本和生命周期。
2023 年 12 月 12 日
发布了文本嵌入模型 003 (textembedding-gecko@003
)
发布了更新后的文本嵌入基础模型 textembedding-gecko@003
的稳定版。与之前的稳定版 textembedding-gecko@001
和 textembedding-gecko@002
相比,textembedding-gecko@003
提升了质量。如需详细了解模型版本,请参阅模型版本和生命周期。
2023 年 12 月 8 日
Vertex AI 上的生成式 AI 安全控制更新
Access Transparency (AXT) 安全控制可用于以下功能:
- 多模态在线预测的嵌入
- Imagen on Vertex AI 在线预测
- Imagen on Vertex AI 调整
2023 年 12 月 6 日
更新后的文本模型
您可以使用文本、聊天、代码和代码聊天模型的版本 @002
。@002
模型版本包含经过改进的提示响应。@002
模型如下:
text-bison@002
chat-bison@002
code-bison@002
codechat-bison@002
如需确保始终使用稳定模型版本,请使用版本号指定模型标识符。例如 text-bison@002
。如需了解详情,请参阅模型版本和生命周期。
2023 年 12 月 5 日
功能
模型基础目前提供预览版。使用基础功能将 text-bison
和 chat-bison
模型连接到 Vertex AI Search 中的非结构化数据存储区。通过基础功能,模型可以访问和使用数据存储区中的信息,以生成更增强、更细致的响应。如需了解详情,请参阅基础概览。
2023 年 12 月 1 日
更改
以下 model_garden_name 更新可用:
- 更新了使用 L4 GPU 的默认模型部署设置,例如 LLaMA2、falcon-instruct、openllama、Stable Diffusion 1.5 和 2.1,以及 XL 模型。
- 支持使用 Vertex AI 中的监督调整所使用的数据集格式对 LLaMA2 模型进行超参数调整和自定义数据集。
- 建议在 Vertex AI 中调整大型语言模型的 LoRA 和 QLoRA 设置。如需了解详情,请参阅使用 LoRA 和 QLoRA 调整 LLM 的建议。
- 支持 LLaMA2 和 OpenLLaMA 模型的 AWQ 和 GPTQ 转换。
- ViT pytorch 和 JAX 训练、Openllama7b 调整、OpenLLaMA 3b/7b/13b 超参数调节的基准报告和 Stable Diffusion 1.5 调整和服务。
2023 年 11 月 30 日
功能
PaLM 2 for Text 的模型大小现已正式发布(正式版)。与 text-bison
模型相比,text-unicorn
模型为一组复杂的推理任务提供了更高的响应质量。如需了解详情,请参阅模型信息。
2023 年 11 月 17 日
ComputeToken API 已发布预览版
ComputeToken API 已发布预览版。您可以使用此 API 获取给定提示的词元列表。词元是一种表示文本输入中的常见字符序列的方法。如需了解详情,请参阅获取词元列表。
2023 年 11 月 10 日
Vertex AI 上的生成式 AI
安全控制适用于更多 Vertex AI 上的生成式 AI 功能。
2023 年 11 月 3 日
Model Garden 更新
功能
Model Garden 中增加了以下模型:
- ImageBind:多模态嵌入模型。
- Vicuna v1.5:根据 llama2 微调的 LLM。
- OWL-ViT v2:SoTA 开放词汇对象检测模型。
- DITO:SoTA 开放词汇对象检测模型。
- NLLB:多语言翻译模型。
- Mistral-7B:小规模 SoTA LLM。
- BioGPT:针对生物医学领域微调的 LLM。
- BiomedCILP:针对生物医学领域微调的多模态基础模型。
如需查看所有可用模型的列表,请参阅在 Model Garden 中探索模型。
改动
- 改善了语言模型服务吞吐量。如需了解详情,请参阅在 Model Garden 中高效提供开源大语言模型。相关模型卡片中的笔记本也已相应地进行更新。
- 与原始实现相比,Stable Diffusion 1.5、2.1 和 XL 模型的推理速度最多可提升至 2 倍。
- 改善了所有支持的模型卡片中的部署按钮的工作流。
- 更新了 Llama2、OpenLlama 和 Falcon Instruct 的笔记本,其中包含建议的模型服务机器规格,以及用于模型评估的 EleutherAI 的 Evaluation Harness Docker。
新的 textembedding-gecko
和 textembedding-gecko-multilingual
稳定模型版本
Vertex AI 上的生成式 AI 提供以下稳定模型版本:
textembedding-gecko@002
textembedding-gecko-multilingual@001
如需详细了解模型版本,请参阅模型版本和生命周期。
2023 年 11 月 2 日
可通过北美洲、欧洲和亚洲的 12 个区域级 API 访问 Vertex AI 上的生成式 AI。区域级 API 可让客户控制数据的静态存储位置。
2023 年 11 月 3 日
适用于 chat-bison@001
的模型调优已正式发布 (GA)。
调优 chat-bison@001
支持 TensorBoard 指标可视化。如需了解详情,请参阅调优和评估指标。
2023 年 10 月 4 日
适用于 textembedding-gecko
的模型调优已发布预览版
您可以使用监督式调优来调优 textembedding-gecko
模型。此功能处于预览版阶段。
如需了解详情,请参阅调整文本嵌入。
2023 年 9 月 1 日
价格更新
text-bison
的价格已降至每 1,000 个输入和输出字符 $0.0005。如需了解详情,请参阅 Vertex AI 价格。
2023 年 8 月 29 日
新的 Vertex AI 上的生成式 AI 模型和扩展语言支持
Vertex AI 上的生成式 AI 已更新,其中添加了新的候选语言模型(最新模型)、支持最多 3.2 万个输入和输出词元的语言模型,以及更多受支持的语言。如需了解详情,请参阅可用模型以及模型版本和生命周期。
流式传输来自生成式 AI 模型的回复
生成式 AI 模型流式传输支持已正式发布 (GA)。发送提示后,模型会在生成回复词元时返回回复词元,而不是等待整个输出可用后才返回。
支持的模型包括:
text-bison
chat-bison
code-bison
codechat-bison
如需了解详情,请参阅流式传输来自生成式 AI 模型的回复。
适用于 text-bison
模型的监督式调优已正式发布 (GA)
适用于 text-bison
模型的监督式调优已正式发布 (GA)。
适用于 chat-bison
模型的模型调优已发布预览版
您可以使用监督式调优来调优 chat-bison
模型。此功能处于预览版阶段。
如需了解详情,请参阅调整文本模型。
新的嵌入模型已发布预览版
Vertex AI 上的生成式 AI 用户可以使用以各种非英语语言训练的新模型创建嵌入。该模型处于预览版阶段。
textembedding-gecko-multilingual
如需了解详情,请参阅获取文本嵌入。
Imagen 主题调优和样式调优已正式发布 (GA)
Imagen on Vertex AI 提供以下正式版功能:
- 主题模型调整(标准调整)*
- 样式模型调整*
* 受限访问功能。
如需详细了解 Imagen on Vertex AI 或如何访问受限正式版,请参阅 Imagen on Vertex AI 概览。
text-bison
的基于人类反馈的强化学习 (RLHF) 调整
Vertex AI 上的生成式 AI 文本生成基础模型 (text-bison
) 支持 RLHF 调优。RLHF 调整功能目前为预览版。如需了解详情,请参阅使用 RLHF 模型调整。
Vertex AI Codey API 语言支持
Vertex AI Codey API 支持其他编程语言。如需了解详情,请参阅支持的编码语言。
Vertex AI Codey API 支持监督式调优
代码聊天 (codechat-bison
) 和代码生成 (code-bison
) Vertex AI Codey API 模型支持监督式调优。Vertex AI Codey API 模型的监督式调整功能处于预览版阶段。如需了解详情,请参阅调整代码模型。
基于指标的模型评估
您可以根据评估数据集评估基础模型和经调整的模型的性能,以进行分类、汇总、问答和常规文本生成。此功能为预览版
如需了解详情,请参阅评估模型性能。
CountToken API 已发布预览版
CountToken API 已发布预览版。您可以使用此 API 获取提示的词元数和计费字符数。如需了解详情,请参阅获取词元数。
2023 年 8 月 9 日
Imagen 多模态嵌入现提供正式版
Imagen on Vertex AI 提供以下正式版功能:
- 多模态嵌入
此功能会产生不同的价格,具体取决于您是使用图片输入还是文本输入。如需了解详情,请参阅多模态嵌入功能页面。
2023 年 8 月 21 日
模型调整参数更新
对于模型评估和 Vertex AI TensorBoard 集成,模型调优作业接受可选参数。这样,您就可以使用单个命令评估模型并生成可视化效果。如需了解详情,请参阅创建模型调整作业。
2023 年 7 月 28 日
模型调整参数更新
模型调优中的 learning_rate
参数为 learning_rate_multiplier
。如需使用模型或调整方法的默认学习速率,请使用默认的 learning_rate_multiplier
值 1.0
。
如果您之前未配置过 learning_rate
,则无需执行任何操作。如果将 tuning_method=tune_v2
与 v2.0.0 流水线模板(Python SDK v1.28.1+)搭配使用,则建议的学习速率为 0.0002。如需将自定义 learning_rate
转换为 learning_rate_multiplier
,计算公式如下:
learing_rate_multiplier = custom_learning_rate_value / 0.0002
2023 年 7 月 18 日
text-bison 的模型调整更新
- 升级后的调优流水线为 text-bison 提供更高效的调优和更好的性能。
- 新的调整区域 (
us-central1
) 提供 GPU 支持。 - 利用新的
learning_rate
参数,您可以在每次迭代时调整步长。
如需了解详情,请参阅调整语言基础模型。
Chirp 正式版
Chirp 发布正式版 (GA)。如需了解详情,请参阅以下页面:
2023 年 7 月 17 日
Imagen on Vertex AI 正式版功能
Imagen on Vertex AI 提供以下正式版功能:
* 受限访问功能。
如需详细了解 Imagen 或如何获取受限正式版或预览版功能的访问权限,请参阅 Imagen on Vertex AI 概览。
支持人脸生成
对于以下功能,Imagen 支持人脸生成:
* 受限访问功能。
人脸生成默认处于启用状态,但包含儿童或名人的图片除外。如需了解详情,请参阅使用指南。
其他语言支持
Vertex AI PaLM API 添加了对以下语言的支持:
- 西班牙语 (es)
- 韩语 (ko)
- 印地语 (hi)
- 中文 (zh)
如需受支持的语言的完整列表,请参阅支持的语言。
2023 年 7 月 13 日
对 PaLM 2 for Text 的批处理支持
针对批量文本 (text-bison
) 请求的支持已发布正式版。您可以在 Vertex AI 价格页面上查看 chat-bison
模型的价格。
2023 年 7 月 10 日
PaLM 2 for Chat
针对 Chat (chat-bison
) 的支持已发布正式版。您可以在 Vertex AI 价格页面上查看 chat-bison
模型的价格。
2023 年 6 月 29 日
Vertex AI Codey API
Vertex AI Codey API 已正式发布 (GA)。使用 Vertex AI Codey API 创建包含代码生成、代码补全和代码聊天的解决方案。由于 Vertex AI Codey API 已正式发布,因此使用它们会产生使用费用。如需了解价格,请参阅 Vertex AI 上的生成式 AI 价格页面。
此版本中的模型包括:
code-bison
(代码生成)codechat-bison
(代码聊天)code-gecko
(代码补全)
code-bison
和 codechat-bison
的输入词元数上限从 4,096 个词元增加到 6,144 个,可支持较长的提示和聊天记录。code-bison
和 codechat-bison
的输出词元数上限从 1,024 增加到 2,048,可支持更长的回复。
支持其他编程语言。如需了解详情,请参阅支持的编码语言。
从 code-bison
和 codechat-bison
模型中移除了多个微调数据集,实现以下改进:
- 聊天过多。
- 工件,例如 NBSP(不间断空格)字符。
- 低质量代码回复。
如需了解云水平,请参阅 Vertex AI 认证。
2023 年 6 月 15 日
PaLM 2 for Chat
chat-bison
模型已更新,可更好地遵循 context
字段中的说明进行操作。如需详细了解如何为 chat-bison
创建聊天提示,请参阅设计聊天提示。
2023 年 6 月 7 日
PaLM Text 和 Embeddings API 以及 Vertex AI Studio
Vertex AI 上的生成式 AI 已发布正式版。此功能发布后,您可以使用 Vertex AI PaLM API 生成可以在依托 AI 技术的应用中测试、调优和部署的 AI 模型。由于这些功能是正式版,因此使用 text-bison
和 textembedding-gecko
PaLM API 会产生使用费用。如需详细了解价格,请参阅 Vertex AI 价格页面。
此版本中的功能和模型包括:
- PaLM 2 for Text:
text-bison
- Embedding for Text:
textembedding-gecko
- Vertex AI Studio for Language
Model Garden
Model Garden 已发布正式版。Model Garden 是一个平台,可帮助您发现、测试、自定义和部署 Vertex AI 及部分 OSS 模型。从可调模型到针对特定任务的模型,都可在 Google Cloud 控制台的“Model Garden”页面上找到。
若要开始使用,请参阅在 Model Garden 中探索 AI 模型和 API。
Vertex AI Codey API
Vertex AI Codey API 处于预览版阶段。借助 Codey API,您可以从任何 Google Cloud 项目使用代码生成、代码补全和代码聊天 API,而无需列入许可名单。您可以从 us-central1
区域访问这些 API。Codey API 可以在 Vertex AI Studio 中使用,也可以通过程序化方式在 REST 命令中使用。
如需开始使用此功能,请参阅代码模型概览。
2023 年 5 月 10 日
Vertex AI 上的生成式 AI
Vertex AI 上的生成式 AI 已发布预览版。此功能发布后,您可以使用 Vertex AI PaLM API 生成可以在依托 AI 技术的应用中测试、调优和部署的 AI 模型。
此版本中的功能和模型包括:
- PaLM 2 for Text:
text-bison
- PaLM 2 for Chat:
chat-bison
- Embedding for Text:
textembedding-gecko
- Vertex AI Studio for Language
- Tuning for PaLM 2
- Vertex AI SDK v1.25,其中包括 TextGenerationModel (
text-bison
)、ChatModel (chat-bison
)、TextEmbeddingModel (textembedding-gecko@001
) 等新功能
您可以使用 Google Cloud 控制台中的 Vertex AI Studio、Vertex AI API 和 Python 版 Vertex AI SDK 与 Vertex AI 上的生成式 AI 功能进行交互。
- 详细了解 Vertex AI 上的生成式 AI。
- 查看 Vertex AI Studio 简介。
- 开始使用 Vertex AI Studio 快速入门。
Model Garden
Model Garden 已发布预览版。Model Garden 是一个平台,可帮助您发现、测试、自定义和部署 Vertex AI 及部分 OSS 模型。从可调模型到针对特定任务的模型,都可在 Google Cloud 控制台的“Model Garden”页面上找到。