借助 Generative AI on Vertex AI(也称为 genai),您可以访问 Vertex AI 中的 Google 大型生成式 AI 模型。
生成式 AI 基础模型参考文档
模型名称 | 说明 | 可以流式传输回复 |
---|---|---|
Gemini API(gemini-1.5-pro 、gemini-1.0-pro 和 gemini-1.0-pro-vision ) |
Gemini 是 Google DeepMind 开发的一系列生成式 AI 模型,专为多模态用例而设计。Gemini API 让您可以使用 Gemini Pro Vision 和 Gemini Pro 模型。 |
✔ |
PaLM 2 for Text (text-bison ) |
专门为了遵循自然语言指令而进行了调优,适用于各种语言任务。 |
✔ |
Embeddings for Text (textembedding-gecko ) |
返回文本输入的模型嵌入。 |
|
PaLM 2 for Chat (chat-bison ) |
已针对多轮对话应用场景进行微调。 |
✔ |
Codey for Code Generation (code-bison ) |
该模型经过调优,可根据所需代码的自然语言描述生成代码。例如,它可以为函数生成单元测试。 |
✔ |
Codey for Code Chat (codechat-bison ) |
该模型针对聊天机器人对话进行了调优,可帮助解决与代码相关的问题。 |
✔ |
Codey for Code Completion (code-gecko ) |
该模型经过调优,可根据编写的代码中的上下文建议代码补全。 |
|
Imagen for Image Generation (imagegeneration ) |
此模型支持图片生成,可在几秒钟内创建高品质的视觉素材资源。 |
|
Embeddings for Multimodal (multimodalembedding ) |
此模型会根据您提供的输入生成向量,可包含图片和文本的组合。 |
|
Image captioning (imagetext ) |
此模型支持图片说明,可以根据您指定的语言对您提供的图片生成图片说明。 |
|
Visual Question Answering - VQA (imagetext ) |
支持图片问答的模型。 |
流式传输来自生成式 AI 模型的回复
对于 API 的流式传输请求和非流式传输请求,这些参数是相同的。
如需使用 REST API 查看示例代码请求和响应,请参阅使用流式传输 REST API 的示例。
如需使用 Python 版 Vertex AI SDK 查看示例代码请求和响应,请参阅使用 Python 版 Vertex AI SDK 进行流式传输的示例。
可用区域
如需查看 Vertex AI 上的生成式 AI 中支持基础模型的区域列表,请参阅区域。
Responsible AI 参考文档
如需了解安全专用属性并查看示例回复,请参阅安全过滤条件和属性。在这些引用中,都有一个 citation
参数。如要详细了解引用,请参阅引用元数据。
后续步骤
- Generative AI on Vertex AI 存在一些限制。如需了解详情,请参阅 PaLM API 限制。
- 使用 Vertex AI Studio 或 Vertex AI API 尝试学习快速入门教程。
- 探索 Model Garden 中的预训练模型。
- 了解配额和限制。
- 了解价格。