本文档介绍了如何在 SAP BTP、ABAP 环境中安装和配置 Vertex AI SDK for ABAP。
安装
当您安装最新版本的 SAP BTP 版本的 ABAP SDK for Google Cloud 时,系统会为您安装 Vertex AI SDK for ABAP。如需了解安装步骤,请参阅安装和配置 SAP BTP 版本的 ABAP SDK for Google Cloud。
我们了解到,某些开发者可能无法获取 Vertex AI 和云资源。如需以最少的设置进行原型设计和实验,请参阅使用 Gemini 快速制作原型。
启用 Vertex AI API
在您的 Google Cloud 项目中启用 Vertex AI API。
如需了解如何启用 Google Cloud API,请参阅启用 API。
身份验证
在 SAP BTP 版 ABAP SDK for Google Cloud 中设置身份验证以访问 API 后,Vertex AI SDK for ABAP 会使用相同的身份验证方法来访问 Vertex AI API。 Google Cloud 如需了解如何在 SAP BTP 版本的 ABAP SDK for Google Cloud 中设置身份验证,请参阅身份验证概览。
请记下您在身份验证设置过程中创建的客户端密钥。在配置 AI 模型生成参数和搜索参数时,您可以使用此客户端密钥。
IAM 权限
确保您在客户端密钥表中配置的专用于 API 访问的服务账号可以访问 Vertex AI 资源。
Vertex AI
如需使用 Vertex AI 资源,您必须向已授予 Vertex AI API 访问权限的专用服务账号授予 Vertex AI User (roles/aiplatform.user
) 角色。
如果您需要提供特定权限来创建、修改、部署制品,请视情况授予特定的 Vertex AI IAM 权限。
Vertex AI Feature Store
如需使用 Vertex AI Feature Store,您必须向服务账号授予以下角色:
AI 功能 | 所需 IAM 角色 |
---|---|
Vertex AI Feature Store |
验证是否已将 Fiori 应用添加到 launchpad
为了让管理员和开发者能够配置模型生成参数和矢量搜索参数,SAP BTP 版本的 ABAP SDK for Google Cloud 提供了 SAP Fiori 应用。SDK 还提供了仅用于显示的 Fiori 应用,用于查看维护的参数。
您可以在安装 SAP BTP 版本的 ABAP SDK for Google Cloud 时将这些 Fiori 应用添加到您的启动板。确认您的启动器中是否提供了这些应用。如需了解详情,请参阅将 Fiori 应用添加到启动板。
配置模型生成参数
大语言模型 (LLM) 是使用大量文本数据训练的深度学习模型。模型包含控制模型如何生成回答的参数值。您可以通过更改参数值,从模型中获取不同的结果。
如需为模型定义生成参数,Vertex AI SDK for ABAP 将使用表 /GOOG/AI_CONFIG
。
如需为模型配置生成参数,请执行以下步骤:
访问 SAP Fiori launchpad。
前往包含用于 SDK 配置的 Fiori 应用的空间。
打开 Vertex AI SDK:配置模型生成参数应用。
点击创建。
在随即显示的创建对话框中,为模型键字段输入值,然后点击继续。
为显示的字段输入值。
下表介绍了这些字段以及它们与模型生成参数的对应关系:
字段 数据类型 说明 模型键 字符串 您指定用于标识模型配置的唯一名称,例如
Gemini
。您可以在实例化生成模型类或嵌入类时使用此模型键来指定要生效的生成配置。
模型 ID 字符串 LLM 的模型 ID,例如
gemini-1.5-flash-001
。如需了解 Vertex AI 模型版本,请参阅模型版本和生命周期。
Google Cloud 密钥名称 字符串 您在身份验证设置期间为了向 Google Cloud 进行身份验证而配置的客户端密钥。 Google Cloud 区域位置 ID 字符串 您要使用的 Vertex AI 功能可用的 Google Cloud 区域的位置 ID。
通常,您应使用与您的物理位置或目标用户的物理位置最接近的区域。 如需了解详情,请参阅 Vertex AI 位置。
LLM 的发布商 ID 字符串 可选。LLM 的发布商,例如 google
。响应 MIME 类型 字符串 可选。生成的候选文本的输出回答 MIME 类型。 支持的 MIME 类型: text/plain
:(默认)文本输出。application/json
:候选项中的 JSON 响应。
随机性温度 字符串 可选。控制预测的随机程度。如需了解详情,请参阅温度。
范围:[0.0, 1.0]
Top-K 采样 浮点数 可选。Top-K 可更改模型选择输出 token 的方式。
指定较低的值可获得随机程度较低的回答,指定较高的值可获得随机程度较高的回答。如需了解详情,请参阅 Top-K。
范围:[1, 40]
Top-P 采样 浮点数 可选。Top-P 可更改模型选择输出 token 的方式。
指定较低的值可获得随机程度较低的回答,指定较高的值可获得随机程度较高的回答。如需了解详情,请参阅 Top-P。
范围:[0.0, 1.0]
每条消息的输出令牌数上限 整数 可选。回复中可生成的 token 数量上限。一个 token 约为 4 个字符。100 个 token 对应大约 60-80 个单词。
指定较低的值可获得较短的回答,指定较高的值可获得可能较长的回答。
正例惩罚 浮点数 可选。正值会惩罚生成的文本中已存在的 token,从而增加生成更多样化主题的概率。
范围:[-2.0, 2.0]
频次惩罚 浮点数 可选。正值会惩罚生成的文本中反复出现的 token,从而降低生成重复内容的概率。
范围:[-2.0, 2.0]
如果您未为可选参数提供值,则 SDK 会使用在
Model ID
中配置的模型版本所特有的参数的默认值。点击创建以保存条目。
配置向量搜索参数
如需定义 Vector Search 配置,Vertex AI SDK for ABAP 将使用表 /GOOG/SEARCHCONF
。
如需配置向量搜索参数,请执行以下步骤:
访问 SAP Fiori launchpad。
前往包含用于 SDK 配置的 Fiori 应用的空间。
打开 Vertex AI SDK:Vector Search 配置应用。
点击创建。
在随即显示的创建对话框中,为模型键字段输入值,然后点击继续。
为显示的字段输入值。
下表介绍了这些字段以及它们与矢量搜索参数的对应关系:
字段 数据类型 说明 搜索键 字符串 您指定用于标识搜索配置的唯一名称。 Google Cloud 密钥名称 字符串 您在身份验证设置期间为了向 Google Cloud 进行身份验证而配置的客户端密钥。 Google Cloud 区域位置 ID 字符串 您要使用的 Vertex AI 功能可用的 Google Cloud 区域的位置 ID。
通常,您应使用与您的物理位置或目标用户的物理位置最接近的区域。如需了解详情,请参阅 Vertex AI 位置。
向量索引的部署 ID 字符串 索引的部署 ID。将索引部署到端点时,您需要为其分配唯一的部署 ID。 如需了解索引部署,请参阅将向量索引部署到索引端点。
向量索引端点 ID 字符串 索引部署到的索引端点的 ID。
如需了解索引端点,请参阅创建矢量索引端点。
点击创建以保存条目。