训练自定义模型。
HTTP 请求
POST https://discoveryengine.googleapis.com/v1beta/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel
网址采用 gRPC 转码语法。
路径参数
参数 | |
---|---|
dataStore |
必需。数据存储区的资源名称,例如 |
请求正文
请求正文中包含结构如下的数据:
JSON 表示法 |
---|
{ "modelType": string, "errorConfig": { object ( |
字段 | |
---|---|
modelType |
要训练的模型。支持的值包括:
|
errorConfig |
数据注入和训练期间发生的错误的预期位置。 |
modelId |
如果未提供,系统会生成一个 UUID。 |
联合字段 training_input 。模型训练输入。training_input 只能是下列其中一项: |
|
gcsTrainingInput |
Cloud Storage 训练输入。 |
响应正文
如果成功,则响应正文包含一个 Operation
实例。
授权范围
需要以下 OAuth 范围之一:
https://www.googleapis.com/auth/cloud-platform
https://www.googleapis.com/auth/discoveryengine.readwrite
如需了解详情,请参阅 Authentication Overview。
IAM 权限
需要拥有 dataStore
资源的以下 IAM 权限:
discoveryengine.dataStores.trainCustomModel
如需了解详情,请参阅 IAM 文档。
GcsTrainingInput
Cloud Storage 训练数据输入。
JSON 表示法 |
---|
{ "corpusDataPath": string, "queryDataPath": string, "trainDataPath": string, "testDataPath": string } |
字段 | |
---|---|
corpusDataPath |
可与训练数据相关联的 Cloud Storage 语料库数据。数据路径格式为 对于搜索调优模型,每行应包含 ID、标题和文本。示例: |
queryDataPath |
可能与训练数据相关联的 GCS 查询数据。数据路径格式为 对于搜索调优模型,每行应包含 ID 和文本。示例:{"Id": "query1", "text": "example query"} |
trainDataPath |
Cloud Storage 训练数据路径,其格式应为 对于搜索调优模型,它应具有查询 ID、语料库 ID、得分作为 TSV 文件头。得分应为
|
testDataPath |
Cloud Storage 测试数据。与 trainDataPath 格式相同。如果未提供,系统将对 trainDataPath 执行随机 80/20 训练/测试拆分。 |