此旧版 AI Platform Prediction
已弃用,2025 年 1 月 31 日之后将不再在 Google Cloud 上提供。所有模型、关联的元数据和部署都将在 2025 年 1 月 31 日之后被删除。请将您的资源迁移至
Vertex AI,以获取 AI Platform 中未提供的新机器学习功能。
监控模型版本
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
了解模型的性能是管理机器学习模型的重要部分。您可以监控模型的流量模式、错误率、延迟时间和资源利用率,以帮助发现模型存在的问题,并找到合适的机器类型来优化延迟和成本。
您还可以使用 Cloud Monitoring 根据指标配置提醒。举例来说,如果模型预测延迟时间过长,您会收到提醒。AI Platform Prediction 会将metrics导出到 Cloud Monitoring。
每个 AI Platform Prediction 指标类型的名称中均包含“prediction”;例如 ml.googleapis.com/prediction/online/replicas
或 ml.googleapis.com/prediction/online/accelerator/duty_cycle
。
您可以在 Google Cloud 控制台中找到有关模型流量模式、错误和延迟时间的信息。版本详情页面的性能标签页上提供以下图表:
- 预测数:每秒的预测数量(包括在线预测和批量预测)。如果每个请求涉及多个实例,则每个实例都会计入此图表。
- 错误率:模型产生的错误率。错误率高通常表示模型存在问题或对该模型的请求存在问题。响应代码可用于确定发生了哪些错误。
- 模型延迟时间和总延迟时间:模型的延迟时间。总延迟时间是指服务中花费的总请求时间。模型延迟时间指执行计算所花费的时间。
如需查看性能图表,请按以下步骤操作:
转到 Google Cloud 控制台中的 AI Platform Prediction 模型页面。
转到“模型”页面
点击列表中的模型名称,以转到模型详情页面。
点击列表中的版本名称,以转到版本详情页面。
如果尚未进行选择,请点击性能标签页。
滚动查看每个图表。
监控资源消耗
Google Cloud 控制台中提供了使用 Compute Engine (N1) 机器类型的模型版本的资源利用率图表。您可以在版本详情页面的资源使用情况标签页上查看以下图表:
如需查看资源利用率图表,请按以下步骤操作:
转到 Google Cloud 控制台中的 AI Platform Prediction 模型页面。
转到“模型”页面
点击列表中的模型名称,以转到模型详情页面。
点击列表中的版本名称,以转到版本详情页面。
点击资源使用情况标签页。
滚动查看每个图表。
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2023-12-08。
[{
"type": "thumb-down",
"id": "hardToUnderstand",
"label":"Hard to understand"
},{
"type": "thumb-down",
"id": "incorrectInformationOrSampleCode",
"label":"Incorrect information or sample code"
},{
"type": "thumb-down",
"id": "missingTheInformationSamplesINeed",
"label":"Missing the information/samples I need"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]
{"lastModified": "\u6700\u540e\u66f4\u65b0\u65f6\u95f4 (UTC)\uff1a2023-12-08\u3002"}
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["Hard to understand","hardToUnderstand","thumb-down"],["Incorrect information or sample code","incorrectInformationOrSampleCode","thumb-down"],["Missing the information/samples I need","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2023-12-08。"]]