下表比较了用于提供 Vertex AI 在线预测的受支持的端点类型,并指明了哪些类型被推荐为最佳实践。
专用公共端点(推荐) | 公共端点 | Private Service Connect 端点(推荐) | 专用端点 | |
---|---|---|---|---|
用途 | 默认网络体验。允许从公用互联网提交请求(如果未启用 VPC Service Controls)。 | 默认网络体验。允许从公用互联网提交请求(如果未启用 VPC Service Controls)。 | 建议用于生产企业应用。通过确保请求和响应以专用方式进行路由,从而缩短网络延迟时间并提高安全性。 | 建议用于生产企业应用。通过确保请求和响应以专用方式进行路由,从而缩短网络延迟时间并提高安全性。 |
入站网络 | 使用专用网络层面的公共互联网 | 使用共享网络层面的公共互联网 | 使用 Private Service Connect 端点的专用网络 | 使用专用服务访问通道 (VPC 网络对等互连) 的专用网络 |
出站网络 | 公共互联网 | 公共互联网 | 不支持 | 使用专用服务访问通道 (VPC 网络对等互连) 的专用网络 |
VPC Service Controls | 不支持。请改用 Private Service Connect 端点。 | 支持 | 支持 | 支持 |
费用 | Vertex AI Prediction | Vertex AI Prediction | Vertex AI Prediction + Private Service Connect 端点 | Vertex AI Prediction + 专用服务访问通道(请参阅“使用 Private Service Connect 端点(转发规则)访问已发布的服务”) |
网络延迟 | 已优化 | 未优化 | 已优化 | P50 延迟时间较短,P99(尾)延迟时间较长 |
传输加密 | 使用 CA 签名证书的 TLS | 使用 CA 签名证书的 TLS | 使用自签名证书的可选 TLS | 无 |
推理超时 | 最多可配置 1 小时 | 60 秒 | 最多可配置 1 小时 | 60 秒 |
载荷大小限制 | 10 MB | 1.5 MB | 10 MB | 10 MB |
QPM 配额 | 无限制 | 30,000 | 无限制 | 无限制 |
协议支持 | HTTP 或 gRPC | HTTP | HTTP 或 gRPC | HTTP |
流式传输支持 | 是 (SSE) | 否 | 是 (SSE) | 否 |
流量拆分 | 是 | 是 | 是 | 否 |
请求和响应日志记录 | 是 | 是 | 是 | 否 |
访问日志记录 | 是 | 是 | 是 | 否 |
AutoML 模型和可解释性 | 否 | 是 | 否 | 否 |