选择端点类型

下表比较了用于提供 Vertex AI 在线预测的受支持的端点类型,并指明了哪些类型被推荐为最佳实践。

专用公共端点(推荐) 公共端点 Private Service Connect 端点(推荐) 专用端点
用途 默认网络体验。允许从公用互联网提交请求(如果未启用 VPC Service Controls)。 默认网络体验。允许从公用互联网提交请求(如果未启用 VPC Service Controls)。 建议用于生产企业应用。通过确保请求和响应以专用方式进行路由,从而缩短网络延迟时间并提高安全性。 建议用于生产企业应用。通过确保请求和响应以专用方式进行路由,从而缩短网络延迟时间并提高安全性。
入站网络 使用专用网络层面的公共互联网 使用共享网络层面的公共互联网 使用 Private Service Connect 端点的专用网络 使用专用服务访问通道 (VPC 网络对等互连) 的专用网络
出站网络 公共互联网 公共互联网 不支持 使用专用服务访问通道 (VPC 网络对等互连) 的专用网络
VPC Service Controls 不支持。请改用 Private Service Connect 端点。 支持 支持 支持
费用 Vertex AI Prediction Vertex AI Prediction Vertex AI Prediction + Private Service Connect 端点 Vertex AI Prediction + 专用服务访问通道(请参阅“使用 Private Service Connect 端点(转发规则)访问已发布的服务”)
网络延迟 已优化 未优化 已优化 P50 延迟时间较短,P99(尾)延迟时间较长
传输加密 使用 CA 签名证书的 TLS 使用 CA 签名证书的 TLS 使用自签名证书的可选 TLS
推理超时 最多可配置 1 小时 60 秒 最多可配置 1 小时 60 秒
载荷大小限制 10 MB 1.5 MB 10 MB 10 MB
QPM 配额 无限制 30,000 无限制 无限制
协议支持 HTTP 或 gRPC HTTP HTTP 或 gRPC HTTP
流式传输支持 是 (SSE) 是 (SSE)
流量拆分
请求和响应日志记录
访问日志记录
AutoML 模型和可解释性