了解在线预测
  
      
    
  
  
  
  
  
    
  
  
    
    
    
    
    
    
    
    
    
    
    
    
      
    
Vertex AI 通过 Online Prediction API 在 Google Distributed Cloud (GDC) 气隙环境中提供在线预测。预测结果是经过训练的机器学习模型的输出。具体来说,在线预测是指向模型端点发出的同步请求。
借助在线预测,您可以上传、部署、提供和请求使用一组受支持的容器中的自有预测模型。如果您需要发出请求以响应应用输入,或者在其他需要及时推断的情况下,可以使用在线预测。
您可以将 Kubernetes 自定义资源应用于您的基础设施运维人员 (IO) 为您创建的专用预测集群,从而使用在线预测 API。
在获取在线预测结果之前,您必须导出模型制品并将模型部署到端点。此操作会将计算资源与模型相关联,以便以低延迟方式执行在线预测。
然后,您可以设置格式并发送请求,从而从自定义训练模型获取在线预测结果。
可用容器映像
下表列出了 Distributed Cloud 中在线预测功能支持的容器:
  
    | 机器学习框架 | 
    版本 | 
    支持的加速器 | 
    支持的图片 | 
  
  
    | TensorFlow | 
    2.14 | 
    CPU | 
    tf2-cpu.2-14 | 
  
  
    | GPU | 
    tf2-gpu.2-14 | 
  
  
    | PyTorch | 
    2.4 | 
    CPU | 
    pytorch-cpu.2-4 | 
  
  
    | GPU | 
    pytorch-gpu.2-4 | 
  
  
    | 2.1(已弃用) | 
    CPU | 
    pytorch-cpu.2-1 | 
  
  
    | GPU | 
    pytorch-gpu.2-1 | 
  
      
      
  
  
  
  
    
  
  
 
  
    
    
      
       
         
  
       
    
    
  
  
  如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
  最后更新时间 (UTC):2025-10-22。
  
  
    
    
    
      
  
    
  
  
    
      [[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-10-22。"],[],[]]