全代管式批处理服务,用于在 Google 的基础架构上安排批量作业、将批量作业排入队列并执行批量作业。
优势
利用可伸缩的全代管式计算基础架构,将重点转移到作业提交上,并从作业结果中提取业务数据洞见。
运行由脚本或容器定义的高吞吐量或紧密耦合的计算。
Batch 简化了工作负载的开发和执行。 只需几个步骤即可提交批量作业。 利用 Cloud Storage、Pub/Sub、Cloud Logging 和 Workflows 获得端到端的开发者体验。
主要特性
对云计算资源运行任何扩缩批量作业,以限制作业等待时间,同时并行执行请求和扩缩资源,而无需手动干预。
Batch 可为 Docker 容器化工作负载或直接在虚拟机上运行的基于脚本的工作负载提供一致的体验。
轻松采用第一方服务,控制从预处理到后处理的端到端批量工作流。
文档
使用场景
用于基因组测序、药物发现等用途且可重现的流水线的高吞吐量处理技术。
执行蒙特卡罗模拟并快速分析在市场中开展业务所需的结果。
根据不同的输入自动执行验证测试和模拟,以优化设计。
所有特性
对容器或脚本的支持 | 在 Compute Engine 虚拟机实例上原生运行您的脚本,或者完成将要运行的容器化工作负载。 |
利用 Google Cloud 计算 | 获取最新软件和硬件,作为 Batch 中的一项服务使用。 |
作业优先级和重试 | 定义作业的优先级并制定自动重试策略。 |
适用于 Batch 的 Pub/Sub 通知 | 使用 Batch 配置 Pub/Sub,以异步方式将消息传递给订阅者。 |
集成的日志记录和监控功能 | 将 stderr 和 stdout 日志直接检索到 Cloud Logging。审核日志可帮助您了解谁何时在何处执行了哪些操作。监控与 Cloud Monitoring 中使用的资源相关的指标。 |
使用 Batch 的替代方法 | 您可以通过 gcloud、REST API、客户端库或 Cloud 控制台直接调用 Batch API。此外,Batch 还可与工作流引擎生态系统结合使用。 |
身份和访问权限管理 | 使用 IAM 权限和 VPC Service Controls 控制资源和服务的访问权限。 |