功能
Cloud Run 会按 100 毫秒的间隔,向您收取分配给实例的 CPU 和内存费用。借助“缩减至零”功能,您只需在使用服务时付费。
使用 Cloud Run functions,创建和部署单一用途函数,并将这些函数与您的云基础架构和服务发出的事件相关联。
常见用途
提供实时推理支持
使用 Cloud Run GPU,为 Gemma 3、Llama 3.2 或自定义微调模型等开源模型提供实时推理支持。构建聊天机器人、即时生成文档摘要,等等,同时还能扩容以应对不可预测的流量高峰。或者,通过在 Cloud Run functions 上使用 GPU,数据科学家可以运行 Python 脚本,进行事件驱动的推理,无需过多了解底层基础架构。
提供实时推理支持
使用 Cloud Run GPU,为 Gemma 3、Llama 3.2 或自定义微调模型等开源模型提供实时推理支持。构建聊天机器人、即时生成文档摘要,等等,同时还能扩容以应对不可预测的流量高峰。或者,通过在 Cloud Run functions 上使用 GPU,数据科学家可以运行 Python 脚本,进行事件驱动的推理,无需过多了解底层基础架构。
价格
| Cloud Run 定价方式 | 按量付费,包含一个“始终免费”层级,计费时间以 100 毫秒为增量向上取整。仅针对实际使用量计费,无使用不产生费用。 | |
|---|---|---|
| SKU | 超出免费层级的无折扣价格 | 免费 |
CPU | $0.00001800 / vCPU 秒 | 每月前 24 万 vCPU 秒免费 |
内存 | $0.00000200 / GiB 秒 | 每月前 45 万 GiB 秒免费 |