采用和实现 FinOps

Last reviewed 2023-06-13 UTC

Google Cloud 架构框架中的本文档概述了策略,以帮助您在 Google Cloud 中预配和管理资源时考虑您的操作和决策的费用影响。其中介绍了 FinOps 做法,它将人员、流程和技术组合在一起,以在组织中推广财务问责制和费用优化原则,而不考虑组织在云中的规模或成熟程度。

本部分中的指导适用于负责控制其组织在云中的支出的 CTO、CIO 和高管。该指导还可以帮助各个 Cloud Operations 了解并采用 FinOps。

无论角色是分析师、架构师、开发者还是管理员,组织中的每个员工都有助于降低 Google Cloud 中的资源费用。在不必跟踪过去基础架构费用的团队中,您可能需要向员工讲授集体责任制的必要性。

常见模型旨在让中心 FinOps 团队或云技术卓越中心 (CCoE) 实现跨所有云工作负载优化费用流程的标准化。此模型假设中心团队具有必要的知识和专业知识,能够发现提高效率的高价值机会。

虽然集中式费用控制在云采用的初始阶段(此时用量较低)可能运行良好,但随着云采用和用量的增加,效率会下降。中心团队可能会遭遇扩缩问题,而项目团队可能无法接受其团队以外的人员做出的决策。

我们建议中心团队将优化资源的决策制定权委托给项目团队。中心团队可以推动更广泛的工作,从而鼓励在整个组织中采用 FinOps。要使各个项目团队都能够练习 FinOps,中心团队必须实现费用优化流程、报告和工具的标准化。中心团队必须与不熟悉 FinOps 实践的团队密切合作,并帮助他们在制定决策的过程中考虑费用。中心团队还必须充当财务团队与各个项目团队之间的中介。

后续各部分介绍了我们建议中心团队推广的设计原则。

鼓励个人问责制

创建和使用云资源的任何员工都会影响到这些资源的用量和费用。为了让组织成功实现 FinOps,中心团队必须帮助员工转变思想,从费用由其他人承担责任转变为自己的费用自己负责。通过此次转变,员工可以拥有并制定适合其工作负载、团队和组织的费用决策。此所有权可扩展到实现数据驱动的费用优化操作。

为鼓励费用问责制,中心团队可以执行以下操作:

  • 向用户讲授费用优化机会和方法。
  • 对优化费用的员工进行奖励和表彰。
  • 在整个组织中公开费用。

公开费用

如果员工在云中预配和管理资源时要考虑费用,他们需要全方位了解相关数据(尽可能接近实时数据)。随着相关影响的出现,报告和信息中心中的数据必须显示团队成员决策的相关费用和业务影响。其他团队的用量和费用数据可充当识别高效部署模式的基准。这些数据有助于对云服务的最佳使用方式形成共识。

如果组织不鼓励和推广共享费用数据,则员工可能不愿意共享数据。有时,出于业务原因,组织可能不允许共享原始费用数据。即使是在这种情况下,我们都建议您避免使用限制访问费用信息的默认政策。

如需在组织中公开费用,中心团队可以执行以下操作:

  • 使用一种明确定义的方法来计算云资源的完全加载费用。例如,该方法会考虑根据购买折扣和共享费用(如共享数据库的费用)进行调整的总计云支出。
  • 设置信息中心可让员工近乎实时地查看他们的云支出。
  • 为激励团队中的个人拥有自己的费用,请允许跨团队广泛公开云支出。

实现协作行为

高效管理云资源的费用要求团队协作以改进其技术和运营流程。协作文化可帮助团队根据一组一致的业务目标和因素来设计经济实惠的部署模式。

为实现协作行为,中心团队可以执行以下操作:

  • 创建工作负载初始配置流程,通过其他工程师对建议的架构进行对等审核,有助于确保在设计阶段提高成本效益。
  • 打造经济实惠架构模式的跨团队知识库。

打造不责罚文化

促进建立学习和发展文化,确保安全地承担风险,必要时进行更正,并开展创新。承认错误(有时是代价高昂的错误)可能会在 IT 设计和部署生命周期中的任何阶段发生,就像在业务的任何其他部分发生一样。

不应指责或羞辱对于那些超支或造成浪费的个人,而应推广无责罚文化,帮助确定费用超支和计算错误的原因。在此环境中,团队成员更有可能分享其观点和经验。错误会经过匿名化处理并在整个企业之间共享以防止错误再次发生。

请勿将不责罚文化和缺乏责任感相混淆。员工继续负责自己制定的决策及自己的支出。但是,发生错误后,重点是将它当作学习机会,以防止错误再次发生。

为打造不责罚文化,中心团队可以执行以下操作:

  • 针对严重的费用问题运行事后分析但不责罚,将重点放在问题的系统性根本原因,而不是所涉及的人员。
  • 对响应费用超支和分享经验教训的团队成员进行表彰。鼓励团队中的其他成员分享错误、执行的操作和经验教训。

专注于业务价值

虽然 FinOps 做法通常侧重于降低费用,但中心团队的重点必须是让项目团队做出的决策能够使云资源发挥最大业务价值。您可以轻松做出决策以将费用降低到满足最低服务等级的程度。但是,此类决策通常会将费用转移到其他资源,从而导致更高的维护费用,并有可能增加总拥有成本。例如,为降低费用,您可能决定使用虚拟机 (VM) 而不是代管式服务。但是,与代管式服务相比,维护基于虚拟机的解决方案需要付出更多的精力,因此代管式服务提供的业务净值更高。

FinOps 做法可以为项目团队提供分析和数据洞见,供团队用来做出架构和运营决策,从而使其云资源发挥最大的业务价值。

为了帮助员工专注于业务价值,中心团队可以执行以下操作:

  • 使用代管式服务和无服务器架构来降低计算资源的总拥有成本。如需了解详情,请参阅选择计算平台

  • 将云资源用量与业务价值指标(如成本效益、弹性、功能速度和创新)相关联,从而做出费用优化决策。如需详细了解业务价值指标,请参阅 Cloud FinOps 白皮书

  • 为云中运行的所有应用和服务中实施单位价格

后续步骤