管理和优化云资源

Last reviewed 2024-10-31 UTC

Google Cloud 架构框架卓越运营支柱中的这一原则提供了一些建议,可帮助您管理和优化云工作负载使用的资源。这涉及根据实际使用情况和需求调整资源大小、使用自动扩缩功能进行动态资源分配、实施成本优化策略,以及定期检查资源利用率和费用。此原则中讨论的许多主题在费用优化支柱中都有详细介绍。

原则概览

云资源管理和优化在优化云支出、资源使用情况和基础架构效率方面发挥着重要作用。其中包含各种策略和最佳实践,旨在最大限度地提高云支出的价值和回报。

此支柱的优化重点不仅仅是降低费用。该计划强调了以下目标:

  • 效率:利用自动化和数据分析功能,实现卓越成效并节省成本。
  • 性能:轻松扩缩资源,以满足波动的需求并提供最佳结果。
  • 可伸缩性:调整基础架构和流程,以适应快速增长和多样化的工作负载。

通过着重实现这些目标,您可以在费用和功能之间取得平衡。您可以就资源预配、伸缩和迁移做出明智的决策。此外,您还可以深入了解资源使用情况,从而主动发现并解决潜在问题,避免问题进一步恶化。

建议

如需管理和优化资源,请考虑以下部分中的建议。本文档中的每项建议都与一个或多个运营准备重点领域相关。

调整资源大小

持续监控资源利用率并调整资源分配以满足实际需求,对于高效管理云资源至关重要。过度预配资源可能会导致不必要的开支,而资源不足可能会导致性能瓶颈,进而影响应用性能和用户体验。为了实现最佳平衡,您必须采用积极主动的做法来合理调整云资源的规模。此建议与治理“运营准备情况”重点领域相关。

Cloud MonitoringRecommender 可帮助您发现调整大小的机会。Cloud Monitoring 可让您实时了解资源利用率指标。借助这种可见性,您可以跟踪资源使用情况模式并发现潜在的低效问题。Recommender 会分析资源利用率数据,以便做出智能建议来优化资源分配。通过使用这些工具,您可以深入了解资源使用情况,并就如何合理调整资源规模做出明智的决策。

除了 Cloud Monitoring 和 Recommender 之外,不妨考虑使用自定义指标触发自动调整大小操作。借助自定义指标,您可以跟踪与应用和工作负载相关的特定资源利用率指标。您还可以配置提醒,以便在达到预定义阈值时通知管理员。然后,管理员可以采取必要的措施来调整资源分配。这种主动方法可确保及时扩缩资源,从而帮助优化云端费用并防止出现性能问题。

使用自动扩缩

自动扩缩计算资源和其他资源有助于确保基于云的应用实现最佳性能和成本效益。借助自动扩缩功能,您可以根据工作负载波动情况动态调整资源容量,以便在需要时获得所需资源,并避免过度预配和不必要的费用。此建议与运营准备工作的重点领域相关的流程有关。

为了满足不同应用和工作负载的多样化需求,Google Cloud 提供了各种自动扩缩选项,包括:

  • Compute Engine 托管实例组 (MIG) 是一组作为单个实体进行管理和扩缩的虚拟机。借助 MIG,您可以定义自动扩缩政策,指定要在组中维护的虚拟机数下限和上限,以及触发自动扩缩的条件。例如,您可以配置一项政策,以便在 CPU 利用率达到特定阈值时在 MIG 中添加虚拟机,并在利用率低于另一个阈值时移除虚拟机。
  • Google Kubernetes Engine (GKE) 自动扩缩可动态调整集群资源,以满足应用的需求。它提供了以下工具:

    • 集群自动扩缩器会根据 Pod 资源需求添加或移除节点。
    • Pod 横向自动扩缩器会根据 CPU、内存或自定义指标更改 Pod 副本数量。
    • Pod 纵向自动扩缩器会根据使用模式微调 Pod 资源请求和限制。
    • 节点自动预配功能会自动为您的工作负载创建经过优化的节点池。

    这些工具协同工作,可优化资源利用率、确保应用性能并简化集群管理。

  • Cloud Run 是一个无服务器平台,可让您运行代码,而无需管理基础架构。Cloud Run 提供内置的自动扩缩功能,可根据传入流量自动调整实例数量。当流量增加时,Cloud Run 会扩容实例数量以处理负载。当流量减少时,Cloud Run 会缩减实例数量以降低费用。

通过使用这些自动扩缩选项,您可以确保云端应用拥有处理各种工作负载所需的资源,同时避免过度预配和不必要的费用。使用自动扩缩功能可以提高性能、节省费用,并更高效地使用云资源。

利用费用优化策略

优化云支出有助于您有效管理贵组织的 IT 预算。此建议与治理“运营准备情况”重点领域相关。

Google Cloud 提供了多种工具和方法,可帮助您优化云端费用。通过使用这些工具和技术,您可以从云支出中获得最大价值。这些工具和技术可帮助您确定可以降低成本的方面,例如识别利用率过低的资源或推荐更具成本效益的实例类型。 Google Cloud 提供的以下选项有助于优化云成本:

  • 承诺使用折扣 (CUD) 是指在一定时间段内承诺达到一定使用量的折扣。
  • Compute Engine 中的持续使用折扣可针对持续使用某项服务提供折扣。
  • 与常规虚拟机相比,Spot 虚拟机可让您以更低的费用使用未使用的虚拟机容量。

价格模型可能会随时间而变化,我们可能会推出与现有选项相比具有更出色性能或更低费用的新功能。因此,您应定期审核定价模型,并考虑替代功能。通过及时了解最新的定价模式和功能,您可以就云架构做出明智的决策,从而最大限度地降低费用。

Google Cloud的费用管理工具(例如预算和提醒)可提供有关云支出的有价值的数据洞见。借助预算和提醒功能,用户可以设置预算,并在超出预算时收到提醒。这些工具可帮助用户跟踪其云支出,并找出可降低费用的地方。

跟踪资源使用情况和费用

您可以使用代码植入和标签来跟踪资源使用情况和费用。通过为云资源(例如项目、部门或其他相关维度)分配标记和标签,您可以对资源进行分类和整理。这样,您就可以监控和分析特定资源的支出模式,并找出高使用率或潜在节省费用的地方。此建议与以下运营准备工作的重点领域相关:治理和工具。

Cloud Billing 和费用管理等工具可帮助您全面了解自己的支出模式。这些工具可提供有关云端使用情况的详细数据分析,让您能够发现趋势、预测费用并做出明智的决策。通过分析历史数据和当前的支出模式,您可以确定费用优化工作的重点领域。

自定义信息中心和报告可帮助您直观呈现费用数据,并深入了解支出趋势。通过使用相关指标和维度自定义信息中心,您可以监控关键绩效指标 (KPI),并跟踪实现成本优化目标的进度。报告可对费用数据进行更深入的分析。借助报告,您可以按特定时间段或资源类型过滤数据,以了解导致云支出增加的根本因素。

定期查看和更新代码、标签和费用分析工具,确保您掌握最新的云端使用情况和费用信息。通过及时了解相关信息并开展费用事后分析或主动费用审核,您可以及时发现任何意外支出增加情况。这样,您就可以做出主动决策,优化云资源并控制费用。

建立费用分配和预算

在云端进行成本管理时,问责和透明度至关重要,这有助于优化资源利用率并确保财务控制。此建议与治理“运营准备情况”重点领域相关。

为确保问责和透明度,您需要制定明确的费用分配和退款机制。通过将费用分配给特定团队、项目或个人,贵组织可以确保这些实体各自负责自己的云用量。这种做法有助于培养归属感,并鼓励负责任的资源管理。此外,借助扣款机制,贵组织可以从内部客户收回云端费用,将奖励与绩效挂钩,并促进财务纪律。

为不同的团队或项目制定预算是云端费用管理的另一个重要方面。借助预算,贵组织可以指定支出限额,并根据这些限额跟踪实际支出。通过这种方法,您可以做出积极的决策,以防止支出失控。通过设置切实可行的预算,您可以确保高效使用云资源,并使其与业务目标保持一致。定期监控实际支出与预算的对比情况有助于您发现差异并及时解决可能超支的问题。

如需监控预算,您可以使用 Cloud Billing 预算和提醒等工具。这些工具可实时分析云支出,并在可能超支时通知利益相关方。通过使用这些功能,您可以跟踪云端费用,并在出现重大偏差之前采取纠正措施。这种积极主动的做法有助于避免财务意外,并确保负责任地使用云资源。