运维套件

运维套件用于监控基础架构和应用的性能,排查问题并加以改善
监控基础架构和应用的性能,排查问题并加以改善

Google Cloud 的运维套件(原 Stackdriver)用于监控云基础架构、软件和应用的性能,排查问题并加以改善。借助此套件,您可以高效地构建和运行工作负载,确保应用的高性能和可用性。

  • 跨 Google Cloud 内部与外部的应用、平台和服务收集信号
  • 分析和监控您的运营遥测数据
  • 设置适当的性能和可用性指标
  • 利用内置监测功能对应用进行问题排查和改善
  • 利用开箱即用的工具以及通过编程接口定制的工具,实现运营自动化

主要特性

对于 Ops、SecOps、SRE、DevOps 团队

实时日志管理与分析

Cloud Logging 是一项可大规模实现出色性能的全托管式服务,能够从数以千计的虚拟机中提取应用和系统日志数据,以及自定义日志数据。Cloud Logging 让您可以实时分析所选日志并将其导出至长期存储空间中。

对于 Ops、SRE、DevOps 团队

规模化的内置监测功能

Cloud Monitoring 可帮助您了解云应用的性能、正常运行时间以及总体运行状况。它会从以下来源收集指标、事件和元数据:Google Cloud 服务、托管的正常运行时间探测工具、应用插桩,以及各种常见应用组件。

对于 DevOps 团队

监控应用性能并加以改善

应用性能管理工具 (APM) 可帮助您缩短延迟时间并降低费用,让您更高效地运行应用。借助 Cloud TraceCloud DebuggerCloud Profiler,您可以深入了解代码和服务的运行情况,并在需要时对其进行问题排查。

查看所有特性

客户案例

亮点

  • 借助 Cloud Monitoring 减少在基础架构管理方面所花的时间

  • 在一个集中式平台中管理所有运维套件产品以提高生产力

  • 节省高达 80% 的问题排查时间。

合作伙伴

查看更多客户

最新资讯

文档

教程
开始使用 Cloud Logging

帮助您上手运行 Cloud Logging 的指南和设置文档。

教程
Cloud Audit Logs

了解 Cloud Audit Logs 如何维护三类审核日志:管理员活动、数据访问和系统事件。

教程
开始使用 Cloud Monitoring

了解工作区、监控代理、正常运行时间检查和其他功能。

架构
Google Cloud 指标

查看 Cloud Monitoring 支持哪些指标。

Google Cloud 基础知识
为 GKE 提供监控和日志记录支持

了解 Google Kubernetes Engine 与 Cloud Monitoring 和 Cloud Logging 的原生集成。

常见使用场景

管理 Cloud 运维套件

使用集成式日志记录工具、监控工具和应用性能管理工具,将监测功能内置到您的平台中。

集中管理日志记录和运维套件

集成式日志记录工具可为开发团队、DevOps/SRE 团队和安全团队提供有关平台事件的重要数据洞见。从 Google Cloud 服务和外部来源提取日志,并将其用于短期运营和长期日志分析。利用集成式审核日志记录工具执行详细的取证分析。通过实时日志导出功能与第三方日志记录系统相集成。

SD overview_Dig_1第 1 层外部区域 - 蓝色外部区域 - 绿色外部区域 - 黄色外部区域 - 灰色Logging storage形状填充-3填充-4填充-4-2填充-4-3填充-7Cloud StorageBigQuery外部区域 - 灰色• Log search & analysis • Log based metrics • Log error analysis • Dashboards from logs • Alerting from logs外部区域 - 灰色Anywhere…XMLID_5_XMLID_4_XMLID_3_XMLID_2_XMLID_1_Logs APIAudit logsLogs APIService logsApp logsSyslogPlatform logsCentralized Cloud Logging API形状填充-3填充-4填充-4-2填充-4-3填充-7Log router形状外部区域 - 灰色Log sinks - Inclusion filters外部区域 - 灰色Exclusion filters外部区域 - 灰色US$0.50/GB*外部区域 - 灰色Cost per servicePub/Sub

Cloud Logging 会收集所有日志(包括审核日志、平台日志、用户日志和发送到 API 的外部日志),这些日志会发送到日志路由器并由其传输给 Cloud Logging、BigQuery 或外部(借助与 Pub/Sub 的集成)。

将监测功能内置到应用和基础架构中

集成式监测功能可为开发团队、DevOps/SRE 团队和安全团队提供有关平台事件的重要数据洞见。Cloud Monitoring 提供集中式信息中心和提醒功能,有助于您高效地运营服务。集成式日志记录功能可助力漏洞检测工作,并让您的安全和运营团队实现主动式智能监控。使用 Cloud Functions 和 Data Loss Protection API 来定制您的日志监控系统。

SD overview_Dig_2第 1 层GCP 徽标填充-3填充-5填充-7填充-8填充-9填充-18填充-19填充-20填充-21填充-22填充-23内部区域 - 蓝色Logging export optionsBigQueryCloud StorageSecurity Command Center形状椭圆外部区域 - 灰色Data centerStorageComputeThird-party log provider形状_1_AlertsDashboardsOn-premises logsLogging metric内部区域 - 蓝色Google Cloud projectBigQueryCloud StorageCompute EngineGoogle Kubernetes Engine形状Rectangle-pathCloud Functionscolored-32_functions形状colored-32_functions-2形状-2椭圆椭圆-2椭圆-3Dataproc形状Rectangle-path内部区域 - 蓝色Google Cloud projectPub/SubBigQueryCloud StorageCompute EngineGoogle Kubernetes Engine形状Rectangle-pathAI Platform形状BindPlanePub/SubCloud Logging形状填充-3填充-4填充-4-2填充-4-3填充-7Logs router形状Event Threat Detection外部区域 - 灰色Operations usersUsers形状_1_线条-21线条-22Cloud Monitoring

Cloud Logging 和 Cloud Monitoring 服务可为您的 SRE/DevOps 团队提供所需的监测功能,以便监控 Google Cloud、本地环境和第三方提供商。Logging 和 Monitoring 与 Security Command Center 相集成,可为安全和运营团队提供其所需的数据洞见。

BindPlane 是 Blue Medora 的注册商标。

利用应用性能管理工具缩短延迟时间并提升效率

利用应用性能管理工具缩短应用的延迟时间并降低费用。通过详细了解应用在生产环境中的行为表现,您可以提升应用的运行速度和可靠性,而无论其是否托管在 Google Cloud 上。通过 Cloud Trace 的分布式跟踪记录,了解请求如何在您的应用中传播。使用 Cloud Profiler 帮助确定导致延迟和低效的代码。使用 Cloud Debugger 对生产环境中的应用进行问题排查,而不用停止或拖慢应用。

SD overview_Dig_3第 1 层GCP 徽标填充-3填充-5填充-7填充-8填充-9填充-18填充-19填充-20填充-21填充-22填充-23外部区域 - 灰色Data center, third-party cloud providersComputeCloud Trace形状填充-1形状-2填充-1-2形状-3填充-1-3Istio tracesOpenTelemetry tracesTraces, debugging, profiler telemetryTraces, debugging, profiler telemetryCloud Debugger页-1icon_debugDEBUG_SECTION形状Cloud Profilercolored-32_profiler椭圆椭圆-2Combined-Shape内部区域 - 蓝色Google Cloud projectCompute EngineGoogle Kubernetes Engine形状Rectangle-pathApp Engine形状内部区域 - 蓝色Google Cloud projectCompute EngineGoogle Kubernetes Engine形状Rectangle-pathApp Engine形状Google Cloud APM LibrariesIstiohullmainsailheadsailTrace & APM APIsOpenTelemetry外部区域 - 灰色Developers外部区域 - 灰色DevOps/SREUsers形状_1_线条-21线条-22Users形状_1_线条-21线条-22

所有特性

日志管理 日志路由器让客户可以控制将日志发送到何处。所有日志(包括审核日志、平台日志和用户日志)都会发送到 Cloud Logging API,并流经日志路由器。日志路由器会依据现有规则检查每条日志条目,以确定哪些日志条目应该舍弃,哪些应该提取,以及哪些应该包括在导出内容中。
日志数据分析 Error Reporting 可分析汇总云应用中的错误,并在检测到新错误时通知您。
主动监控 Cloud Monitoring 让您可以创建提醒政策,以便在各项指标、运行状况检查结果和正常运行时间检查结果达到指定阈值时收到通知。该产品集成了多种通知渠道,包括 Slack 和 PagerDuty。
自定义可视化 Cloud Monitoring Dashboards 提供默认的开箱即用型信息中心,让您可以利用强大的可视化工具根据需求来自定义信息中心。
运行状况检查监控 Cloud Monitoring 为您的云环境中运行的 Web 应用和其他可通过互联网访问的服务提供端点检查功能。您可以配置与网址、群组或资源(例如实例和负载平衡器)相关的正常运行时间检查。
服务监控 Service Monitoring 提供开箱即用的遥测功能和信息中心,让您可通过拓扑图和情境图在具体情境中排查问题;另外还通过 SLO 和错误预算管理功能实现了运行状况监控的自动化。
延迟管理 Cloud Trace 提供 App Engine 延迟采样和报告功能,其中包括每个网址的统计数据和延迟分布。
调试 Cloud Debugger 可让您在生产环境中的任意代码位置检查应用状态,从而将应用的生产环境数据关联至您的源代码。您无需中止或者减缓请求处理。
性能和费用管理 Cloud Profiler 可持续分析您的生产应用中的资源使用情况,从而帮助您识别并消除潜在的性能问题。
安全管理 Cloud Audit Logs 在整个 Google Cloud 中提供近乎实时的用户活动可见性。

价格

控制您自己的用量和支出:只需为所用资源付费。免费用量配额让您无需预付费用或做出承诺,即可开始使用服务。

免费用量配额让您无需预付费用或做出承诺,即可开始使用服务。

查看价格详情

合作伙伴

从丰富且不断发展的技术集成生态系统中获得支持,拓展 Google Cloud 客户可用的 IT 运营、安全和合规功能。

后续行动

获享 $300 赠金,用于在 Google Cloud 上进行学习和构建应用,有效期长达 12 个月。

不知从何入手,需要一点帮助?
与值得信赖的合作伙伴携手
继续浏览