借助 Gemini Cloud Assist 加快诊断速度


即使使用标准工具,排查复杂的 Google Kubernetes Engine (GKE) 问题也可能非常耗时。解读加密的错误消息或识别日志和指标中的细微模式通常需要深厚的专业知识。

本页介绍了 Gemini Cloud Assist 如何通过分析错误消息、推荐解决方案和执行自动化调查来加快复杂问题的诊断速度,从而帮助您更快地找到根本原因。

对于希望快速了解和解决集群或节点级问题的平台管理员和运维人员,需要了解此信息;对于需要调试应用错误和解读复杂堆栈轨迹的应用开发者,需要了解此信息;对于希望使用 AI 赋能的分析来识别潜在的安全相关异常或配置错误的安全性专家,需要了解此信息。如需详细了解我们在 Google Cloud 内容中提及的常见角色和示例任务,请参阅常见的 GKE 用户角色和任务

访问 Gemini Cloud Assist

如需访问 Gemini Cloud Assist,请完成以下步骤:

  1. 在 Google Cloud 控制台中,前往任意页面。
  2. 在 Google Cloud 控制台工具栏中,点击星光图标 打开或关闭 Gemini Cloud Assist 对话

    系统将打开 Cloud Assist 面板。您可以点击显示的示例提示,也可以在输入提示字段中输入提示。

探索示例提示

为帮助您了解 Gemini Cloud Assist 的用途,下面提供了一些示例提示:

主题 场景 提示示例 Gemini Cloud Assist 可以提供哪些帮助
混乱的错误消息 Pod 处于 CrashLoopBackoff 状态,但错误消息难以理解。 此 GKE Pod 错误意味着什么,导致该错误的常见原因是什么:panic: runtime error: invalid memory address or nil pointer dereference Gemini Cloud Assist 会分析消息并以清晰的措辞进行解释。它还会提供可能的原因和解决方案。
性能问题 您的团队发现,在 GKE 中运行的某个应用的延迟时间较长。 prod GKE 集群中的 api-gateway 服务延迟时间较长。我应该先检查哪些指标?你能否提供一些导致该现象的 GKE 相关的常见原因? Gemini Cloud Assist 会建议您检查关键指标,探索潜在问题(例如资源限制或网络拥塞),并推荐用于进一步调查的工具和方法。
节点问题 GKE 节点卡在 NotReady 状态。 我的某个 GKE 节点 (node-xyz) 显示 NotReady 状态。排查此问题的常规步骤有哪些? Gemini Cloud Assist 会提供分步调查方案,说明节点自动修复等概念,并建议相关的 kubectl 命令。
了解 GKE 您不确定某个特定的 GKE 功能或如何实施最佳实践。 保护 GKE 集群的最佳实践有哪些?有没有什么方法可以了解更多信息? Gemini Cloud Assist 会清晰阐述 GKE 最佳实践。点击显示相关内容,即可查看指向官方文档的链接。

如需了解详情,请参阅以下资源:

使用 Gemini Cloud Assist 调查

除了互动式对话之外,Gemini Cloud Assist 还可以通过 Gemini Cloud Assist 调查执行更深入的自动化分析。此功能直接集成到 Logs Explorer 等工作流中,是一款强大的根本原因分析工具。

当您对某个错误或特定资源发起调查时,Gemini Cloud Assist 会分析相关日志、配置和指标。它会使用这些数据来生成有关潜在根本原因的排名观测结果和假设,然后为您提供建议的后续步骤。如果您有支持套餐,还可以将调查结果转移到 Google Cloud 支持服务工单中,从而提供有助于更快解决支持服务工单的其他背景信息。

后续步骤