排查 Cloud Assist 调查问题

Gemini Cloud Assist 调查是一款用于在复杂的分布式云环境中排查基础设施和应用问题的根本原因分析 (RCA) 工具。调查可以帮助您了解、诊断和解决 Google Cloud中的问题。借助调查,您可以通过缩短问题解决时间和提高整体可用性来简化突发事件响应,而无需耗费太多精力。

Gemini Cloud Assist 调查的优势

  • 在上下文中排查问题

    Gemini Cloud Assist 调查已集成到您的当前工作流中

  • 查看 Gemini Cloud Assist 看到的内容。

    调查会生成观察结果,即与问题最相关的环境状态分析洞见。观察结果有助于您快速了解环境中发生的情况,并且是 Gemini Cloud Assist 对日志、配置和指标等数据源进行审核后得出的。跨数据源的分析可能来自程序 runbook、广泛的信号分析或工具。然后,系统会对观察结果进行排名和过滤,以帮助您专注于与问题最相关的信息。观察结果中包含指向为每项观察结果提供信息的数据源的链接,以便您进一步调查和核实观察。

  • 诊断问题。

    调查会综合观察结果,并利用特定于该领域的知识来找出可能的根本原因。公开知识和私有知识用于解释根本原因的背景信息,使其更易于理解。在存在不确定性时,可以提供多个根本原因作为假设。您可以迭代调查并创建新的修订版本,以便深入了解某些领域。

  • 解决问题。

    调查会推荐后续问题排查步骤或修复措施,以帮助您解决问题。提及特定资源或时间段可为您提供相关信息,而这些信息如果靠您自己收集,则需要花费更长时间,从而让您能够更快、更轻松地解决问题。

  • 获取更多支持。

    如果您需要其他支持,可以将调查无缝转换为 Google Cloud 支持请求。支持工程师可以使用调查的详细信息,了解您的问题排查背景信息,从而帮助您更快地解决支持请求,减少来回沟通。

支持的 Google Cloud 产品

受支持的产品是指通过调查支持排查问题的产品。 Gemini Cloud Assist 调查支持以下Google Cloud 产品:

并非受支持产品中的所有资源本身都受支持。某些工具(例如 Google Cloud 控制台)会阻止您向调查中添加不受支持的资源,或阻止您看到与不受支持的资源关联的调查按钮;不过,其他工具(例如直接 REST API 请求)即使在调查包含不受支持、拼写错误或格式不正确的资源时,也可以运行调查。在查看调查结果时,一个不错的做法是确认您在初始调查中指定的所有资源是否都在输出观察内容中被提及。如果输出中未提及某个资源,但该资源似乎应该被提及,则可能是该资源不受支持,或者该资源的命名存在问题。

入口点

您可以在Google Cloud 控制台中的以下位置发起调查:

  • “调查”页面

    点击创建以启动调查。

  • Logs Explorer

    当日志的严重级别为“警告”或更高级别时,系统会在支持的资源的日志中显示调查按钮。在 Logs Explorer 中发起调查时,系统会自动将日志消息、开始时间和日志中的任何相关资源预先填充到调查创建面板中。您可以在运行调查之前选择性地修改或添加信息。

    前往严重程度为“警告”或更高级别的日志

  • Cloud Monitoring 提醒

    对于具有资源标签的提醒,系统会显示调查按钮。 针对提醒发起调查时,系统会自动在调查创建面板中预先填充提醒的标题、问题描述、开始时间和相关资源。您可以在运行调查之前选择性地修改或添加信息。

  • Gemini Cloud Assist 对话面板

    新调查选项会显示在对话面板的新建下拉菜单中。

  • Cloud Hub

    运行状况和问题排查页面中会显示创建调查按钮。您可以查看并启动以项目或应用为范围的调查。

  • 在特定商品页面中。

    您可以在支持的产品页面(例如 Google Kubernetes Engine 中收到提醒的工作负载或失败的 Dataproc 批处理)中发起调查。

您还可以使用以下选项来发起和查看调查:

注意事项

  • 每项调查都会在其正常运行中使用 OAuth 2.0 令牌。调查会根据现有授权创建令牌,并在必要时请求获得范围为 API_CLOUD_PLATFORM 的新授权。

    • OAuth 2.0 令牌提供的访问权限仅限于运行调查的用户或服务账号可用的访问权限。

    • OAuth 2.0 令牌绝不会用于更改数据。

  • Gemini Cloud Assist 调查会创建调查资源,其中包含注解和观测结果。此信息可以存储在任何 Google Cloud 数据中心。您不应调查受驻留或管辖区法规遵从性要求约束的数据。如需了解其他安全功能的支持状态,请参阅 Gemini 的认证和安全

  • Gemini Cloud Assist 调查会在调查过程中分析全球 Google Cloud资源,例如日志

    • 调查不会分析特定于位置的内容,例如存储在区域日志存储桶中的数据。

    • 调查不会分析位于 Google Cloud之外的数据。

  • 创建调查的账号会自动获得针对该特定调查的 Investigation Owner (roles/geminicloudassist.investigationOwner) IAM 角色。

  • 调查旨在对Google Cloud 环境进行有针对性的问题排查。调查仅限于诊断单个 Google Cloud 项目或单个 App Hub 应用内的问题。

    • 对于项目级调查,调查结果会存储在创建调查的项目中。

    • 对于应用级调查,调查在已启用应用的文件夹的 App Hub 管理项目中创建,结果存储在应用的管理边界内。调查会分析所选应用中的资源,即使这些资源分布在不同的项目中也是如此。

    • 调查不适用于在宿主项目中创建的应用。

  • 调查受 AI 技术的一般限制的约束。

  • 调查运行是动态的,这意味着重新运行同一调查可能会生成存在细微差异的结果。导致运行之间出现差异的一些因素包括大语言模型(例如 Gemini)输出的概率性本质,以及 Google Cloud 的总体状态并非静态。

  • 时间戳是有效调查的关键信息。为获得最佳结果,请验证调查中报告的开始时间是否合理准确。

反馈

用户反馈是提高调查质量和效果的重要机制。您可以通过以下方式提供反馈:

  • 为项目中的 Gemini Cloud Assist 配置提示与回答共享功能。默认情况下,Google Cloud 不会检查与您的调查关联的输入或输出。

  • 如需针对调查提供反馈,请点击任意调查中的我喜欢不喜欢图标。此记录用于表明您是否认为该特定调查有帮助。此反馈机制仅记录您提供的具体反馈,不会记录调查的任何输入内容或生成的输出。

后续步骤