测试版指南

本指南详细介绍了测试版期间 Stackdriver Kubernetes Monitoring 的当前版本和计划版本。

发布版本

由于 Stackdriver Kubernetes Monitoring 的安装现在由 GKE 管理,因此不再记录手动安装。

下面列出了 Stackdriver Kubernetes Monitoring 的当前版本和更新,最新的版本列在最前面:

  • 测试版更新 (Kubernetes 1.12.7):强烈建议所有用户使用此更新。要升级到此版本,请转到安装 Kubernetes Monitoring

  • 其他受支持的测试版 (Kubernetes 1.10.12 / 1.11.6 / 1.11.7 / 1.11.8 / 1.12.5 / 1.12.6):要升级到任何这些版本,请转到安装 Kubernetes Monitoring

    在升级到任何这些版本之前,请务必查看此页面以了解已知问题。

  • 原始测试版 (Kubernetes 1.10.2):由于此版本存在不少已知问题,因此建议不要将此版本用于任何用途。

功能和已知问题

本部分列出了当前测试版中的已知问题。截至 2019 年 4 月 29 日,下列问题仍然存在

测试版更新 1.12.6

  1. LogEntry 元数据标签字段发生变化

    将 Google Kubernetes Engine 集群升级到 GKE 1.12.6 或更高版本时,元数据标签字段会发生变化:

    • 目前位于 metadata.userLabels 字段的 Kubernetes Pod 标签会移到 LogEntry 中的 labels 字段,标签键的前缀为 k8s-pod/接收器基于日志的指标排除项或查询中的过滤条件表达式可能需要更改。

    • metadata.systemLabels 字段中的 Stackdriver 系统标签不再可用。

  2. 元数据代理生成日志垃圾内容

    元数据代理具有已知错误,该错误会生成具有 400 Bad Request 错误的日志垃圾内容。系统仍会正确收集所有元数据,并且功能不会受到影响。但是,此日志垃圾内容会使用不必要的日志存储空间,且可能会生成其他付费日志。

    在此错误修复之前,用户不应升级到此版本。

    已在 1.12.7-gke.10 中修复

测试版更新 1.11.6

要升级到此版本,请转到安装 Kubernetes Monitoring

  • 包括对 Stackdriver Kubernetes Monitoring 表格界面加载和呈现延迟的重大改进。
  • 修复了 1.10.2 版本的大多数已知问题。
  • 恢复了为 Stackdriver Kubernetes Monitoring 安装托管支持的功能。
  • 支持升级安装有 Stackdriver Kubernetes Monitoring 的现有集群。
  • 无需在 GKE 上进行任何手动安装。
  1. Stackdriver 元数据代理重启

    在测试版中,元数据代理可能在正常操作期间每小时重启一次,并且可能连续多次重启。

    在 1.12.6-gke.7 中得到了修复

    变通方法:不要担心元数据代理的重启计数

测试版 1.11.4

  1. 从 Kubernetes 1.11.4 开始,结构化 JSON 日志的解析不正确

    从 Kubernetes 1.11.4 开始,结构化 JSON 日志的解析不正确。所造成的后果之一是配置为基于结构化日志内容触发的提醒无法正确触发。这可能导致提醒触发失败或误触发。此外,依赖于结构化日志内容的基于日志的指标将无效。

    变通方法:降级到 GKE 版本 1.11.3:

    gcloud container clusters upgrade [CLUSTER_NAME] --zone [ZONE] --project [PROJECT] --master --cluster-version=1.11.3
    

    在 1.11.6-gke.2 和 1.12.4-gke.2 中得到了修复

测试版 1.10.2

  1. 缺失资源条目

    您可能在 Stackdriver Kubernetes Monitoring 中看不到所有的命名空间、工作负载、pod 或其他实体。这是由于收集元数据时出现了问题。查找缺失实体最多可能需要 30 分钟。这些实体会在刷新显示后显示。

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  2. 区域和多地区集群

    属于区域和多地区集群的实体未正确显示。这些集群的“基础架构”、“工作负载”和“服务”标签不会扩展到节点/pod 级别。

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  3. 日志条目中缺失严重性

    Logging 代理提取的日志条目缺失严重性字段,这会导致所有日志条目显示为默认严重性(灰色星标),从而破坏错误报告集成。

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  4. 异常堆栈轨迹检测被破坏

    多行异常堆栈轨迹被拆分为多个单独的日志条目,从而破坏错误报告集成。

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  5. 来自代理的不相关错误消息

    当代理的前一个实例不正确关闭后,元数据代理可能写入不相关的错误日志消息。消息是:

    terminate called after throwing an instance of 'boost::exception_ ...'
    what():  Error listening on provided port.
    terminate called recursively
    Aborted (core dumped)
    

    此外,Logging 代理将在元数据代理终止后记录 Error calling Metadata Agent

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  6. Stackdriver 代理在 Compute Engine 防火墙后不起作用

    Stackdriver Kubernetes Monitoring 不适用于某些 Compute Engine 防火墙后的集群。在这些情况下,您的元数据代理会发出以下错误消息:

    Metadata request unsuccessful: Address family not supported by protocol.
    

    在 Kubernetes 版本 1.10.6 和 1.11.2 中得到了修复。您还可以按照手动安装中的步骤在新集群中安装较新版本的 Heapster 和 Stackdriver 代理。

  7. Stackdriver 元数据代理重启

    在测试版中,元数据代理可能在正常操作期间每小时重启一次,并且可能连续多次重启。

    在 1.12.6-gke.7 中得到了修复

    变通方法:不要担心元数据代理的重启计数

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
Stackdriver Monitoring
需要帮助?请访问我们的支持页面