使用网络拓扑监控网络配置

您可以使用网络拓扑来审核网络配置或排查网络问题。网络拓扑提供网络基础架构的图形视图。

您可以通过转到 Google Cloud 控制台,开始使用网络拓扑。无需进行其他配置。

准备工作

简要了解网络拓扑及其拓扑界面

所需的角色和权限

如需获取查看网络拓扑和指标所需的权限, 请让管理员授予您 项目的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理访问权限

这些预定义角色包含 查看网络拓扑和指标所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

需要具备以下权限才能查看网络拓扑和指标:

  • 查看项目或受监控项目的网络拓扑图: networkmanagement.topologygraphs.read
  • 查看多个项目的网络拓扑图: networkmanagement.topologygraphs.read
  • 查看网络拓扑图上的指标: monitoring.timeSeries.list

您也可以使用自定义角色或其他预定义角色来获取这些权限。

如需详细了解所需的权限和角色,请参阅角色和权限

将多个项目添加到单个图表中

网络拓扑可以在单个图表中直观呈现来自多个项目的实体。例如,在共享 VPC 方案中,您可以查看包含宿主项目和服务项目中的实体的图表。

如需在图中添加多个项目,请参阅查看多个 Cloud 项目的指标

如果您有一个多项目图表,则可以按项目汇总实体

以下各部分介绍了如何使用网络拓扑界面的不同功能,例如过滤或导航实体层次结构。

停用跨项目遥测

Google Cloud 会收集跨项目网络遥测。默认情况下,您的组织会启用跨项目遥测。收集的网络 遥测数据不会导出到监控和诊断服务, Cloud Monitoring 和 Network Intelligence Center。

如果您不希望 Google Cloud 收集跨项目遥测数据, 可以为整个组织停用收集功能。收集的遥测数据 会存储保留期限如需更多信息 请参阅数据保留

控制台

  1. 在 Google Cloud 控制台中,转到跨项目遥测页面。

    转到跨项目遥测

  2. 选择停用跨项目遥测
  3. 点击保存更改

显示或隐藏层次结构和特定级层

您可以选择要在图表中显示的层次结构及其级层。您可能希望执行此操作以显示或隐藏某些资源类型。例如,您可以取消选中整个外部客户端层次结构复选框,以便仅查看 Google Cloud 资源之间的通信。在图表中,外部客户端以及进出其中的所有流量都处于隐藏状态。

如果取消选择层次结构的特定级层,则网络拓扑会将其隐藏。例如,如果您取消选中虚拟机实例的地区网络子网复选框,则网络拓扑将按区域显示每个地区中的实例,这是网络和子网之后层次结构中的下一个级层。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项 > Topology configuration(拓扑配置)中,选择或取消选择层次结构复选框以包含或排除整个层次结构,包括其基础实体。
  3. 如需切换层次结构的特定级层,请点击相关层次结构旁边的 更多。您不能取消选择某些级层,因为它们对于直观呈现图中的实体是必需的。

过滤特定实体

使用过滤来显示特定实体,例如特定地区、区域或实例组。如果您已知道正在接受调查的资源,请使用过滤功能在图表中查看这些资源。网络拓扑会显示过滤后的实体以及与其通信的任何对等体。 借助过滤功能,您可以执行以下操作:

  • 过滤层次结构中任何级别的实体。

  • 在指定要搜索和过滤的实体的名称时使用星号 (*)。例如,您可以使用值 *replica* 来搜索名称中包含 replica 的所有实体。您可以在模式中的任意位置使用星号。例如,Instance: www-*europe* 过滤条件与 www-service-europe-f9vqwww-static-europe-a5hj 实例都匹配。

  • 指定多个过滤条件。网络拓扑会显示与至少一个过滤条件匹配的任何实体。

过滤操作不区分大小写。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 过滤条件字段中,选择一个实体类型键,例如区域HTTPS 负载均衡器

    网络拓扑会显示与 实体。例如,如果您取消选中拓扑配置面板中的负载均衡器复选框,则网络拓扑不会显示与负载均衡器相关的过滤提示。

  4. 为过滤条件选择一个值,例如 us-east4my-load-balancer

    网络拓扑可提供适用于您的图表的值。例如,网络拓扑不会显示地区过滤条件的所有 Google Cloud 地区。它只显示包含资源的地区。

在 GKE Enterprise 视图中过滤节点

您可以过滤和查看特定节点,例如集群、工作负载和 Pod “GKE Enterprise”视图中

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,从指标和数据分析部分选择一个指标。
  3. 过滤条件部分,点击添加过滤条件以选择节点及其对等方。本部分仅适用于指标视图,不适用于数据分析视图。
  4. 类型列表中选择节点的类型。
  5. 节点列表中选择节点。

导航实体层次结构

加载图表时,所有顶级实体都会汇总至其顶级层次结构中。您可以展开某个实体以查看其较低级别的实体。您还可以收起已展开的实体。

例如,您可以展开一个地区以查看该地区中的所有 VPC 网络。父实体始终会直观地包含较低级别的实体。例如,如果您拖动地区实体,则地区内的网络会与之一起移动。

如需详细了解实体及其层次结构,请参阅“网络拓扑概览”中的实体

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 将指针悬停在实体上即可显示 展开 用于展开的图标收起 用于收起的图标 图标。

    如果收起实体,网络拓扑会显示展开图标。如果实体已展开,网络拓扑会显示收起图标。

  3. 点击展开收起图标。

  4. 在配置窗格中,如需仅显示区域等顶级实体之间的流量路径,请选中仅在处于焦点位置时显示子节点的连接复选框。

    如需查看较低级别实体之间的流量路径,请选择较低级别的实体或将指针悬停在这些实体上。

    如需显示所有流量路径,请取消选中复选框。

查看实体之间的流量指标

默认情况下,网络拓扑在每个连接上都会覆盖吞吐量值,以便您可以了解各实体之间的流量。您还可以更改网络拓扑在连接上覆盖的指标。如果所选指标与 网络拓扑不会叠加 连接。

指标值基于所选小时。 如需了解详情,请参阅数据收集和数据时效性

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    转到“网络拓扑”页面

  2. 选择 Infrastructure 视图或 GKE Enterprise 视图。
  3. 视图选项中,从指标和数据分析部分选择一个指标。

  4. 进入特定实体层次结构以查看与该实体相关的流量。

    例如,如果要查看某个区域和其他地区之间的吞吐量,则必须展开实体,直到看到该区域。

  5. 点击实体以突出显示其所有流量路径。

    网络拓扑会显示支持所选指标的每个连接的指标值。

在 GKE Enterprise 视图中查看转发次数最多和丢弃的流量最多

您可以在 GKE 视图中查看以下流量详细信息:

  • 大多数转发流显示 GKE 集群中的当前流量。
  • 丢弃最多的流有助于识别或调试 GKE 应用中的问题。 您还可以在详细信息面板中提供的图表中查看丢弃的原因。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    转到“网络拓扑”页面

  2. 选择 GKE Enterprise 视图。
  3. 查看选项中,从指标和数据分析部分选择网络判断
  4. 输入集群的名称,或从可用选项中选择集群。
  5. 选择流量选项以查看包含来自所选集群的流量的离群值的排序表。
  6. 点击下载 CSV 文件以下载表格,以便进一步处理 。

  7. 导航到特定实体层次结构以查看与该实体相关的流量。

  8. 点击实体以突出显示其所有流量路径。

    网络拓扑会显示支持所选指标的每个连接的指标值。

查看时间序列图表

网络拓扑会显示某些实体的时间序列图表。例如,网络拓扑可以显示实例的 CPU 利用率,或负载平衡器与其中一个后端之间的延迟时间。

这些图显示每分钟的值。一项活动之后的 7 分钟内即可获得这些图的数据。

查看与流量相关的指标

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 进入特定实体层次结构以查看与该实体相关的流量。

    例如,如果要查看负载平衡器与其他实体之间的延迟时间,您必须展开实体,直到看到负载平衡器。

  3. 点击实体以突出显示其所有流量路径。

  4. 点击覆盖在连接上的指标以查看其详细信息。

    网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。

查看与实体相关的指标

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 查找并展开实体层次结构,直到看到要查看其指标的实体为止。

  3. 点击实体。

    网络拓扑在详细信息窗格中显示图表。例如,您可以查看虚拟机实例的 CPU 利用率和内存百分比。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。

查看具有高指标值的实体的数据分析

除了平均每小时吞吐量、平均每小时丢包率和延迟时间中位数指标之外,您还可以查看实例和实例组的出站流量指标离群值排名。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. Metrics and insights(指标和数据分析)部分中,从选项中选择一项数据分析。

    当您选择高出站流量 - 出站流量类型 实例高出站流量实例组高出站流量 GKE 工作负载

  3. Types of egress(出站流量类型)列表中选择流量类型。 在“基础架构”视图中,选择以下选项之一:

    • Cross-zonal(跨可用区):显示 Google Cloud 可用区之间流量的离群值排名表,并排除同一可用区中的实体之间的流量
    • To the internet(到互联网):显示从 Google Cloud 到外部端点的流量(不包括混合流量)的离群值排行表
    • Hybrid(混合):显示通过 Cloud VPN、Cloud Interconnect 和路由器设备的流量的离群值排行表
    • All measured egress(所有测量的出站流量):显示来自某个实体的流量的离群值排行表

    GKE Enterprise 视图中,选择以下选项之一: - 跨可用区:显示离群值 GKE 的排名表 Google Cloud 可用区与工作负载之间的流量 排除同一可用区内实体之间的流量 - 所有测量的出站流量:显示离群值排名表 使用来自某实体的流量的 GKE 工作负载

  4. 如需突出显示实体的所有流量路径,请点击或指向该实体。

  5. 如需查看指标详细信息,请点击连接上叠加的指标。

网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值是选定的时段(小时)内的值。如果您正在查看最近的时段,则指标会显示当前值。

查看 Pod、工作负载和集群的指标、提醒、事件和日志

查看特定详细信息(例如指标、提醒、事件和日志) 除了平均每小时吞吐量和中位数延迟时间指标外,

控制台

  1. 在 Google Cloud 控制台中,转到 GKE Enterprise 标签页, 网络拓扑页面。

    转到 GKE Enterprise 标签页

  2. 查看与实体相关的指标。 网络拓扑在详细信息窗格中显示图表。

  3. 点击操作。 网络拓扑会显示详细信息面板。

  4. 在“Pod 详情”面板中,您可以执行以下操作:

    • 指标:查看容器指标、Pod 指标和节点指标。您还可以下载 PNG 和 CSV 格式的指标相关图表。
    • 提醒:查看现有提醒或创建新的提醒政策。
    • 事件:查看所有 Kubernetes 事件或选择在 Logging 中查看事件。
    • 日志:根据所选严重性查看日志。您还可以使用字段和值进一步过滤。

选择时段(小时)

您可以选择特定的时段(小时)来查看该小时内存在的实体及其通信关系。首次加载图表时,网络拓扑会直观呈现最近完成的小时,但指标来自最近几分钟。如需详细了解数据时效性,请参阅数据收集和时效性

如需选择不同的时段(小时),请使用时间轴,然后将滑块拖至特定小时。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 在时间轴中,将滑块拖动到时段(小时)以进行查看。

    网络拓扑会使用时段(小时)的信息来刷新图表。

仅显示当前项目或所有项目

多项目场景中,您可以选中显示工作区中的所有项目复选框,以显示 指标范围中的所有项目或仅显示当前项目。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 选中 Show all projects in the Workspace(显示工作区中的所有项目)复选框。如需仅显示当前项目,请取消选中该复选框。

    网络拓扑会重新绘制图表并显示指标范围中的所有项目或当前项目。

按项目汇总实体

多项目场景中,您可以按项目汇总实体。这样,您就可以按项目查看并过滤资源,然后按标准层次结构查看。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 选择项目聚合

    网络拓扑重新绘制图表并按项目聚合 Google Cloud 实体。

使用生成的查询检索详细日志

如果您已启用 VPC 流日志,则可以查询实例与其他实体之间的详细流。如果这些日志被导出到 BigQuery,您可以复制由网络拓扑生成的查询,并在 BigQuery 中使用它们查看特定流的详细日志。

网络拓扑会生成某些虚拟机流的查询。如果网络拓扑在连接上叠加吞吐量指标,则可以为它生成查询。生成的查询将日志限制为 选定的时段

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 展开包含要调查的实例的实体。

  3. 点击实例以突出显示其所有连接。

  4. 点击吞吐量指标以查看连接的详细信息窗格。

  5. 在详细信息窗格中的在 BigQuery 中查看流下,点击显示说明

  6. 如果尚未配置,请按照准备工作下的说明以配置将日志导出到 BigQuery 接收器的过程,并启用 VPC 流日志。这些说明提供了一个表格,其中列出了 与所选连接相关的子网通过 VPC 流日志状态列会指明 VPC 流日志已启用。

  7. 按照运行查询下的说明以复制生成的查询并在 BigQuery 中运行该查询。

    BigQuery 返回的日志可用于进一步调查问题或排查问题。

后续步骤