使用网络拓扑监控网络配置

您可以使用网络拓扑来审核网络配置或排查网络问题。网络拓扑提供网络基础架构的图形视图。

您可以通过转到 Google Cloud 控制台,开始使用网络拓扑。无需进行其他配置。

准备工作

简要了解网络拓扑及其拓扑界面

所需的角色和权限

如需获得查看网络拓扑和指标所需的权限,请让您的管理员向您授予项目的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理访问权限

这些预定义角色包含查看网络拓扑和指标所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

需要具备以下权限才能查看网络拓扑和指标:

  • 查看项目或受监控项目的网络拓扑图: networkmanagement.topologygraphs.read
  • 查看多个项目的网络拓扑图: networkmanagement.topologygraphs.read
  • 查看网络拓扑图上的指标: monitoring.timeSeries.list

您也可以使用自定义角色或其他预定义角色来获取这些权限。

如需详细了解所需的权限和角色,请参阅角色和权限

将多个项目添加到单个图表中

网络拓扑可以在单个图表中直观呈现来自多个项目的实体。例如,在共享 VPC 方案中,您可以查看包含宿主项目和服务项目中的实体的图表。

如需在图中添加多个项目,请参阅查看多个 Cloud 项目的指标

如果您有一个多项目图表,则可以按项目汇总实体

以下各部分介绍了如何使用网络拓扑界面的不同功能,例如过滤或导航实体层次结构。

停用跨项目遥测

Google Cloud 会收集跨项目网络遥测。默认情况下,您的组织会启用跨项目遥测。收集的网络遥测不会导出到监控和诊断服务(例如 Cloud Monitoring 和 Network Intelligence Center)。

如果您不希望 Google Cloud 收集跨项目遥测,则可以为整个组织停用收集。之前收集的遥测数据将存储在保留期限中。如需了解详情,请参阅数据保留

控制台

  1. 在 Google Cloud 控制台中,转到跨项目遥测页面。

    转到跨项目遥测

  2. 选择停用跨项目遥测
  3. 点击保存更改

显示或隐藏层次结构和特定级层

您可以选择要在图表中显示的层次结构及其级层。您可能希望执行此操作以显示或隐藏某些资源类型。例如,您可以取消选中整个外部客户端层次结构复选框,以便仅查看 Google Cloud 资源之间的通信。在图表中,外部客户端以及进出其中的所有流量都处于隐藏状态。

如果取消选择层次结构的特定级层,则网络拓扑会将其隐藏。例如,如果您取消选中虚拟机实例的地区网络子网复选框,则网络拓扑将按区域显示每个地区中的实例,这是网络和子网之后层次结构中的下一个级层。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项 > Topology configuration(拓扑配置)中,选择或取消选择层次结构复选框以包含或排除整个层次结构,包括其基础实体。
  3. 如需切换层次结构的特定级层,请点击相关层次结构旁边的 更多。您不能取消选择某些级层,因为它们对于直观呈现图中的实体是必需的。

过滤特定实体

使用过滤来显示特定实体,例如特定地区、区域或实例组。如果您已知道正在接受调查的资源,请使用过滤功能在图表中查看这些资源。网络拓扑会显示过滤后的实体以及与其通信的任何对等体。 借助过滤功能,您可以执行以下操作:

  • 过滤层次结构中任何级别的实体。

  • 在指定要搜索和过滤的实体的名称时使用星号 (*)。例如,您可以使用值 *replica* 来搜索名称中包含 replica 的所有实体。您可以在模式中的任意位置使用星号。例如,Instance: www-*europe* 过滤条件与 www-service-europe-f9vqwww-static-europe-a5hj 实例都匹配。

  • 指定多个过滤条件。网络拓扑会显示与至少一个过滤条件匹配的任何实体。

过滤操作不区分大小写。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 过滤条件字段中,选择一个实体类型键,例如区域HTTPS 负载均衡器

    网络拓扑会显示与当前显示的图表中存在的实体对应的过滤提示。例如,如果您取消选中拓扑配置面板中的负载均衡器复选框,则网络拓扑不会显示与负载均衡器相关的过滤提示。

  4. 为过滤条件选择一个值,例如 us-east4my-load-balancer

    网络拓扑可提供适用于您的图表的值。例如,网络拓扑不会显示地区过滤条件的所有 Google Cloud 地区。它只显示包含资源的地区。

在 GKE 视图中过滤节点

您可以在 GKE 视图中过滤和查看特定节点,例如集群、工作负载和 Pod。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,从指标和数据分析部分选择一个指标。
  3. 过滤条件部分,点击添加过滤条件以选择节点及其对等方。本部分仅适用于指标视图,不适用于数据分析视图。
  4. 类型列表中选择节点的类型。
  5. 节点列表中选择节点。

导航实体层次结构

加载图表时,所有顶级实体都会汇总至其顶级层次结构中。您可以展开某个实体以查看其较低级别的实体。您还可以收起已展开的实体。

例如,您可以展开一个地区以查看该地区中的所有 VPC 网络。父实体始终会直观地包含较低级别的实体。例如,如果您拖动地区实体,则地区内的网络会与之一起移动。

如需详细了解实体及其层次结构,请参阅“网络拓扑概览”中的实体

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 将鼠标悬停在实体上,以显示展开 用于展开的图标收起 用于收起的图标 图标。

    如果收起实体,网络拓扑会显示展开图标。如果实体已展开,网络拓扑会显示收起图标。

  3. 点击展开收起图标。

  4. 在配置窗格中,如需仅显示区域等顶级实体之间的流量路径,请选中仅在处于焦点位置时显示子节点的连接复选框。

    如需查看较低级别实体之间的流量路径,请选择较低级别的实体或将指针悬停在这些实体上。

    如需显示所有流量路径,请取消选中复选框。

查看实体之间的流量指标

默认情况下,网络拓扑在每个连接上都会覆盖吞吐量值,以便您可以了解各实体之间的流量。您还可以更改网络拓扑在连接上覆盖的指标。如果当前选定的指标与连接无关,则网络拓扑不会覆盖该连接的值。

  • 如需了解每个连接支持的指标,请参阅网络拓扑指标
  • 如需了解“基础架构”视图和 GKE 视图中的各种指标,请参阅实体指标
  • 如需了解网络拓扑界面(包括可更改覆盖指标的位置),请参阅查看图形界面元素

指标值根据当前所选小时计算。如需了解详情,请参阅数据收集和数据时效性

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 选择基础架构视图或 GKE 视图。
  3. 视图选项中,从指标和数据分析部分选择一个指标。

  4. 进入特定实体层次结构以查看与该实体相关的流量。

    例如,如果要查看某个区域和其他地区之间的吞吐量,则必须展开实体,直到看到该区域。

  5. 点击实体以突出显示其所有流量路径。

    网络拓扑会显示支持当前所选指标的每个连接的指标值。

在 GKE 视图中查看转发流量最多和丢弃的流量

您可以在 GKE 视图中查看以下流量详细信息:

  • 大多数转发流显示 GKE 集群中的当前流量。
  • 丢弃最多的流有助于识别或调试 GKE 应用中的问题。 您还可以在详细信息面板中提供的图表中查看丢弃的原因。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 选择 GKE 视图。
  3. 查看选项中,从指标和数据分析部分选择网络判断
  4. 输入集群的名称,或从可用选项中选择集群。
  5. 选择流量选项以查看包含来自所选集群的流量的离群值的排序表。

  6. 进入特定实体层次结构以查看与该实体相关的流量。

  7. 点击实体以突出显示其所有流量路径。

    网络拓扑会显示支持当前所选指标的每个连接的指标值。

查看时序图表

网络拓扑会显示某些实体的时序图表。例如,网络拓扑可以显示实例的 CPU 利用率,或负载均衡器与其中一个后端之间的延迟时间。

这些图显示每分钟的值。一项活动之后的 7 分钟内即可获得这些图的数据。

查看与流量相关的指标

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 进入特定实体层次结构以查看与该实体相关的流量。

    例如,如果要查看负载均衡器与其他实体之间的延迟时间,您必须展开实体,直到看到负载均衡器。

  3. 点击实体以突出显示其所有流量路径。

  4. 点击覆盖在连接上的指标以查看其详细信息。

    网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。

查看与实体相关的指标

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 查找并展开实体层次结构,直到看到要查看其指标的实体为止。

  3. 点击实体。

    网络拓扑在详细信息窗格中显示图表。例如,您可以查看虚拟机实例的 CPU 利用率和内存百分比。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。

查看具有高指标值的实体的数据分析

除了平均每小时吞吐量、平均每小时丢包率和延迟时间中位数指标之外,您还可以查看实例和实例组的出站流量指标离群值排名。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. Metrics and insights(指标和数据分析)部分中,从选项中选择一项数据分析。

    当您选择 高出站流量实例高出站流量实例组时,系统会显示 Types of egress(出站流量类型)列表。 高出站流量 GKE 工作负载

  3. Types of egress(出站流量类型)列表中选择流量类型。 在“基础架构”视图中,选择以下选项之一:

    • Cross-zonal(跨可用区):显示 Google Cloud 可用区之间流量的离群值排名表,并排除同一可用区中的实体之间的流量
    • To the internet(到互联网):显示从 Google Cloud 到外部端点的流量(不包括混合流量)的离群值排行表
    • Hybrid(混合):显示通过 Cloud VPN、Cloud Interconnect 和路由器设备的流量的离群值排行表
    • All measured egress(所有测量的出站流量):显示来自某个实体的流量的离群值排行表

    在 GKE 视图中,选择以下选项之一: - Cross-zonal(跨可用区):显示离群 GKE 工作负载的排序表,其中包含 Google Cloud 可用区之间的流量并排除同一可用区内实体之间的流量 - All measured egress(所有测量的出站流量):显示具有来自某个实体的流量的离群 GKE 工作负载的排序表

  4. 如需突出显示实体的所有流量路径,请点击或指向该实体。

  5. 如需查看指标详细信息,请点击连接上叠加的指标。

网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值是选定的时段(小时)内的值。如果您正在查看最近的时段,则指标会显示当前值。

查看 Pod、工作负载和集群的指标、提醒、事件和日志

除了平均每小时吞吐量和延迟时间中位数指标之外,还可以查看指标、提醒、事件和日志等特定详细信息。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面上的 GKE 标签页。

    转到“网络拓扑 GKE”标签页

  2. 查看与实体相关的指标。 网络拓扑在详细信息窗格中显示图表。

  3. 点击操作。 网络拓扑会显示详细信息面板。

  4. 在“Pod 详情”面板中,您可以执行以下操作:

    • 指标:查看容器指标、Pod 指标和节点指标。您还可以下载 PNG 和 CSV 格式的指标相关图表。
    • 提醒:查看现有提醒或创建新的提醒政策。
    • 事件:查看所有 Kubernetes 事件或选择在 Logging 中查看事件。
    • 日志:根据所选严重性查看日志。您还可以使用字段和值进一步过滤。

选择时段(小时)

您可以选择特定的时段(小时)来查看该小时内存在的实体及其通信关系。首次加载图表时,网络拓扑会直观呈现最近完成的小时,但指标来自最近几分钟。如需详细了解数据时效性,请参阅数据收集和时效性

如需选择不同的时段(小时),请使用时间轴,然后将滑块拖至特定小时。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 在时间轴中,将滑块拖动到时段(小时)以进行查看。

    网络拓扑会使用时段(小时)的信息来刷新图表。

仅显示当前项目或所有项目

多项目场景中,您可以选中显示工作区中的所有项目复选框,以显示 指标范围中的所有项目或仅显示当前项目。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 选中 Show all projects in the Workspace(显示工作区中的所有项目)复选框。如需仅显示当前项目,请取消选中该复选框。

    网络拓扑会重新绘制图表并显示指标范围中的所有项目或当前项目。

按项目汇总实体

多项目场景中,您可以按项目汇总实体。这样,您就可以按项目查看并过滤资源,然后按标准层次结构查看。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 视图选项中,选择 Topology configuration(拓扑配置)部分。
  3. 选择项目聚合

    网络拓扑重新绘制图表并按项目聚合 Google Cloud 实体。

使用生成的查询检索详细日志

如果您已启用 VPC 流日志,则可以查询实例与其他实体之间的详细流。如果这些日志被导出到 BigQuery,您可以复制由网络拓扑生成的查询,并在 BigQuery 中使用它们查看特定流的详细日志。

网络拓扑会生成某些虚拟机流的查询。如果网络拓扑在连接上叠加吞吐量指标,则可以为它生成查询。生成的查询将日志限制为当前选定的时段(小时)。

控制台

  1. 在 Google Cloud 控制台中,转到网络拓扑页面。

    进入“网络拓扑”页面

  2. 展开包含要调查的实例的实体。

  3. 点击实例以突出显示其所有连接。

  4. 点击吞吐量指标以查看连接的详细信息窗格。

  5. 在详细信息窗格中的在 BigQuery 中查看流下,点击显示说明

  6. 如果尚未配置,请按照准备工作下的说明以配置将日志导出到 BigQuery 接收器的过程,并启用 VPC 流日志。这些说明提供了一个表,其中列出了与当前所选连接相关的子网。VPC 流日志状态列指示 VPC 流日志当前是否已启用。

  7. 按照运行查询下的说明以复制生成的查询并在 BigQuery 中运行该查询。

    BigQuery 返回的日志可用于进一步调查问题或排查问题。

后续步骤