使用网络拓扑监控网络配置
您可以使用网络拓扑来审核网络配置或排查网络问题。网络拓扑提供网络基础架构的图形视图。
您可以通过转到 Google Cloud 控制台,开始使用网络拓扑。无需进行其他配置。
准备工作
所需的角色和权限
如需获得查看网络拓扑和指标所需的权限,请让您的管理员向您授予项目的以下 IAM 角色:
-
Network Management Viewer (
roles/networkmanagement.viewer
) -
Monitoring Viewer (
roles/monitoring.viewer
)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
这些预定义角色包含查看网络拓扑和指标所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
需要具备以下权限才能查看网络拓扑和指标:
-
查看项目或受监控项目的网络拓扑图:
networkmanagement.topologygraphs.read
-
查看多个项目的网络拓扑图:
networkmanagement.topologygraphs.read
-
在网络拓扑图上查看指标:
monitoring.timeSeries.list
如需详细了解所需的权限和角色,请参阅角色和权限。
将多个项目添加到单个图表中
网络拓扑可以在单个图表中直观呈现来自多个项目的实体。例如,在共享 VPC 方案中,您可以查看包含宿主项目和服务项目中的实体的图表。
如需在图中添加多个项目,请参阅查看多个 Cloud 项目的指标。
如果您有一个多项目图表,则可以按项目汇总实体。
以下各部分介绍了如何使用网络拓扑界面的不同功能,例如过滤或导航实体层次结构。
停用跨项目遥测
Google Cloud 会收集跨项目网络遥测。默认情况下,您的组织会启用跨项目遥测。收集的网络遥测数据不会导出到监控和诊断服务(例如 Cloud Monitoring 和 Network Intelligence Center)。
如果您不希望 Google Cloud 收集跨项目遥测数据,则可以为整个组织停用收集。之前收集的遥测数据将存储在保留期限中。如需了解详情,请参阅数据保留。
控制台
- 在 Google Cloud 控制台中,转到跨项目遥测页面。
- 选择停用跨项目遥测。
- 点击保存更改。
显示或隐藏层次结构和特定级层
您可以选择要在图表中显示的层次结构及其级层。您可能希望执行此操作以显示或隐藏某些资源类型。例如,您可以取消选中整个外部客户端层次结构复选框,以便仅查看 Google Cloud 资源之间的通信。在图表中,外部客户端以及进出其中的所有流量都处于隐藏状态。
如果取消选择层次结构的特定级层,则网络拓扑会将其隐藏。例如,如果您取消选中虚拟机实例的地区网络和子网复选框,则网络拓扑将按区域显示每个地区中的实例,这是网络和子网之后层次结构中的下一个级层。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 在视图选项 > Topology configuration(拓扑配置)中,选择或取消选择层次结构复选框以包含或排除整个层次结构,包括其基础实体。
- 如需切换层次结构的特定级层,请点击相关层次结构旁边的 更多。您不能取消选择某些级层,因为它们对于直观呈现图中的实体是必需的。
过滤特定实体
使用过滤来显示特定实体,例如特定地区、区域或实例组。如果您已知道正在接受调查的资源,请使用过滤功能在图表中查看这些资源。网络拓扑会显示过滤后的实体以及与其通信的任何对等体。 借助过滤功能,您可以执行以下操作:
过滤层次结构中任何级别的实体。
在指定要搜索和过滤的实体的名称时使用星号 (*)。例如,您可以使用值
*replica*
来搜索名称中包含 replica 的所有实体。您可以在模式中的任意位置使用星号。例如,Instance: www-*europe*
过滤条件与www-service-europe-f9vq
和www-static-europe-a5hj
实例都匹配。指定多个过滤条件。网络拓扑会显示与至少一个过滤条件匹配的任何实体。
过滤操作不区分大小写。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 在视图选项中,选择 Topology configuration(拓扑配置)部分。
在过滤条件字段中,选择一个实体类型键,例如区域或 HTTPS 负载均衡器。
网络拓扑会显示与显示的图表中存在的实体对应的过滤提示。例如,如果您取消选中拓扑配置面板中的负载均衡器复选框,则网络拓扑不会显示与负载均衡器相关的过滤提示。
为过滤条件选择一个值,例如 us-east4 或 my-load-balancer。
网络拓扑可提供适用于您的图表的值。例如,网络拓扑不会显示地区过滤条件的所有 Google Cloud 地区。它只显示包含资源的地区。
在 GKE Enterprise 视图中过滤节点
您可以在 GKE Enterprise 视图中过滤和查看特定节点,例如集群、工作负载和 Pod。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 在视图选项中,从指标和数据分析部分选择一个指标。
- 在过滤条件部分,点击添加过滤条件以选择节点及其对等方。本部分仅适用于指标视图,不适用于数据分析视图。
- 从类型列表中选择节点的类型。
- 从节点列表中选择节点。
导航实体层次结构
加载图表时,所有顶级实体都会汇总至其顶级层次结构中。您可以展开某个实体以查看其较低级别的实体。您还可以收起已展开的实体。
例如,您可以展开一个地区以查看该地区中的所有 VPC 网络。父实体始终会直观地包含较低级别的实体。例如,如果您拖动地区实体,则地区内的网络会与之一起移动。
如需详细了解实体及其层次结构,请参阅“网络拓扑概览”中的实体。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
将指针悬停在实体上,以显示展开 或收起 图标。
如果收起实体,网络拓扑会显示展开图标。如果实体已展开,网络拓扑会显示收起图标。
点击展开或收起图标。
在配置窗格中,如需仅显示区域等顶级实体之间的流量路径,请选中仅在处于焦点位置时显示子节点的连接复选框。
如需查看较低级别实体之间的流量路径,请选择较低级别的实体或将指针悬停在这些实体上。
如需显示所有流量路径,请取消选中复选框。
查看实体之间的流量指标
默认情况下,网络拓扑在每个连接上都会覆盖吞吐量值,以便您可以了解各实体之间的流量。您还可以更改网络拓扑在连接上覆盖的指标。如果所选指标与连接无关,则网络拓扑不会覆盖该连接的值。
- 如需了解每个连接支持的指标,请参阅网络拓扑指标。
- 如需了解“基础架构”视图和 GKE Enterprise 视图中的各种指标,请参阅实体指标。
- 如需了解网络拓扑界面(包括可更改覆盖指标的位置),请参阅查看图形界面元素。
指标值根据所选小时计算。如需了解详情,请参阅数据收集和数据时效性。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 选择基础架构视图或 GKE Enterprise 视图。
在视图选项中,从指标和数据分析部分选择一个指标。
进入特定实体层次结构以查看与该实体相关的流量。
例如,如果要查看某个区域和其他地区之间的吞吐量,则必须展开实体,直到看到该区域。
点击实体以突出显示其所有流量路径。
网络拓扑会显示支持所选指标的每个连接的指标值。
在 GKE Enterprise 视图中查看转发流量最多和丢弃的流量
您可以在 GKE 视图中查看以下流量详细信息:
- 大多数转发流显示 GKE 集群中的当前流量。
- 丢弃最多的流有助于识别或调试 GKE 应用中的问题。 您还可以在详细信息面板中提供的图表中查看丢弃的原因。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 选择 GKE Enterprise 视图。
- 在查看选项中,从指标和数据分析部分选择网络判断。
- 输入集群的名称,或从可用选项中选择集群。
- 选择流量选项以查看包含来自所选集群的流量的离群值的排序表。
点击下载 CSV 文件可下载表格,以便进一步处理详细信息。
导航到特定实体层次结构以查看与该实体相关的流量。
点击实体以突出显示其所有流量路径。
网络拓扑会显示支持所选指标的每个连接的指标值。
查看时间序列图表
网络拓扑会显示某些实体的时间序列图表。例如,网络拓扑可以显示实例的 CPU 利用率,或负载平衡器与其中一个后端之间的延迟时间。
这些图显示每分钟的值。一项活动之后的 7 分钟内即可获得这些图的数据。
查看与流量相关的指标
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
进入特定实体层次结构以查看与该实体相关的流量。
例如,如果要查看负载平衡器与其他实体之间的延迟时间,您必须展开实体,直到看到负载平衡器。
点击实体以突出显示其所有流量路径。
点击覆盖在连接上的指标以查看其详细信息。
网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。
查看与实体相关的指标
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
查找并展开实体层次结构,直到看到要查看其指标的实体为止。
点击实体。
网络拓扑在详细信息窗格中显示图表。例如,您可以查看虚拟机实例的 CPU 利用率和内存百分比。指标值适用于选定的时段(小时)。如果您正在查看最近的时段(小时),则指标会显示实时值。
查看具有高指标值的实体的数据分析
除了平均每小时吞吐量、平均每小时丢包率和延迟时间中位数指标之外,您还可以查看实例和实例组的出站流量指标离群值排名。
控制台
在 Google Cloud 控制台中,转到网络拓扑页面。
在 Metrics and insights(指标和数据分析)部分中,从选项中选择一项数据分析。
当您选择高出站流量实例、高出站流量实例组或高出站流量 GKE 工作负载时,系统会显示 Types of egress(出站流量类型)列表。
从 Types of egress(出站流量类型)列表中选择流量类型。 在“基础架构”视图中,选择以下选项之一:
- Cross-zonal(跨可用区):显示 Google Cloud 可用区之间流量的离群值排名表,并排除同一可用区中的实体之间的流量
- To the internet(到互联网):显示从 Google Cloud 到外部端点的流量(不包括混合流量)的离群值排行表
- Hybrid(混合):显示通过 Cloud VPN、Cloud Interconnect 和路由器设备的流量的离群值排行表
- All measured egress(所有测量的出站流量):显示来自某个实体的流量的离群值排行表
在 GKE Enterprise 视图中,选择以下选项之一: - 跨可用区:显示 Google Cloud 可用区之间流量的离群值 GKE 工作负载排名表,并排除同一可用区中的实体之间的流量 - 所有测量的出站流量:显示实体流量的离群值 GKE 工作负载排名表
如需突出显示实体的所有流量路径,请点击或指向该实体。
如需查看指标详细信息,请点击连接上叠加的指标。
网络拓扑在详细信息窗格中显示图表。该信息包括所选实体与连接实体之间的入站流量和出站流量。指标值是选定的时段(小时)内的值。如果您正在查看最近的时段,则指标会显示当前值。
查看 Pod、工作负载和集群的指标、提醒、事件和日志
除了平均每小时吞吐量和延迟时间中位数指标之外,还可以查看指标、提醒、事件和日志等特定详细信息。
控制台
在 Google Cloud 控制台中,前往网络拓扑页面上的 GKE Enterprise 标签页。
查看与实体相关的指标。 网络拓扑在详细信息窗格中显示图表。
点击操作。 网络拓扑会显示详细信息面板。
在“Pod 详情”面板中,您可以执行以下操作:
- 指标:查看容器指标、Pod 指标和节点指标。您还可以下载 PNG 和 CSV 格式的指标相关图表。
- 提醒:查看现有提醒或创建新的提醒政策。
- 事件:查看所有 Kubernetes 事件或选择在 Logging 中查看事件。
- 日志:根据所选严重性查看日志。您还可以使用字段和值进一步过滤。
选择时段(小时)
您可以选择特定的时段(小时)来查看该小时内存在的实体及其通信关系。首次加载图表时,网络拓扑会直观呈现最近完成的小时,但指标来自最近几分钟。如需详细了解数据时效性,请参阅数据收集和时效性。
如需选择不同的时段(小时),请使用时间轴,然后将滑块拖至特定小时。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
在时间轴中,将滑块拖动到时段(小时)以进行查看。
网络拓扑会使用时段(小时)的信息来刷新图表。
仅显示当前项目或所有项目
在多项目场景中,您可以选中显示工作区中的所有项目复选框,以显示 指标范围中的所有项目或仅显示当前项目。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 在视图选项中,选择 Topology configuration(拓扑配置)部分。
选中 Show all projects in the Workspace(显示工作区中的所有项目)复选框。如需仅显示当前项目,请取消选中该复选框。
网络拓扑会重新绘制图表并显示指标范围中的所有项目或当前项目。
按项目汇总实体
在多项目场景中,您可以按项目汇总实体。这样,您就可以按项目查看并过滤资源,然后按标准层次结构查看。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
- 在视图选项中,选择 Topology configuration(拓扑配置)部分。
选择项目聚合。
网络拓扑重新绘制图表并按项目聚合 Google Cloud 实体。
使用生成的查询检索详细日志
如果您已启用 VPC 流日志,则可以查询实例与其他实体之间的详细流。如果这些日志被导出到 BigQuery,您可以复制由网络拓扑生成的查询,并在 BigQuery 中使用它们查看特定流的详细日志。
网络拓扑会生成某些虚拟机流的查询。如果网络拓扑在连接上叠加吞吐量指标,则可以为它生成查询。生成的查询将日志限制为所选的时段(小时)。
控制台
- 在 Google Cloud 控制台中,转到网络拓扑页面。
展开包含要调查的实例的实体。
点击实例以突出显示其所有连接。
点击吞吐量指标以查看连接的详细信息窗格。
在详细信息窗格中的在 BigQuery 中查看流下,点击显示说明。
如果尚未配置,请按照准备工作下的说明以配置将日志导出到 BigQuery 接收器的过程,并启用 VPC 流日志。这些说明提供了一个表,其中列出了与所选连接相关的子网。VPC 流日志状态列指示 VPC 流日志是否已启用。
按照运行查询下的说明以复制生成的查询并在 BigQuery 中运行该查询。
BigQuery 返回的日志可用于进一步调查问题或排查问题。