您正在查看 Apigee 和 Apigee Hybrid 文档。
查看 Apigee Edge 文档。
问题排查既是艺术,也是科学。Apigee 技术支持团队一直致力于揭开这一艺术的神秘面纱,并揭示问题识别和解决方法背后的科学原理。
什么是策略方案?
Apigee 问题排查策略方案是与 Apigee 技术支持团队合作开发的,旨在快速有效地解决使用 Apigee 产品时可能会遇到的错误或其他问题。
受众
问题排查策略方案适用于对 Apigee 及其架构有大致了解,并对政策和分析等基本概念有一定了解的读者。
某些问题只能由 Apigee Hybrid 用户诊断和解决,并且可能需要了解内部组件,例如 Cassandra 和 Postgres 数据存储区、消息处理器和路由器。
如果您使用的是 Apigee,我们会明确说明何时可以执行指定的问题排查步骤,何时需要联系 Google Cloud Customer Care 获取帮助。
策略方案
本部分介绍当前的策略方案。
要过滤此表格,请执行以下一项或多项操作:选择类别、选择产品,输入搜索字词,或点击列标题进行排序。
类别 | 策略方案/问题说明 | 错误消息 | 策略方案适用对象 |
---|---|---|---|
Cassandra | 排查 Cassandra 恢复问题 | 在 Apigee Hybrid 中的 Cassandra 恢复期间,您可能会遇到恢复日志错误。 | 仅限 Apigee Hybrid |
自动问题呈现 | 运行时平面与控制平面之间没有网络连接 | Apigee API 管理请求失败:
|
仅限 Apigee Hybrid |
自动问题呈现 | 虚拟主机缺少环境组 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_VIRTUALHOST_MISSING_ENVGROUP 错误。
|
仅限 Apigee Hybrid |
自动问题呈现 | 虚拟主机缺少选择器 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_VIRTUALHOST_MISSING_SELECTOR 错误。
|
仅限 Apigee Hybrid |
自动问题呈现 | Ingress 证书不匹配 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_INGRESS_CERT_MISMATCH 错误。
|
仅限 Apigee Hybrid |
自动问题呈现 | Ingress 证书过期 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_INGRESS_CERT_EXPIREY 错误。
|
仅限 Apigee Hybrid |
自动问题呈现 | Ingress mTLS CA 证书过期 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_INGRESS_MTLS_CA_CERT_EXPIREY 错误。
|
仅限 Apigee Hybrid |
自动问题呈现 | Ingress mTLS CA 证书无效 | 运行 kubectl -n apigee get apigeeissues 后,系统会显示 AIS_INGRESS_MTLS_CA_CERT_INVALID 错误。
|
仅限 Apigee Hybrid |
Cassandra | Cassandra 数据复制失败 |
在多区域扩展期间复制数据时,CassandraDataReplication 状态可能会显示错误状态,并且数据复制可能会失败。
|
仅限 Apigee Hybrid |
Cassandra | Cassandra Java 堆空间问题 |
Cassandra 堆问题可能会导致 Apigee Hybrid 代理执行速度变慢,甚至可能导致 Datastore 错误。有时,日志是早期指标,甚至是在症状出现之前。
|
仅限 Apigee Hybrid |
Cassandra | Cassandra pod 未在次要区域中启动 |
Cassandra pod 无法在多区域 Hybrid 设置中的某一个区域启动。您可能会在 Cassandra pod 日志中看到 node already exists 错误消息,或在 Cassandra pod 状态中看到 FailedPreStopHook 警告。 |
仅限 Apigee Hybrid |
Cassandra | Cassandra 问题排查指南 |
使用 kubectl 查看 Pod 状态时,您会看到一个或多个 Cassandra Pod 卡住。本指南介绍 Cassandra 数据存储区问题的诊断和解决方法。
|
仅限 Apigee Hybrid |
部署 | API 代理部署失败,没有活动运行时 pod 警告 | 在 API 代理页面上,没有活动的运行时 pod (No active runtime pods) 警告显示在错误消息 Deployment issues on ENVIRONMENT: REVISION_NUMBER 旁边的 详细信息对话框中。 | 仅限 Apigee Hybrid |
Ingressgateway | API 调用失败并显示超时错误 |
curl: (7) Failed to connect to example.apis.com port 443: Operation timed out |
仅限 Apigee Hybrid |
Ingressgateway | API 调用失败并显示 TLS 错误 |
curl: (35) LibreSSL SSL_connect: SSL_ERROR_SYSCALL in connection to example.apis.com:443 |
仅限 Apigee Hybrid |
日志记录 | 排查 Cloud Logging 中缺失 Apigee 日志的问题 | 在这种情况下,系统不显示错误消息。 | Apigee 和 Apigee Hybrid |
管理/界面 | 在 Hybrid 界面中或通过 Management API 发现实体具有不一致数据或无数据 | 在这种情况下,系统不显示错误消息。 | 仅限 Apigee Hybrid |
网络配置 | Apigee 的访问路由问题 |
外部客户端无法以所需的方式访问/连接到 Apigee。这包括网络连接失败(TLS 握手失败)或来自 Apigee 的 4xx/5xx 响应。
|
Apigee 和 Apigee Hybrid |
网络配置 | 与南向 PSC 目标相关的 Apigee 连接问题 |
Apigee 和目标服务之间的网络连接问题或 TCP 超时显示为 503 错误响应,如果您创建调试会话,则系统会显示如下所示的错误。
{"fault":{"faultstring":"The Service is temporarily unavailable","detail":{"errorcode":"messaging.adaptors.http.flow.ServiceUnavailable","reason":"TARGET_CONNECT_TIMEOUT"}}} |
Apigee 和 Apigee Hybrid |
其他 | 排空节点时扩展 Istio 属性副本数量 | 排空 Istio Pod 时,某些节点可能由于副本数量为 1 而没有排空,而需要使用 3 个或更多副本。为避免出现这种情况,您应将每个属性的最小副本数量至少设置为 3。 | 仅限 Apigee Hybrid |
其他 | 消息处理器问题排查指南 |
一个或多个 apigee-runtime Pod 未处于 Ready 状态。
使用 kubectl 描述失败的 apigee-runtime Pod 时,您会看到以下错误:
Readiness probe failed: HTTP probe failed with statuscode: 500 |
仅限 Apigee Hybrid |
其他 | 打印构建信息 |
buildinfo API 返回有关运行时组件当前构建的信息。如果您需要联系支持团队,这些信息可能会很有用。
|
仅限 Apigee Hybrid |
其他 | StreamingPull 显示 100% 错误率 |
如果您在指标信息中心内看到 google.pubsub.vl.Subscriber.StreamingPull 方法失败并出现 100% 错误,您可以放心地忽略此问题。这是预期行为。 |
仅限 Apigee Hybrid |
部署 | 实例未报告环境组的状态 | API 代理部署失败,实例 INSTANCE_NAME 未报告 Apigee Hybrid 界面中环境组 ENV_GROUP_NAME 错误的状态。 | 仅限 Apigee Hybrid |
部署 | API 代理部署失败,apigee-serving-cert 未找到或已过期 |
API 代理部署失败,apigee-watcher 日志中出现错误消息。
|
仅限 Apigee Hybrid |
Ingressgateway | 展开 Istio 属性副本计数,以避免排空 Istio 节点时出现问题 |
排空 Istio Pod 时,某些节点可能由于副本计数为 1 而没有排空,而实际需要使用 3 个或更多副本。为避免出现这种情况,您应将每个属性的最小副本数量至少设置为 3 。
|
仅限 Apigee Hybrid |
网络配置 | 排查没有可用 IP 地址空间的问题 | 在 Apigee 预配期间,如果您选择的网络 CIDR 范围不完全可用,则可能会看到错误消息。 | Apigee 和 Apigee Hybrid |
网络配置 | VPC 对等互连因 TARGET_CONNECT_TIMEOUT 原因出现“503 服务不可用”错误 | 本文档介绍了如何在使用 VPC 对等互连时诊断和纠正因 TARGET_CONNECT_TIMEOUT 原因出现的“503 服务不可用”错误。 | Apigee |
网络配置 | 504 网关超时 - 目标读取超时 | 本文档介绍了如何诊断和纠正因 TARGET_READ_TIMEOUT 原因出现的“504 网关超时”错误。 | Apigee 和 Apigee Hybrid |
其他 | 排查 Apigee Hybrid 卡在正在创建或正在发布状态的问题 |
本文档介绍如何在 Apigee Hybrid 组件卡在 creating 或 releasing 状态时进行重置。
|
仅限 Apigee Hybrid |