本页介绍了在使用 App Engine 时可能遇到的错误的问题排查过程。如需了解影响 Google Cloud服务的突发事件,请参阅 Google Cloud Service Health 信息中心和为 App Engine 报告的所有突发事件。
如需了解如何解决与您的应用相关的问题,请参阅以下页面:
App Engine 问题排查策略
以下部分介绍了如何运用常规问题排查策略来解决错误。如果您在按照排查问题指南中的步骤操作后仍遇到错误,请与支持团队联系。
使用 Cloud Logging 输出良好的日志
如果您有可用于调试的良好应用日志,则更容易对在 App Engine 上运行的应用进行问题排查。确保您的应用以将请求日志与应用日志相关联的方式写入日志。
借助相关日志,您可以确定需要进一步分析的请求,找到请求跟踪记录,并分析问题的根本原因。如需详细了解如何写入日志,请参阅写入应用日志。
解决意外延迟问题
如果您遇到延迟问题,请执行以下操作:
检查延迟时间是否影响对您的服务的所有请求,还是仅影响一小部分请求。App Engine 延迟信息中心会显示第 50、第 95 和第 99 百分位的延迟时间。
如果这三个指标都存在高延迟,则至少有 50% 的请求存在高延迟。如果您仅在第 99 百分位图表中看到高延迟,则表示 1% 的请求存在高延迟。
找出延迟时间较长的请求,以了解延迟时间的来源。您可以使用 Cloud Trace 或 Cloud Logging 了解特定请求花费了多长时间。如需了解详情,请参阅了解应用延迟时间。
如需使用 Cloud Logging 识别延迟时间较长的请求,请应用
traceSampled=true
过滤器,以便将 Cloud Logging 中的日志与 Cloud Trace 中的跟踪记录相关联。如需了解详情,请参阅与 Cloud Logging 集成。请尝试执行以下步骤来解决延迟问题,并提高服务性能:
调整 CPU、内存和磁盘资源。
调整扩缩设置。
考虑使用性能分析器。
修改源代码。
如需详细了解如何排查延迟时间变长的问题,请参阅排查导致应用延迟时间变长的问题。
解决连接问题
默认情况下,您的 App Engine 服务可通过公共互联网访问,不过您可以修改服务,以对入口和出口网络连接施加更多限制。
您可以使用入口设置或通过 App Engine 防火墙规则来限制入口连接。如果您无法通过 VPC 网络或互联网资源连接到 App Engine 服务,请检查以下内容:
如需解决其他连接问题,请执行以下操作:
将实例设置为调试模式,并在实例继续接收实时流量时通过 SSH 连接到该实例。连接到实例后,您可以使用常见的命令行工具对实例进行调试。
检查 VPC 网络上的防火墙规则,确保流量未被屏蔽。
检查您是否停用了外部 IP。
如需详细了解如何排查连接问题,请参阅 App Engine 连接策略。