请求的处理方式

区域 ID

REGION_ID 是 Google 根据您在创建应用时选择的区域分配的缩写代码。此代码不对应于国家/地区或省,尽管某些区域 ID 可能类似于常用国家/地区代码和省代码。对于 2020 年 2 月以后创建的应用,REGION_ID.r 包含在 App Engine 网址中。对于在此日期之前创建的现有应用,网址中的区域 ID 是可选的。

详细了解区域 ID

本文档介绍 App Engine 应用如何接收请求和发送响应。如需了解详情,请参阅请求标头参考文档

如果您的应用使用服务,您可以将请求发送到特定服务或此服务的特定版本。如需详细了解服务可寻址性,请参阅请求的路由方式

处理请求

应用负责启动 Web 服务器和处理请求。您可以使用支持您的开发语言的任何 Web 框架。

App Engine 运行应用的多个实例,每个实例都有自己的 Web 服务器来处理请求。请求都可以路由到任何实例,因此来自同一用户的连续请求并不一定会发送到同一实例。一个实例可以并行处理多个请求。系统会根据流量的变化自动调整实例数量。以下示例中包含的 JavaScript 代码可启动服务器,并通过在 8080 端口上运行的服务器响应从 Web 客户端到根路径 ('/') 的所有 GET 请求(通过显示“Hello, world!”消息):

const express = require('express');

const app = express();

app.get('/', (req, res) => {
  res.status(200).send('Hello, world!').end();
});

// Start the server
const PORT = parseInt(process.env.PORT) || 8080;
app.listen(PORT, () => {
  console.log(`App listening on port ${PORT}`);
  console.log('Press Ctrl+C to quit.');
});

重要的是,最后几行代码让服务器侦听 process.env.PORT 变量指定的端口。该变量是由 App Engine 运行时设置的环境变量。如果您的服务器不侦听此端口,将无法接收请求。

配额和限制

App Engine 会随着流量的增加自动为您的应用分配资源。但是,这一过程会受到下列限制:

  • App Engine 会为低延时应用(应用响应请求的时间少于 1 秒)预留自动扩缩容量。

  • 严重受 CPU 限制的应用还可能发生额外的延时,以便与同一服务器上的其他应用有效地共享资源。静态文件请求不受这些延迟限制的影响。

发送到应用的所有传入请求都会计入请求限额。为响应请求而发送的数据会计入传出带宽(计费)限额。

HTTP 和 HTTPS(安全)请求均计入请求传入带宽(计费)传出带宽(计费)限额。Google Cloud 控制台的“配额详情”页面还会分别列出安全请求次数安全传入带宽安全传出带宽的值,以供参考。仅 HTTPS 请求计入这些值。如需了解详情,请参阅配额页面。

以下限制仅适用于请求处理程序的使用:

请求限制

  • 允许最大约 15KB 的请求标头。
  • 请求的总大小上限为约 32MB。
  • 转发到应用服务器时,所有 HTTP/2 请求都将转换为 HTTP/1.1 请求。
  • SSL 连接在负载平衡器处结束。来自负载平衡器的流量通过加密渠道发送到实例,然后通过 HTTP 转发到应用服务器。您可以通过 X-Forwarded-Proto 标头了解原始请求是 HTTP 还是 HTTPS。

响应限制

  • 响应由 64k 存储块缓冲。
  • 响应大小无限制。
  • 响应时间限制为一小时。

不支持的 HTTP 请求

App Engine 柔性环境不支持以下功能:

  • 发送至后端服务的 HTTP/2 流量。
  • 直接访问实例的 HTTP 请求。

请求标头

传入 HTTP 请求包含客户端发送的 HTTP 标头。为保证安全,部分标头在到达应用前由中间代理进行清理或修改。

如需了解详情,请参阅请求标头参考文档

强制 HTTPS 连接

出于安全考虑,所有应用都应建议客户端使用 https 连接。如需指示浏览器为给定页面或整个网域使用 https 而不是 http,请在响应中设置 Strict-Transport-Security。例如:

Strict-Transport-Security: max-age=31536000; includeSubDomains

如需为代码生成的响应设置此标头,请使用 helmet 软件包

处理异步后台工作

后台工作是指您的应用在传送 HTTP 响应后为请求执行的任何工作。避免在应用中执行后台工作,并审核代码,以确保所有异步操作都会在传送响应之前完成。

对于长时间运行的作业,我们建议使用 Cloud Tasks。使用 Cloud Tasks 时,HTTP 请求会长期有效,并且仅在任何异步工作结束后返回响应。