Como as solicitações são processadas

Neste documento, descrevemos como um aplicativo do App Engine recebe solicitações e envia respostas. Para mais detalhes, consulte a referência de cabeçalhos de solicitação.

Se o aplicativo usar serviços, você poderá direcionar solicitações para um serviço específico ou uma versão específica desse serviço. Para mais informações sobre a capacidade de endereçamento do serviço, consulte Como as solicitações são encaminhadas.

Como processar solicitações

O aplicativo é responsável por iniciar um servidor da Web e processar as solicitações. Use qualquer biblioteca da Web disponível na sua linguagem de programação.

Várias instâncias do aplicativo são executadas no App Engine, e cada uma tem um servidor da Web próprio para processar as solicitações. Cada solicitação pode ser encaminhada para qualquer instância. Portanto, solicitações consecutivas do mesmo usuário não são necessariamente enviadas para a mesma instância. Uma instância pode processar várias solicitações simultaneamente. É possível ajustar o número de instâncias automaticamente, à medida que o tráfego muda. Também é possível alterar o número de solicitações simultâneas que uma instância pode processar. Basta configurar o elemento max_concurrent_requests no arquivo app.yaml.

O ambiente de execução do Go para App Engine usa o pacote http padrão como interface entre o programa Go e os servidores do App Engine. Quando o App Engine recebe uma solicitação da Web para o aplicativo, ele invoca o http.Handler associado ao URL da solicitação.

O exemplo a seguir é um aplicativo Go completo que gera uma string HTML codificada para o usuário:

package hello

import (
	"fmt"
	"net/http"
)

func init() {
	http.HandleFunc("/", hello)
}

func hello(w http.ResponseWriter, r *http.Request) {
	fmt.Fprintf(w, "<h1>Hello, world</h1>")
}

Cotas e limites

No App Engine, os recursos são alocados automaticamente para o aplicativo à medida que o tráfego aumenta. No entanto, isso é limitado pelas seguintes restrições:

  • O App Engine reserva a capacidade de dimensionamento automático para aplicativos com baixa latência, em que a resposta a uma solicitação ocorre em menos de um segundo. Aplicativos com latência muito alta, como mais de um segundo por solicitação no caso de muitas solicitações, e com alta capacidade, requerem o suporte Silver, Gold ou Platinum. Os clientes com esses níveis de suporte podem entrar em contato com nossos representantes para solicitar limites de capacidade mais altos.

  • Aplicativos que fazem muito uso da CPU podem gerar latência adicional, a fim de compartilhar recursos de maneira eficiente com outros aplicativos nos mesmos servidores. Solicitações de arquivos estáticos estão isentas dos limites de latência.

Cada solicitação recebida para o aplicativo é contabilizada no limite de Solicitações. Os dados enviados em resposta a uma solicitação são contabilizados no limite de Largura de banda de saída (faturável).

Tanto as solicitações HTTP como as HTTPS (seguras) são contabilizadas nos limites de Solicitações, Largura de banda de entrada (faturável) e Largura de banda de saída (faturável). A página Detalhes da cota no console do GCP também exibe Solicitações seguras, Largura de banda segura de entrada e Largura de banda segura de saída como valores separados, para fins informativos. Apenas solicitações HTTPS são contabilizadas nesses valores. Para mais informações, consulte a página Cotas.

Os limites a seguir referem-se especificamente ao uso de gerenciadores de solicitações:

Limites de solicitações

  • É permitido usar no máximo aproximadamente 15 KB nos cabeçalhos das solicitações.
  • O tamanho total da solicitação está limitado a aproximadamente 32 MB.
  • Todas as solicitações em HTTP/2 serão traduzidas para HTTP/1.1 quando encaminhadas para o servidor do aplicativo.
  • As conexões SSL são encerradas no balanceador de carga. O tráfego do balanceador de carga é enviado para a instância por meio de um canal criptografado e, em seguida, encaminhado para o servidor do aplicativo por HTTP. O cabeçalho X-Forwarded-Proto permite saber se a solicitação da origem era HTTP ou HTTPS.

Limites de respostas

  • As respostas são armazenadas em buffer por blocos de 64 K.
  • O tamanho da resposta é ilimitado.
  • O limite de tempo de resposta é de uma hora.

Solicitações HTTP incompatíveis

Os recursos a seguir são incompatíveis com o ambiente flexível do App Engine:

  • tráfego HTTP/2 para o serviço de back-end
  • WebSockets
  • solicitações HTTP que acessam instâncias diretamente

Cabeçalhos de solicitação

Uma solicitação HTTP de entrada inclui os cabeçalhos HTTP enviados pelo cliente. Para fins de segurança, alguns cabeçalhos são limpos ou alterados por proxies intermediários antes de chegarem ao aplicativo.

Para mais informações, consulte a referência Cabeçalhos de solicitação.

Respostas a solicitações

O App Engine chama o gerenciador com Request e ResponseWriter e aguarda até ele gravar em ResponseWriter e retornar. Quando o gerenciador retorna, os dados no buffer interno de ResponseWriter são enviados ao usuário.

Isso é praticamente igual a quando você grava programas Go normais que usam o pacote http.

Há limites que se aplicam à resposta gerada. Além disso, essa resposta pode ser modificada antes de retornar ao cliente.

Como desativar o armazenamento em buffer

Por padrão, todas as respostas do App Engine são armazenadas em buffer em blocos de 64 K. Em alguns casos, pode ser útil desativar o armazenamento em buffer e fazer streaming de bytes diretamente para o cliente. É mais comum adotar esse procedimento ao usar solicitações GET de suspensão ou eventos enviados pelo servidor (SSEs, na sigla em inglês). Para desativar o armazenamento em buffer, você pode definir o cabeçalho de resposta X-Accel-Buffering como no.

X-Accel-Buffering: no

Como forçar conexões HTTPS

Por motivos de segurança, todos os aplicativos precisam incentivar os clientes a se conectarem por https. Você pode usar o cabeçalho Strict-Transport-Security para instruir o navegador a preferir https a http para uma determinada página ou um domínio inteiro. Por exemplo:

Strict-Transport-Security: max-age=31536000; includeSubDomains
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Ambiente flexível do App Engine para Go