Visão geral do armazenamento em cache

Uma resposta armazenável em cache é uma resposta HTTP que o Cloud CDN pode armazenar e recuperar rapidamente, possibilitando tempos de carregamento mais rápidos. Nem todas as respostas HTTP são armazenáveis em cache.

Modos de cache

Com os modos de cache, é possível controlar os fatores que determinam se o Cloud CDN armazena seu conteúdo.

O Cloud CDN oferece três modos de cache, que definem como as respostas serão armazenadas em cache, se o Cloud CDN vai respeitar as diretivas de cache enviadas pela origem e como os TTLs do cache serão aplicados.

Os modos de cache disponíveis são mostrados na tabela a seguir:

Modo cache Comportamento
CACHE_ALL_STATIC Armazena automaticamente o conteúdo estático que não tem a diretiva no-store ou private. As respostas de origem que definem diretivas de armazenamento em cache válidas também são armazenadas em cache.

Esse é o comportamento padrão para back-ends ativados para o Cloud CDN criados com a ferramenta de linha de comando gcloud ou a API REST.

USE_ORIGIN_HEADERS Requer respostas de origem para definir diretivas de cache e cabeçalhos de cache válidos. As respostas sem essas diretivas são encaminhadas da origem.
FORCE_CACHE_ALL Armazena incondicionalmente as respostas em cache, substituindo as diretivas de cache definidas pela origem. Esse modo não é apropriado se o back-end veicular conteúdo particular por usuário, como HTML dinâmico ou respostas da API.

Para instruções de configuração, consulte Como definir o modo de cache.

Conteúdo estático

O conteúdo estático é sempre igual, mesmo quando acessado por usuários diferentes. O CSS que você usa para customizar seu site e o JavaScript que fornece conteúdo interativo de vídeo e imagem normalmente não mudam a cada usuário para um determinado URL (chave de cache) e, portanto, se beneficiam do armazenamento em cache na rede de borda global do Cloud CDN.

Quando você define o modo de cache como CACHE_ALL_STATIC, o Cloud CDN armazena automaticamente as respostas para os seguintes itens:

  • Recursos da Web, incluindo CSS (text/css), JavaScript (application/javascript) e todas as fontes da Web, inclusive WOFF2 (font/woff2)
  • Imagens, incluindo JPEG (image/jpg) e PNG (image/png)
  • Vídeos, inclusive H.264, H.265 e MP4 (video/mp4) +. Arquivos de áudio, incluindo MP3 (image/mpeg) e MP4 (audio/mp4)
  • Documentos formatados, incluindo PDF (application/pdf)

Veja um resumo na tabela a seguir.

Categoria Tipos MIME
Recursos da Web text/css text/ecmascript text/javascript application/javascript
Fontes Qualquer Content-Type que corresponda a font/*
Imagens Qualquer Content-Type que corresponda a image/*
Vídeos Qualquer Content-Type que corresponda a video/*
Áudio Qualquer Content-Type que corresponda a audio/*
Tipos de documento formatado application/pdf e application/postscript

O Cloud CDN inspeciona o cabeçalho de resposta HTTP Content-Type, que reflete o tipo MIME do conteúdo exibido.

Observe o seguinte:

  • O software servidor da Web de origem precisa definir o Content-Type de cada resposta. Muitos servidores da Web definem automaticamente o cabeçalho Content-Type, incluindo NGINX, Varnish e Apache.

  • O Cloud Storage define o cabeçalho Content-Type automaticamente no upload quando você usa o Console do Cloud ou a ferramenta gsutil para fazer upload de conteúdo.

  • Se uma resposta puder ser armazenada em cache com base no tipo MIME, mas tiver um cabeçalho de resposta Cache-Control de private ou no-store, ou um cabeçalho Set-Cookie (veja a lista completa de regras), ela não será armazenada.

O Cloud CDN não usa extensões de arquivo no caminho do URL para determinar se uma resposta é armazenável em cache porque muitas respostas válidas armazenáveis não são refletidas nos URLs.

Se você quiser armazenar em cache os tipos de conteúdo text/html e application/json, defina cabeçalhos Cache-Control explícitos na resposta. Tenha cuidado para não armazenar por engano os dados de um usuário e exibi-los para todos os demais.

Conteúdo armazenável em cache

O Cloud CDN armazena em cache as respostas que atendem todos os requisitos desta seção. Alguns desses requisitos são especificados no documento RFC 7234 (em inglês), enquanto outros são específicos para o Cloud CDN.

O Cloud CDN pode alterar periodicamente o conjunto exato de condições em que ele armazena conteúdo em cache. Se você quiser impedir explicitamente que o Cloud CDN armazene em cache seu conteúdo, siga as diretrizes na RFC 7234 para determinar como especificar uma resposta garantida sem cache. Consulte também a seção conteúdo não armazenável em cache com base nos cabeçalhos de origem.

A implementação atual do Cloud CDN armazena as respostas no cache se todas as condições a seguir forem verdadeiras.

Atributo Requisito
Exibido por Serviço de back-end, bucket de back-end ou um back-end externo com o Cloud CDN ativado
Em resposta a Solicitação GET:
Código de status

200, 203, 204, 206, 300, 301, 302, 307, 308, 404, 405, 410, 421, 451 ou 501.

Atualização

A resposta tem um cabeçalho Cache-Control com uma diretiva max-age ou s-maxage ou um cabeçalho Expires com um carimbo de data/hora no futuro.

Com o modo de cache CACHE_ALL_STATIC, se não houver nenhuma diretiva de atualização, uma resposta bem-sucedida com o tipo de conteúdo estático ainda será qualificada para armazenamento em cache.

Com o modo de cache FORCE_CACHE_ALL, qualquer resposta bem-sucedida é qualificada para armazenamento em cache.

Se o armazenamento em cache negativo estiver ativado e o código de status corresponder a um para o qual o armazenamento em cache negativo especificar um TTL, a resposta será qualificada para o armazenamento em cache, mesmo sem uma diretiva de atualização explícita.

Conteúdo

Contém um cabeçalho Content-Length, Content-Range ou Transfer-Encoding: chunked válido

Por exemplo, um cabeçalho Content-Length que corresponde corretamente ao tamanho da resposta.

tamanho; Menor ou igual ao tamanho máximo.

Para respostas com tamanhos entre 10 MB e 5 TB, consulte as outras restrições de armazenamento em cache descritas em Solicitações de intervalo de bytes.

Para buckets de back-end do Cloud Storage, existem várias maneiras de atender a esses requisitos:

Por padrão, quando todo o bucket é público ou os objetos individuais são públicos e os objetos individuais não especificam metadados Cache-Control, o Cloud Storage atribui um cabeçalho Cache-Control: public, max-age=3600 ao objeto. É possível definir valores diferentes usando metadados Cache-Control.

Para ver um exemplo de como configurar um balanceador de carga HTTP(S) externo com um bucket de back-end, consulte Como configurar o Cloud CDN com um bucket de back-end.

Tamanho máximo

O Cloud CDN aplica um tamanho máximo para cada resposta. Qualquer resposta com um corpo maior que o tamanho máximo não é armazenada em cache, mas ainda é entregue ao cliente.

O tamanho máximo varia dependendo se o servidor de origem é compatível com solicitações de intervalo de bytes.

O servidor de origem é compatível com solicitações de intervalo de bytes O servidor de origem não é compatível com solicitações de intervalo de bytes
5 TB (5.497.558.138.880 bytes) 10 MB (10.485.760 bytes)

Quase todos os servidores da Web modernos (incluindo NGINX, Apache e Varnish) são compatíveis com solicitações de intervalo de bytes.

Conteúdo não armazenável em cache com base em cabeçalhos de origem

Há verificações que bloqueiam o armazenamento em cache das respostas. O Cloud CDN pode alterar periodicamente o conjunto exato de condições em que ele armazena conteúdo em cache. Assim, se você quiser impedir explicitamente que o Cloud CDN armazene seu conteúdo em cache, siga as diretrizes no padrão (RFC 7234) para determinar como especificar uma resposta sem cache garantido.

A implementação atual do Cloud CDN não armazena em cache uma resposta se ela não atender aos requisitos de conteúdo armazenável em cache ou se alguma das seguintes condições for verdadeira.

Atributo Requisito
Exibido por Serviço de back-end ou back-end externo que não tenha o Cloud CDN ativado
Cookie Tem um cabeçalho Set-Cookie
Cabeçalho Vary Tem um valor diferente de Accept, Accept-Encoding ou Origin
Diretiva de resposta A resposta terá um cabeçalho Cache-Control com uma diretiva no-store ou private, a menos que use o modo de armazenamento em cache FORCE_CACHE_ALL. Nesse caso o cabeçalho Cache-Control será ignorado
Diretiva de solicitação A solicitação tem uma diretiva Cache-Control: no-store
Solicitar autorização A solicitação tem um cabeçalho Authorization, a menos que seja modificado pela resposta Cache-Control.
tamanho; Maior que o tamanho máximo

Se Cache-Control: no-store ou private estiverem presentes, mas o conteúdo ainda estiver sendo armazenado, isso se deverá a um dos seguintes motivos:

  • A assinatura de URL está configurada.
  • O modo de cache do Cloud CDN está definido para forçar o armazenamento de todas as respostas.

Como evitar o armazenamento em cache

Para evitar que informações particulares sejam armazenadas nos caches do Cloud CDN, faça o seguinte:

  1. Verifique se o modo de cache do Cloud CDN não está definido para FORCE_CACHE_ALL, que armazena todas as respostas incondicionalmente.
  2. Inclua um cabeçalho Cache-Control: private em respostas que não podem ser armazenadas em caches do Cloud CDN ou um cabeçalho Cache-Control: no-store em respostas que não podem ser armazenadas em nenhum cache, nem mesmo no de um navegador da Web.
  3. Não assine URLs que forneçam acesso a informações particulares. Quando o conteúdo é acessado usando um URL assinado, ele é potencialmente qualificado para armazenamento em cache, independente de quaisquer diretivas Cache-Control na resposta.
  4. Para solicitações de origem (preenchimento de cache) que incluem o cabeçalho da solicitação Authorization, o Cloud CDN armazena em cache somente as respostas que incluem a diretiva de controle de cache public, must-revalidate e s-maxage quando o modo de cache é definido como USE_ORIGIN_HEADERS ou CACHE_ALL_STATIC. Isso impede o armazenamento em cache de conteúdo por usuário e/ou conteúdo que exija autenticação no momento. O modo de cache FORCE_CACHE_ALL não tem essa restrição.

Como adicionar cabeçalhos de resposta personalizados

Com cabeçalhos de resposta personalizados, é possível especificar cabeçalhos que o balanceador de carga HTTP(S) externo adiciona a respostas via proxy. Os cabeçalhos de resposta personalizados permitem refletir o status de cache dos seus clientes, dos dados geográficos deles e dos cabeçalhos de resposta estática que você tem.

Para ver a lista de cabeçalhos, consulte Variáveis que podem aparecer no valor do cabeçalho.

Para mais instruções, consulte Como trabalhar com cabeçalhos de resposta personalizados.

Chaves de cache

Cada entrada de cache do Cloud CDN é identificada por uma chave de cache. Quando uma solicitação chega ao cache, ele converte o URI da solicitação em uma chave de cache, depois compara com as chaves das entradas em cache. Se encontrar uma correspondência, o cache retornará o objeto associado a essa chave.

Em serviços de back-end, o padrão do Cloud CDN é usar o URI de solicitação completo como chave de cache. Por exemplo, https://example.com/images/cat.jpg é o URI completo de uma solicitação específica para o objeto cat.jpg. Essa string é usada como chave de cache padrão. Somente as solicitações com uma string idêntica a essa são correspondentes. As solicitações para http://example.com/images/cat.jpg ou https://example.com/images/cat.jpg?user=user1 não são correspondentes.

É possível alterar quais partes do URI são usadas na chave do cache. Embora o nome do arquivo e o caminho sempre façam parte da chave, é possível incluir ou omitir qualquer combinação de protocolo, host ou string de consulta ao personalizar sua chave de cache. A seção Como usar as chaves de cache mostra como personalizá-las.

Parte do URI Personalização URLs de exemplo que têm a mesma chave de cache
Protocolo Omita o protocolo da chave de cache.
  • https://example.com/images/cat.jpg
  • http://example.com/images/cat.jpg
Host Omita o host da chave de cache.
  • https://example.com/images/cat.jpg
  • https://example2.com/images/cat.jpg
String de consulta

Omita a string de consulta da chave de cache.

Omita ou inclua partes da string de consulta de maneira seletiva.

  • https://example.com/images/cat.jpg?user=user1
  • https://example.com/images/cat.jpg?user=user2

Além de incluir ou omitir toda a string de consulta, é possível usar partes dela com listas de inclusão e de exclusão.

Para buckets de back-end, a chave de cache consiste no URI sem o protocolo, o host ou a string de consulta.

Assim, em um determinado bucket de back-end, os seguintes URIs são resolvidos para o mesmo objeto em cache:

  • http://example.com/images/cat.jpg
  • https://example.com/images/cat.jpg
  • https://example.com/images/cat.jpg?user=user1
  • http://example.com/images/cat.jpg?user=user1
  • https://example.com/images/cat.jpg?user=user2
  • https://media.example.com/images/cat.jpg
  • https://www.example.com/images/cat.jpg

Lista de inclusões da string de consulta

É possível controlar quais são os parâmetros da string de consulta que o Cloud CDN incorpora às chaves de cache. Por exemplo, se você criar uma lista de inclusão de user, https://example.com/images/cat.jpg?user=user1&color=blue criará uma chave de cache de https://example.com/images/cat.jpg?user=user1 que também corresponde a https://example.com/images/cat.jpg?user=user1&color=red.

Para usar essa opção, você precisa incluir a string de consulta, especificar uma lista de inclusão não vazia e não especificar uma lista de exclusão.

URLs com uma ordem diferente dos mesmos parâmetros de consulta resultam em chaves de cache distintas. Os dois URLs a seguir têm chaves de cache diferentes, mesmo que tenham os mesmos parâmetros de consulta:

  • https://example.com/images/cat.jpg?user=user1&color=red
  • https://example.com/images/cat.jpg?color=red&user=user1

Lista de exclusões da string de consulta

Para controlar, de maneira seletiva, os parâmetros da string de consulta que o Cloud CDN ignora, use uma lista de exclusão. Por exemplo, se você criar uma lista de exclusão de user, todos os parâmetros de string de consulta, exceto user, serão usados na chave de cache.

Com a lista de exclusão configurada e uma entrada de https://example.com/images/cat.jpg?user=user1&color=blue, o Cloud CDN cria uma chave de cache de https://example.com/images/cat.jpg?color=blue que também corresponde a https://example.com/images/cat.jpg?user=user2&color=blue, mas não a https://example.com/images/cat.jpg?user=user1&color=red.

Para usar essa opção, é preciso incluir a string de consulta, especificar uma lista de exclusão não vazia e não especificar uma lista de inclusão.

Diretivas de controle de cache

As diretivas de controle de cache HTTP afetam o comportamento do Cloud CDN, conforme descrito na tabela a seguir.

N/A significa que uma diretiva não é aplicável a uma solicitação ou resposta.

Diretiva Solicitação Resposta
no-store Quando presente em uma solicitação, o Cloud CDN respeita isso e não armazena a resposta no cache.

Uma resposta com no-store não é armazenada em cache.

Isso pode ser modificado por back-end com o modo de cache FORCE_CACHE_ALL.

no-cache A diretiva de solicitação no-cache é ignorada para evitar que os clientes iniciem ou forçem a revalidação para a origem.

Uma resposta com no-cache é armazenada em cache, mas precisa ser revalidada com a origem antes de ser veiculada.

Isso pode ser modificado por back-end com o modo de cache FORCE_CACHE_ALL.

public N/A

Essa diretiva não é necessária para armazenamento em cache, mas é uma prática recomendada incluí-la para conteúdo que precisa ser armazenado em cache por proxies.

private N/A

Uma resposta com a diretiva private não é armazenada em cache pelo Cloud CDN, mesmo que a resposta seja considerada armazenável em cache. Os clientes (como navegadores) ainda podem armazenar o resultado em cache.

Isso pode ser modificado por back-end com o modo de cache FORCE_CACHE_ALL. Use no-store para evitar todo o armazenamento em cache das respostas.

max-age=seconds A diretiva de solicitação max-age é ignorada. Uma resposta em cache é retornada como se esse cabeçalho não estivesse incluído na solicitação. Uma resposta com a diretiva max-age é armazenada em cache até o seconds definido.
s-maxage=seconds N/A

Uma resposta com a diretiva s-maxage é armazenada em cache até o seconds definido.

Se max-age e s-maxage estiverem presentes, o s‑maxage será usado pelo Cloud CDN.

As respostas com essa diretiva não são exibidas.

s-max-age (dois hifens) não é válido para fins de armazenamento em cache.

min-fresh=seconds A diretiva de solicitação min-fresh é ignorada. Uma resposta em cache é retornada como se esse cabeçalho não estivesse incluído na solicitação. N/A
max-stale=seconds

A diretiva de solicitação max-stale determina a inatividade máxima (em segundos) que o cliente está disposto a aceitar.

O Cloud CDN respeitará isso e retornará uma resposta em cache desatualizada somente se a inatividade da resposta for menor que a diretiva max-stale. Caso contrário, ele será revalidado antes de atender à solicitação.

N/A
stale-while-revalidate=seconds N/A

Uma resposta com stale-while-revalidate é veiculada a um cliente por até seconds, enquanto a revalidação ocorre de forma assíncrona.

Esse comportamento pode ser ativado para todas as respostas, definindo cdnPolicy.serveWhileStale no back-end.

stale-if-error=seconds A diretiva de solicitação stale-if-error é ignorada. Uma resposta em cache é retornada como se esse cabeçalho não estivesse incluído na solicitação.

Este cabeçalho de resposta não tem efeito.

must-revalidate N/A

Uma resposta com must-revalidate é revalidada com o servidor de origem após a expiração.

As respostas com essa diretiva não são exibidas.

proxy-revalidate

Uma resposta com proxy-revalidate é revalidada com o servidor de origem após a expiração.

As respostas com essa diretiva não são exibidas.

immutable N/A Nenhum efeito. Isso é passado ao cliente na resposta.
no-transform N/A Nenhuma transformação é aplicada pelo Cloud CDN.
only-if-cached A diretiva de solicitação only-if-cached é ignorada. Uma resposta em cache é retornada como se esse cabeçalho não estivesse incluído na solicitação. N/A

Sempre que possível, o Cloud CDN estará em conformidade com o RFC (HTTP RFC 7234). No entanto, é preferível otimizá-lo para o armazenamento em cache e, dessa forma, minimizar o impacto que os clientes têm na taxa de ocorrência e/ou na carga de origem geral.

Para respostas que usam o cabeçalho Expires HTTP/1.1:

  • O valor do cabeçalho Expires precisa ser uma data de HTTP válida, conforme definido no RFC 7231.
  • Uma data no passado, uma data inválida ou um valor de 0 indica que o conteúdo já expirou e requer revalidação.
  • Se um cabeçalho Cache-Control estiver presente na resposta, o Cloud CDN ignorará o cabeçalho Expires.

A presença de um cabeçalho Expires válido e futuro na resposta permite que a resposta seja armazenada em cache e não exige que outras diretivas de cache sejam especificadas.

O cabeçalho HTTP/1.0 Pragma, se presente em uma resposta, será ignorado e transmitido como está para o cliente. As solicitações de clientes com esse cabeçalho são passadas para a origem e não afetam a maneira como uma resposta é veiculada pelo Cloud CDN.

Cabeçalhos Vary

O cabeçalho Vary indica que a resposta varia de acordo com os cabeçalhos de solicitação do cliente. Além do URI de solicitação, o Cloud CDN também respeita os cabeçalhos Vary que os servidores de origem incluem nas respostas. Por exemplo, se uma resposta especificar Vary: Accept, o Cloud CDN usará uma entrada de cache para solicitações que especificam Accept: image/webp,image/*,*/*;q=0.8 e outra para as que especificam Accept: */*.

A tabela na seção Conteúdo não armazenável em cache lista os cabeçalhos Vary que permitem o armazenamento em cache. Outros valores de cabeçalho Vary impedem que o conteúdo seja armazenado em cache.

O modo de cache FORCE_CACHE_ALL não modifica esse comportamento. Os cabeçalhos Vary são importantes para evitar o envenenamento de cache entre várias respostas possíveis do servidor de origem. Seria perigoso para FORCE_CACHE_ALL fazer com que essas respostas sejam armazenadas em cache.

Às vezes, os cabeçalhos Vary são usados ao exibir conteúdo compactado. O Cloud CDN não compacta nem descompacta respostas, mas pode veicular respostas compactadas pelo servidor de origem. Se o servidor de origem escolher exibir conteúdo compactado ou descompactado com base no valor do cabeçalho da solicitação Accept-Encoding, verifique se a resposta especifica Vary: Accept-Encoding.

Prazo de validade e solicitações de validação

Com o modo de cache USE_ORIGIN_HEADERS, cada entrada de cache em um cache do Cloud CDN tem um prazo de validade definido pelos cabeçalhos Cache-Control: s-maxage, Cache-Control: max-age e/ou Expires, de acordo com o RFC 7234. Se mais de um estiver presente, Cache-Control: s-maxage terá precedência sobre Cache-Control: max-age, e Cache-Control: max-age terá precedência sobre Expires.

Com o modo de cache CACHE_ALL_STATIC, os cabeçalhos de origem são consultados por padrão para determinar a atualização. Se elas não estiverem presentes, qualquer conteúdo estático será considerado atualizado.

Com o modo de cache FORCE_CACHE_ALL, todas as respostas de back-end são consideradas recentes.

Quando o Cloud CDN recebe uma solicitação, ele consulta a entrada de cache correspondente e verifica há quanto tempo ela existe. Se a entrada de cache existir e for recente o bastante, a resposta poderá ser disponibilizada a partir do cache. No entanto, se o prazo de validade tiver passado, o Cloud CDN tentará revalidar a entrada de cache entrando em contato com um dos back-ends. Isso é feito antes da exibição da resposta, a menos que você ative serve-while-stale. Nesse caso, a revalidação é executada de forma assíncrona.

O Cloud CDN revalida objetos em cache com mais de 30 dias. Isso permite a invalidação automática e a remoção de conteúdo desatualizado armazenado em cache gerado pelo usuário. Quando um valor max-age ou s-maxage excede 30 dias (2.592.000 segundos), o Cloud CDN trata o valor como se fosse 2.592.000 segundos. Os clientes downstream ainda veem os valores precisos de max-age e s-maxage, mesmo que excedam 30 dias.

O Cloud CDN pode tentar usar as informações nos cabeçalhos de resposta armazenados em cache para validar a entrada do cache com o back-end. Isso acontece quando os dois itens a seguir são verdadeiros:

  • A resposta armazenada em cache anteriormente tem um cabeçalho Last-Modified ou ETag.
  • A solicitação do cliente é uma solicitação GET que não contém cabeçalhos If-Modified-Since ou If-None-Match.

O Cloud CDN realizará essa validação de maneira ligeiramente diferente com base no uso de solicitações de intervalo de byte para o armazenamento em cache:

  • Se a resposta foi armazenada em cache usando solicitações de intervalo de bytes, o Cloud CDN inicia uma solicitação de validação separada que inclui os cabeçalhos If-Modified-Since e/ou If-None-Match.
  • Caso contrário, o Cloud CDN irá adicionar os cabeçalhos If-Modified-Since e/ou If-None-Match à solicitação do cliente e encaminhar a solicitação modificada ao back-end.

Se a cópia em cache ainda estiver atualizada, o back-end poderá validar a entrada de cache atual enviando uma resposta 304 Not Modified. Nesse caso, o back-end envia somente os cabeçalhos da resposta, não o corpo. O Cloud CDN insere os novos cabeçalhos de resposta no cache, atualiza o prazo de validade e exibe os novos cabeçalhos de resposta e o corpo da resposta em cache para o cliente.

Se a resposta armazenada em cache anteriormente não tiver um cabeçalho Last-Modified ou ETag, o Cloud CDN ignorará a entrada de cache expirada e encaminhará a solicitação do cliente para o back-end sem modificações.

O prazo de validade de um cache indica o período máximo pelo qual uma entrada de cache permanece válida. Não há garantia de que uma entrada de cache lá permaneça até que ela expire. As entradas de cache para conteúdos incomuns podem ser excluídas para dar espaço a conteúdos novos. Seja qual for o prazo de validade especificado, as entradas de cache que não são acessadas por 30 dias são automaticamente removidas.

Para mais informações, consulte Remoção e expiração.

Modificações e configurações de TTL

É possível ajustar o comportamento do Cloud CDN em relação ao tempo que ele aguarda antes de revalidar o conteúdo.

Para mais informações, consulte Como usar configurações e modificações de TTL.

Suporte para solicitações de intervalo de bytes

Uma resposta que atende aos seguintes critérios indica que o servidor de origem é compatível com solicitações de intervalo de bytes:

  • Código de status: 200 OK ou 206 Partial Content
  • Cabeçalho: Accept-Ranges: bytes
  • Cabeçalho: Content-Length e/ou Content-Range
  • Cabeçalho: ETag com um validador forte
  • Cabeçalho: Last-Modified

O Cloud Storage é compatível com solicitações de intervalo de bytes na maioria dos objetos. No entanto, o Cloud Storage não é compatível com solicitações de intervalo de bytes para objetos com metadados Content-Encoding: gzip, a menos que a solicitação do cliente inclua um cabeçalho Accept- Encoding: gzip. Se você tiver objetos do Cloud Storage maiores que 10 MB, verifique se eles não têm metadados Content-Encoding: gzip. Para informações sobre como editar metadados de objetos, consulte Como visualizar e editar metadados de objetos.

O software de servidor da Web mais conhecido também é compatível com solicitações de intervalo de bytes. Consulte a documentação do software do servidor da Web para detalhes sobre como ativar o suporte. Para mais informações sobre solicitações de intervalo de bytes, consulte a especificação HTTP (em inglês).

Quando um servidor de origem for compatível com solicitações de intervalo de bytes, o cache do Cloud CDN não armazenará uma resposta armazenável em cache pela primeira vez que ela for solicitada caso alguma das afirmações abaixo seja verdadeira:

  • O corpo da resposta está incompleto porque o cliente solicitou apenas parte do conteúdo.
  • O corpo da resposta é maior que 1 MB (1.048.576 bytes).

Quando isso acontece e a resposta satisfaz aos requisitos de armazenamento em cache normais, o cache registra se o servidor de origem tem suporte para as solicitações de intervalo de bytes dessa chave do cache e encaminha a resposta do servidor de origem para o cliente.

Em uma ausência no cache, o cache verifica se o servidor de origem tem suporte para solicitações de intervalo de bytes. Se as solicitações de intervalos de bytes forem compatíveis com a chave do cache, o cache não encaminhará a solicitação do cliente para o balanceador de carga HTTP(S). Em vez disso, o cache inicia as próprias solicitações de preenchimento de cache de intervalo de bytes para as partes do conteúdo que estiverem faltando. Se o servidor de origem retornar o intervalo de bytes solicitado em uma resposta 206 Partial Content, o cache poderá armazenar esse intervalo para solicitações futuras.

Um cache armazena uma resposta 206 Partial Content somente quando é recebido em resposta a uma solicitação de intervalo de bytes iniciada pelo cache. Como um cache não inicia uma solicitação de intervalo de bytes, a menos que tenha registrado anteriormente que o servidor de origem aceita solicitações de intervalo de bytes para essa chave de cache, um determinado cache não armazena conteúdo maior que 1 MB até o segundo acesso.

Devido à natureza distribuída dele, às vezes o Cloud CDN pode buscar a parte final da origem mais de uma vez por local. Isso afeta somente as primeiras solicitações por chave de cache.

Solicitar o recolhimento (agrupamento)

O recolhimento de solicitações (ou agrupamento) recolhe ativamente várias solicitações de preenchimento de cache orientadas pelo usuário para a mesma chave em uma única solicitação de origem por nó de borda. Isso pode reduzir a carga na origem e se aplica às solicitações de itens (respostas buscadas diretamente) e de blocos, em que o Cloud CDN usa solicitações Range para buscar objetos maiores com mais eficiência.

O recolhimento de solicitações está ativado por padrão.

As solicitações recolhidas se comportam da seguinte maneira:

  • As solicitações recolhidas registram a solicitação voltada para o cliente e a solicitação de preenchimento do cache (recolhida).
  • O líder da sessão recolhida é usado para fazer a solicitação de preenchimento de origem.
  • Atributos de solicitação que não fazem parte da chave de cache, como o cabeçalho User-Agent ou Accept-Encoding, refletem somente o líder da sessão recolhida.
  • Não é possível recolher as solicitações que não têm a mesma chave de cache.

O diagrama a seguir mostra como as solicitações são agrupadas:

Cloud CDN com o recolhimento de solicitações ativado (clique para ampliar)
Cloud CDN com recolhimento de solicitações ativado (clique para ampliar)

Em comparação, com o recolhimento de solicitações desativado ou no caso de solicitações que não podem ser agrupadas, o número de solicitações de origem e respostas pode ser igual ao número de clientes tentando recuperar um objeto que não está armazenado em cache no momento.

Cloud CDN sem recolhimento de solicitações ativado (clique para ampliar)
Cloud CDN sem recolhimento de solicitações ativado (clique para ampliar)

Para todos os tipos de solicitações, o recolhimento é ativado por padrão. Para tipos de solicitação de item, é possível desativar o recolhimento. Recomendamos desativar o recolhimento de solicitações de item em cenários confidenciais de latência alta, como veiculação de anúncios, em que a carga de origem não é uma consideração.

A tabela a seguir resume o comportamento padrão e a configurabilidade para diferentes tipos de solicitação.

Tipo de solicitação Comportamento padrão Configurável Benefícios do recolhimento
Solicitações de fragmentos Ativada Não Pode reduzir significativamente a largura de banda de origem
Solicitações de itens Ativada Sim Pode reduzir o volume de solicitações de origem

Para desativar o recolhimento de solicitações de itens usando o SDK do Cloud para um bucket de back-end que faz referência a um bucket do Cloud Storage, faça o seguinte:

gcloud

Use o comando gcloud compute backend-services ou backend-buckets:

gcloud compute backend-services update BACKEND_SERVICE_NAME \
    --no-request-coalescing

Para ativar o recolhimento de solicitações de item em um bucket de back-end usando o SDK do Cloud, siga estas etapas:

gcloud

Use o comando gcloud compute backend-buckets:

gcloud compute backend-buckets update BACKEND_BUCKET_NAME \
    --request-coalescing

Para ativar o recolhimento da solicitação de item usando o SDK do Cloud para um serviço de back-end, incluindo grupos de VM e back-ends externos, faça o seguinte:

gcloud

Use o comando gcloud compute backend-services:

gcloud compute backend-services update BACKEND_SERVICE_NAME \
    --request-coalescing

Solicitações iniciadas pelo Cloud CDN

Quando o servidor de origem é compatível com solicitações de intervalo de bytes, o Cloud CDN pode enviar várias solicitações a esse servidor em resposta a apenas uma solicitação do cliente. Conforme descrito abaixo, o Cloud CDN pode iniciar dois tipos de solicitações: solicitações de validação e de intervalo de bytes.

Uma resposta indicou que o servidor de origem era compatível com as solicitações de intervalo de bytes de uma chave de cache específica. Se essa resposta tiver expirado, o Cloud CDN iniciará uma solicitação de validação para confirmar que o conteúdo não foi alterado e que o servidor de origem ainda é compatível com as solicitações de intervalo do conteúdo. Se o servidor de origem responder com uma resposta 304 Not Modified, o Cloud CDN continuará exibindo o conteúdo usando intervalos de bytes. Do contrário, o Cloud CDN encaminha a resposta do servidor de origem para o cliente. Controle os prazos de validade usando os cabeçalhos de resposta Cache-Control e Expires.

Em uma ausência no cache, o Cloud CDN inicia solicitações de preenchimento de cache para um conjunto de intervalos de bytes que se sobrepõem à solicitação do cliente. Se alguns intervalos do conteúdo solicitado pelo cliente estiverem presentes no cache, o Cloud CDN exibirá todo o conteúdo possível a partir do cache e enviará solicitações de intervalo de bytes somente para os intervalos que não estiverem no servidor de origem.

Cada solicitação de intervalo de bytes iniciada pelo Cloud CDN especifica um intervalo que começa em um deslocamento múltiplo de 2.097.136 bytes. Com a possível exceção do intervalo final, cada intervalo também tem 2.097.136 bytes. Se o conteúdo não for múltiplo desse tamanho, o intervalo final será menor. O tamanho e os deslocamentos usados nas solicitações de intervalos de bytes poderão mudar no futuro.

Como exemplo, pense em uma solicitação do cliente dos bytes de 1.000.000 a 3.999.999 de conteúdo que não está presente no cache. Neste exemplo, o Cloud CDN poderia iniciar duas solicitações GET, uma para os primeiros 2.097.136 bytes do conteúdo e a outra para os próximos 2.097.136 bytes. Isso resulta em 4.194.272 bytes de preenchimento de cache, mesmo que o cliente tenha solicitado apenas 3.000.000 bytes.

Ao usar um bucket do Cloud Storage como origem, cada solicitação GET é faturada como uma operação de Classe B separada. Você é cobrado por todas as solicitações GET processadas pelo Cloud Storage, incluindo todas as solicitações iniciadas pelo Cloud CDN. Quando uma resposta é exibida inteiramente de um cache do Cloud CDN, nenhuma solicitação GET é enviada ao Cloud Storage e você não é cobrado por nenhuma operação do Cloud Storage.

Quando o Cloud CDN inicia uma solicitação de validação ou de intervalo de bytes, ele não inclui cabeçalhos específicos do cliente, como Cookie ou User-Agent.

No campo httpRequest.userAgent do Cloud Logging, Cloud-CDN-Google significa que o Cloud CDN iniciou a solicitação.

Ignorar o cache

A eliminação de cache permite que solicitações contendo cabeçalhos de solicitação específicos ignorem o cache, mesmo que o conteúdo tenha sido armazenado em cache anteriormente.

Nesta seção, é possível encontrar informações sobre como ignorar o cache com cabeçalhos HTTP, como Pragma e Authorization. Esse recurso é útil quando você quer garantir que os usuários ou clientes sempre tenham o conteúdo mais recente atualizado do servidor de origem. Convém fazer isso para os testes, configurar diretórios de preparo ou scripts.

Se um cabeçalho especificado corresponder, o cache será ignorado para todas as configurações do modo cache, mesmo FORCE_CACHE_ALL. O cache ignora o grande número de ausências no cache se os cabeçalhos especificados forem comuns a muitas solicitações.

Antes de começar

  • Verifique se o Cloud CDN está ativado. Para instruções, consulte Como usar o Cloud CDN.

  • Se necessário, atualize para a versão mais recente do SDK do Cloud:

    gcloud components update
    

Como configurar a opção de ignorar cache

É possível especificar até cinco nomes de cabeçalho HTTP. Os valores são indiferentes a maiúsculas. O nome do cabeçalho precisa ser uma definição válida do campo de cabeçalho HTTP. Um nome de cabeçalho não pode aparecer mais de uma vez na lista de cabeçalhos adicionados. Para ver as regras sobre nomes de cabeçalho válidos, consulte Como funcionam os cabeçalhos personalizados.

Console

  1. No Console do Google Cloud, acesse a página Balanceamento de carga.

    Acessar a página "Balanceamento de carga"

  2. Clique no nome do balanceador de carga HTTP(S) externo.
  3. Clique em Editar .
  4. Em Configuração de back-end, selecione um back-end e clique em Editar .
  5. Verifique se a opção Ativar o Cloud CDN está selecionada.
  6. Na parte inferior da janela, clique em Configurações avançadas.
  7. Em Ignorar cache no cabeçalho da solicitação, clique em Adicionar cabeçalho.
  8. Digite um nome de cabeçalho, como Pragma ou Authorization.
  9. Clique em Atualizar.
  10. Clique em Atualizar novamente.

gcloud

Nos buckets de back-end, use o comando gcloud compute backend-buckets create ou gcloud compute backend-buckets update com a sinalização --bypass-cache-on-request-headers.

Nos serviços de back-end, use o comando gcloud compute backend-services create ou gcloud compute backend-services update com a sinalização --bypass-cache-on-request-headers.

gcloud compute backend-buckets (create | update) BACKEND_BUCKET_NAME
    --bypass-cache-on-request-headers=BYPASS_REQUEST_HEADER
gcloud compute backend-services (create | update) BACKEND_SERVICE_NAME
    --bypass-cache-on-request-headers=BYPASS_REQUEST_HEADER

Exemplo:

gcloud compute backend-services update my-backend-service
    --bypass-cache-on-request-headers=Pragma
    --bypass-cache-on-request-headers=Authorization

api

Para buckets de back-end, use a chamada de API Method: backendBuckets.insert, Method: backendBuckets.update ou Method: backendBuckets.patch .

Para serviços de back-end, use a chamada de API Method: backendServices.insert, Method: backendServices.update ou Method: backendServices.patch .

Exemplo:

PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendBuckets

Adicione o seguinte snippet ao corpo da solicitação JSON:

"cdnPolicy": {
  "bypassCacheOnRequestHeaders": [
    {
      "headerName": string
    }
  ]
}

Como desativar a opção de ignorar cache

gcloud

Nos buckets de back-end, use o comando gcloud compute backend-buckets create ou gcloud compute backend-buckets update com a sinalização --no-bypass-cache-on-request-headers.

Nos serviços de back-end, use o comando gcloud compute backend-services create ou gcloud compute backend-services update com a sinalização --no-bypass-cache-on-request-headers.

gcloud compute backend-services (create | update) (BACKEND_SERVICE_NAME | BACKEND_BUCKET_NAME)
    --no-bypass-cache-on-request-headers

api

Nos buckets de back-end, use a chamada de API Method: backendBuckets.insert ou Method: backendBuckets.update.

Nos serviços de back-end, use a chamada de API Method: backendServices.insert ou Method: backendServices.update.

Use uma das seguintes chamadas de API:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendBuckets
PUT https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendBuckets/BACKEND_BUCKET
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendServices
PUT https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/backendServices/BACKEND_SERVICE

Adicione o seguinte snippet ao corpo da solicitação JSON:

"cdnPolicy": {
  "fields": "bypassCacheOnRequestHeaders"
}

A seguir