Plataformas de CPU


Ao criar uma máquina virtual (VM) ou uma instância bare metal usando o Compute Engine, você especifica uma série de máquinas e um tipo de máquina para a instância. Cada série de máquina está associada a uma ou mais plataformas de CPU. Se houver várias plataformas de CPU disponíveis para uma série de máquinas, selecione uma plataforma de CPU mínima para a instância de computação.

Uma plataforma de CPU oferece vários processadores físicos, e cada um deles é chamado de núcleo. Para os processadores disponíveis no Compute Engine, um único núcleo de CPU pode ser executado como várias threads de hardware usando Multithreading simultâneo (SMT, na sigla em inglês), que é conhecido pelos processadores Intel como Tecnologia Intel Hyper-Threading. No Compute Engine, cada linha de hardware é chamada de CPU virtual (vCPU). Algumas séries de máquinas, como H3 e T2D, não usam SMT, e cada vCPU representa um núcleo. Quando a VM recebe a informação de que as vCPUs estão ocupando núcleos virtuais diferentes, o Compute Engine garante que elas nunca compartilhem o mesmo núcleo físico.

O tipo de máquina da instância de computação especifica o número de vCPUs e é possível inferir o número de núcleos físicos da CPU usando a proporção padrão de vCPUs por núcleo dessa série de máquinas:

  • Para as séries de máquinas Tau T2D, Tau T2A e H3, as VMs sempre têm uma vCPU por núcleo.
  • Para todas as outras séries, as instâncias de computação têm duas vCPUs por núcleo por padrão.

Como alternativa, defina o número de linhas de execução por núcleo para um valor diferente do padrão, o que pode beneficiar algumas cargas de trabalho. É importante ressaltar que, quando isso é feito, o tipo de máquina da instância de computação não reflete mais o número correto de vCPUs. Em vez disso, o preço e o número de núcleos de CPU físicos permanecem os mesmos das duas vCPUs padrão por núcleo, e o número de vCPUs é metade do valor indicado pelo tipo de máquina.

Processadores Arm

Para os processadores Arm, o Compute Engine usa uma linha de execução por núcleo. Cada vCPU corresponde a um núcleo físico sem SMT.

A tabela a seguir descreve os processadores Arm disponíveis para instâncias do Compute Engine.

Processador de CPU SKU do processador Séries e tipos de máquina compatíveis Frequência contínua de todos os núcleos (GHz)
Ampere Altra Q64-30 3.0

Processadores x86

Na maioria dos processadores x86, cada vCPU é implementada como uma única linha de execução de hardware. A série de máquinas Tau T2D é exceção, com uma vCPU representando um núcleo físico.

Processadores Intel

Nos processadores Intel Xeon, a Tecnologia Intel Hyper-Threading é compatível com várias linhas de execução em execução simultaneamente, em cada núcleo. O tipo de máquina da sua instância de computação determina o número de vCPUs e de memória.

Processador de CPU SKU do processador Séries e tipos de máquina compatíveis Frequência de base (GHz) Frequência Turbo em todos os núcleos (GHz) Frequência Single-Core Max Turbo (GHz)
Processador escalonável Intel Xeon
(Emerald Rapids)
5ª geração
Processador Intel® Xeon® Platinum 8581C
2.3 3.1 4.0
Processador Intel® Xeon® Platinum 8581C
2.1 2.9 3.3
Processador escalonável Intel Xeon
(Sapphire Rapids)
4a geração
Processador Intel® Xeon® Platinum 8490H 1.9 2.9 3.5
Processador Intel® Xeon® Platinum 8481C 2.2 3.0 3.0
Processador Intel® Xeon® Platinum 8481C 2,0 3,8 2.9
Processador escalonável Intel Xeon (Ice Lake)
3a geração
Processador Intel® Xeon® Platinum
8373C
2,6 3.4 3.5
Processador escalonável Intel Xeon (Cascade Lake)
2a geração
Processador Intel® Xeon® Gold 6268CL 2.8 3.4 3.9
Processador Intel® Xeon® Gold 6253CL 3.1 3.8 3.9
Processador Intel® Xeon® Platinum 8280L 2.5 3.4 4.0
Processador Intel® Xeon® Platinum 8273CL 2.2 2.9 3.7
Processador escalonável Intel Xeon (Skylake)
1a geração
Processador Intel® Xeon® escalonável platina 8173M 2,0 2.7 3.5
Intel Xeon E7 (Broadwell E7) Processador Intel® Xeon® E7-8880V4 2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) Processador Intel® Xeon® E5-2696V4 2.2 2.8 3.7
Intel Xeon E5 v3 (Haswell) Processador Intel® Xeon® E5-2696V3 2.3 2.8 3.8
Intel Xeon E5 v2 (Ivy Bridge) Processador Intel® Xeon® E5-2696V2 2.5 3.1 3.5
Intel Xeon E5 (Sandy Bridge) Processador Intel® Xeon® E5-2689 2.6 3.2 3.6

* Os tipos de máquina N2 com 96 ou mais vCPUs exigem a CPU Intel Ice Lake.

Processadores AMD

Os processadores AMD oferecem escalonabilidade e desempenho otimizados quando SMT é utilizada. Em quase todos os casos, o Compute Engine usa duas linhas de execução por núcleo, sendo cada vCPU uma linha de execução. A Tau T2D é exceção, onde o Compute Engine usa uma linha de execução por núcleo e cada vCPU é mapeada quanto a um núcleo físico. O tipo de máquina da sua instância de computação determina o número de vCPUs e de memória.

Processador de CPU SKU do processador Série de máquinas compatível Frequência de base (GHz) Frequência efetiva (GHz) Frequência de aumento máximo (GHz)
AMD EPYC Genoa
4ª geração
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
3ª geração
AMD EPYC™ 7B13 2,45 2.8 3.5
AMD EPYC Rome
2ª geração
AMD EPYC™ 7B12 2,25 2.7 3.3

Comportamento de frequência

As tabelas anteriores descrevem as especificações de hardware das CPUs disponíveis com o Compute Engine, mas é necessário considerar os seguintes pontos:

  • Frequência: a frequência de um computador, ou velocidade do clock, que mede o número de ciclos que a CPU executa por segundo, medido em GHz (gigahertz). Geralmente, frequências mais altas indicam um melhor desempenho. No entanto, como diferentes designs de CPU processam as instruções de maneiras diferentes, uma CPU mais antiga com uma velocidade de clock mais alta pode ser superada por uma mais recente com uma velocidade de clock menor, porque a nova arquitetura lida com as instruções de maneira mais eficiente.

  • Frequência de base: a frequência de execução da CPU quando o sistema está inativo ou com uma carga leve. Quando executada na frequência de base, a CPU consome menos energia e produz menos calor.

    O ambiente de convidado de uma instância de computação reflete a frequência de base, seja qual for a frequência real de execução da CPU.

  • Frequência turbo em todos os núcleos: a frequência em que cada CPU normalmente é executada quando todos os núcleos no soquete não estão inativos ao mesmo tempo. Diferentes cargas de trabalho geram demandas diferentes na CPU de um sistema. As tecnologias de otimização lidam com essa diferença e ajudam os processos a se adaptarem às demandas da carga de trabalho, aumentando a frequência da CPU.

    • A maioria das instâncias de computação chega à frequência turbo em todos os núcleos, mesmo que apenas a frequência de base seja anunciada para o ambiente de convidado.
    • Os processadores Arm da Ampere Altra podem fornecer um desempenho mais previsível porque a frequência deles é sempre a turbo em todos os núcleos.
    • As VMs C4 podem ser executadas na frequência turbo máxima de todos os núcleos definindo o campo AdvancedMachineFeature como ALL_CORE_MAX. Se esse campo não estiver definido, a VM será executada na configuração padrão, que é a frequência irrestrita.
  • Frequência turbo máxima: a frequência-alvo de uma CPU quando sob carga de um aplicativo exigente como um videogame ou aplicativo de modelagem de design. Essa é a frequência máxima de núcleo único que uma CPU atinge sem overclock.

  • Tecnologias de gerenciamento de energia do processador: os processadores Intel são compatíveis com várias tecnologias que otimizam o consumo de energia. Essas tecnologias são divididas em duas categorias ou estados:

    • Os estados C são aqueles em que a CPU reduziu ou desativou determinadas funções.
    • Os estados P fornecem uma maneira de dimensionar a frequência e a tensão em que o processador funciona para reduzir o consumo de energia da CPU.

    Todos os tipos de máquina C4 e alguns tipos de máquina C2 (30, 60 vCPUs), C2D (56, 112 vCPUs) e M2 (208, 416 vCPUs) oferecem suporte a dicas de estado C fornecidas pela instância por meio da instrução MWAIT.

    As instâncias do Compute Engine não fornecem recursos para o controle de estados P pelo cliente.

Recursos de CPU

Os fabricantes de chips adicionam tecnologias avançadas para cálculos, gráficos, virtualização e gerenciamento de memória às CPUs produzidas. O Google Cloud oferece suporte ao uso de alguns desses recursos avançados com o Compute Engine.

Advanced Matrix Extensions (AMX)

O Intel AMX é uma nova extensão de arquitetura de conjunto de instruções (ISA) projetada para acelerar as cargas de trabalho de inteligência artificial (IA) e machine learning (ML). O AMX introduz novas instruções que podem ser usadas para executar operações de multiplicação e convolução de matrizes, que são duas das operações mais comuns em IA e ML.

O AMX tem suporte em processadores Intel Xeon de 5ª geração (codinome Emerald Rapids), que alimenta a série de VMs de uso geral C4, bem como em processadores Intel Xeon de 4ª geração (codinome Sapphire Rapids), que alimenta a série de VMs de uso geral C3 e VMs de uso geral C3 otimizadas para acelerador A3. Todos os tipos de máquina de VM C4 e C3 têm suporte a conjuntos de instruções AMX.

O AMX introduz registros bidimensionais chamados de blocos em que os aceleradores podem executar operações. O AMX é uma arquitetura extensível. O primeiro acelerador implementado é chamado de unidade de multiplicação de matriz de blocos (TMUL). Cada núcleo de CPU do processador Sapphire Rapids tem uma unidade AMX TMUL independente.

Mais detalhes técnicos sobre o Intel AMX podem ser encontrados no suporte do Intel AMX 5.16. A Intel oferece um tutorial sobre o AMX em Exemplo de código: Intel® Advanced Matrix Extensions (Intel® AMX) - Funções intrínsecas.

Requisitos para usar o AMX

As instruções do Intel AMX têm alguns requisitos mínimos de software, como:

  • Para imagens personalizadas, o AMX é compatível com a versão 5.16 ou posterior do kernel do Linux.
  • O Compute Engine oferece suporte para AMX nas seguintes imagens públicas:
    • CentOS Stream 8 ou posterior
    • Container-Optimized OS 109 LTS ou mais recente
    • RHEL 8 (versão mais recente) ou posterior
    • Rocky Linux 8 (versão mais recente) ou posterior
    • Ubuntu 22.04 ou posterior
    • Windows Server 2022 ou mais recente
  • Tensorflow 2.9.1 ou mais recente
  • Extensão Intel para Intel® Optimization para PyTorch

Para conferir a disponibilidade regional das VMs C4 e C3, consulte Regiões e zonas disponíveis e filtre a tabela para mostrar apenas os tipos de máquina C4 ou C3.

Recursos de CPU disponíveis para instâncias bare metal

Além de oferecer todos os recursos de computação brutos do servidor, as instâncias bare metal que são executadas em processadores escalonáveis Intel Xeon de 4ª geração podem usar vários aceleradores e descarregamentos integrados específicos de função:

  • Intel-QAT: a Intel QuickAssist Technology (Intel QAT) acelera a compactação, a criptografia e a descriptografia.
  • Intel-DLB: o balanceador de carga dinâmico da Intel (Intel DLB, na sigla em inglês) ajuda a acelerar as filas de dados.
  • Intel IAA: o Intel In-Memory Analytics Accelerator (Intel IAA) melhora a performance do processamento de consultas.
  • Intel DSA: o Intel Data Streaming Accelerator (Intel DSA) ajuda a copiar e mover dados com mais rapidez.

Computação confidencial

Para proteger seus dados enquanto eles estão em uso, as plataformas de CPU que oferecem suporte às tecnologias de computação confidencial podem ser usadas para criar instâncias de VMs confidenciais.

Para saber mais sobre os requisitos para criar uma instância de VM confidencial, consulte Configurações compatíveis.

A seguir

Faça um teste

Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Compute Engine em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Faça uma avaliação gratuita do Compute Engine