Cuando creas una máquina virtual o una instancia de Bare Metal con Compute Engine, especificas una serie y un tipo de máquina para la instancia. Cada serie de máquinas está asociada a una o varias plataformas de CPU. Si hay varias plataformas de CPU disponibles para una serie de máquinas, puedes seleccionar una plataforma de CPU mínima para la instancia de proceso.
Una plataforma de CPU ofrece varios procesadores físicos, y cada uno de estos procesadores se denomina "núcleo". En los procesadores disponibles en Compute Engine, un solo núcleo de CPU puede ejecutarse como varios hilos de hardware mediante multihilo simultáneo (SMT), que en los procesadores Intel se conoce como tecnología Hyper-Threading de Intel. En Compute Engine, cada hilo de hardware se denomina CPU virtual (vCPU). Algunas series de máquinas, como C4A, T2D y H3, no usan SMT y cada vCPU representa un núcleo. Cuando se informa a la VM de que las vCPUs ocupan núcleos virtuales diferentes, Compute Engine verifica que estas vCPUs nunca compartan el mismo núcleo físico.
El tipo de máquina de tu instancia de computación especifica el número de vCPUs que tiene. Puedes deducir el número de núcleos de CPU físicos que tiene mediante la proporción predeterminada de vCPUs por núcleo de esa serie de máquinas:
- En las series de máquinas C4A, Tau T2D, Tau T2A, H3 y A4X, las máquinas virtuales siempre tienen una vCPU por núcleo.
- En el resto de las series de máquinas, las instancias de proceso tienen dos vCPUs por núcleo de forma predeterminada.
Si quieres, puedes definir el número de hilos por núcleo con un valor distinto al predeterminado, lo que puede ser útil para algunas cargas de trabajo. Es importante tener en cuenta que, al hacerlo, el tipo de máquina de tu instancia de proceso ya no reflejará el número correcto de vCPUs. En su lugar, los precios y el número de núcleos de CPU físicos siguen siendo los mismos que con la relación predeterminada de dos vCPUs por núcleo, y el número de vCPUs es la mitad del valor indicado por el tipo de máquina.
Procesadores Arm
En el caso de los procesadores Arm, Compute Engine usa un hilo por núcleo. Cada vCPU se asigna a un núcleo físico sin SMT.
En la siguiente tabla se describen los procesadores Arm que están disponibles para las instancias de Compute Engine.
Procesador de CPU | SKU del procesador | Series y tipos de máquinas admitidos |
---|---|---|
Procesadores NVIDIA Grace con núcleos Arm Neoverse V2 | Superchip | A4X |
Procesadores Google Axion | C4A | |
Ampere Altra | Q64-30 | Tau T2A |
Procesadores x86
En la mayoría de los procesadores x86, cada vCPU se implementa como un único hilo de hardware. La serie de máquinas H3 es la excepción, ya que una vCPU representa un núcleo físico.
Procesadores Intel
En los procesadores Intel Xeon, la tecnología Hyper-Threading de Intel admite varios hilos que se ejecutan simultáneamente en cada núcleo. El tipo de máquina de tu instancia de proceso determina el número de vCPUs y la cantidad de memoria.
Procesador de CPU | SKU del procesador | Series y tipos de máquinas admitidos | Frecuencia base (GHz) | Frecuencia turbo en todos los núcleos (GHz) | Frecuencia turbo máxima de un solo núcleo (GHz) |
---|---|---|---|---|---|
Procesador escalable Intel Xeon (Granite Rapids) de sexta generación |
|||||
Procesador Intel® Xeon® Platinum 6985P-C |
2.81 | 3.9 | 4.2 | ||
Procesador Intel Xeon Scalable (Emerald Rapids) de quinta generación |
|||||
Procesador Intel Xeon Platinum 8581C |
2.1 | 2.9 | 4.0 | ||
2.3 | 3.1 | 4.0 | |||
2.1 | 2.9 | 3,3 | |||
Procesador escalable Intel Xeon (Sapphire Rapids) de 4.ª generación |
Procesador Intel Xeon Platinum 8490H | 1.9 | 2.9 | 3,5 | |
Procesador Intel Xeon Platinum 8481C | 2.2 | 3,0 | 3,0 | ||
2.2 | 3,0 | 3,8 | |||
2,0 | 2.9 | 3,8 | |||
Procesador escalable Intel Xeon (Ice Lake) 3.ª generación |
Procesador Intel Xeon Platinum 8373C |
2.6 | 3.4 | 3,5 | |
Procesador Intel Xeon Scalable (Cascade Lake) segunda generación |
|||||
Procesador Intel Xeon Gold 6268CL | 2,8 | 3.4 | 3.9 | ||
Procesador Intel Xeon Gold 6253CL | 3.1 | 3,8 | 3.9 | ||
Procesador Intel Xeon Platinum 8280L | 2,5 | 3.4 | 4.0 | ||
Procesador Intel Xeon Platinum 8273CL | 2.2 | 2.9 | 3.7 | ||
Procesador escalable Intel Xeon (Skylake) 1.ª generación |
Procesador Intel Xeon Scalable Platinum 8173M | 2,0 | 2,7 | 3,5 | |
Intel Xeon E7 (Broadwell E7) | Procesador Intel Xeon E7-8880V4 | 2.2 | 2.6 | 3,3 | |
Intel Xeon E5 v4 (Broadwell E5) | Procesador Intel Xeon E5-2696V4 | 2.2 | 2,8 | 3.7 | |
Intel Xeon E5 v3 (Haswell) | Procesador Intel Xeon E5-2696V3 | 2.3 | 2,8 | 3,8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Procesador Intel Xeon E5-2696V2 | 2,5 | 3.1 | 3,5 | |
Intel Xeon E5 (Sandy Bridge) | Procesador Intel Xeon E5-2689 | 2.6 | 3.2 | 3.6 |
Los tipos de máquinas 1C4 que usan la CPU Intel Granite Rapids tienen una frecuencia base de 2,8, pero vPMU mostrará 2,3 por motivos de compatibilidad.
2Los tipos de máquinas N2 que tienen 96 vCPUs o más requieren la CPU Intel Ice Lake.
Procesadores AMD
Los procesadores AMD ofrecen un rendimiento y una escalabilidad optimizados mediante SMT. En casi todos los casos, Compute Engine usa dos hilos por núcleo y cada vCPU es un hilo. Tau T2D es la excepción, ya que Compute Engine usa un hilo por núcleo y cada vCPU se asigna a un núcleo físico. El tipo de máquina de tu instancia de proceso determina el número de vCPUs y la cantidad de memoria.
Procesador de CPU | SKU del procesador | Series de máquinas admitidas | Frecuencia base (GHz) | Frecuencia efectiva (GHz) | Frecuencia máxima de aceleración (GHz) |
---|---|---|---|---|---|
AMD EPYC Turin 5.ª generación |
AMD EPYC™ 9B45 | 2,7 | 3,5 | 4.1 | |
AMD EPYC Genoa 4.ª generación |
AMD EPYC™ 9B14 | 2.6 | 3,3 | 3.7 | |
AMD EPYC Milan (3.ª gen.) |
AMD EPYC™ 7B13 | 2,45 | 2,8 | 3,5 | |
AMD EPYC Rome de segunda generación |
AMD EPYC™ 7B12 | 2,25 | 2,7 | 3,3 |
Comportamiento de la frecuencia
En las tablas anteriores se describen las especificaciones de hardware de las CPUs disponibles en Compute Engine, pero debes tener en cuenta los siguientes puntos:
Frecuencia: la frecuencia de un ordenador, o velocidad de reloj, mide el número de ciclos que ejecuta la CPU por segundo, medido en GHz (gigahercios). Por lo general, cuanto mayor sea la frecuencia, mejor será el rendimiento. Sin embargo, los diferentes diseños de CPU gestionan las instrucciones de forma distinta, por lo que una CPU antigua con una velocidad de reloj más alta puede tener un rendimiento inferior al de una CPU más reciente con una velocidad de reloj más baja, ya que la arquitectura más reciente gestiona las instrucciones de forma más eficiente.
Frecuencia base: frecuencia a la que funciona la CPU cuando el sistema está inactivo o con una carga ligera. Cuando funciona a su frecuencia base, la CPU consume menos energía y produce menos calor.
El entorno invitado de una instancia de computación refleja la frecuencia base, independientemente de la frecuencia a la que se esté ejecutando la CPU.
Frecuencia turbo de todos los núcleos: frecuencia a la que suele funcionar cada CPU cuando todos los núcleos del socket no están inactivos al mismo tiempo. Las diferentes cargas de trabajo exigen diferentes recursos de la CPU de un sistema. Las tecnologías de aceleración abordan esta diferencia y ayudan a los procesos a adaptarse a las demandas de la carga de trabajo aumentando la frecuencia de la CPU.
- La mayoría de las instancias de proceso obtienen la frecuencia Turbo de todos los núcleos, aunque solo se anuncie la frecuencia base al entorno invitado.
- Los procesadores Arm Ampere Altra pueden ofrecer un rendimiento más predecible, ya que la frecuencia de los procesadores Arm siempre es la frecuencia turbo de todos los núcleos.
Las instancias C4 pueden ejecutarse a la frecuencia turbo máxima de todos los núcleos si se asigna el valor
ALL_CORE_MAX
al campo AdvancedMachineFeature. Si no se define este campo, la máquina virtual se ejecuta con la configuración predeterminada, que es una frecuencia sin restricciones.El ajuste
ALL_CORE_MAX
no está disponible en instancias de máquina C4D ni C4A.
Frecuencia turbo máxima: frecuencia a la que se dirige una CPU cuando está sometida a una aplicación exigente, como un videojuego o una aplicación de modelado de diseño. Es la frecuencia máxima de un solo núcleo que alcanza una CPU sin overclocking.
Tecnologías de gestión de energía del procesador: los procesadores Intel admiten varias tecnologías para optimizar el consumo de energía. Estas tecnologías se dividen en dos categorías o estados:
- Los estados C son estados en los que la CPU ha reducido o desactivado determinadas funciones.
- Los estados P proporcionan una forma de escalar la frecuencia y el voltaje a los que se ejecuta el procesador para reducir el consumo de energía de la CPU.
Todos los tipos de máquinas C4 y algunos tipos de máquinas C2 (30 y 60 vCPUs), C2D (56 y 112 vCPUs) y M2 (208 y 416 vCPUs) admiten sugerencias de estado C proporcionadas por la instancia mediante la instrucción
MWAIT
.Las instancias de Compute Engine no ofrecen ninguna función para que los clientes controlen los estados P.
Funciones de la CPU
Los fabricantes de chips añaden tecnologías avanzadas para cálculos, gráficos, virtualización y gestión de memoria a las CPUs que producen. Google Cloudadmite el uso de algunas de estas funciones avanzadas con Compute Engine.
Extensiones de vector avanzadas
Las extensiones de vector avanzadas (AVX) son extensiones de una sola instrucción y varios datos (SIMD) de la arquitectura del conjunto de instrucciones x86 para microprocesadores de Intel y Advanced Micro Devices (AMD). AVX proporciona nuevas instrucciones y un nuevo esquema de codificación.
Para obtener más información, consulta Extensiones de vector avanzadas.
AVX está disponible en todos los procesadores x86 que usa Compute Engine.
Extensiones de vector avanzadas (AVX2)
AVX2 (también conocido como Haswell New Instructions) introduce las siguientes adiciones a AVX:
- Amplía la mayoría de las instrucciones SSE y AVX de enteros vectoriales a 256 bits.
- Se añade compatibilidad con Gather, lo que permite cargar elementos vectoriales desde ubicaciones de memoria no contiguas.
- Permutaciones de cualquier tipo con granularidad DWORD y QWORD
- Desplazamientos de vectores
AVX2 está disponible en las siguientes plataformas de CPU:
- Procesadores Intel Xeon E5 v3 (Haswell) y posteriores
- Todos los procesadores AMD
Extensiones de vector avanzadas (AVX512)
AVX-512 amplía AVX a la compatibilidad con 512 bits mediante la codificación de prefijo EVEX. AVX-512 proporciona aceleración integrada para cargas de trabajo exigentes que implican un procesamiento pesado basado en vectores. El registro de gran tamaño del acelerador AVX-512 admite 32 números de punto flotante de doble precisión y 64 de precisión simple, además de ocho enteros de 64 bits y 16 de 32 bits.
Para obtener más información sobre AVX-512, consulta el artículo ¿Qué es Intel AVX-512?
AVX-512 está disponible en las siguientes plataformas de CPU:
- Procesador escalable Intel Xeon (Skylake) de primera generación y procesadores más recientes
- Procesadores AMD EPYC Genoa de 4.ª generación o posteriores
Extensiones de matriz avanzadas
Intel Advanced Matrix Extensions (AMX) es una nueva extensión de arquitectura de conjunto de instrucciones (ISA) diseñada para acelerar las cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (ML). AMX introduce nuevas instrucciones que se pueden usar para realizar multiplicaciones de matrices y operaciones de convolución, que son dos de las operaciones más comunes en la IA y el aprendizaje automático.
AMX introduce registros bidimensionales denominados baldosas sobre los que los aceleradores pueden realizar operaciones. AMX se ha diseñado como una arquitectura extensible. El primer acelerador implementado se llama unidad de multiplicación de matriz de baldosas (TMUL). Cada núcleo de CPU del procesador Sapphire Rapids tiene una unidad TMUL AMX independiente.
Para obtener información técnica sobre Intel AMX, consulta Compatibilidad con Intel AMX en la versión 5.16. Intel ofrece un tutorial sobre AMX en Code Sample: Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions (Código de ejemplo: extensiones de matriz avanzadas de Intel [Intel AMX] - Funciones intrínsecas).
AMX está disponible en los procesadores Intel Xeon de 4.ª generación (Sapphire Rapids) y versiones posteriores. AMX no está disponible con procesadores AMD ni Arm.
Requisitos para usar AMX
Las instrucciones de Intel AMX tienen ciertos requisitos mínimos de software, como los siguientes:
- En el caso de las imágenes personalizadas, AMX es compatible con la versión 5.16 o posterior del kernel de Linux.
- Compute Engine ofrece compatibilidad con AMX en las siguientes imágenes públicas:
- CentOS Stream 9
- Container-Optimized OS 109 LTS o versiones posteriores
- RHEL 8 (última compilación) o versiones posteriores
- Rocky Linux 8 (última compilación) o una versión posterior
- Ubuntu 22.04 o versiones posteriores
- Windows Server 2022 o versiones posteriores
- TensorFlow 2.9.1 o una versión posterior
- Extensión de Intel para Intel Optimization for PyTorch
Funciones de CPU disponibles para instancias de hardware desnudo
Además de ofrecer todos los recursos de computación sin procesar del servidor, las instancias de hardware desnudo que se ejecutan en procesadores escalables Intel Xeon de cuarta generación o posteriores pueden usar varios aceleradores y descargas específicos de funciones integrados:
- Intel QAT: Intel QuickAssist Technology (Intel QAT) acelera la compresión, el cifrado y el descifrado.
- Intel DLB: Intel Dynamic Load Balancer (Intel DLB) ayuda a acelerar las colas de datos.
- Intel IAA: Intel In-Memory Analytics Accelerator (Intel IAA) mejora el rendimiento del procesamiento de consultas.
- Intel DSA: Intel Data Streaming Accelerator (Intel DSA) ayuda a copiar y mover datos más rápido.
Confidential Computing
Para proteger tus datos mientras están en uso, se pueden usar plataformas de CPU que admitan tecnologías de Confidential Computing para crear instancias de máquina virtual confidencial.
Para obtener más información sobre los requisitos para crear una instancia de VM confidencial, consulta Configuraciones admitidas.
Siguientes pasos
- Consulta más información sobre las familias de máquinas.
- Consulta más información sobre las instancias de Compute Engine.
- Consulta más información sobre las imágenes.
- Consulta cómo especificar una plataforma de CPU mínima.
Pruébalo
Si es la primera vez que utilizas Google Cloud, crea una cuenta para evaluar el rendimiento de Compute Engine en situaciones reales. Los nuevos clientes también reciben 300 USD en crédito gratuito para ejecutar, probar y desplegar cargas de trabajo.
Probar Compute Engine gratis