Familia de máquinas optimizadas para HPC en Compute Engine


Las instancias optimizadas para HPC son ideales para cargas de trabajo de computación intensiva y de alto rendimiento (HPC). Las instancias optimizadas para HPC ofrecen el mayor rendimiento por núcleo y se basan en una arquitectura que usa funciones como el acceso no uniforme a la memoria (NUMA) para un rendimiento uniforme y confiable.

Machine Cargas de trabajo
Serie de máquinas H4D (versión preliminar)
  • Cargas de trabajo de HPC y cargas de trabajo de varios nodos
  • Fabricación
  • Pronóstico del tiempo
  • Automatización de diseño electrónico (EDA)
  • Salud y ciencias biológicas
  • Computación científica
Serie de máquinas H3
  • Cargas de trabajo de HPC
  • Dinámica de fluidos computacional
  • Seguridad en caso de accidentes
  • Genomics
  • Modelado financiero
  • Cálculos generales de ingeniería y ciencia

Las siguientes series de máquinas están disponibles en esta familia:

  • Las instancias H4D (vista previa) funcionan con procesadores AMD EPYC Turin, que tienen una frecuencia base de 2.7 GHz y una frecuencia máxima de 4.1 GHz. Las instancias H4D tienen 192 núcleos (CPU virtuales) y hasta 1,488 GB de memoria. Las instancias H4D se pueden usar con almacenamiento SSD local y redes RDMA de Cloud.
  • Las instancias H3 funcionan con dos procesadores escalables Intel Xeon de 4ª generación (con nombre interno Sapphire Rapids), que tienen una frecuencia de todos los núcleos de 3.0 GHz. Las instancias H3 tienen 88 CPUs virtuales y 352 GB de memoria DDR5.

Serie de máquinas H4D

Las instancias H4D funcionan con los procesadores AMD EPYC Turin de 5ª generación y los procesadores de descarga Titanium.

Las instancias H4D ofrecen alto rendimiento, bajo costo y escalabilidad para cargas de trabajo de varios nodos. Las instancias H4D son de un solo subproceso y están optimizadas para aplicaciones vinculadas de forma estrecha que escalan en varios nodos. Estas instancias aprovechan tecnologías como las redes de 200 Gbps habilitadas para RDMA y Cluster Director, y priorizan el rendimiento y las optimizaciones específicas de la carga de trabajo. Además, puedes usar el programador de cargas de trabajo dinámico para la implementación programada o inmediata del clúster, lo que hace que H4D sea ideal para las necesidades de cargas de trabajo con picos de HPC.

Una instancia H4D usa todas las CPUs virtuales de un servidor host completo. Las instancias H4D pueden usar todo el ancho de banda de la red host y vienen con una tasa de ancho de banda de red predeterminada de hasta 200 Gbps. Sin embargo, el ancho de banda de la instancia a Internet está limitado a 1 Gbps.

El multiprocesamiento simultáneo (SMT) está inhabilitado para las instancias H4D y no se puede habilitar. Tampoco hay exceso de compromiso para garantizar una coherencia de rendimiento óptima.

Las instancias H4D están disponibles según demanda o con descuentos por compromiso de uso (CUD) de uno y tres años. Para comparar estos métodos, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

Limitaciones de H4D

La serie de máquinas H4D tiene las siguientes restricciones:

  • Los tipos de máquinas H4D solo están disponibles en un tipo predefinido de máquina. Los tipos personalizados de máquinas no están disponibles.
  • No puedes usar GPUs con instancias H4D.
  • Transferencia de datos saliente limitada a 1 Gbps.
  • No puedes crear imágenes de máquina a partir de instancias H4D.
  • Las imágenes de máquina H4D no se pueden usar para crear discos.
  • No puedes compartir discos entre instancias, ya sea en modo de multiescritura o en modo de solo lectura.
  • El rendimiento de Hyperdisk Balanced está limitado a 15,000 IOPS y 240 MBps de capacidad de procesamiento.
  • La migración en vivo no es compatible con las instancias H4D.

Tipos de máquinas H4D

Tipos de máquina CPU virtuales1 Memoria (GB) SSD de Titanium Ancho de banda de salida predeterminado (Gbps)2 Nodos de NUMA
h4d-highmem-192-lssd 192 1,488 (10 x 375 GiB)
3,750 GiB
Hasta 200 Gbps 2

1 Una CPU virtual representa un núcleo completo, sin multiprocesamiento simultáneo (SMT).
2 El ancho de banda de salida predeterminado no puede ser superior al número especificado. El ancho de banda de salida real depende de la dirección IP de destino y de otros factores. Consulta Ancho de banda de red.

Tipos de discos compatibles con H4D

Las instancias H4D pueden usar los siguientes tipos de almacenamiento en bloque:

  • Hyperdisk Balanced (hyperdisk-balanced)
  • SSD local de Titanium

Límites de disco y capacidad

Se aplican las siguientes restricciones:

  • La cantidad de volúmenes de Hyperdisk no puede exceder los 64 por VM.
  • La capacidad total máxima del disco en todos los discos no puede exceder los 512 TiB.

Para obtener detalles sobre los límites de capacidad, consulta Límites de capacidad de Hyperdisk por VM.

Los límites de almacenamiento H4D se describen en la siguiente tabla:

Cantidad máxima de discos por instancia
Tipos de máquina Todos los tipos de
Hyperdisk
Hiperdisco balanceado Capacidad de procesamiento del hiperdisco Hiperdisco extremo
h4d-highmem-192-lssd 64 8 0 0

Compatibilidad de red para instancias H4D

Las instancias H4D requieren interfaces de red gVNIC. H4D admite un ancho de banda de red de hasta 200 Gbps para las redes estándar. El ancho de banda de salida de la instancia a Internet está limitado a 1 Gbps.

Las instancias compatibles con RDMA requieren al menos dos interfaces de red (NIC virtuales). Una vNIC se usa para la conexión en red normal y está completamente conectada a la red de Google y, de manera opcional, a Internet. Esta vNIC usa el controlador gVNIC. La otra vNIC usa un controlador Intel iDPF/iRDMA y se usa para la comunicación RDMA. La vNIC de RDMA no se conecta a Internet.

Antes de migrar a H4D o crear instancias H4D, asegúrate de que la imagen del sistema operativo que uses sea compatible en su totalidad con H4D. Las imágenes totalmente compatibles incluyen la compatibilidad con un ancho de banda de red de 200 Gbps. Si usas Cloud RDMA, la imagen de SO también debe admitir el tipo de interfaz de red IRDMA. Si tu instancia de H4D usa un sistema operativo que no es totalmente compatible o tiene versiones anteriores de los controladores de red, es posible que tu instancia no pueda alcanzar el ancho de banda de red máximo para las instancias de H4D.

Experiencia de mantenimiento para instancias H4D

Durante el ciclo de vida de una instancia de Compute Engine, la máquina anfitrión en la que se ejecuta tu instancia experimenta varios eventos del host. Un evento de host puede incluir el mantenimiento regular de la infraestructura de Compute Engine o, en casos excepcionales, un error de host. Compute Engine también aplica algunas actualizaciones básicas sin interrupciones para el hipervisor y la red en segundo plano.

La serie de máquinas H4D ofrece las siguientes funciones relacionadas con el mantenimiento del host:

Tipo de máquina Frecuencia típica de eventos de mantenimiento programados Comportamiento de mantenimiento Notificación avanzada Mantenimiento a pedido Simular mantenimiento
h4d-highmem-192-lssd Mínimo de 30 días Finaliza con persistencia de datos en SSD local 7 días

Las frecuencias de mantenimiento que se muestran en la tabla anterior son aproximaciones, no garantías. Puede que Compute Engine haga tareas de mantenimiento con mayor frecuencia.

Serie de máquinas H3

Las instancias H3 funcionan con los procesadores escalables Intel Xeon de 4ª generación (con nombre interno Sapphire Rapids), la memoria DDR5 y los procesadores de descarga Titanium.

Las instancias H3 ofrecen la mejor relación precio-rendimiento para las cargas de trabajo de computación de alto rendimiento (HPC) que requieren mucho procesamiento en Compute Engine. Las instancias H3 son de un solo subproceso y son ideales para una variedad de cargas de trabajo de modelado y simulación, como dinámica de fluidos computacional, seguridad en caso de accidentes, genómica, modelado financiero y computación científica y de ingeniería general. Las instancias de H3 admiten la posición compacta, que está optimizada para aplicaciones estrechamente vinculadas que escalan en varios nodos.

La serie H3 está disponible en un tamaño, que comprende un servidor host completo. Para ahorrar en costos de licencias, puedes personalizar la cantidad de núcleos visibles, pero se te cobrará el mismo precio por la instancia. Las instancias H3 pueden usar todo el ancho de banda de la red host y vienen con una tasa de ancho de banda de red predeterminada de hasta 200 Gbps. Sin embargo, el ancho de banda de la instancia a Internet está limitado a 1 Gbps.

El multiprocesamiento simultáneo (SMT) está inhabilitado para las instancias H3 y no se puede habilitar. Tampoco hay exceso de compromiso para garantizar una coherencia de rendimiento óptima.

Las instancias H3 están disponibles según demanda o con descuentos por compromiso de uso (CUD) de uno y tres años. Las instancias H3 se pueden usar con Google Kubernetes Engine.

Limitaciones de H3

La serie de máquinas H3 tiene las siguientes restricciones:

  • La serie de máquinas H3 solo está disponible en un tipo predefinido de máquina. Las formas de máquina personalizadas no están disponibles.
  • No puedes usar GPUs con instancias H3.
  • Transferencia de datos saliente limitada a 1 Gbps.
  • El rendimiento de Persistent Disk y Google Cloud Hyperdisk está limitado a 15,000 IOPS y 240 MBps de capacidad de procesamiento.
  • Las instancias de H3 no admiten imágenes de máquinas.
  • Las instancias de H3 solo admiten la interfaz de almacenamiento NVMe.
  • Las imágenes de instancias de H3 no se pueden usar para crear discos.
  • Las instancias de H3 no admiten el uso compartido de discos entre instancias, ya sea en modo de multiescritura o en modo de solo lectura.

Tipos de máquinas H3

Las instancias H3 están disponibles como una configuración predefinida con 88 CPU virtuales y 352 GB de memoria.

Tipos de máquina CPU virtuales1 Memoria (GB) SSD local Ancho de banda de salida
predeterminado (Gbps)2
h3-standard-88 88 352 No compatible Hasta 200 Gbps

1 Una CPU virtual representa un núcleo completo, sin multiprocesamiento simultáneo (SMT).
2 El ancho de banda de salida predeterminado no puede ser superior al número especificado. El ancho de banda de salida real depende de la dirección IP de destino y de otros factores. Consulta Ancho de banda de red.

Tipos de discos compatibles para H3

Las instancias H3 pueden usar los siguientes tipos de almacenamiento en bloque:

  • Disco persistente balanceado (pd-balanced)
  • Hyperdisk Balanced (hyperdisk-balanced)
  • Hyperdisk Throughput (hyperdisk-throughput)

Límites de disco y capacidad

Si el tipo de máquina lo admite, puedes conectar una combinación de volúmenes de Hyperdisk y Persistent Disk a una instancia, pero se aplican las siguientes restricciones:

  • La cantidad combinada de volúmenes de Hyperdisk y Persistent Disk no puede exceder los 128 por instancia.
  • La capacidad total máxima del disco (en TiB) en todos los tipos de discos no puede exceder lo siguiente:

    • 512 TiB para todos los Hyperdisk
    • 512 TiB para una mezcla de Hyperdisk y Persistent Disk
    • 257 TiB para todos los Persistent Disk

Para obtener detalles sobre los límites de capacidad, consulta Límites de tamaño y conexión de Hyperdisk y Capacidad máxima de Persistent Disk.

Los límites de almacenamiento H3 se describen en la siguiente tabla:

Cantidad máxima de discos por instancia
Tipos de máquina Todos los tipos de discos 1 Todos los tipos de
Hyperdisk
Hiperdisco balanceado Capacidad de procesamiento del hiperdisco Hiperdisco extremo
h3-standard-88 128 64 8 64 0

1 Este límite se aplica a Persistent Disk y a Hyperdisk, pero no incluye los discos SSD locales.

Compatibilidad de red para instancias H3

Las instancias H3 requieren interfaces de red gVNIC. H3 admite un ancho de banda de red de hasta 200 Gbps para las redes estándar.

Antes de migrar a H3 o crear instancias H3, asegúrate de que la imagen del sistema operativo que uses admita el controlador de gVNIC. Para obtener el mejor rendimiento posible en las instancias H3, en la pestaña Funciones de redes de la tabla de detalles del SO, elige una imagen de SO que admita tanto "Redes Tier_1" como "Ancho de banda de red de 200 Gbps". Estas imágenes incluyen un controlador gVNIC actualizado, incluso si el SO invitado muestra la versión del controlador gve como 1.0.0. Si tu instancia de H3 usa un sistema operativo con una versión anterior del controlador de gVNIC, aún se admite, pero es posible que la instancia experimente un rendimiento no óptimo, como menos ancho de banda de red o mayor latencia.

Si usas una imagen de SO personalizada con la serie de máquinas H3, puedes instalar el controlador de gVNIC más reciente de forma manual. Se recomienda la versión 1.4.2 o posterior del controlador gVNIC para usar con instancias H3. Google recomienda usar la versión más reciente del controlador gVNIC para aprovechar las funciones adicionales y las correcciones de errores.

Experiencia de mantenimiento para instancias de H3

Durante el ciclo de vida de una instancia de Compute Engine, la máquina anfitrión en la que se ejecuta tu instancia experimenta varios eventos del host. Un evento de host puede incluir el mantenimiento regular de la infraestructura de Compute Engine o, en casos excepcionales, un error de host. Compute Engine también aplica algunas actualizaciones básicas sin interrupciones para el hipervisor y la red en segundo plano.

La serie de máquinas H3 ofrece las siguientes características relacionadas con el mantenimiento del host:

Tipo de máquina Frecuencia típica de eventos de mantenimiento programados Comportamiento de mantenimiento Notificación avanzada Mantenimiento a pedido Simular mantenimiento
h3-standard-88 Mínimo de 30 días Migración en vivo 7 días

Las frecuencias de mantenimiento que se muestran en la tabla anterior son aproximaciones, no garantías. Puede que Compute Engine haga tareas de mantenimiento con mayor frecuencia.

¿Qué sigue?