Familia de máquinas optimizadas para HPC de Compute Engine


Las instancias optimizadas para HPC son ideales para cargas de trabajo que requieren una gran cantidad de recursos de computación y de computación de alto rendimiento (HPC). Las instancias optimizadas para HPC ofrecen el mayor rendimiento por núcleo y se basan en una arquitectura que utiliza funciones como el acceso a memoria no uniforme (NUMA) para ofrecer un rendimiento uniforme y fiable óptimo.

Máquina Cargas de trabajo
Serie de máquinas H4D (vista previa)
  • Cargas de trabajo de HPC y cargas de trabajo de varios nodos
  • Fabricación
  • Pronóstico del tiempo
  • Automatización del diseño electrónico (EDA)
  • Sanidad y ciencias biológicas
  • Computación científica
Serie de máquinas H3
  • Cargas de trabajo de HPC
  • Dinámica de fluidos computacional
  • Seguridad en caso de colisión
  • Genomics
  • Modelado financiero
  • Computación científica y de ingeniería general

En esta familia de máquinas están disponibles las siguientes series de máquinas:

  • Las instancias H4D (vista previa) se basan en procesadores AMD EPYC Turin, que tienen una frecuencia base de 2,7 GHz y una frecuencia máxima de 4,1 GHz. Las instancias H4D tienen 192 núcleos (vCPUs) y hasta 1488 GB de memoria. Las instancias H4D se pueden usar con almacenamiento SSD local y redes RDMA en la nube.
  • Las instancias H3 utilizan dos procesadores escalables Intel Xeon de 4.ª generación (con el nombre en clave Sapphire Rapids) que tienen una frecuencia de 3,0 GHz en todos los núcleos. Las instancias H3 tienen 88 vCPUs y 352 GB de memoria DDR5.

Serie de máquinas H4D

Las instancias H4D se basan en los procesadores AMD EPYC Turin de 5.ª generación y en los procesadores de descarga Titanium.

Las instancias H4D ofrecen alto rendimiento, bajo coste y escalabilidad para cargas de trabajo de varios nodos. Las instancias H4D son de un solo subproceso y están optimizadas para aplicaciones estrechamente acopladas que se escalan en varios nodos. Estas instancias aprovechan tecnologías como la red de 200 Gbps habilitada para RDMA y Cluster Director, y priorizan el rendimiento y las optimizaciones específicas de las cargas de trabajo. Además, puedes usar Dynamic Workload Scheduler para programar o implementar clústeres de forma inmediata, lo que hace que H4D sea ideal para las necesidades de cargas de trabajo de HPC con picos de actividad.

Una instancia H4D usa todas las vCPUs de un servidor host completo. Las instancias H4D pueden usar todo el ancho de banda de la red del host y tienen una tasa de ancho de banda de red predeterminada de hasta 200 Gbps. Sin embargo, el ancho de banda de la instancia a Internet está limitado a 1 Gbps.

El multihilo simultáneo (SMT) está inhabilitado en las instancias H4D y no se puede habilitar. Tampoco se sobrecompromete para asegurar la coherencia del rendimiento óptimo.

Las instancias H4D están disponibles bajo demanda o con descuentos por compromiso de uso (CUDs) de uno y tres años. Para comparar estos métodos, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

Limitaciones de H4D

La serie de máquinas H4D tiene las siguientes restricciones:

  • Los tipos de máquinas H4D solo están disponibles en un tipo de máquina predefinido. Los tipos de máquinas personalizadas no están disponibles.
  • No puedes usar GPUs con instancias H4D.
  • La transferencia de datos saliente está limitada a 1 Gbps.
  • No puedes crear imágenes de máquina a partir de instancias H4D.
  • Las imágenes de máquina H4D no se pueden usar para crear discos.
  • No puedes compartir discos entre instancias, ni en modo multiescritura ni en modo de solo lectura.
  • El rendimiento de Hyperdisk Balanced está limitado a 15.000 IOPS y 240 MBps.
  • La migración en tiempo real no se admite en las instancias H4D.

Tipos de máquinas H4D

Tipos de máquina vCPUs1 Memoria (GB) Titanium SSD Ancho de banda de salida predeterminado (Gbps)2 Nodos NUMA
h4d-highmem-192-lssd 192 1488 (10 x 375 GiB)
3750 GiB
Hasta 200 Gbps 2

1 Una vCPU representa un núcleo completo, sin multihilo simultáneo (SMT).
2 El ancho de banda de salida predeterminado no puede superar el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y de otros factores. Consulta Ancho de banda de la red.

Tipos de discos compatibles con H4D

Las instancias H4D pueden usar los siguientes tipos de almacenamiento en bloque:

  • Hyperdisk Balanced (hyperdisk-balanced)
  • SSD de titanio local

Límites de disco y capacidad

Se aplican las siguientes limitaciones:

  • El número de volúmenes de Hyperdisk no puede superar los 64 por VM.
  • La capacidad total máxima de todos los discos no puede superar los 512 TiB.

Para obtener información sobre los límites de capacidad, consulta Límites de capacidad de Hyperdisk por VM.

Los límites de almacenamiento de H4D se describen en la siguiente tabla:

Número máximo de discos por instancia
Tipos de máquina Todos los tipos de Hyperdisk
Hyperdisk Balanced Hyperdisk Throughput Hyperdisk Extreme
h4d-highmem-192-lssd 64 8 0 0

Compatibilidad de red con instancias H4D

Las instancias H4D requieren interfaces de red gVNIC. H4D admite hasta 200 Gbps de ancho de banda de red para redes estándar. El ancho de banda de salida de las instancias a Internet está limitado a 1 Gbps.

Las instancias compatibles con RDMA requieren al menos dos interfaces de red (NICs virtuales). Una vNIC se usa para las redes normales y está totalmente conectada a la red de Google y, opcionalmente, a Internet. Esta NIC virtual usa el controlador gVNIC. La otra vNIC usa un controlador Intel iDPF/iRDMA y se usa para la comunicación RDMA. La NIC virtual RDMA no se conecta a Internet.

Antes de migrar a H4D o crear instancias de H4D, asegúrate de que la imagen del sistema operativo que utilices sea totalmente compatible con H4D. Las imágenes totalmente compatibles admiten un ancho de banda de red de 200 Gbps. Si usas Cloud RDMA, la imagen del SO también debe admitir el tipo de interfaz de red IRDMA. Si tu instancia H4D usa un sistema operativo que no es totalmente compatible o tiene versiones anteriores de los controladores de red, es posible que tu instancia no pueda alcanzar el ancho de banda de red máximo para las instancias H4D.

Experiencia de mantenimiento de instancias H4D

Durante el ciclo de vida de una instancia de Compute Engine, la máquina host en la que se ejecuta tu instancia experimenta varios eventos del host. Un evento de host puede incluir el mantenimiento periódico de la infraestructura de Compute Engine o, en raras ocasiones, un error de host. Compute Engine también aplica algunas actualizaciones ligeras no disruptivas para el hipervisor y la red en segundo plano.

La serie de máquinas H4D ofrece las siguientes funciones relacionadas con el mantenimiento del host:

Tipo de máquina Frecuencia habitual de los eventos de mantenimiento programados Comportamiento de mantenimiento Notificación avanzada Mantenimiento bajo demanda Simular mantenimiento
h4d-highmem-192-lssd Mínimo de 30 días Termina con la persistencia de datos de SSD local 7 días

Las frecuencias de mantenimiento que se muestran en la tabla anterior son aproximaciones, no garantías. Es posible que Compute Engine realice tareas de mantenimiento con más frecuencia en ocasiones.

Serie de máquinas H3

Las instancias H3 utilizan la tecnología de los procesadores escalables Intel Xeon de 4.ª generación (con el nombre en clave Sapphire Rapids), la memoria DDR5 y los procesadores de descarga Titanium.

Las instancias H3 ofrecen la mejor relación precio-rendimiento para cargas de trabajo de computación de alto rendimiento (HPC) que requieren muchos recursos de computación en Compute Engine. Las instancias H3 son de un solo subproceso y son ideales para diversas cargas de trabajo de modelización y simulación, como la dinámica de fluidos computacional, la seguridad en caso de colisión, la genómica, la modelización financiera y la computación científica y de ingeniería en general. Las instancias H3 admiten la colocación compacta, que está optimizada para aplicaciones estrechamente acopladas que se escalan en varios nodos.

La serie H3 está disponible en un tamaño que abarca todo un servidor host. Para ahorrar costes de licencia, puedes personalizar el número de núcleos visibles, pero se te cobrará el mismo precio por la instancia. Las instancias H3 pueden usar todo el ancho de banda de la red del host y tienen una tasa de ancho de banda de red predeterminada de hasta 200 Gbps. Sin embargo, el ancho de banda de la instancia a Internet está limitado a 1 Gbps.

El multihilo simultáneo (SMT) está inhabilitado en las instancias H3 y no se puede habilitar. Tampoco se sobrecompromete para asegurar la coherencia del rendimiento óptimo.

Las instancias H3 están disponibles bajo demanda o con descuentos por compromiso de uso (CUDs) de uno y tres años. Las instancias H3 se pueden usar con Google Kubernetes Engine.

H3 Limitaciones

La serie de máquinas H3 tiene las siguientes restricciones:

  • La serie de máquinas H3 solo está disponible en un tipo de máquina predefinido. Las formas de máquina personalizadas no están disponibles.
  • No puedes usar GPUs con instancias H3.
  • La transferencia de datos saliente está limitada a 1 Gbps.
  • El rendimiento de Persistent Disk y Google Cloud Hyperdisk está limitado a 15.000 IOPS y 240 MBps de capacidad de procesamiento.
  • Las instancias H3 no admiten imágenes de máquina.
  • Las instancias H3 solo admiten la interfaz de almacenamiento NVMe.
  • Las imágenes de instancia H3 no se pueden usar para crear discos.
  • Las instancias H3 no admiten el uso compartido de discos entre instancias, ni en el modo multiescritura ni en el modo de solo lectura.

Tipos de máquinas H3

Las instancias H3 están disponibles como configuración predefinida con 88 vCPUs y 352 GB de memoria.

Tipos de máquina vCPUs1 Memoria (GB) SSD local Ancho de banda de salida predeterminado (Gbps)
2
h3-standard-88 88 352 No compatible Hasta 200 Gbps

1 Una vCPU representa un núcleo completo, sin multihilo simultáneo (SMT).
2 El ancho de banda de salida predeterminado no puede superar el número indicado. El ancho de banda de salida real depende de la dirección IP de destino y de otros factores. Consulta Ancho de banda de la red.

Tipos de discos admitidos para H3

Las instancias H3 pueden usar los siguientes tipos de almacenamiento en bloque:

  • Disco persistente balanceado (pd-balanced)
  • Hyperdisk Balanced (hyperdisk-balanced)
  • Rendimiento de Hyperdisk (hyperdisk-throughput)

Límites de disco y capacidad

Si el tipo de máquina lo admite, puedes asociar una combinación de volúmenes de hiperdisco y de disco persistente a una instancia, pero se aplican las siguientes restricciones:

  • El número combinado de volúmenes de hiperdisco y de disco persistente no puede superar los 128 por instancia.
  • La capacidad total máxima de disco (en TiB) de todos los tipos de disco no puede superar lo siguiente:

    • 512 TiB para todos los Hyperdisk
    • 512 TiB para una combinación de Hyperdisk y Persistent Disk
    • 257 TiB para todos los discos persistentes

Para obtener más información sobre los límites de capacidad, consulta Límites de tamaño y de archivos adjuntos de Hyperdisk y Capacidad máxima de los discos persistentes.

En la siguiente tabla se describen los límites de almacenamiento de H3:

Número máximo de discos por instancia
Tipos de máquina Todos los tipos de disco 1 Todos los tipos de Hyperdisk
Hyperdisk Balanced Hyperdisk Throughput Hyperdisk Extreme
h3-standard-88 128 64 8 64 0

1 Este límite se aplica a Persistent Disk y Hyperdisk, pero no incluye los discos SSD locales.

Compatibilidad de red con instancias H3

Las instancias H3 requieren interfaces de red gVNIC. H3 admite hasta 200 Gbps de ancho de banda de red para redes estándar.

Antes de migrar a H3 o crear instancias H3, asegúrate de que la imagen del sistema operativo que utilices sea compatible con el controlador gVNIC. Para obtener el mejor rendimiento posible en las instancias H3, en la pestaña Funciones de red de la tabla de detalles del SO, elige una imagen del SO que admita tanto "Red de nivel 1" como "Ancho de banda de red de 200 Gbps". Estas imágenes incluyen un controlador gVNIC actualizado, aunque el SO invitado muestre la versión gve del controlador como 1.0.0. Si tu instancia H3 usa un sistema operativo con una versión anterior del controlador gVNIC, sigue siendo compatible, pero es posible que la instancia tenga un rendimiento inferior al óptimo, como un ancho de banda de red menor o una latencia más alta.

Si usas una imagen de SO personalizada con la serie de máquinas H3, puedes instalar manualmente el controlador gVNIC más reciente. Se recomienda usar la versión 1.4.2 o una posterior del controlador gVNIC con instancias H3. Google recomienda usar la versión más reciente del controlador gVNIC para beneficiarse de funciones adicionales y correcciones de errores.

Mantenimiento de instancias H3

Durante el ciclo de vida de una instancia de Compute Engine, la máquina host en la que se ejecuta tu instancia experimenta varios eventos del host. Un evento de host puede incluir el mantenimiento periódico de la infraestructura de Compute Engine o, en raras ocasiones, un error de host. Compute Engine también aplica algunas actualizaciones ligeras no disruptivas para el hipervisor y la red en segundo plano.

La serie de máquinas H3 ofrece las siguientes funciones relacionadas con el mantenimiento del host:

Tipo de máquina Frecuencia habitual de los eventos de mantenimiento programados Comportamiento de mantenimiento Notificación avanzada Mantenimiento bajo demanda Simular mantenimiento
h3-standard-88 Mínimo de 30 días Migrar en tiempo real 7 días

Las frecuencias de mantenimiento que se muestran en la tabla anterior son aproximaciones, no garantías. Es posible que Compute Engine realice tareas de mantenimiento con más frecuencia en ocasiones.

Siguientes pasos