La ingeniería asistida por ordenador (CAE) abarca una amplia gama de aplicaciones, entre las que se incluyen el análisis estructural, las dinámicas de fluidos, la seguridad en fallos y el análisis térmico, entre otras. Todos estos casos prácticos requieren una gran cantidad de recursos computacionales para gestionar las complejas simulaciones de los mecanismos de física involucrados y los datos de entrada y salida potencialmente voluminosos. En esta guía de referencia técnica se describe cómo aprovechar Google Cloud para acelerar los flujos de trabajo de CAE proporcionando recursos de computación de alto rendimiento (HPC).
La plataforma de HPC de Google Cloud proporciona una plataforma potente y escalable para los flujos de trabajo de CAE más exigentes. Combina el rendimiento de los sistemas de HPC tradicionales con las ventajas de una nube de escala mundial, elástica y flexible:
Para simplificar el uso de Google Cloud con los flujos de trabajo de CAE, hemos creado los componentes de la nube adecuados para satisfacer los requisitos de las cargas de trabajo de CAE que requieren numerosos recursos de computación. En concreto, nuestra solución de CAE se ha diseñado a partir de las familias de máquinas virtuales H3 y C3 de Google Cloud y de la plataforma Intel Xeon más reciente. Estas familias de máquinas virtuales proporcionan un ancho de banda de memoria elevado para una proporción de memoria/flop equilibrada, lo que es ideal para CAE. La solución es ideal para aplicaciones MPI con un alto acoplamiento, así como para cargas de trabajo que requieren una mayor memoria y hasta 16 GB por núcleo. Incluye varias opciones de almacenamiento que satisfacen una amplia gama de requisitos de E/S. Para la gestión de recursos, es compatible programadores como Slurm de SchedMD y PBS Professional de Altair.
En el siguiente diagrama de arquitectura se muestra la solución:
La arquitectura de la solución de CAE se compone de varios componentes clave, como la computación, las redes, el almacenamiento y el kit de herramientas de HPC de código abierto de Google.
La solución CAE se basa en Google Compute Engine. Compute Engine ofrece una gran variedad de tipos de máquinas, incluidos los tipos de máquinas con GPUs. Compute Engine es una buena opción para las cargas de trabajo de CAE que requieren un alto rendimiento y flexibilidad, debido a sus tipos de máquinas virtuales especializados y a sus redes de alto rendimiento:
Máquinas virtuales H3: se ha creado una partición equilibrada, ideal para las cargas de trabajo de CAE, a partir de la máquina virtual HPC de Google con el último procesador Sapphire Rapids de Intel con 4 GB por núcleo y hasta miles de núcleos (con MPI).
Máquinas virtuales C3: se ha creado la máquina virtual C3 de Google con la última generación de Sapphire Rapids de Intel, que es de 16 GB por núcleo, y es una partición con alta capacidad de memoria, adecuada para las cargas de trabajo de CAE que consumen mucha memoria.
Políticas de emplazamiento: gracias a ellas, se asegura de que las máquinas virtuales se creen unas próximas a otras, lo que reduce la latencia de las comunicaciones entre máquinas virtuales y mejora el rendimiento general.
Imagen de máquina virtual de HPC: para conseguir un rendimiento óptimo, proporcionamos imágenes de máquina virtual de computación de alto rendimiento (HPC) que configuran distribuciones estándar del sistema operativo Linux para que el rendimiento en Google Cloud sea óptimo.
Máquinas virtuales de uso general: para nodos de inicio de sesión, servidores de licencias y otras tareas.
Máquinas virtuales de escritorio remoto: para sesiones de escritorio remoto y visualización remota.
Nube privada virtual de Google: Google VPC es una versión virtual de una red física para tu proyecto.
Conectividad de Google Cloud: Conectividad de Google Cloud te permite conectar y ampliar redes on‐premise a Google Cloud con alta disponibilidad y baja latencia.
Google Cloud VPN: Google Cloud VPN conecta de forma segura tu red de emparejamiento a una red de nube privada virtual (VPC).
gVNIC un NIC virtual de Google es una tarjeta de interfaz de red virtual (NIC) que ofrece un alto rendimiento y baja latencia entre las máquinas virtuales de computación. gVNIC es una buena opción para las cargas de trabajo de CAE que requieren un alto rendimiento de red.
Google Filestore: Filestore es un servicio de NFS totalmente gestionado que ofrece un alto rendimiento y baja latencia. Filestore es una buena opción para los datos que se comparten o que deben estar visibles en toda la red, como en las aplicaciones o los directorios principales.
Sistemas de archivos paralelos: Google Cloud colabora con varios proveedores de almacenamiento para ofrecer diversos sistemas de archivos en paralelo para cargas de trabajo de HPC. Entre estos partners se incluyen NetApp, DDN EXAScaler, Sycomp Spectrum Scale y Weka.
Servicio de transferencia de Google Storage: el servicio de transferencia de Storage gestionado puede transferir datos de forma rápida y segura entre el almacenamiento de objetos y archivos en Google Cloud, Amazon, Azure, on-premise y más.
Google Cloud Storage: Cloud Storage es un servicio de almacenamiento de objetos escalable y duradero. El almacenamiento en la nube es una buena opción para almacenar grandes cantidades de datos o puede usarse para transferir datos.
Kit de herramientas de HPC de Google Cloud: el kit de herramientas de HPC para Cloud (de código abierto) de Google facilita a clientes y partners el despliegue de entornos de HPC repetibles siguiendo las prácticas recomendadas de Google Cloud. La solución de CAE de Google incluye un esquema del kit de herramientas de HPC que permite crear fácilmente una instancia de un entorno de HPC en Google Cloud listo para ejecutar cargas de trabajo de CAE.
Al ejecutar cargas de trabajo de ingeniería asistida por ordenador (CAE) en la nube, hay que tener en cuenta una serie de factores, incluidos los siguientes:
Como parte de la solución de CAE de Google Cloud, hemos desarrollado una arquitectura y un plano de referencia de CAE de uso general que puedes usar fácilmente con el kit de herramientas de HPC de Cloud de Google para aprovisionar la arquitectura de CAE en Google Cloud. Hemos comprobado la compatibilidad y el rendimiento de varias de las principales aplicaciones de ISV, entre las que se incluyen:
Consulta la sección de comparativas que se incluye más abajo para ver el rendimiento de esos paquetes de software.
El plano general de la arquitectura de referencia de CAE permite a los usuarios crear al instante un entorno en la nube compatible con una amplia gama de aplicaciones y flujos de trabajo de CAE. Es una buena opción para los usuarios que quieren tener flexibilidad a la hora de elegir su software de CAE y gestionar su propio entorno de HPC. También sirve como punto de partida para los integradores de sistemas, ya que aprovechan las prácticas recomendadas de Google para ejecutar simulaciones de CAE en Google Cloud.
Google Cloud también ofrece una serie de planos específicos de aplicaciones para softwares populares de CAE. Estos planos están preconfigurados para proporcionar un rendimiento óptimo para el software de CAE específico. Los softwares con planos específicos incluyen:
Los planos específicos de aplicación son una buena opción para los usuarios que quieren empezar a utilizar CAE de forma rápida y sencilla. Los planos proporcionan un entorno preconfigurado y optimizado para el software CAE específico, por lo que los usuarios no tienen que preocuparse por configurar el entorno por su cuenta.
Google Cloud colabora con varios proveedores de HPC como servicio (como TotalCAE, Rescale, Parallel Works, Eviden Nimbix, Penguin Computing y NAG), y también con proveedores de ISVs de CAE, como Altair. Estos proveedores ofrecen diversas soluciones gestionadas de HPC para CAE, incluidos entornos de software de CAE preconfigurados, compatibilidad con aplicaciones específicas de CAE y servicios de consultoría expertos. Estos productos son una buena opción para los usuarios que quieren una solución de HPC gestionada para CAE. Los proveedores ofrecen numerosos servicios, incluidos entornos de software de CAE preconfigurados, asistencia para aplicaciones de CAE específicas y servicios de consultoría de amplia experiencia.
Aunque la solución CAE se ha desarrollado en Google Compute Engine, también es posible crearla sobre otros frameworks de computación, como Google Kubernetes Engine o Google Batch. Kubernetes Engine es un servicio gestionado de Kubernetes que puede usarse para ejecutar cargas de trabajo de CAE en entornos en contenedores. Kubernetes Engine es una buena opción para las cargas de trabajo de CAE que requieren escalabilidad y portabilidad. Google Batch es un servicio gestionado para ejecutar tareas por lotes. Batch es una buena opción para las cargas de trabajo de CAE que no están en contenedores y no requieren personalización ni ajustes significativos.
Puedes obtener más información sobre cómo diseñar la arquitectura de entornos de HPC en nuestra guía técnica de Cluster Toolkit, que aborda la amplia variedad de opciones de infraestructura (cálculo, red y almacenamiento), software del sistema (programadores y almacenamiento) y aspectos relacionados con la arquitectura.
Hay una serie de prácticas recomendadas que puedes seguir para optimizar el rendimiento de tus cargas de trabajo de CAE en Google Cloud. Por ejemplo, puedes usar políticas de emplazamiento para asegurarte de que tus cargas de trabajo se ejecuten en recursos de computación que estén cerca los unos de los otros, lo que puede reducir la latencia y mejorar el rendimiento. También puedes usar el kit de herramientas de HPC de Cloud para optimizar tus cargas de trabajo.
Nuestra guía "Prácticas recomendadas para ejecutar cargas de trabajo de HPC" documenta cómo mejorar el rendimiento de MPI. Tanto Open MPI como Intel MPI se han diseñado y optimizado para ofrecer el mejor rendimiento de Google Cloud en colaboración con los ingenieros de redes de HPC de Google Cloud.
CAE Environment Blueprint y su máquina virtual H3 se han comparado con las principales aplicaciones de ISV de CAE en sus modelos de referencia estándar.
En el siguiente gráfico se muestra el rendimiento de un solo nodo al ejecutar Altair Radioss 2022.3 en la VM H3 en relación con la VM C2 (toda la VM en cada caso). La velocidad de Altair Radioss con respecto a dos de los puntos de referencia más utilizados (Neon 5CARS y T10M) es 2,6 veces mayor.
En el siguiente gráfico se muestra el rendimiento al ejecutar Ansys Fluent 2022 R2 en la VM H3 en relación con la VM C2 mediante el plano de la solución CAE (VM completa en cada caso). La velocidad con respecto a los puntos de referencia habituales con respecto a Ansys Fluent es de 2,8 veces y demuestra que la plataforma H3 de Google es adecuada para las cargas de trabajo de dinámicas de fluidos computacionales.
En el siguiente gráfico se muestra el rendimiento de un solo nodo al ejecutar Ansys LS-DYNA R9.3.1 en la máquina virtual H3 en relación con la máquina virtual C2 (en cada máquina virtual completa, en cada caso). La velocidad en el punto de referencia para el choque de vehículo a vehículo de Ansys LS-DYNA es de 2,7 veces superior
En el siguiente gráfico se muestra el rendimiento de un solo nodo al ejecutar Ansys Mechanical 2022 R1 en la máquina virtual H3 en relación con la C2 (en cada máquina virtual completa, en cada caso). La velocidad del punto de referencia de V2iter-4 de Ansys Mechanical es de 2,8 veces superior
En el siguiente gráfico se muestra el rendimiento de un solo nodo al ejecutar la versión 7 de OpenFOAM de OpenFOAM Foundation en la máquina virtual H3 en relación con la máquina virtual C2 (en cada máquina virtual completa, en cada caso). La velocidad con respecto a los puntos de referencia habituales de OpenFOAM es de 2,4 veces superior.
En el siguiente gráfico se muestra el rendimiento de un solo nodo al ejecutar Siemens Simcenter STAR-CCM+ 18.02.008 en la máquina virtual H3 en relación con la máquina virtual C2 (en cada máquina virtual completa, en cada caso). La velocidad de los puntos de referencia habituales de Siemens Simcenter STAR-CCM+ es 2,9 veces superior.
En el siguiente gráfico se muestra el fuerte comportamiento de escalado de Ansys Fluent 2022 R2 en el punto de referencia F1 RaceCar (140 m) usando máquinas virtuales H3. Puedes ver un buen escalado de 2 a 16 nodos, con una eficiencia paralela de más del 90 % en 16 nodos (1408 núcleos).
Google Cloud ofrece numerosas ventajas a la hora de ejecutar cargas de trabajo de CAE, entre las que se incluyen:
La infraestructura de computación de alto rendimiento (HPC) de Google Cloud está diseñada para proporcionar un alto rendimiento a las cargas de trabajo de CAE. Las CPUs y GPUs más recientes están disponibles y la infraestructura de red se ha diseñado para ofrecer una latencia baja.
Escalabilidad
La infraestructura de computación de alto rendimiento (HPC) de Google Cloud está diseñada para ser escalable. Las cargas de trabajo de CAE se pueden escalar o reducir verticalmente según sea necesario, y añadir o quitar recursos de forma rápida y sencilla.
Flexibilidad
La infraestructura de computación de alto rendimiento (HPC) de Google Cloud está diseñada para ser flexible. Las cargas de trabajo de CAE se pueden ejecutar con diversas opciones de computación, y hay una gran variedad de opciones de almacenamiento disponibles.
Facilidad de uso
La infraestructura de computación de alto rendimiento (HPC) de Google Cloud está diseñada para ser fácil de usar. Cloud HPC Toolkit proporciona un conjunto de herramientas y bibliotecas que se pueden usar para optimizar las cargas de trabajo de CAE en Google Cloud.
Rentabilidad
La infraestructura de computación de alto rendimiento (HPC) de Google Cloud está diseñada para ser rentable. Hay varias opciones de precios disponibles y las máquinas virtuales de acceso puntual se pueden utilizar para reducir costes.
Google Cloud ofrece una amplia gama de tipos de máquinas, cada uno con diferentes configuraciones de CPU, GPU y memoria. Elegir el tipo de máquina adecuado para tu carga de trabajo puede tener un impacto significativo en el rendimiento y el coste. Por ejemplo, la máquina virtual H3 es una buena opción para las aplicaciones de CAE con licencia por núcleo debido a la gran relación de ancho de banda de memoria y núcleo, y con 4 GB por núcleo, la máquina virtual H3 ofrece suficiente memoria para diversas cargas de trabajo. Para cargas de trabajo especialmente exigentes en cuanto a memoria, como la mecánica estructural, la máquina virtual C3 ofrece 16 GB por núcleo en su configuración de alta memoria.
Google Cloud ofrece varias opciones de almacenamiento, cada una de ellas con un rendimiento y un coste distintos. Elegir la opción de almacenamiento adecuada para tu carga de trabajo puede tener un impacto significativo en el rendimiento y el coste. También hay varios tipos de almacenamiento en un entorno de HPC que se deben tener en cuenta.
Los entornos de HPC habituales alojan al menos dos tipos de almacenamiento con requisitos diferentes: almacenamiento doméstico y almacenamiento temporal. La elección del tipo de almacenamiento para cada opción dependerá de las necesidades específicas de la carga de trabajo de HPC. Por ejemplo, una carga de trabajo que genera una gran cantidad de datos temporales puede requerir una solución de almacenamiento temporal de alto rendimiento, o una carga de trabajo que accede a datos comunes de varios nodos de computación simultáneamente, puede que necesite un sistema de archivos paralelo. La elección del tipo de almacenamiento para una carga de trabajo de HPC concreta dependerá de sus necesidades específicas.
Además del almacenamiento doméstico y temporal, los entornos de HPC también pueden usar otros tipos de almacenamiento, como el almacenamiento de archivos, que se utiliza para almacenar datos a los que no se accede con frecuencia. Cloud Storage puede proporcionar el almacenamiento de archivos de la forma más rentable.
Almacenamiento doméstico
El almacenamiento doméstico se suele utilizar para almacenar archivos compartidos de los usuarios, sobre todo en el directorio "/home", como configuraciones, secuencias de comandos y datos posteriores al procesamiento. Este almacenamiento se montará en el mismo lugar del clúster para que todos tengan acceso al espacio de nombres. El almacenamiento doméstico suele ser persistente. El almacenamiento doméstico se suele basar en el protocolo NFS.
En los entornos de HPC de Google Cloud, servicios de Google como Filestore u otros partners como NetApp pueden proporcionar almacenamiento doméstico.
Almacenamiento temporal
El almacenamiento temporal se suele utilizar para almacenar archivos temporales, como resultados intermedios y datos de salida de simulación. Se pueden compartir o no entre nodos diferentes en el entorno de HPC. El almacenamiento temporal no suele ser persistente. El almacenamiento temporal se suele crear en sistemas de almacenamiento de mayor rendimiento que el almacenamiento doméstico, como el almacenamiento flash local o los sistemas de archivos paralelos.
En los entornos de HPC de Google Cloud, el almacenamiento temporal lo pueden proporcionar servicios de Google como Persistent Disk, SSD local, Cloud Filestore o Parallelstore, o bien mediante soluciones de partners como NetApp, DDN EXAScaler, Sycomp y Weka.
Máquinas virtuales de acceso puntual
Las máquinas virtuales de acceso puntual pueden ser una forma rentable de ejecutar cargas de trabajo de CAE. Las máquinas virtuales de acceso puntual están disponibles a un precio rebajado, pero pueden cancelarse en cualquier momento con un breve periodo de antelación. Las máquinas virtuales de acceso puntual tienen hasta un 91 % de descuento sobre el coste de una instancia estándar y admiten el tipo de funciones que los usuarios de HPC esperan, como GPUs y SSDs locales.
Si su flujo de trabajo puede tolerar las posibilidades de interrupción (interrupción temporal), es recomendable probar el modelo de Spot si la aplicación puede ejecutarse en un periodo relativamente corto (menos de 4 horas). Los clientes han observado que gracias al ahorro de costes de hasta el 90 % en comparación con el modelo bajo demanda, ahorran lo suficiente como para tolerar pequeñas interrupciones.
Ten en cuenta que algunos tipos de máquina virtual, como H3, no son compatibles con Spot.
AirShaper es una plataforma aerodinámica online que permite a diseñadores e ingenieros ejecutar simulaciones de flujo de aire completamente automatizadas para que los usuarios sin conocimientos aerodinámicos puedan obtener resultados fiables y mejorar su diseño.
AirShaper migró sus cargas de trabajo de HPC Computational Fluid Dynamics (CFD) a la nueva familia de máquinas virtuales C2D desde una plataforma de máquinas virtuales más antigua. Esto le permitió ahorrar tiempo de simulación y coste por ejecución de carga de trabajo en comparación con su entorno en la nube anterior. Además, el tiempo de obtención de los resultados aumentó drásticamente en comparación con el entorno on-premise.
"En AirShaper ofrecemos simulaciones de CFD a un coste fijo. El aumento de los núcleos más rápidos suele implicar un coste general más alto, en parte debido a problemas de escalado. Pero con H3 podemos reducir a la mitad los tiempos de simulación al tiempo que reducimos el coste general."
- Wouter Remmerie, CEO de AirShaper
Reducción de los costes de casi un 50 % | En comparación con las instancias on-premise, han sido capaces de reducir los tiempos de simulación en más de un factor de tres. | Los tiempos de simulación se redujeron en un 30 % en comparación con las instancias de computación de alto rendimiento de la generación anterior |
Reducción de los costes de casi un 50 %
En comparación con las instancias on-premise, han sido capaces de reducir los tiempos de simulación en más de un factor de tres.
Los tiempos de simulación se redujeron en un 30 % en comparación con las instancias de computación de alto rendimiento de la generación anterior
Altair es una empresa tecnológica internacional que ofrece soluciones de software y de nube en las áreas de desarrollo de productos, computación de alto rendimiento (HPC) y análisis de datos. Ingenieros, científicos y analistas de datos utilizan el software de Altair para solucionar problemas complejos en una amplia gama de sectores, como la automoción, la aeroespacial, la fabricación y la energía.
Altair es un Google Cloud Partner y su software está disponible en Google Cloud. El software de Altair está optimizado para Google Cloud y puedes usarlo para aprovechar el rendimiento, la escalabilidad y la flexibilidad de Google Cloud. Altair se compromete a ayudar a los clientes a conseguir sus objetivos de HPC y ofrece una amplia gama de soluciones de software para HPC. Una de ellas es Radioss, una herramienta de análisis de elementos finitos. Altair ha podido demostrar mejoras significativas en el tiempo de ejecución de radios basado en la nube con la nueva máquina virtual H3.
"En Altair, estamos encantados de que las pruebas iniciales indiquen una reducción de hasta 3 veces en el tiempo de ejecución de las simulaciones de cargas de trabajo de Radioss que se ejecutan en H3 en comparación con C2. Estos tiempos de ejecución en Google Cloud, significativamente más rápidos, ayudarán a aumentar la productividad de los ingenieros de nuestros clientes conjuntos".
- Eric Lequiniou, vicepresidente sénior de Desarrollo de Radios y Altair Solver
TotalCAE es uno de los principales proveedores de soluciones de HPC gestionadas para aplicaciones científicas y de ingeniería. Las soluciones de TotalCAE están diseñadas para ser fáciles de usar y para ayudar a los clientes a obtener resultados más rápidamente, reducir costes y mejorar la productividad. Clientes de todo el mundo usan las soluciones de TotalCAE para resolver problemas científicos y de ingeniería complejos. Por ejemplo, las soluciones de TotalCAE se utilizan para diseñar y simular aviones, coches y otros vehículos; para analizar el rendimiento de edificios y puentes; y desarrollar nuevos medicamentos y tratamientos.
TotalCAE es un Google Cloud Partner y sus soluciones permiten operar en Google Cloud. Las soluciones de TotalCAE están optimizadas para Google Cloud y pueden usarse para aprovechar el rendimiento, la escalabilidad y la flexibilidad de Google Cloud. Gracias a la infraestructura de HPC de Google Cloud, TotalCAE ha podido ofrecer a sus clientes un mejor rendimiento a un coste menor.
"Gracias a las instancias H3 de Google Cloud, hemos observado un aumento de hasta el 25 % en el rendimiento por núcleo de las cargas de trabajo de CAE a un coste de trabajo un 50 % inferior al de las de C2. De esta forma, TotalCAE ha podido ofrecer a los clientes un rendimiento de precio 2,5 veces superior y escalabilidad para las cargas de trabajo de CAE en Google Cloud".
- Rodney Mach, CEO de TotalCAE
Hay mucho más que aprender sobre las cargas de trabajo de HPC y CAE en Google Cloud. Ponte en contacto con nosotros si te interesa hablar con un miembro del equipo de HPC de Google o si quieres empezar a usar Google Cloud. Hasta entonces, sigue con todos nuestros recursos para continuar aprendiendo.
Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.