La progettazione assistita da computer (CAE) comprende una vasta gamma di applicazioni tra cui analisi strutturale, dinamica dei fluidi, sicurezza degli incidenti e analisi termica, per citarne alcune. Tutti questi casi d'uso richiedono risorse di calcolo significative per gestire le complesse simulazioni fisiche del caso, nonché dati di input e di output potenzialmente molto grandi. In questa guida di riferimento tecnica descriviamo come utilizzare Google Cloud per accelerare i flussi di lavoro CAE fornendo risorse di computing ad alte prestazioni (HPC).
La piattaforma HPC di Google Cloud è una soluzione potente e scalabile per i flussi di lavoro CAE più complessi. Combina le prestazioni dei sistemi HPC tradizionali con i vantaggi di un cloud resiliente, flessibile e su scala globale:
Per semplificare l'utilizzo di Google Cloud con i flussi di lavoro CAE, abbiamo assemblato i componenti cloud giusti per soddisfare i requisiti dei carichi di lavoro CAE ad alta intensità di calcolo. Nello specifico, l'architettura della nostra soluzione CAE si basa sulle famiglie di VM H3 e C3 di Google Cloud, che si avvalgono della più recente piattaforma Intel Xeon. Queste famiglie di VM offrono un'elevata larghezza di banda di memoria per un rapporto memoria/flop bilanciato, ideale per la progettazione CAE. La soluzione è in grado di soddisfare applicazioni MPI ad alto accoppiamento e carichi di lavoro che richiedono molta memoria, con un massimo di 16 GB per core. Include varie opzioni di archiviazione che soddisfano un’ampia gamma di requisiti di I/O. Per la gestione delle risorse, supporta programmi di pianificazione come Slurm di SchedMD e PBS Professional di Altair.
Il seguente diagramma dell'architettura illustra la soluzione:
L'architettura della soluzione CAE è composta da diversi componenti chiave, tra cui computing, networking, archiviazione e il toolkit open source Cloud HPC di Google.
La soluzione CAE si basa su Google Compute Engine. Compute Engine offre vari tipi di macchina, inclusi tipi di macchine con GPU. Compute Engine è una buona scelta per i carichi di lavoro CAE che richiedono prestazioni e flessibilità elevate per via dei tipi di VM specializzate e del networking ad alte prestazioni:
VM H3: una partizione bilanciata adatta ai carichi di lavoro CAE viene creata dalla VM HPC di Google utilizzando la più recente tecnologia Intel Sapphire Rapids con 4 GB/core e fino a migliaia di core (tramite MPI).
VM C3: una partizione con memoria elevata ideale per carichi di lavoro CAE che richiedono molta memoria viene creata dalla VM C3 di Google utilizzando l'ultima generazione di Sapphire Rapids di Intel con 16 GB/core.
Criteri di posizionamento: i criteri di posizionamento assicurano che le VM vengano create molto vicine tra loro, riducendo la latenza di comunicazione tra le VM e migliorando le prestazioni complessive.
Immagine VM HPC: per prestazioni ottimali, forniamo immagini VM HPC che configurano distribuzioni di sistemi operativi Linux standard per prestazioni ottimali su Google Cloud.
VM per uso generico: per nodi di accesso, server di licenze e attività varie.
VM su computer remoto per sessioni da computer remoto e visualizzazione remota.
Google Virtual Private Cloud: Google VPC è una versione virtuale di una rete fisica per il progetto.
Connettività di Google Cloud: la connettività di Google Cloud consente di connettere ed estendere le reti on-premise su Google Cloud con alta disponibilità e bassa latenza.
Google Cloud VPN: Google Cloud VPN connette in modo sicuro la rete peer a una rete Virtual Private Cloud (VPC).
gVNIC: Google Virtual NIC è una scheda di interfaccia di rete (NIC) virtuale che offre prestazioni elevate e bassa latenza tra le VM di computing. gVNIC è una buona scelta per i carichi di lavoro CAE che richiedono prestazioni di rete elevate.
Google Filestore: Filestore è un servizio NFS completamente gestito che offre prestazioni elevate e bassa latenza. Filestore è una buona scelta per i dati condivisi o che devono essere visibili sulla rete, come applicazioni o home directory.
File system paralleli: Google Cloud collabora con diversi fornitori di servizi di archiviazione per offrire vari file system paralleli per i carichi di lavoro HPC. Tra questi partner figurano NetApp, DDN EXAScaler, Sycomp Spectrum Scale e Weka.
Google Storage Transfer Service: Storage Transfer Service è un servizio gestito che consente di trasferire in modo rapido e sicuro i dati tra l'archiviazione di oggetti e file su Google Cloud, Amazon, Azure, on-premise e altri servizi.
Google Cloud Storage: Cloud Storage è un servizio di archiviazione di oggetti scalabile e durevole. Cloud Storage è una buona scelta per archiviare grandi quantità di dati o per il trasferimento di dati.
Toolkit Google Cloud HPC: il toolkit open source Cloud HPC di Google consente a clienti e partner di eseguire facilmente il deployment di ambienti HPC pronti all'uso ripetibili seguendo le best practice HPC di Google Cloud. La soluzione CAE di Google include un progetto del toolkit HPC che consente di creare facilmente un'istanza di un ambiente HPC in Google Cloud, pronto per eseguire carichi di lavoro CAE.
Quando si eseguono carichi di lavoro CAE nel cloud, occorre considerare una serie di fattori, tra cui:
Nell'ambito della soluzione CAE di Google Cloud, abbiamo sviluppato un'architettura di riferimento e un progetto CAE per uso generico che possono essere facilmente utilizzati con il toolkit Cloud HPC di Google per eseguire il provisioning dell'architettura CAE in Google Cloud. Abbiamo verificato la compatibilità e le prestazioni di diverse applicazioni ISV leader del settore, tra cui:
Per le prestazioni di questi pacchetti software, consulta la sezione seguente sui benchmark.
Il progetto base dell'architettura di riferimento CAE per uso generico consente agli utenti di creare istantaneamente un ambiente cloud compatibile con un'ampia gamma di applicazioni e flussi di lavoro CAE. È una buona opzione per gli utenti che vogliono avere flessibilità nella scelta del proprio software CAE e che vogliono gestire il proprio ambiente HPC. È anche un punto di partenza per gli integratori di sistemi, grazie alle best practice di Google per l'esecuzione di simulazioni CAE su Google Cloud.
Google Cloud offre anche una serie di progetti specifici per le applicazioni per i software CAE più diffusi. Questi progetti sono preconfigurati in modo da fornire prestazioni ottimali per il software CAE specifico. I software con progetti specifici includono:
I progetti specifici per l'applicazione sono una buona opzione per gli utenti che vogliono iniziare a utilizzare la progettazione CAE in modo facile e veloce. I progetti forniscono un ambiente preconfigurato che è ottimizzato per lo specifico software CAE, in modo che gli utenti non debbano preoccuparsi di configurare l'ambiente da soli.
Google Cloud collabora con una serie di provider HPC-as-a-Service, tra cui TotalCAE, Rescale, Parallel Works, Eviden Nimbix, Penguin Computing e NAG, oltre a fornitori CAE ISV come Altair. Questi provider offrono una varietà di soluzioni HPC gestite per CAE, tra cui ambienti software CAE preconfigurati, supporto per applicazioni CAE specifiche e servizi di consulenza da parte di esperti. Queste offerte sono una buona opzione per gli utenti che vogliono una soluzione HPC gestita per la progettazione CAE. I provider offrono una vasta gamma di servizi tra cui ambienti software CAE preconfigurati, supporto per applicazioni CAE specifiche e servizi di consulenza da parte di esperti.
Sebbene la soluzione CAE si basi su Google Compute Engine, è possibile anche utilizzarla su altri framework di computing, come Google Kubernetes Engine o Google Batch. Kubernetes Engine è un servizio Kubernetes gestito che può essere utilizzato per eseguire carichi di lavoro CAE in un ambiente containerizzato. Kubernetes Engine è una buona scelta per i carichi di lavoro CAE che richiedono scalabilità e portabilità. Google Batch è un servizio gestito per l'esecuzione dei job batch. È una buona scelta per i carichi di lavoro CAE che non sono containerizzati e che non richiedono personalizzazioni o ottimizzazioni significative.
Per saperne di più sulla progettazione di ambienti HPC, consulta la nostra guida tecnica su Cluster Toolkit, che illustra l'ampia gamma di opzioni a livello di infrastruttura (computing, rete, archiviazione), software di sistema (scheduler, archiviazione) e considerazioni sull'architettura.
Esistono varie best practice che puoi seguire al fine di ottimizzare le prestazioni dei carichi di lavoro CAE su Google Cloud. Ad esempio, puoi utilizzare i criteri di posizionamento per assicurarti che i carichi di lavoro siano posizionati su risorse di computing vicine tra loro, il che può ridurre la latenza e migliorare le prestazioni. Puoi anche utilizzare il toolkit Cloud HPC per ottimizzare i carichi di lavoro.
La nostra guida sulle best practice per l'esecuzione di carichi di lavoro HPC spiega come migliorare le prestazioni MPI. Sia Open MPI che Intel MPI sono stati perfezionati e ottimizzati per offrire fin da subito le prestazioni di Google Cloud, grazie alla collaborazione dei networking engineer HPC di Google Cloud.
Il progetto generico per l'ambiente CAE e la rispettiva VM H3 sono stati confrontati per le principali applicazioni ISV CAE in base a modelli di benchmark standard.
Il grafico seguente mostra le prestazioni del singolo nodo nell'esecuzione di Altair Radioss 2022.3 sulla VM H3 rispetto alla VM C2 (l'intera VM in ciascun caso). L'accelerazione rispetto a due benchmark di uso comune (Neon 5CARS e T10M) per Altair Radioss è 2,6 volte.
Il grafico seguente mostra le prestazioni durante l'esecuzione di Ansys Fluent 2022 R2 sulla VM H3 rispetto alla VM C2 utilizzando il progetto della soluzione CAE (l'intera VM in ciascun caso). L'accelerazione rispetto ai benchmark di uso comune per Ansys Fluent è 2,8 volte e dimostra che la piattaforma Google H3 è molto adatta per carichi di lavoro di dinamica dei fluidi computazionale.
Il seguente grafico mostra le prestazioni del singolo nodo nell'esecuzione di Ansys LS-DYNA R9.3.1 sulla VM H3 rispetto alla VM C2 (l'intera VM in ciascun caso). L’accelerazione per il benchmark degli arresti anomali car2car per Ansys LS-DYNA è 2,7 volte
Il grafico seguente mostra le prestazioni del singolo nodo nell'esecuzione di Ansys Mechanical 2022 R1 sulla VM H3 rispetto alla VM C2 (l'intera VM in ciascun caso). L'accelerazione per il benchmark V2iter-4 per Ansys Mechanical è 2,8 volte
Il grafico seguente mostra le prestazioni del singolo nodo nell'esecuzione di OpenFOAM v7 di OpenFOAM Foundation sulla VM H3 rispetto alla VM C2 (l'intera VM in ciascun caso). L'accelerazione rispetto ai benchmark comunemente utilizzati per OpenFOAM è 2,4 volte.
Il grafico seguente mostra le prestazioni del singolo nodo nell'esecuzione di Siemens Simcenter STAR-CCM+ 18.02.008 sulla VM H3 rispetto alla VM C2 (l'intera VM in ciascun caso). L'accelerazione rispetto ai benchmark comunemente utilizzati per Siemens Simcenter STAR-CCM+ è 2,9 volte.
Il seguente grafico mostra il comportamento di elevata scalabilità di Ansys Fluent 2022 R2 sul benchmark F1 RaceCar (140m) utilizzando VM H3. Puoi vedere una buona scalabilità da 2 a 16 nodi, con un'efficienza parallela superiore al 90% su 16 nodi (1408 core).
Google Cloud offre una serie di vantaggi per l'esecuzione dei carichi di lavoro CAE, tra cui:
L'infrastruttura HPC di Google Cloud è progettata per fornire alte prestazioni per i carichi di lavoro CAE. Sono disponibili CPU, anche quelle più recenti, e l'infrastruttura di rete è progettata per fornire bassa latenza.
Scalabilità
L'infrastruttura HPC di Google Cloud è progettata per essere scalabile. È possibile fare lo scale up o lo scale down dei carichi di lavoro CAE in base alle esigenze e aggiungere o rimuovere risorse in modo semplice e veloce.
Flessibilità
L'infrastruttura HPC di Google Cloud è progettata per essere flessibile. I carichi di lavoro CAE possono essere eseguiti su una varietà di opzioni di computing e sono disponibili diverse opzioni di archiviazione.
Facilità di utilizzo
L'infrastruttura HPC di Google Cloud è progettata per essere facile da usare. Cloud HPC Toolkit fornisce una serie di strumenti e librerie che possono essere utilizzati per ottimizzare i carichi di lavoro CAE su Google Cloud.
Convenienza
L'infrastruttura HPC di Google Cloud è progettata per essere conveniente. È disponibile un'ampia gamma di opzioni di prezzo e le VM spot possono essere utilizzate per ridurre i costi.
Google Cloud offre un'ampia gamma di tipi di macchina, ognuno con configurazioni di CPU, GPU e memoria diverse. La scelta del tipo di macchina giusto per il tuo carico di lavoro può avere un impatto significativo sulle prestazioni e sui costi. Ad esempio, la VM H3 è una buona scelta per le applicazioni CAE con licenza per core grazie all'elevato rapporto larghezza di banda di memoria/core e con 4 GB/core la VM H3 fornisce memoria sufficiente per carichi di lavoro diversi. Per carichi di lavoro che richiedono molta memoria, come la meccanica strutturale, la VM C3 nella sua configurazione con memoria elevata fornisce 16 GB/core.
Google Cloud offre una varietà di opzioni di archiviazione, ognuna con caratteristiche diverse in termini di prestazioni e costi. La scelta dell'opzione di archiviazione giusta per il tuo carico di lavoro può avere un impatto significativo su prestazioni e costi. In un ambiente HPC esistono anche diversi tipi di archiviazione da considerare.
Gli ambienti HPC tipici ospitano almeno due tipi di archiviazione con requisiti diversi: archiviazione locale e archiviazione temporanea. La scelta del tipo di archiviazione dipende dalle esigenze specifiche del carico di lavoro HPC. Ad esempio, un carico di lavoro che genera una grande quantità di dati temporanei potrebbe richiedere una soluzione di archiviazione temporanea ad alte prestazioni oppure un carico di lavoro che accede ai dati comuni su più nodi di computing contemporaneamente potrebbe richiedere un file system parallelo. La scelta del tipo di archiviazione per un particolare carico di lavoro HPC dipende dalle esigenze specifiche del carico di lavoro.
Oltre all'archiviazione locale e all'archiviazione temporanea, gli ambienti HPC possono utilizzare anche altri tipi di archiviazione, come l'archiviazione ad accesso sporadico, che viene utilizzato per archiviare dati a cui non si accede di frequente. L'archiviazione ad accesso sporadico può essere fornita in modo più conveniente da Cloud Storage.
Archiviazione locale
L'archiviazione locale viene generalmente utilizzata per archiviare file utente condivisi, principalmente nella directory "/home", ad esempio configurazioni, script e dati di post-elaborazione. Questo tipo di archiviazione verrà montato nella stessa posizione nel cluster per consentire l'accesso comune a questo spazio dei nomi. In genere, l'archiviazione locale è permanente e si basa sul protocollo NFS.
In un ambiente Google Cloud HPC, l'archiviazione locale può essere fornita da servizi Google come Filestore o da offerte di partner come NetApp.
Archiviazione temporanea
L'archiviazione temporanea viene in genere utilizzata per archiviare file temporanei, come risultati intermedi e dati di output delle simulazioni. Possono essere condivisi o non condivisi tra nodi diversi nell'ambiente HPC. L'archiviazione temporanea in genere non è permanente. L'archiviazione temporanea si basa in genere su sistemi di archiviazione con prestazioni più elevate rispetto all'archiviazione locale, come l'archiviazione Flash locale o i file system paralleli.
In un ambiente Google Cloud HPC, l'archiviazione temporanea può essere fornita da servizi Google come Persistent Disk, SSD locale, Cloud Filestore o Parallelstore, oppure tramite offerte di partner come NetApp, DDN EXAScaler, Sycomp e Weka.
VM spot
Le VM spot possono essere un modo conveniente per eseguire i carichi di lavoro CAE. Le VM spot sono disponibili a un prezzo scontato, ma possono essere terminate in qualsiasi momento con un breve periodo di preavviso. Le VM spot hanno uno sconto fino al 91% sul costo di un'istanza standard e supportano il tipo di funzionalità che gli utenti HPC si aspettano, tra cui GPU e SSD locali.
Se il tuo flusso di lavoro può tollerare la possibilità di interruzione (prerilascio), è consigliabile testare il modello Spot se l'applicazione può essere eseguita in un periodo di tempo relativamente breve (meno di 4 ore). I clienti hanno scoperto che il risparmio sui costi fino al 90% rispetto a quelli on demand consente loro di tollerare lievi interruzioni.
Tieni presente che alcuni tipi di VM, come H3, non supportano Spot.
AirShaper è una piattaforma di aerodinamica online che consente a designer e ingegneri di eseguire simulazioni del flusso d'aria in modo completamente automatizzato, consentendo agli utenti senza esperienza di aerodinamica di ottenere risultati affidabili e migliorare il proprio design.
AirShaper ha migrato i propri carichi di lavoro di Computational Fluid Dynamics (CFD) HPC alla nuova famiglia di VM C2D da una piattaforma VM precedente, risparmiando tempo di simulazione e costi per esecuzione del carico di lavoro rispetto al precedente ambiente cloud e migliorando notevolmente i tempi di raggiungimento dei risultati rispetto al proprio ambiente on-premise.
"In AirShaper offriamo simulazioni CFD a un costo fisso. Un numero maggiore di core più veloci di solito significa un costo complessivo più elevato, in parte a causa di problemi di scalabilità. Con H3, invece, possiamo dimezzare i tempi di simulazione e, allo stesso tempo, ridurre il costo complessivo."
- Wouter Remmerie, CEO, Airshaper
Costi ridotti quasi del 50% | Rispetto alle istanze on-prem, sono stati in grado di ridurre i tempi di simulazione di oltre tre volte | Tempi di simulazione ridotti del 30% rispetto alle istanze di computing ad alte prestazioni della generazione precedente |
Costi ridotti quasi del 50%
Rispetto alle istanze on-prem, sono stati in grado di ridurre i tempi di simulazione di oltre tre volte
Tempi di simulazione ridotti del 30% rispetto alle istanze di computing ad alte prestazioni della generazione precedente
Altair è una società tecnologica globale che fornisce soluzioni software e cloud nei settori dello sviluppo dei prodotti, del computing ad alte prestazioni (HPC) e dell'analisi dei dati. Il software di Altair viene utilizzato da tecnici, scienziati e analisti di dati per risolvere problemi complessi in un'ampia gamma di settori, tra cui quello automobilistico, aerospaziale, manifatturiero ed energetico.
Altair è partner di Google Cloud e il suo software è disponibile su Google Cloud. Il software di Altair è ottimizzato per Google Cloud e può essere utilizzato per sfruttare le prestazioni, la scalabilità e la flessibilità di Google Cloud. Altair si impegna ad aiutare i clienti a raggiungere i loro obiettivi HPC e offre un'ampia gamma di soluzioni software per l'HPC. Uno di questi è Radioss, uno strumento di analisi di elementi finiti. Altair ha potuto dimostrare miglioramenti significativi nel tempo di esecuzione di Radioss basato su cloud con la nuova VM H3.
"In Altair, siamo entusiasti del fatto che i test iniziali indicano una riduzione fino a 3 volte del tempo di esecuzione della simulazione per i carichi di lavoro Radioss eseguiti su H3 rispetto a C2. Questi tempi di esecuzione significativamente più rapidi su Google Cloud contribuiranno ad aumentare la produttività nella progettazione per i nostri clienti comuni."
- Eric Lequiniou, Senior Vice President, Radioss Development e Altair Solver
TotalCAE è un provider leader di soluzioni HPC gestite per applicazioni ingegneristiche e scientifiche. Le soluzioni di TotalCAE sono progettate per essere facili da usare e per aiutare i clienti ad accelerare la realizzazione di risultati, ridurre i costi e migliorare la produttività. Le soluzioni di TotalCAE sono utilizzate dai clienti di tutto il mondo per risolvere complessi problemi ingegneristici e scientifici. Ad esempio, le soluzioni di TotalCAE vengono utilizzate per progettare e simulare aerei, automobili e altri veicoli, per analizzare le prestazioni di edifici e ponti e per sviluppare nuovi farmaci e terapie.
TotalCAE è un partner Google Cloud e le sue soluzioni supportano il funzionamento su Google Cloud. Le soluzioni di TotalCAE sono ottimizzate per Google Cloud e possono essere utilizzate per sfruttare le prestazioni, la scalabilità e la flessibilità di Google Cloud. Utilizzando l'infrastruttura HPC di Google Cloud, TotalCAE ha potuto offrire ai propri clienti prestazioni migliori a un costo inferiore.
"Con le istanze H3 di Google Cloud, abbiamo registrato un aumento delle prestazioni per core fino al 25% per i carichi di lavoro CAE con un costo del job inferiore del 50% rispetto a C2, consentendo a TotalCAE di offrire ai clienti prestazioni del prezzo fino a 2,5 volte superiori e scalabilità per i carichi di lavoro CAE su Google Cloud."
- Rodney Mach, CEO, TotalCAE
C'è molto da imparare sui carichi di lavoro HPC e CAE su Google Cloud. Contattaci se vuoi parlare con un membro del team Google HPC o se vuoi iniziare a utilizzare Google Cloud. Fino ad allora, segui tutte le nostre risorse per continuare ad apprendere!
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.