Computer-aided engineering (CAE) mencakup berbagai aplikasi, beberapa diantaranya termasuk analisis struktural, dinamika fluida, keselamatan tabrakan, dan analisis termal. Semua kasus penggunaan tersebut memerlukan resource komputasi yang signifikan untuk menangani simulasi kompleks fisika yang terlibat serta data input dan output yang cenderung besar. Dalam panduan referensi teknis ini, kami menjelaskan cara memanfaatkan Google Cloud untuk mempercepat alur kerja CAE dengan menyediakan resource komputasi berperforma tinggi (HPC).
Platform HPC Google Cloud menyediakan platform yang andal dan skalabel untuk alur kerja CAE yang menuntut. Solusi ini menggabungkan performa sistem HPC tradisional dengan keunggulan cloud berskala global yang elastis dan fleksibel:
Guna menyederhanakan penggunaan alur kerja Google Cloud untuk CAE, kami telah menyusun komponen cloud yang tepat untuk memenuhi persyaratan workload CAE dengan komputasi yang intensif. Secara khusus, solusi CAE kami dirancang berdasarkan kelompok VM H3 dan C3 Google Cloud, berdasarkan platform Intel Xeon terbaru. Kelompok VM ini menyediakan bandwidth memori tinggi untuk rasio memori/flop seimbang, yang cocok untuk CAE. Solusi ini mengakomodasi aplikasi MPI yang terkait erat serta beban kerja yang membutuhkan memori hingga 16 GB/core. Layanan ini mencakup berbagai opsi penyimpanan yang memenuhi berbagai persyaratan IO. Untuk pengelolaan resource, alat ini mendukung penjadwal seperti Slurm dari SchedMD dan PBS Professional dari Altair.
Diagram arsitektur berikut mengilustrasikan solusinya:
Arsitektur solusi CAE terdiri atas beberapa komponen utama, termasuk komputasi, jaringan, penyimpanan, dan Cloud HPC Toolkit open source Google.
Solusi CAE dibangun di Google Compute Engine. Compute Engine menawarkan berbagai jenis mesin, termasuk jenis mesin dengan GPU. Compute Engine adalah pilihan tepat untuk workload CAE yang memerlukan performa dan fleksibilitas tinggi, karena jenis VM khusus dan jaringannya yang berperforma tinggi:
VM H3: Partisi seimbang yang sangat cocok untuk workload CAE dibangun dari VM HPC Google menggunakan Sapphire Rapids terbaru Intel dengan 4 GB/core dan hingga ribuan core (melalui MPI).
VM C3: Partisi bermemori tinggi yang sangat cocok untuk workload CAE intensif memori yang dibangun dari VM C3 Google menggunakan generasi Sapphire Rapids terbaru dari Intel dengan 16 GB/core.
Kebijakan Penempatan: Kebijakan penempatan memastikan VM dibuat berdekatan satu sama lain, sehingga mengurangi latensi komunikasi antar-VM dan meningkatkan performa secara keseluruhan.
Image VM HPC: Untuk performa optimal, kami menyediakan image VM HPC yang mengonfigurasi distribusi sistem operasi Linux standar untuk performa yang optimal di Google Cloud.
VM tujuan umum: untuk node login, server lisensi, dan tugas lain-lain.
VM desktop jarak jauh - untuk sesi desktop jarak jauh dan visualisasi jarak jauh.
Virtual Private Cloud Google: VPC Google adalah versi virtual jaringan fisik untuk project Anda.
Konektivitas Google Cloud: Konektivitas Google Cloud memungkinkan Anda menghubungkan dan memperluas jaringan lokal ke Google Cloud dengan ketersediaan tinggi dan latensi rendah.
VPN Google Cloud: VPN Google Cloud menghubungkan jaringan peer Anda dengan aman ke jaringan Virtual Private Cloud (VPC).
gVNIC: NIC Virtual Google adalah kartu antarmuka jaringan virtual (NIC) yang menawarkan performa tinggi dan latensi rendah di antara VM komputasi. gVNIC adalah pilihan tepat untuk workload CAE yang memerlukan performa jaringan tinggi.
Google Filestore: Filestore adalah layanan NFS terkelola sepenuhnya yang menawarkan performa tinggi dan latensi rendah. Filestore adalah pilihan tepat untuk data yang dibagikan atau perlu terlihat di seluruh jaringan, seperti aplikasi atau direktori beranda.
Sistem File Paralel: Google Cloud berpartner dengan sejumlah vendor penyimpanan untuk menawarkan berbagai sistem file paralel untuk workload HPC. Partner ini mencakup NetApp, DDN EXAScaler, Sycomp Spectrum Scale, dan Weka.
Google Storage Transfer Service: Storage Transfer Service yang terkelola dapat mentransfer data dengan cepat dan aman antara penyimpanan objek dan file di Google Cloud, Amazon, Azure, infrastruktur lokal, dan lainnya.
Google Cloud Storage: Cloud Storage adalah layanan penyimpanan objek yang skalabel dan tahan lama. Cloud Storage adalah pilihan tepat untuk menyimpan data dalam jumlah besar atau dapat digunakan untuk transfer data.
Google Cloud HPC Toolkit - Cloud HPC Toolkit open source Google memudahkan pelanggan dan partner dalam men-deploy lingkungan HPC turnkey berulang dengan mengikuti praktik terbaik HPC Google Cloud. Solusi CAE Google dilengkapi dengan blueprint HPC Toolkit yang memungkinkan Anda membuat instance lingkungan HPC dengan mudah di Google Cloud, dan siap menjalankan workload CAE.
Saat menjalankan workload CAE di cloud, ada sejumlah faktor yang perlu dipertimbangkan, termasuk:
Sebagai bagian dari solusi CAE Google Cloud, kami mengembangkan blueprint dan arsitektur referensi CAE tujuan umum, yang dapat digunakan bersama Cloud HPC Toolkit Google untuk menyediakan arsitektur CAE di Google Cloud. Kami telah memverifikasi kompatibilitas dan performa beberapa aplikasi ISV terkemuka, termasuk:
Lihat bagian benchmark di bawah untuk mengetahui performa paket software tersebut.
Blueprint Arsitektur Referensi CAE tujuan umum memungkinkan pengguna untuk secara instan memunculkan lingkungan cloud yang kompatibel dengan berbagai aplikasi dan alur kerja CAE. Opsi ini bagus bagi pengguna yang ingin memiliki fleksibilitas dalam memilih software CAE dan ingin mengelola lingkungan HPC mereka sendiri. Ini juga berfungsi sebagai titik awal bagi integrator sistem, yang memanfaatkan praktik terbaik Google untuk menjalankan simulasi CAE di Google Cloud.
Google Cloud juga menawarkan sejumlah blueprint khusus aplikasi untuk software CAE populer. Blueprint ini telah dikonfigurasi sebelumnya untuk memberikan performa optimal untuk software CAE tertentu. Perangkat lunak dengan blueprint tertentu meliputi:
Blueprint khusus aplikasi adalah opsi yang bagus bagi pengguna yang ingin memulai CAE dengan cepat dan mudah. Blueprint menyediakan lingkungan yang telah dikonfigurasi sebelumnya dan dioptimalkan untuk software CAE tertentu, sehingga pengguna tidak harus mengonfigurasi lingkungan tersebut sendiri.
Google Cloud berpartner dengan sejumlah penyedia HPC-as-a-Service, seperti TotalCAE, Rescale, Parallel Works, Eviden Nimbix, Penguin Computing, dan NAG, serta dengan vendor CAE ISV seperti Altair. Penyedia ini menawarkan berbagai solusi HPC terkelola untuk CAE, termasuk lingkungan software CAE yang telah dikonfigurasi sebelumnya, dukungan untuk aplikasi CAE tertentu, dan layanan konsultasi pakar. Penawaran ini merupakan opsi yang bagus bagi pengguna yang menginginkan solusi HPC terkelola untuk CAE. Penyedia menawarkan berbagai layanan, termasuk lingkungan software CAE yang telah dikonfigurasi sebelumnya, dukungan untuk aplikasi CAE tertentu, dan layanan konsultasi pakar.
Meskipun solusi CAE dibuat di Google Compute Engine, solusi ini juga dapat dibangun di atas framework komputasi lain, seperti Google Kubernetes Engine atau Google Batch. Kubernetes Engine adalah layanan Kubernetes terkelola yang dapat digunakan untuk menjalankan beban kerja CAE di lingkungan dalam container. Kubernetes Engine adalah pilihan tepat untuk beban kerja CAE yang memerlukan skalabilitas dan portabilitas. Batch: Batch merupakan layanan terkelola untuk menjalankan tugas batch. Batch adalah pilihan tepat untuk workload CAE yang tidak berada dalam container, dan tidak memerlukan penyesuaian atau penyesuaian yang signifikan.
Anda dapat membaca lebih lanjut cara merancang lingkungan HPC di panduan teknis kami tentang Cluster Toolkit, yang mencakup beragam opsi dalam infrastruktur (komputasi, jaringan, penyimpanan), software sistem (penjadwal, penyimpanan), dan pertimbangan arsitektur.
Ada sejumlah praktik terbaik yang dapat Anda ikuti untuk mengoptimalkan performa workload CAE Anda di Google Cloud. Misalnya, Anda dapat menggunakan kebijakan penempatan untuk memastikan bahwa beban kerja Anda ditempatkan pada resource komputasi yang berdekatan satu sama lain, sehingga dapat mengurangi latensi dan meningkatkan performa. Anda juga dapat menggunakan Cloud HPC Toolkit untuk mengoptimalkan workload Anda.
Panduan “Praktik terbaik untuk menjalankan workload HPC” kami mendokumentasikan cara meningkatkan performa MPI. Open MPI dan Intel MPI telah disesuaikan dan dioptimalkan untuk performa Google Cloud secara langsung, melalui kemitraan dengan engineer jaringan HPC Google Cloud.
Bluprint Lingkungan CAE generik dan dengan VM H3-nya telah diukur untuk aplikasi CAE ISV utama pada model tolok ukur standar mereka.
Diagram berikut menunjukkan performa node tunggal yang menjalankan Altair Radioss 2022.3 di VM H3 relatif terhadap VM C2 (seluruh VM dalam setiap kasus). Percepatan pada dua tolok ukur yang umum digunakan (Neon 5CARS dan T10M) untuk Altair Radioss adalah 2,6x.
Bagan berikut menunjukkan performa saat menjalankan Ansys Fluent 2022 R2 pada VM H3, relatif terhadap VM C2 menggunakan blueprint Solusi CAE (seluruh VM dalam setiap kasus). Peningkatan kecepatan dibandingkan benchmark yang biasa digunakan untuk Ansys Fluent adalah 2,8x dan menunjukkan bahwa platform Google H3 sangat cocok untuk beban kerja dinamika fluida komputasi.
Bagan berikut menunjukkan kinerja node tunggal menjalankan Ansys LS-DYNA R9.3.1 pada VM H3 dibandingkan dengan VM C2 (seluruh VM dalam setiap kasus). Percepatan untuk benchmark kecelakaan car2car untuk Ansys LS-DYNA adalah 2,7x
Diagram berikut menunjukkan performa node tunggal menjalankan Ansys Mechanical 2022 R1 pada VM H3 dibandingkan pada VM C2 (seluruh VM dalam setiap kasus). Percepatan benchmark V2iter-4 untuk Ansys Mechanical adalah 2,8x
Bagan berikut menunjukkan performa node tunggal dalam menjalankan OpenFOAM v7 milik OpenFOAM Foundation pada VM H3 jika dibandingkan dengan C2 VM (seluruh VM dalam setiap kasus). Percepatan terhadap tolok ukur yang biasa digunakan untuk OpenFOAM adalah 2,4x.
Tabel berikut menunjukkan kinerja node tunggal dalam menjalankan Siemens Simcenter STAR-CCM+ 18.02.008 pada VM H3 jika dibandingkan dengan VM C2 (seluruh VM dalam setiap kasus). Percepatan pada tolok ukur yang umum digunakan untuk Siemens Simcenter STAR-CCM+ adalah 2,9x.
Bagan berikut menunjukkan perilaku penskalaan yang kuat dari Ansys Fluent 2022 R2 pada tolok ukur mobil balap F1 (140m) menggunakan VM H3. Anda dapat melihat penskalaan yang baik dari 2 hingga 16 node dengan efisiensi paralel >90% pada 16 node (1408 core).
Google Cloud menawarkan berbagai kelebihan dalam menjalankan workload CAE, di antaranya:
Infrastruktur HPC Google Cloud dirancang agar memberikan performa tinggi untuk workload CAE. CPU dan GPU terbaru tersedia dan infrastruktur jaringan dirancang untuk memberikan latensi rendah.
Skalabilitas
Infrastruktur HPC Google Cloud dirancang agar skalabel. Workload CAE dapat ditingkatkan atau diturunkan skalanya sesuai kebutuhan, dan resource dapat ditambahkan atau dihapus dengan cepat dan mudah.
Fleksibilitas
Infrastruktur HPC Google Cloud dirancang agar fleksibel. Workload CAE dapat dijalankan pada berbagai opsi komputasi dan tersedia berbagai opsi penyimpanan.
Mudah digunakan
Infrastruktur HPC Google Cloud dirancang agar mudah digunakan. Cloud HPC Toolkit menyediakan serangkaian alat dan library yang dapat digunakan untuk mengoptimalkan workload CAE di Google Cloud.
Hemat biaya
Infrastruktur HPC Google Cloud dirancang agar hemat biaya. Berbagai opsi harga tersedia dan Spot VM dapat digunakan untuk lebih hemat biaya.
Google Cloud menawarkan berbagai jenis mesin, masing-masing dengan konfigurasi CPU, GPU, dan memori yang berbeda. Memilih jenis mesin yang tepat untuk workload Anda dapat memberikan dampak signifikan terhadap performa dan biaya. Misalnya, VM H3 adalah pilihan yang baik untuk aplikasi CAE berlisensi per-core karena rasio antara bandwidth-memori terhadap core yang tinggi, dan dengan 4 GB/core, VM H3 menyediakan memori yang cukup untuk beragam beban kerja. Untuk beban kerja yang membutuhkan memori secara khusus, seperti mekanisme struktural, VM C3 dengan konfigurasi memori tingginya menyediakan 16 GB/core.
Google Cloud menawarkan berbagai opsi penyimpanan, masing-masing dengan karakteristik performa dan biaya yang berbeda. Memilih opsi penyimpanan yang tepat untuk workload Anda dapat berdampak signifikan pada performa dan biaya. Ada juga beberapa jenis penyimpanan di lingkungan HPC yang perlu dipertimbangkan.
Lingkungan HPC biasanya menghosting setidaknya dua jenis penyimpanan dengan persyaratan yang berbeda: home storage dan scratch storage. Pilihan jenis penyimpanan untuk masing-masing penyimpanan akan bergantung pada kebutuhan workload HPC yang spesifik. Misalnya, workload yang menghasilkan data scratch dalam jumlah besar mungkin memerlukan solusi scratch storage berperforma tinggi, sementara workload yang mengakses data umum di beberapa node komputasi secara bersamaan mungkin memerlukan sistem file paralel. Pilihan jenis penyimpanan untuk workload HPC tertentu akan bergantung pada kebutuhan workload yang spesifik.
Selain home storage dan scratch storage, lingkungan HPC juga dapat menggunakan jenis penyimpanan lainnya, seperti archive storage, yang digunakan untuk menyimpan data yang tidak sering diakses. Archive storage dapat disediakan dengan biaya yang paling hemat oleh Cloud Storage.
Home Storage
Home storage biasanya digunakan untuk menyimpan file pengguna bersama, terutama di direktori “/home”, seperti konfigurasi, skrip, dan data pascapemrosesan. Penyimpanan ini akan dipasang di tempat yang sama di seluruh cluster untuk memungkinkan akses umum ke namespace ini. Home storage biasanya persisten. Home storage biasanya dibangun pada protokol NFS.
Dalam lingkungan HPC Google Cloud, home storage dapat disediakan oleh layanan Google seperti Filestore atau penawaran partner seperti NetApp.
Scratch Storage
Scratch storage biasanya digunakan untuk menyimpan file sementara, seperti hasil intermediate dan data output simulasi. Data ini dapat dibagikan atau tidak dibagikan ke berbagai node yang berbeda di lingkungan HPC. Scratch storage biasanya tidak persisten. Scratch storage biasanya dibuat di sistem penyimpanan berperforma lebih tinggi daripada home storage, seperti penyimpanan flash lokal atau Sistem File Paralel.
Di lingkungan HPC Google Cloud, scratch storage dapat disediakan oleh layanan Google seperti Persistent Disk, SSD Lokal, Cloud Filestore, atau Parallelstore atau oleh produk partner seperti NetApp, DDN EXAScaler, Sycomp, dan Weka.
Spot VM
Spot VM dapat menjadi cara hemat biaya untuk menjalankan workload CAE. Spot VM tersedia dengan harga diskon, tetapi dapat diberhentikan kapan saja dengan periode pemberitahuan singkat. Spot VM memberikan potongan harga hingga 91% dari biaya instance standar dan mendukung jenis fitur yang diinginkan pengguna HPC, termasuk GPU dan SSD Lokal.
Jika alur kerja Anda dapat menoleransi kemungkinan terjadinya gangguan (preemption), kami menyarankan menguji model Spot jika aplikasi dapat berjalan dalam jangka waktu yang relatif singkat (<4 jam). Pelanggan mendapati bahwa penghematan biaya hingga 90% ternyata cukup signifikan untuk menoleransi gangguan kecil dibandingkan dengan on-demand.
Perlu diperhatikan bahwa jenis VM tertentu, seperti H3, tidak mendukung Spot.
AirShaper adalah platform aerodinamika online yang memungkinkan desainer dan teknisi untuk menjalankan simulasi aliran udara dengan cara yang sepenuhnya otomatis, sehingga pengguna yang tidak memiliki keahlian dalam aerodinamika dapat memperoleh hasil yang dapat diandalkan dan desain yang lebih baik.
AirShaper memigrasikan workload HPC Computational Fluid Dynamics (CFD) mereka ke kelompok VM C2D baru dari platform VM lama, sehingga menghemat waktu simulasi dan biaya per operasi workload dibandingkan dengan lingkungan cloud mereka sebelumnya, serta secara signifikan meningkatkan waktu untuk mendapatkan hasil dibandingkan dengan lingkungan lokal mereka.
“Di AirShaper, kami menawarkan simulasi CFD dengan biaya tetap. Core yang lebih banyak dan lebih cepat biasanya meningkatkan biaya secara keseluruhan, sebagian karena masalah penskalaan. Namun, dengan H3, kami dapat memangkas setengah waktu simulasi sekaligus mengurangi biaya secara keseluruhan."
- Wouter Remmerie, CEO, Airshaper
Mengurangi biaya hampir 50% | Dibandingkan dengan instance lokal, opsi ini dapat mengurangi waktu simulasi lebih dari tiga kali lipat | Mengurangi waktu simulasi hingga 30% dibandingkan dengan instance komputasi berperforma tinggi generasi sebelumnya |
Mengurangi biaya hampir 50%
Dibandingkan dengan instance lokal, opsi ini dapat mengurangi waktu simulasi lebih dari tiga kali lipat
Mengurangi waktu simulasi hingga 30% dibandingkan dengan instance komputasi berperforma tinggi generasi sebelumnya
Altair adalah perusahaan teknologi global yang menyediakan software dan solusi cloud di bidang pengembangan produk, komputasi berperforma tinggi (HPC), dan analisis data. Perangkat lunak Altair digunakan oleh para insinyur, ilmuwan, dan analis data untuk memecahkan masalah kompleks di berbagai industri, termasuk otomotif, kedirgantaraan, manufaktur, dan energi.
Altair adalah partner Google Cloud, dan software-nya tersedia di Google Cloud. Software Altair dioptimalkan untuk Google Cloud dan dapat digunakan untuk memanfaatkan performa, skalabilitas, dan fleksibilitas Google Cloud. Altair berkomitmen untuk membantu pelanggan mencapai target HPC mereka dan menawarkan berbagai solusi software untuk HPC. Salah satunya adalah Radioss, alat analisis elemen terbatas. Altair mampu mendemonstrasikan peningkatan yang signifikan dalam runtime Radio berbasis cloud dengan VM H3 yang baru.
“Di Altair, kami sangat senang bahwa pengujian awal menunjukkan pengurangan runtime simulasi hingga 3x lipat untuk beban kerja Radioss yang berjalan di H3 versus C2. Runtime yang jauh lebih cepat di Google Cloud ini akan membantu meningkatkan produktivitas teknis bagi pelanggan kami.”
- Eric Lequiniou, Wakil Presiden Senior, Radioss Development dan Altair Solver
TotalCAE adalah penyedia solusi HPC terkelola yang terkemuka untuk aplikasi teknik dan sains. Solusi TotalCAE dirancang agar mudah digunakan dan membantu pelanggan mempercepat waktu mereka untuk mendapatkan hasil, mengurangi biaya, dan meningkatkan produktivitas. Solusi TotalCAE digunakan oleh pelanggan di seluruh dunia untuk memecahkan masalah saintifik dan teknik yang kompleks. Misalnya, solusi TotalCAE digunakan untuk mendesain dan membuat simulasi pesawat, mobil, dan kendaraan lainnya; untuk menganalisis kinerja bangunan dan jembatan; dan untuk mengembangkan obat dan terapi baru.
TotalCAE adalah partner Google Cloud dan produk ini mendukung operasi di Google Cloud. Solusi TotalCAE dioptimalkan untuk Google Cloud dan dapat digunakan untuk memanfaatkan performa, skalabilitas, dan fleksibilitas Google Cloud. Dengan menggunakan infrastruktur HPC Google Cloud, TotalCAE mampu menawarkan performa yang lebih baik kepada pelanggan dengan biaya yang lebih rendah.
“Dengan instance H3 Google Cloud, kami mendapatkan peningkatan performa hingga 25% per core untuk workload CAE dengan biaya 50% lebih rendah daripada C2, sehingga TotalCAE dapat menawarkan nilai harga hingga 2,5x lebih tinggi kepada pelanggan, serta skalabilitas untuk workload CAE di Google Cloud.”
- Rodney Mach, CEO, TotalCAE
Masih banyak lagi yang perlu dipelajari tentang workload HPC dan CAE di Google Cloud. Hubungi kami jika Anda ingin berdiskusi dengan anggota tim HPC Google atau ingin mulai menggunakan Google Cloud. Sampai saat itu tiba, tindak lanjuti dengan semua referensi kami untuk terus belajar.
Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.