Menyajikan model AI yang dioptimalkan secara efisien dengan NVIDIA NIM di GKE. Pelajari lebih lanjut.
NVIDIA dan Google Cloud menghadirkan solusi yang dioptimalkan akselerator untuk mengatasi workload Anda yang paling rumit, termasuk machine learning, komputasi berperforma tinggi, analisis data, grafik, dan workload game.
Manfaat
Peningkatan performa untuk beragam workload
Dengan GPU NVIDIA terbaru di Google Cloud, Anda dapat dengan mudah menyediakan instance Compute Engine dengan NVIDIA H100, A100, L4, T4, P100, P4, dan V100 untuk mempercepat serangkaian workload yang rumit.
Mengurangi biaya dengan penagihan per detik
Dengan harga per detik Google Cloud, Anda hanya membayar apa yang Anda butuhkan, dengan diskon hingga 30% per bulan yang diterapkan secara otomatis. Hemat biaya di muka sekaligus dapatkan waktu beroperasi dan performa skalabel yang sama.
Mengoptimalkan beban kerja dengan konfigurasi mesin kustom
Optimalkan workload Anda dengan mengonfigurasi instance secara tepat dengan rasio prosesor, memori, dan GPU NVIDIA yang Anda butuhkan, bukan memodifikasi workload agar sesuai dengan konfigurasi sistem yang terbatas.
Fitur utama
VM A3s, yang didukung GPU NVIDIA H100 Tensor Core, dibuat khusus untuk melatih dan melayani terutama LLM dan workload AI generatif yang rumit. Penggabungan GPU NVIDIA dengan teknologi infrastruktur terkemuka dari Google Cloud menawarkan performa dan skala besar serta merupakan kemajuan yang signifikan dalam kemampuan supercomputing.
VM A2 yang dioptimalkan akselerator didasarkan pada NVIDIA Ampere A100 Tensor Core GPU. Setiap GPU A100 menawarkan performa komputasi hingga 20x dibandingkan dengan generasi sebelumnya. VM ini dirancang untuk memberikan akselerasi di setiap skala untuk AI, analisis data, dan komputasi berperforma tinggi demi mengatasi tantangan komputasi yang terberat.
G2 merupakan VM cloud pertama di industri yang didukung GPU NVIDIA L4 Tensor Core, yang baru-baru ini diumumkan dan dibuat khusus untuk workload AI inferensi besar seperti AI generatif. G2 menawarkan performa-per dolar yang canggih untuk workload inferensi AI. Sebagai GPU universal, G2 menawarkan peningkatan performa yang signifikan dalam workload HPC, grafis, dan transcoding video.
Dengan menggunakan Google Kubernetes Engine (GKE), Anda dapat dengan mudah membuat cluster dengan GPU NVIDIA sesuai permintaan, melakukan load balancing, dan meminimalkan biaya operasional dengan meningkatkan atau menurunkan skala resource GPU secara otomatis. Dengan dukungan untuk multi-instance GPU (MIG) di GPU NVIDIA A100, GKE kini dapat menyediakan akselerasi GPU berukuran tepat yang lebih terperinci untuk workload inferensi AI multi-pengguna dan multi-model.
NVIDIA CloudXR, inovasi inovatif yang dibangun dengan teknologi NVIDIA RTX™, menjadikan XR berkualitas tinggi dapat diakses melalui Google Cloud Marketplace dengan NVIDIA RTX Virtual Workstation sebagai virtual machine image (VMI). Pengguna dapat dengan mudah menyiapkan, menskalakan, dan mendapatkan pengalaman imersif berkualitas tinggi serta mengalirkan alur kerja XR dari cloud.
Siap untuk memulai? Hubungi kami
Pelajari lebih lanjut cara Google Cloud dan NVIDIA dapat membantu mentransformasi bisnis Anda.
Pelanggan
Dokumentasi
Percepat proses pelatihan untuk berbagai model deep learning, seperti klasifikasi gambar, analisis video, dan natural language processing.
Yang baru
Beri tahu kami masalah yang ingin Anda pecahkan. Pakar Google Cloud akan membantu Anda menemukan solusi terbaik.