Menjalankan inferensi batch menggunakan GPU pada tugas Cloud Run

Anda dapat menjalankan inferensi batch dengan LLM Llama 3.2-1b Meta dan vLLM pada tugas Cloud Run, lalu menulis hasilnya langsung ke Cloud Storage menggunakan pemasangan volume Cloud Run.

Lihat codelab instruksional langkah demi langkah di Cara menjalankan inferensi batch pada tugas Cloud Run.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2025-10-19 UTC.