Model Llama di Vertex AI Google Cloud 

Deploy model Llama (dari perusahaan teknologi Meta) di Vertex AI untuk membangun agen dan aplikasi AI siap produksi. Dengan berbagai ukuran dan kemampuan model, Anda dapat memilih model Llama yang tepat untuk kasus penggunaan spesifik Anda, mulai dari model ringan dan efisien hingga versi multimodal. Akses model ini sebagai API serverless dan manfaatkan kemampuan multimodal dan multibahasa native-nya untuk kecerdasan visual dan teks yang sangat efisien.

Logo teks Vertex AI dan Llama dengan llama kartun di antaranya
Ringkasan model Llama

Model bahasa besar (LLM) open source Llama memberi developer transparansi dan fleksibilitas yang diperlukan untuk inovasi, sehingga memungkinkan deployment yang mudah, efisiensi biaya, dan performa yang skalabel. Saat Anda membangun solusi dengan Llama di Vertex AI, Anda menggabungkan keunggulan model terbuka yang canggih dengan keamanan, skalabilitas, dan alat terkelola tingkat perusahaan dari platform AI komprehensif Google Cloud.

LLM yang dapat diakses secara terbuka, dibangun untuk penskalaan

Llama 4 Maverick, dengan 17 miliar parameter aktif, adalah model multimodal terlatih dengan 128 pakar, yang menawarkan keseimbangan optimal antara kecerdasan, biaya, dan kecepatan. Llama 4 Maverick menawarkan pemahaman gambar dan teks, sehingga memungkinkan pembuatan aplikasi AI canggih yang menjembatani hambatan bahasa. Model Llama 4 menawarkan kemampuan pengkodean, penalaran, dan gambar, serta menampilkan arsitektur mixture-of-experts (MoE) dari jaringan neural.

Kasus penggunaan teratas mencakup penerjemahan bahasa, ringkasan multi-dokumen, dan pembuatan konten. Gemini juga dapat memberikan bantuan pribadi, mendukung pendidikan dan pembelajaran, membantu riset, dan melakukan penalaran atas codebase yang luas.


LLM yang dapat diakses secara terbuka, dibangun untuk penskalaan

Llama 4 Maverick, dengan 17 miliar parameter aktif, adalah model multimodal terlatih dengan 128 pakar, yang menawarkan keseimbangan optimal antara kecerdasan, biaya, dan kecepatan. Llama 4 Maverick menawarkan pemahaman gambar dan teks, sehingga memungkinkan pembuatan aplikasi AI canggih yang menjembatani hambatan bahasa. Model Llama 4 menawarkan kemampuan pengkodean, penalaran, dan gambar, serta menampilkan arsitektur mixture-of-experts (MoE) dari jaringan neural.

Kasus penggunaan teratas mencakup penerjemahan bahasa, ringkasan multi-dokumen, dan pembuatan konten. Gemini juga dapat memberikan bantuan pribadi, mendukung pendidikan dan pembelajaran, membantu riset, dan melakukan penalaran atas codebase yang luas.


Llama 4 Scout: model multimodal native terdepan di kelasnya

Llama 4 Scout adalah model AI multimodal yang canggih, dengan performa terbaik untuk menyelesaikan tugas yang sangat kompleks. Model ini dapat menavigasi perintah terbuka dan skenario yang tidak terlihat dengan lancar.

Kasus penggunaan utamanya mencakup aplikasi asisten multimodal seperti membangun chatbot dengan teks dan gambar, men-debug tugas pembuatan kode, aplikasi konteks panjang, alur kerja multi-agen, dan pengambilan keputusan berbasis data.


Llama 3.3 70B: model AI open source

Llama 3.3 70B adalah model khusus teks yang dapat di-deploy melalui platform Vertex AI yang sangat dioptimalkan untuk performa dan efisiensi dalam menangani berbagai tugas berbasis bahasa, sehingga memberi developer aplikasi ringan yang mengurangi biaya.

Kasus penggunaan utamanya mencakup deployment dalam layanan pelanggan, pembuatan dan proses debug kode, serta data pelatihan.


Llama 3.2 90B: model multimodal yang ringan

Llama 3.2 90B, model multimodal, efisien, dan fleksibel yang dapat memahami gambar beresolusi tinggi.

Kasus penggunaan utamanya mencakup fungsi penelusuran visual yang memungkinkan pengguna menemukan produk menggunakan gambar seperti e-commerce, pemindaian medis, analisis data untuk dokumen kompleks, pembuatan konten, dan dapat memahami konteks.


Manfaat dan kemampuan model Llama di Vertex AI

Mempercepat pengembangan AI

Vertex AI menyediakan lingkungan terintegrasi untuk mengevaluasi, men-deploy, dan mengelola aplikasi yang didukung Llama dengan cepat dan dalam skala besar.

Mengoptimalkan performa dan biaya

Sederhanakan cara Anda men-deploy dan menskalakan model Llama dengan infrastruktur terkelola sepenuhnya yang dirancang untuk workload AI, dan opsi untuk memilih dari model harga fleksibel seperti endpoint khusus, atau harga bayar sesuai penggunaan.

Membangun agen AI yang canggih

Kembangkan agen dengan alat Vertex AI dan kemampuan canggih model Llama.

Keamanan, kepatuhan, dan tata kelola data bawaan

Manfaatkan kemampuan keamanan, privasi, tata kelola data, dan kepatuhan bawaan Google Cloud yang disesuaikan untuk mematuhi standar tingkat perusahaan.


Maksimalkan keandalan data Anda

Integrasikan data perusahaan Anda dengan kemampuan canggih Llama, yang memanfaatkan alat seperti BigQuery untuk mengekstrak insight berharga dan mendorong pengambilan keputusan yang tepat.

Kemampuan yang ditingkatkan

Model Llama menunjukkan kemampuan tingkat lanjut dalam penalaran kompleks, analisis visi, pembuatan kode, dan pemrosesan multibahasa. Model ini dapat mengikuti petunjuk yang rumit dan menghasilkan output yang komprehensif dan rinci.

Membangun dengan Llama di Vertex AI