Catatan rilis AI Generatif di Vertex AI

Halaman ini mendokumentasikan pembaruan produksi untuk AI Generatif di Vertex AI dan Vertex AI Model Garden. Anda dapat memeriksa halaman ini secara berkala untuk melihat info terkait fitur baru atau yang diupdate, perbaikan bug, masalah umum, dan fungsi yang tidak digunakan lagi.

29 Maret 2024

Infrastruktur model besar MedLM telah diupgrade untuk meningkatkan latensi dan stabilitas. Respons dari model mungkin sedikit berbeda.

22 Maret 2024

PDF kini didukung sebagai input untuk model bahasa multimodal Gemini 1.0 Pro Vision. Anda dapat langsung memanggil API dengan PDF atau mencobanya di Vertex AI Studio. Untuk mempelajari lebih lanjut, lihat Mengirim permintaan perintah multimodal dengan gambar atau PDF.

19 Maret 2024

Model Anthropic Claude 3 Sonnet dan Claude 3 Haiku di Vertex AI secara umum tersedia di Vertex AI.

Model terkelola Claude 3 Haiku dan Claude 3 Sonnet dari Anthropic tersedia di Vertex AI. Untuk menggunakan model Claude di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Untuk mengetahui informasi selengkapnya, lihat Menggunakan model Claude dari Anthropic dan kartu model Claude di Model Garden:

21 Februari 2024

Model terbuka Gemma tersedia.

Model Gemma, yang merupakan kelompok model terbuka dan ringan yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini, tersedia untuk dijalankan di hardware, perangkat seluler, atau layanan yang dihosting. Untuk mempelajari lebih lanjut, lihat Menggunakan model terbuka Gemma dan kartu Gemma Model Garden.

15 Februari 2024

Model Vision Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro

Model bahasa multimodal Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro Vision sudah Tersedia (GA). Game ini juga telah tersedia di region berikut: europe-west1, europe-west2, europe-west3, europe-west4, dan europe-west9.

Untuk informasi selengkapnya, lihat topik berikut:

9 Februari 2024

Dukungan video embedding multimodal tersedia secara umum

Embedding untuk data video kini tersedia secara umum menggunakan model penyematan multimodal (multimodalembedding). Untuk informasi selengkapnya, lihat dokumentasi produk.

Fitur ini mengenakan harga berdasarkan mode yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat pricing.

7 Februari 2024

Pembaruan Model Garden:

Fitur

Model berikut telah ditambahkan:

  • Stable Diffusion XL LCM: Latent Consistency Model (LCM) meningkatkan pembuatan teks ke gambar dalam Model Difusi Latent dengan memungkinkan pembuatan gambar yang lebih cepat dan berkualitas tinggi dengan lebih sedikit langkah.
  • LLaVA 1.5: Men-deploy model LLaVA 1.5.
  • PyTorch-ZipNeRF: Model Pytorch-ZipNeRF adalah implementasi algoritma ZipNeRF yang canggih dalam framework Pytorch, yang dirancang untuk rekonstruksi 3D yang efisien dan akurat dari gambar 2D.
  • LLaMA 2 (Quantized): Versi terkuantisasi dari model Llama 2 Meta.
  • WizardLM: WizardLM adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang disesuaikan dengan petunjuk kompleks dengan mengadaptasi metode Evol-Instructions.
  • WizardCoder: WizardCoder adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang disesuaikan dengan petunjuk kompleks dengan menyesuaikan metode Evol-Instructions ke domain kode.
  • AutoGluon: Dengan AutoGluon, Anda dapat melatih dan men-deploy model machine learning dan deep learning berakurasi tinggi untuk data tabel.
  • Lama (Large Mask Inpainting): Menggunakan Large Mask Inpainting dengan konvolusi Fourier (FFC) yang cepat, kehilangan persepsi bidang reseptif yang tinggi, dan masker pelatihan yang besar untuk pelukisan gambar dengan resolusi yang kuat.

Berubah

  • Menambahkan tombol penyesuaian sekali klik, serta notebook deployment, tuning, kuantisasi, dan evaluasi khusus untuk Llama 2.
  • Menambahkan tombol deployment sekali klik untuk lebih dari 20 model dengan artefak OSS terlatih, termasuk Salesforce/blip-image-captioning-base dan timbrooks/instruct-pix2pix.
  • Mendukung CodeLlaMA70b dengan notebook dan tombol deployment sekali klik.
  • Menambahkan notebook tuning untuk model Mistral.
  • Menambahkan notebook penayangan untuk Stabil Video Diffusion Img2Vid XT (untuk tujuan riset).

12 Januari 2024

Penyesuaian model untuk model textembedding-gecko dan textembedding-gecko-multilingual tersedia di GA. Anda dapat menggunakan penyempurnaan yang diawasi untuk menyesuaikan model textembedding-gecko. Untuk mengetahui informasi selengkapnya, baca artikel Menyesuaikan embedding teks.

8 Januari 2024

AutoSxS mengevaluasi LLM secara berdampingan

Alat evaluasi otomatis berdampingan (AutoSxS) tersedia dalam Pratinjau untuk menguji A/B performa LLM atau prediksi yang telah dihasilkan sebelumnya. Solusi ini sebanding dengan evaluator manual, tetapi lebih cepat, tersedia sesuai permintaan, dan lebih hemat biaya.

5 Januari 2024

AI Generatif di ekspansi regional Vertex AI

AI Generatif di fitur Vertex AI untuk Prediksi Batch dan Evaluasi Model tersedia di 12 region Google Cloud tambahan.

18 Desember 2023

Pembaruan Model Garden:

13 Desember 2023

Model Vertex AI Gemini Pro dan Gemini Pro Vision

Model bahasa multimodal Vertex AI Gemini Pro dan Gemini Pro Vision tersedia di Pratinjau. Untuk informasi selengkapnya, lihat topik berikut:

Gambar 2 Ketersediaan Umum

Model pembuatan gambar Imagen versi 005 (imagegeneration@005) tersedia secara umum untuk tugas pembuatan gambar. Versi model ini adalah default untuk tugas pembuatan gambar. Untuk informasi selengkapnya, lihat dokumentasi produk.

Untuk mengetahui informasi umum tentang model dan versi Imagen, lihat Versi dan siklus proses imagen.

12 Desember 2023

Model penyematan teks 003 (textembedding-gecko@003) tersedia

Versi stabil terbaru dari model dasar penyematan teks, textembedding-gecko@003, telah tersedia. textembedding-gecko@003 menampilkan kualitas yang lebih baik dibandingkan dengan versi stabil sebelumnya, textembedding-gecko@001 dan textembedding-gecko@002. Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

8 Desember 2023

Update kontrol keamanan AI Generatif di Vertex AI

Kontrol keamanan Transparansi Akses (AXT) tersedia untuk fitur berikut:

  • Embedding untuk prediksi online Multimodal
  • Gambar pada prediksi online Vertex AI
  • Gambar pada penyesuaian Vertex AI

6 Desember 2023

Model teks yang diperbarui

Model versi @002 untuk chat teks, chat, kode, dan kode tersedia. Versi model @002 menyertakan respons perintah yang lebih baik. Model @002 tersebut adalah:

  • text-bison@002
  • chat-bison@002
  • code-bison@002
  • codechat-bison@002

Untuk memastikan bahwa Anda selalu menggunakan versi model stable, tentukan ID model dengan nomor versi. Contoh, text-bison@002. Untuk mengetahui informasi selengkapnya, lihat Versi dan siklus proses model.

5 Desember 2023

Fitur

Grounding model tersedia di Pratinjau. Gunakan grounding untuk menghubungkan model text-bison dan chat-bison ke penyimpanan data tidak terstruktur di Vertex AI Search. Grounding memungkinkan model mengakses dan menggunakan informasi dalam repositori data untuk menghasilkan respons yang lebih baik dan lebih spesifik. Untuk informasi selengkapnya, lihat Ringkasan Dasar.

1 Desember 2023

Ubah

Update model_garden_name berikut tersedia:

30 November 2023

Fitur

Ukuran model untuk PaLM 2 untuk Teks tersedia secara umum (GA). Model text-unicorn memberikan kualitas respons yang lebih baik untuk serangkaian tugas penalaran yang kompleks dibandingkan dengan model text-bison. Untuk mengetahui detailnya, lihat Informasi model.

17 November 2023

ComputeToken API tersedia dalam Pratinjau

ComputeToken API tersedia di (Pratinjau). Anda dapat menggunakan API ini guna mendapatkan daftar token untuk perintah tertentu. Token adalah cara untuk mewakili urutan karakter umum yang ditemukan dalam input teks. Untuk mempelajari lebih lanjut, lihat Mendapatkan daftar token.

10 November 2023

AI Generatif di Vertex AI

Kontrol keamanan tersedia untuk AI Generatif tambahan di fitur Vertex AI.

3 November 2023

Update Model Garden

Fitur

Model berikut telah ditambahkan ke Model Garden:

  • ImageBind: Model penyematan multimodal.
  • Vicuna v1.5: LLM di-finetune berdasarkan llama2.
  • OWL-ViT v2: Model Deteksi Objek Kosakata Terbuka SoTA.
  • DITO: Model Deteksi Objek Kosakata Terbuka SoTA.
  • NLLB: Model terjemahan multibahasa.
  • Mistral-7B: LLM SoTA berukuran kecil.
  • BioGPT: LLM disesuaikan untuk domain biomedis.
  • BiomedCILP: Model dasar multimodal disesuaikan untuk domain biomedis.

Untuk melihat daftar semua model yang tersedia, lihat Menjelajahi model di Model Garden.

Berubah

  • Peningkatan throughput penayangan model bahasa. Untuk mengetahui detailnya, lihat Menyajikan model bahasa besar open source secara efisien di Model Garden. Notebook di kartu model yang relevan telah diperbarui.
  • Kecepatan inferensi hingga 2 kali lebih cepat dibandingkan dengan implementasi asli untuk model Stabil Diffusion 1.5, 2.1, dan XL.
  • Meningkatkan alur kerja tombol Deploy di semua kartu model yang didukung.
  • Update notebook untuk Llama2, OpenLlama, dan Falcon Instructions dengan spesifikasi mesin yang disarankan untuk penyaluran model, dan docker evaluasi EleutherAI untuk evaluasi model.

Versi model stabil textembedding-gecko dan textembedding-gecko-multilingual baru

Versi model stabil berikut tersedia di AI Generatif di Vertex AI:

  • textembedding-gecko@002
  • textembedding-gecko-multilingual@001

Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

2 November 2023

AI Generatif di Vertex AI dapat diakses melalui 12 API regional di Amerika Utara, Eropa, dan Asia. API regional memungkinkan pelanggan mengontrol lokasi penyimpanan data dalam penyimpanan.

3 November 2023

Penyesuaian model untuk chat-bison@001 tersedia secara umum (GA).

Tuning chat-bison@001 mendukung visualisasi metrik tensorboard. Untuk mengetahui detailnya, lihat Metrik penyesuaian dan evaluasi.

4 Oktober 2023

Penyesuaian model untuk textembedding-gecko tersedia dalam Pratinjau

Anda dapat menggunakan tuning yang diawasi untuk men-tuning model textembedding-gecko. Fitur ini berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan embedding teks.

1 September 2023

Pembaruan harga

Harga untuk text-bison telah diturunkan menjadi $0,0005 per 1.000 karakter input dan output. Untuk mengetahui detailnya, lihat Harga Vertex AI.

29 Agustus 2023

Model AI Generatif di Vertex AI baru dan dukungan bahasa yang diperluas

AI generatif di Vertex AI telah diupdate untuk menyertakan kandidat model bahasa baru (model terbaru), model bahasa yang mendukung token input dan output hingga 32 ribu, dan bahasa lainnya yang didukung. Untuk mengetahui detailnya, baca Model yang tersedia serta Versi dan siklus proses model.

Streaming respons dari model AI Generatif

Dukungan streaming model AI generatif Tersedia Secara Umum (GA). Setelah Anda mengirim perintah, model akan menampilkan token respons saat dibuat, bukan menunggu seluruh output tersedia.

Model yang didukung adalah:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

Untuk mempelajari lebih lanjut, lihat Streaming respons dari model AI Generatif.

Penyesuaian yang diawasi untuk model text-bison Tersedia Secara Umum (GA)

Penyesuaian yang diawasi untuk model text-bison tersedia secara umum (GA).

Penyesuaian model untuk model chat-bison tersedia dalam Pratinjau

Anda dapat menggunakan tuning yang diawasi untuk men-tuning model chat-bison. Fitur ini berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan model teks.

Model penyematan baru tersedia di Pratinjau

AI generatif di pengguna Vertex AI dapat membuat embedding menggunakan model baru yang dilatih dengan berbagai bahasa non-Inggris. Model sedang dalam (Pratinjau).

  • textembedding-gecko-multilingual

Untuk mempelajari lebih lanjut, baca artikel Mendapatkan embedding teks.

Tuning subjek dan penyesuaian gaya gambar tersedia secara umum (GA)

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Penyesuaian model subjek (penyesuaian standar)*
  • Penyesuaian model gaya*

* Fitur akses terbatas.

Untuk mengetahui informasi selengkapnya tentang Imagen di Vertex AI atau cara mendapatkan akses ke GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Reinforcement learning from human feedback (RLHF) untuk text-bison

AI Generatif pada model dasar pembuatan teks Vertex AI (text-bison) mendukung penyesuaian RLHF. Fitur penyesuaian RLHF berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menggunakan penyesuaian model RLHF.

Dukungan bahasa Vertex AI Codey API

Vertex AI Codey API mendukung bahasa pemrograman tambahan. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Vertex AI Codey API mendukung penyesuaian yang diawasi

Chat kode (codechat-bison) dan pembuatan kode (code-bison) Model Vertex AI Codey API mendukung tuning yang diawasi. Penyesuaian yang diawasi untuk fitur model Vertex AI Codey API berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan model kode.

Evaluasi model berbasis metrik

Anda dapat mengevaluasi performa model dasar dan model yang disesuaikan berdasarkan set data evaluasi untuk klasifikasi, ringkasan, question answering, dan pembuatan teks umum. Fitur ini tersedia di (Pratinjau)

Untuk mempelajari lebih lanjut, lihat Mengevaluasi performa model.

CountToken API tersedia dalam Pratinjau

CountToken API tersedia di (Pratinjau). Anda dapat menggunakan API ini untuk mendapatkan jumlah token dan jumlah karakter yang dapat ditagih untuk prompt. Untuk mempelajari lebih lanjut, baca artikel Mendapatkan jumlah token.

9 Agustus 2023

Embedding Imagen Multimodal tersedia di GA

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Embedding multimodal

Fitur ini menimbulkan pricing yang berbeda jika Anda menggunakan input image atau input teks. Untuk informasi selengkapnya, lihat halaman fitur embedding multimodal.

21 Agustus 2023

Update parameter penyesuaian model

Tugas penyesuaian model menerima parameter opsional untuk evaluasi model dan integrasi Vertex AI TensorBoard. Dengan demikian, Anda dapat mengevaluasi model dan membuat visualisasi dengan satu perintah. Untuk mengetahui informasi selengkapnya, lihat Membuat tugas penyesuaian model.

28 Juli 2023

Update parameter penyesuaian model

Parameter learning_rate dalam penyesuaian model adalah learning_rate_multiplier. Untuk menggunakan kecepatan pembelajaran default model atau metode penyesuaian, gunakan nilai learning_rate_multiplier default 1.0.

Jika belum mengonfigurasi learning_rate sebelumnya, Anda tidak perlu melakukan tindakan apa pun. Jika menggunakan tuning_method=tune_v2 dengan template pipeline v2.0.0 (Python SDK v1.28.1+), kecepatan pembelajaran yang direkomendasikan adalah 0,0002. Untuk mengonversi learning_rate kustom Anda menjadi learning_rate_multiplier, hitung sebagai berikut:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

18 Juli 2023

Update penyesuaian model untuk text-bison

  • Pipeline tuning yang diupgrade menawarkan tuning yang lebih efisien dan performa yang lebih baik pada text-bison.
  • Region penyesuaian baru (us-central1) tersedia dengan dukungan GPU.
  • Parameter learning_rate baru memungkinkan Anda menyesuaikan ukuran langkah di setiap iterasi.

Untuk mengetahui detailnya, lihat Menyesuaikan model dasar bahasa.

Kicau GA

Chirp Tersedia secara Umum (GA). Untuk mengetahui detailnya, lihat halaman berikut:

17 Juli 2023

Fitur Imagen di Vertex AI yang Tersedia secara Umum

Imagen di Vertex AI menawarkan fitur GA berikut:

* Fitur akses terbatas.

Untuk informasi selengkapnya tentang Imagen atau cara mendapatkan akses ke fitur Pratinjau atau GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Pembuatan wajah manusia didukung

Imagen mendukung pembuatan wajah manusia untuk fitur berikut:

* Fitur akses terbatas.

Pembuatan wajah manusia diaktifkan secara default, kecuali untuk gambar anak-anak atau selebritas. Untuk informasi selengkapnya, lihat panduan penggunaan.

Dukungan bahasa tambahan

Vertex AI PaLM API telah menambahkan dukungan untuk bahasa berikut:

  • Spanyol (es)
  • Korea (ko)
  • Hindi (hi)
  • Mandarin (zh)

Untuk mengetahui daftar lengkap bahasa yang didukung, lihat Bahasa yang didukung.

13 Juli 2023

Dukungan batch untuk PaLM 2 untuk Teks

Dukungan untuk permintaan teks batch (text-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

10 Juli 2023

PaLM 2 untuk Chat

Dukungan untuk Chat (chat-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

29 Juni 2023

Vertex AI Codey API

Codey API Vertex AI tersedia secara umum (GA). Gunakan Vertex AI Codey API untuk membuat solusi dengan pembuatan kode, penyelesaian kode, dan chat kode. Karena Vertex AI Codey API bersifat GA, Anda akan dikenai biaya penggunaan jika menggunakannya. Untuk mempelajari harga, lihat halaman harga AI Generatif di Vertex AI.

Model dalam rilis ini meliputi:

  • code-bison (pembuatan kode)
  • codechat-bison (chat kode)
  • code-gecko (penyelesaian kode)

Token maksimum untuk input ditingkatkan dari 4.096 menjadi 6.144 token untuk code-bison dan codechat-bison agar memungkinkan prompt dan histori chat yang lebih panjang. Token maksimum untuk output dinaikkan dari 1.024 menjadi 2.048 untuk code-bison dan codechat-bison agar memungkinkan respons yang lebih panjang.

Bahasa pemrograman tambahan didukung. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Beberapa set data fine-tuning telah dihapus dari model code-bison dan codechat-bison untuk menerapkan peningkatan berikut:

  • Chat yang berlebihan.
  • Artefak, seperti karakter NBSP (spasi non-breaking).
  • Respons kode berkualitas rendah.

Untuk mempelajari horizontal cloud, lihat sertifikasi Vertex AI.

15 Juni 2023

PaLM 2 untuk Chat

Model chat-bison telah diperbarui untuk mengikuti petunjuk di kolom context dengan lebih baik. Untuk mengetahui detail selengkapnya tentang cara membuat prompt chat untuk chat-bison, lihat Mendesain prompt chat.

7 Juni 2023

PaLM Text and Embeddings API, dan Vertex AI Studio

AI Generatif di Vertex AI tersedia di (GA). Dengan peluncuran fitur ini, Anda dapat menggunakan PaLM API Vertex AI untuk menghasilkan model AI yang dapat Anda uji, sesuaikan, dan deploy dalam aplikasi yang didukung teknologi AI. Karena fitur ini bersifat GA, Anda dikenai biaya penggunaan jika menggunakan PaLM API text-bison dan textembedding-gecko. Untuk mempelajari harga, lihat halaman harga Vertex AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa

Model Garden

Model Garden tersedia di (GA). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, dan semuanya tersedia di halaman Model Garden di konsol Google Cloud.

Untuk memulai, lihat Menjelajahi model dan API AI di Model Garden.

Vertex AI Codey API

Codey API Vertex AI sudah berada di (Pratinjau). Dengan Codey API, pembuatan kode, penyelesaian kode, dan API chat kode dapat digunakan dari project Google Cloud mana pun tanpa memerlukan daftar yang disetujui. API ini dapat diakses dari region us-central1. Codey API dapat digunakan di Vertex AI Studio atau secara terprogram dalam perintah REST.

Untuk memulai, lihat Ringkasan model kode.

10 Mei 2023

AI Generatif di Vertex AI

AI Generatif di Vertex AI tersedia di (Pratinjau). Dengan peluncuran fitur ini, Anda dapat menggunakan Vertex AI PaLM API untuk menghasilkan model AI yang dapat Anda uji, sesuaikan, dan deploy dalam aplikasi yang didukung teknologi AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • PaLM 2 untuk Chat: chat-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa
  • Penyesuaian untuk PaLM 2
  • Vertex AI SDK v1.25, yang mencakup fitur baru, seperti TextGenerationModel (text-bison), ChatModel (chat-bison), TextEmbeddingModel (textembedding-gecko@001)

Anda dapat berinteraksi dengan fitur AI generatif di Vertex AI menggunakan Vertex AI Studio di Konsol Google Cloud, Vertex AI API, dan Vertex AI SDK untuk Python.

Model Garden

Model Garden tersedia di (Pratinjau). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, semuanya tersedia di halaman Model Garden di konsol Google Cloud.