Catatan rilis AI Generatif di Vertex AI

Halaman ini mendokumentasikan pembaruan produksi untuk AI Generatif di Vertex AI dan Vertex AI Model Garden. Anda dapat memeriksa halaman ini secara berkala untuk melihat info terkait fitur baru atau yang diupdate, perbaikan bug, masalah umum, dan fungsi yang tidak digunakan lagi.

29 Maret 2024

Infrastruktur model MedLM-large telah diupgrade untuk meningkatkan latensi dan stabilitas. Respons dari model mungkin sedikit berbeda.

22 Maret 2024

PDF kini didukung sebagai input ke model bahasa multimodal Gemini 1.0 Pro Vision. Anda dapat memanggil API dengan PDF secara langsung atau mencobanya di Vertex AI Studio. Untuk mempelajari lebih lanjut, lihat Mengirim permintaan perintah multimodal dengan gambar atau PDF.

19 Maret 2024

Model Claude 3 Sonnet dan Claude 3 Haiku dari Anthropic di Vertex AI tersedia secara umum di Vertex AI.

Model terkelola Claude 3 Haiku dan Claude 3 Sonnet dari Anthropic tersedia di Vertex AI. Untuk menggunakan model Claude di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Untuk informasi selengkapnya, lihat Menggunakan model Claude dari Anthropic dan kartu model Claude di Model Garden:

21 Februari 2024

Model terbuka Gemma tersedia.

Model Gemma, sekumpulan model terbuka yang ringan dan dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini, tersedia untuk berjalan di hardware, perangkat seluler, atau layanan yang dihosting. Untuk mempelajari lebih lanjut, lihat Menggunakan model terbuka Gemma dan kartu Model Garden Gemma.

15 Februari 2024

Model Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro Vision

Model bahasa multimodal Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro Vision tersedia secara umum (GA). Keduanya juga telah tersedia di region berikut: europe-west1, europe-west2, europe-west3, europe-west4, dan europe-west9.

Untuk informasi selengkapnya, lihat topik berikut:

9 Februari 2024

Dukungan video untuk embedding multimodal tersedia secara umum

Penyematan untuk data video kini tersedia secara Umum menggunakan model penyematan multimodal (multimodalembedding). Untuk informasi selengkapnya, lihat dokumentasi produk.

Fitur ini menimbulkan harga berdasarkan mode yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat harga.

7 Februari 2024

Update Model Garden:

Fitur

Model berikut telah ditambahkan:

  • Stable Diffusion XL LCM: Model Konsistensi Laten (LCM) meningkatkan pembuatan teks ke gambar dalam Model Difusi Laten dengan memungkinkan pembuatan gambar yang lebih cepat dan berkualitas tinggi dengan lebih sedikit langkah.
  • LLaVA 1.5: Men-deploy model LLaVA 1.5.
  • PyTorch-ZipNeRF: Model Pytorch-ZipNeRF adalah implementasi algoritma ZipNeRF terbaru dalam framework Pytorch, yang dirancang untuk rekonstruksi 3D yang efisien dan akurat dari gambar 2D.
  • LLaMA 2 (Kuantisasi): Versi kuantisasi model Llama 2 Meta.
  • WizardLM: WizardLM adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang disesuaikan dengan petunjuk kompleks dengan menyesuaikan metode Evol-Instruct.
  • WizardCoder: WizardCoder adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang disesuaikan dengan petunjuk kompleks dengan menyesuaikan metode Evol-Instruct ke domain kode.
  • AutoGluon: Dengan AutoGluon, Anda dapat melatih dan men-deploy model machine learning dan deep learning dengan akurasi tinggi untuk data tabulasi.
  • Lama (Inpainting mask besar): Gunakan Inpainting Mask Besar dengan konvolusi Fourier cepat (FFC), loss persepsi bidang reseptif yang tinggi, dan mask pelatihan besar untuk inpainting gambar yang andal dalam resolusi.

Diubah

  • Menambahkan tombol penyesuaian sekali klik, dan notebook deployment, penyesuaian, kuantisasi, dan evaluasi khusus untuk Llama 2.
  • Menambahkan tombol deployment sekali klik untuk lebih dari 20 model dengan artefak OSS yang telah dilatih sebelumnya, termasuk Salesforce/blip-image-captioning-base dan timbrooks/instruct-pix2pix.
  • Mendukung CodeLlaMA70b dengan notebook dan tombol deployment sekali klik.
  • Menambahkan notebook penyesuaian untuk model Mistral.
  • Menambahkan notebook penayangan untuk Stable Video Diffusion Img2Vid XT (untuk tujuan riset).

12 Januari 2024

Penyesuaian model untuk model textembedding-gecko dan textembedding-gecko-multilingual tersedia di GA. Anda dapat menggunakan fine-tuning yang diawasi untuk menyesuaikan model textembedding-gecko. Untuk informasi selengkapnya, lihat Menyesuaikan embedding teks.

8 Januari 2024

AutoSxS mengevaluasi LLM secara berdampingan

Alat evaluasi otomatis berdampingan (AutoSxS) tersedia di Pratinjau untuk melakukan pengujian A/B pada performa LLM atau prediksi yang dibuat sebelumnya. Teknologi ini sebanding dengan evaluator manusia, tetapi lebih cepat, tersedia sesuai permintaan, dan lebih hemat biaya.

5 Januari 2024

Ekspansi regional AI Generatif di Vertex AI

Fitur AI Generatif di Vertex AI untuk Prediksi Batch dan Evaluasi Model tersedia di 12 region Google Cloud tambahan.

18 Desember 2023

Update Model Garden:

13 Desember 2023

Model Vertex AI Gemini Pro dan Gemini Pro Vision

Model bahasa multimodal Vertex AI Gemini Pro dan Gemini Pro Vision tersedia dalam Pratinjau. Untuk informasi selengkapnya, lihat topik berikut:

Ketersediaan Umum Imagen 2

Model pembuatan gambar Imagen versi 005 (imagegeneration@005) umumnya tersedia untuk tugas pembuatan gambar. Versi model ini adalah versi default untuk tugas pembuatan gambar. Untuk informasi selengkapnya, lihat dokumentasi produk.

Untuk informasi umum tentang model dan versi Imagen, lihat Versi dan siklus proses model Imagen.

12 Desember 2023

Model penyematan teks 003 (textembedding-gecko@003) tersedia

Versi stabil yang diperbarui dari model dasar penyematan teks, textembedding-gecko@003, tersedia. textembedding-gecko@003 memiliki kualitas yang lebih baik dibandingkan dengan versi stabil sebelumnya, textembedding-gecko@001, dan textembedding-gecko@002. Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

8 Desember 2023

Pembaruan kontrol keamanan AI Generatif di Vertex AI

Kontrol keamanan Transparansi Akses (AXT) tersedia untuk fitur berikut:

  • Embedding untuk Prediksi online multimodal
  • Prediksi online Imagen di Vertex AI
  • Penyesuaian Imagen di Vertex AI

6 Desember 2023

Model teks yang diperbarui

Model versi @002 untuk teks, chat, kode, dan chat kode tersedia. Versi model @002 mencakup respons perintah yang ditingkatkan. Model @002 adalah:

  • text-bison@002
  • chat-bison@002
  • code-bison@002
  • codechat-bison@002

Untuk memastikan Anda selalu menggunakan versi model stabil, tentukan ID model dengan nomor versi. Contoh, text-bison@002. Untuk mengetahui informasi selengkapnya, lihat Versi dan siklus proses model.

5 Desember 2023

Fitur

Grounding model tersedia di Pratinjau. Gunakan grounding untuk menghubungkan model text-bison dan chat-bison ke penyimpanan data tidak terstruktur di Vertex AI Search. Pembumian memungkinkan model mengakses dan menggunakan informasi di repositori data untuk menghasilkan respons yang lebih ditingkatkan dan bernuansa. Untuk informasi selengkapnya, lihat Ringkasan Grounding.

1 Desember 2023

Ubah

Update model_garden_name berikut tersedia:

30 November 2023

Fitur

Ukuran model untuk PaLM 2 untuk Teks tersedia secara umum (GA). Model text-unicorn memberikan kualitas respons yang lebih baik untuk serangkaian tugas penalaran yang kompleks dibandingkan dengan model text-bison. Untuk mengetahui detailnya, lihat Informasi model.

17 November 2023

ComputeToken API tersedia dalam Pratinjau

ComputeToken API tersedia di (Pratinjau). Anda dapat menggunakan API ini untuk mendapatkan daftar token untuk perintah tertentu. Token adalah cara untuk merepresentasikan urutan karakter umum yang ditemukan dalam input teks. Untuk mempelajari lebih lanjut, lihat Mendapatkan daftar token.

10 November 2023

AI Generatif di Vertex AI

Kontrol keamanan tersedia untuk fitur AI Generatif tambahan di Vertex AI.

3 November 2023

Update Model Garden

Fitur

Model berikut telah ditambahkan ke Model Garden:

  • ImageBind: Model embedding multimodal.
  • Vicuna v1.5: LLM yang disesuaikan berdasarkan llama2.
  • OWL-ViT v2: Model Deteksi Objek dengan Vokabularium Terbuka SoTA.
  • DITO: Model Deteksi Objek Kosakata Terbuka SoTA.
  • NLLB: Model terjemahan multibahasa.
  • Mistral-7B: LLM SoTA dengan ukuran kecil.
  • BioGPT: LLM yang dioptimalkan untuk domain biomedis.
  • BiomedCILP: Model dasar multimodal yang disesuaikan untuk domain biomedis.

Untuk melihat daftar semua model yang tersedia, lihat Menjelajahi model di Model Garden.

Diubah

  • Meningkatkan throughput penayangan model bahasa. Untuk mengetahui detailnya, lihat Menayangkan model bahasa besar open source secara efisien di Model Garden. Notebook di kartu model yang relevan telah diperbarui.
  • Kecepatan inferensi hingga 2 kali lebih cepat dibandingkan dengan implementasi asli untuk model Stable Diffusion 1.5, 2.1, dan XL.
  • Meningkatkan alur kerja tombol Deploy di semua kartu model yang didukung.
  • Memperbarui notebook untuk Llama2, OpenLlama, dan Falcon Instruct dengan spesifikasi mesin yang disarankan untuk penayangan model, dan docker harness evaluasi EleutherAI untuk evaluasi model.

Versi model stabil textembedding-gecko dan textembedding-gecko-multilingual baru

Versi model stabil berikut tersedia di AI Generatif di Vertex AI:

  • textembedding-gecko@002
  • textembedding-gecko-multilingual@001

Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

2 November 2023

AI Generatif di Vertex AI dapat diakses melalui 12 API regional di Amerika Utara, Eropa, dan Asia. API regional memungkinkan pelanggan mengontrol tempat data disimpan dalam penyimpanan.

3 November 2023

Penyesuaian model untuk chat-bison@001 tersedia secara umum (GA).

Menyesuaikan chat-bison@001 mendukung visualisasi metrik tensorboard. Untuk mengetahui detailnya, lihat Metrik penyesuaian dan evaluasi.

4 Oktober 2023

Penyesuaian model untuk textembedding-gecko tersedia di Pratinjau

Anda dapat menggunakan penyesuaian yang diawasi untuk menyesuaikan model textembedding-gecko. Fitur ini berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan embedding teks.

1 September 2023

Pembaruan harga

Harga untuk text-bison telah diturunkan menjadi $0,0005 per 1.000 karakter input dan output. Untuk mengetahui detailnya, lihat Harga Vertex AI.

29 Agustus 2023

Model AI Generatif di Vertex AI baru dan dukungan bahasa yang diperluas

AI Generatif di Vertex AI telah diupdate untuk menyertakan kandidat model bahasa baru (model terbaru), model bahasa yang mendukung token input dan output hingga 32 ribu, dan bahasa lainnya yang didukung. Untuk mengetahui detailnya, baca Model yang tersedia serta Versi dan siklus proses model.

Streaming respons dari model AI Generatif

Dukungan streaming model AI generatif Tersedia secara Umum (GA). Setelah Anda mengirim perintah, model akan menampilkan token respons saat dibuat, bukan menunggu seluruh output tersedia.

Model yang didukung adalah:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

Untuk mempelajari lebih lanjut, lihat Streaming respons dari model AI Generatif.

Penyesuaian yang diawasi untuk model text-bison Tersedia secara Umum (GA)

Penyesuaian yang diawasi untuk model text-bison Tersedia secara Umum (GA).

Penyesuaian model untuk model chat-bison tersedia di Pratinjau

Anda dapat menggunakan penyesuaian yang diawasi untuk menyesuaikan model chat-bison. Fitur ini berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan model teks.

Model penyematan baru tersedia di Pratinjau

Pengguna AI Generatif di Vertex AI dapat membuat embedding menggunakan model baru yang dilatih pada berbagai bahasa selain bahasa Inggris. Model sedang dalam (Pratinjau).

  • textembedding-gecko-multilingual

Untuk mempelajari lebih lanjut, baca artikel Mendapatkan embedding teks.

Penyesuaian subjek dan penyesuaian gaya Imagen Tersedia Secara Umum (GA)

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Penyesuaian model subjek (penyesuaian standar)*
  • Penyesuaian model gaya*

* Fitur akses terbatas.

Untuk mengetahui informasi selengkapnya tentang Imagen di Vertex AI atau cara mendapatkan akses ke GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Reinforcement learning from human feedback (RLHF) untuk text-bison

Model dasar pembuatan teks AI Generatif di Vertex AI (text-bison) mendukung penyesuaian RLHF. Fitur penyesuaian RLHF berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menggunakan penyesuaian model RLHF.

Dukungan bahasa Vertex AI Codey API

Vertex AI Codey API mendukung bahasa pemrograman tambahan. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Vertex AI Codey API mendukung penyesuaian yang diawasi

Chat kode (codechat-bison) dan pembuatan kode (code-bison) model Vertex AI Codey API mendukung penyesuaian yang diawasi. Penyesuaian yang diawasi untuk fitur model Vertex AI Codey API berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan model kode.

Evaluasi model berbasis metrik

Anda dapat mengevaluasi performa model dasar dan model yang disesuaikan berdasarkan set data evaluasi untuk klasifikasi, ringkasan, question answering, dan pembuatan teks umum. Fitur ini tersedia di (Pratinjau)

Untuk mempelajari lebih lanjut, lihat Mengevaluasi performa model.

CountToken API tersedia di Pratinjau

CountToken API tersedia di (Pratinjau). Anda dapat menggunakan API ini untuk mendapatkan jumlah token dan jumlah karakter yang dapat ditagih untuk prompt. Untuk mempelajari lebih lanjut, baca artikel Mendapatkan jumlah token.

9 Agustus 2023

Embedding Imagen Multimodal tersedia di GA

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Embedding multimodal

Fitur ini menimbulkan harga yang berbeda jika Anda menggunakan input image atau input teks. Untuk informasi selengkapnya, lihat halaman fitur embedding multimodal.

21 Agustus 2023

Update parameter penyesuaian model

Tugas penyesuaian model menerima parameter opsional untuk evaluasi model dan integrasi Vertex AI TensorBoard. Dengan demikian, Anda dapat mengevaluasi model dan membuat visualisasi dengan satu perintah. Untuk mengetahui informasi selengkapnya, lihat Membuat tugas penyesuaian model.

28 Juli 2023

Update parameter penyesuaian model

Parameter learning_rate dalam penyesuaian model adalah learning_rate_multiplier. Untuk menggunakan kecepatan pembelajaran default model atau metode penyesuaian, gunakan nilai learning_rate_multiplier default 1.0.

Jika belum mengonfigurasi learning_rate sebelumnya, Anda tidak perlu melakukan tindakan apa pun. Jika menggunakan tuning_method=tune_v2 dengan template pipeline v2.0.0 (Python SDK v1.28.1+), kecepatan pembelajaran yang direkomendasikan adalah 0,0002. Untuk mengonversi learning_rate kustom Anda menjadi learning_rate_multiplier, hitung sebagai berikut:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

18 Juli 2023

Update penyesuaian model untuk text-bison

  • Pipeline penyesuaian yang diupgrade menawarkan penyesuaian yang lebih efisien dan performa yang lebih baik pada text-bison.
  • Region penyesuaian baru (us-central1) tersedia dengan dukungan GPU.
  • Parameter learning_rate baru memungkinkan Anda menyesuaikan ukuran langkah di setiap iterasi.

Untuk mengetahui detailnya, lihat Menyesuaikan model dasar bahasa.

Chirp GA

Chirp Tersedia Secara Umum (GA). Untuk mengetahui detailnya, lihat halaman berikut:

17 Juli 2023

Fitur Imagen di Vertex AI yang Tersedia secara Umum

Imagen di Vertex AI menawarkan fitur GA berikut:

* Fitur akses terbatas.

Untuk informasi selengkapnya tentang Imagen atau cara mendapatkan akses ke fitur Pratinjau atau GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Pembuatan wajah manusia didukung

Imagen mendukung pembuatan wajah manusia untuk fitur berikut:

* Fitur akses terbatas.

Pembuatan wajah manusia diaktifkan secara default, kecuali gambar yang menampilkan anak-anak atau selebritas. Untuk informasi selengkapnya, lihat panduan penggunaan.

Dukungan bahasa tambahan

Vertex AI PaLM API telah menambahkan dukungan untuk bahasa berikut:

  • Spanyol (es)
  • Korea (ko)
  • Hindi (hi)
  • Mandarin (zh)

Untuk mengetahui daftar lengkap bahasa yang didukung, lihat Bahasa yang didukung.

13 Juli 2023

Dukungan batch untuk PaLM 2 untuk Teks

Dukungan untuk permintaan teks batch (text-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

10 Juli 2023

PaLM 2 untuk Chat

Dukungan untuk Chat (chat-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

29 Juni 2023

Vertex AI Codey API

Vertex AI Codey API tersedia secara umum (GA). Gunakan Vertex AI Codey API untuk membuat solusi dengan pembuatan kode, penyelesaian kode, dan chat kode. Karena Vertex AI Codey API bersifat GA, Anda akan dikenai biaya penggunaan jika menggunakannya. Untuk mempelajari harga, lihat halaman harga AI Generatif di Vertex AI.

Model dalam rilis ini meliputi:

  • code-bison (pembuatan kode)
  • codechat-bison (chat kode)
  • code-gecko (penyelesaian kode)

Token maksimum untuk input ditingkatkan dari 4.096 menjadi 6.144 token untuk code-bison dan codechat-bison agar memungkinkan prompt dan histori chat yang lebih panjang. Token maksimum untuk output dinaikkan dari 1.024 menjadi 2.048 untuk code-bison dan codechat-bison agar memungkinkan respons yang lebih panjang.

Bahasa pemrograman tambahan didukung. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Beberapa set data fine-tuning telah dihapus dari model code-bison dan codechat-bison untuk menerapkan peningkatan berikut:

  • Chat yang berlebihan.
  • Artefak, seperti karakter NBSP (spasi non-breaking).
  • Respons kode berkualitas rendah.

Untuk mempelajari horizontal cloud, lihat sertifikasi Vertex AI.

15 Juni 2023

PaLM 2 untuk Chat

Model chat-bison telah diperbarui untuk mengikuti petunjuk di kolom context dengan lebih baik. Untuk mengetahui detail selengkapnya tentang cara membuat prompt chat untuk chat-bison, lihat Mendesain prompt chat.

7 Juni 2023

PaLM Text and Embeddings API, dan Vertex AI Studio

AI Generatif di Vertex AI tersedia di (GA). Dengan peluncuran fitur ini, Anda dapat menggunakan Vertex AI PaLM API untuk menghasilkan model AI yang dapat diuji, disesuaikan, dan di-deploy di aplikasi yang didukung teknologi AI. Karena fitur ini bersifat GA, Anda dikenai biaya penggunaan jika menggunakan PaLM API text-bison dan textembedding-gecko. Untuk mempelajari harga, lihat halaman harga Vertex AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa

Model Garden

Model Garden tersedia di (GA). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, dan semuanya tersedia di halaman Model Garden di konsol Google Cloud.

Untuk memulai, lihat Menjelajahi model dan API AI di Model Garden.

Vertex AI Codey API

Vertex AI Codey API berada dalam (Pratinjau). Dengan Codey API, pembuatan kode, penyelesaian kode, dan API chat kode dapat digunakan dari projectGoogle Cloud mana pun tanpa memerlukan daftar yang disetujui. API ini dapat diakses dari region us-central1. Codey API dapat digunakan di Vertex AI Studio atau secara terprogram dalam perintah REST.

Untuk memulai, lihat Ringkasan model kode.

10 Mei 2023

AI Generatif di Vertex AI

AI Generatif di Vertex AI tersedia di (Pratinjau). Dengan peluncuran fitur ini, Anda dapat menggunakan Vertex AI PaLM API untuk menghasilkan model AI yang dapat diuji, disesuaikan, dan di-deploy di aplikasi yang didukung teknologi AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • PaLM 2 untuk Chat: chat-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa
  • Penyesuaian untuk PaLM 2
  • Vertex AI SDK v1.25, yang mencakup fitur baru, seperti TextGenerationModel (text-bison), ChatModel (chat-bison), TextEmbeddingModel (textembedding-gecko@001)

Anda dapat berinteraksi dengan fitur AI generatif di Vertex AI menggunakan Vertex AI Studio di konsol Google Cloud, Vertex AI API, dan Vertex AI SDK untuk Python.

Model Garden

Model Garden tersedia di (Pratinjau). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, semuanya tersedia di halaman Model Garden di konsol Google Cloud.