Catatan rilis AI Generatif di Vertex AI

Halaman ini mendokumentasikan pembaruan produksi untuk AI Generatif di Vertex AI dan Vertex AI Model Garden. Anda dapat memeriksa halaman ini secara berkala untuk melihat info terkait fitur baru atau yang diupdate, perbaikan bug, masalah umum, dan fungsi yang tidak digunakan lagi.

29 Maret 2024

Infrastruktur model MedLM-large telah diupgrade untuk meningkatkan latensi dan stabilitas. Respons dari model mungkin sedikit berbeda.

22 Maret 2024

PDF kini didukung sebagai input untuk model bahasa multimodal Gemini 1.0 Pro Vision. Anda dapat memanggil API dengan PDF secara langsung atau mencobanya di Vertex AI Studio. Untuk mempelajari lebih lanjut, lihat Mengirim permintaan perintah multimodal dengan gambar atau PDF.

19 Maret 2024

Model Claude 3 Sonnet dan Claude 3 Haiku dari Anthropic di Vertex AI tersedia secara umum di Vertex AI.

Model terkelola Claude 3 Haiku dan Claude 3 Sonnet dari Anthropic tersedia di Vertex AI. Untuk menggunakan model Claude di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Untuk mengetahui informasi selengkapnya, lihat Menggunakan model Claude dari Anthropic dan kartu model Claude di Model Garden:

21 Februari 2024

Model terbuka Gemma sudah tersedia.

Model Gemma, yaitu sekumpulan model terbuka yang ringan dan dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini, tersedia untuk dijalankan di hardware, perangkat seluler, atau layanan yang dihosting. Untuk mempelajari lebih lanjut, lihat Menggunakan model terbuka Gemma dan kartu Gemma Model Garden.

15 Februari 2024

Model Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro Vision

Model bahasa multimodal Vertex AI Gemini 1.0 Pro dan Gemini 1.0 Pro Vision kini Tersedia Secara Umum (GA). VM ini juga telah tersedia di region berikut: europe-west1, europe-west2, europe-west3, europe-west4, dan europe-west9.

Untuk informasi selengkapnya, lihat topik berikut:

9 Februari 2024

Dukungan video embedding multimodal sudah Tersedia Secara Umum

Embedding untuk data video kini Tersedia secara umum menggunakan model embedding multimodal (multimodalembedding). Untuk mengetahui informasi selengkapnya, lihat dokumentasi produk.

Fitur ini menimbulkan biaya berdasarkan mode yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat harga.

7 Februari 2024

Pembaruan Model Garden:

Fitur

Model berikut telah ditambahkan:

  • Stable Diffusion XL LCM: Latent Consistency Model (LCM) meningkatkan pembuatan teks ke gambar di Latent Diffusion Model dengan memungkinkan pembuatan gambar yang lebih cepat dan berkualitas tinggi dengan lebih sedikit langkah.
  • LLaVA 1.5: Men-deploy model LLaVA 1.5.
  • PyTorch-ZipNeRF: Model Pytorch-ZipNeRF adalah penerapan algoritma ZipNeRF yang canggih dalam framework Pytorch, yang dirancang untuk rekonstruksi 3D yang efisien dan akurat dari gambar 2D.
  • LLaMA 2 (Dikuantisasi): Versi kuantisasi model Llama 2 Meta.
  • WizardLM: WizardLM adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang di-fine-tune pada petunjuk yang kompleks dengan mengadaptasi metode Evol-Instruct.
  • WizardCoder: WizardCoder adalah model bahasa besar (LLM) yang dikembangkan oleh Microsoft, yang disesuaikan dengan petunjuk yang kompleks dengan mengadaptasi metode Evol-Instruct ke domain kode.
  • AutoGluon: Dengan AutoGluon, Anda dapat melatih dan men-deploy model machine learning dan deep learning dengan akurasi tinggi untuk data tabulasi.
  • Lama (Pewarnaan dengan mask besar): Gunakan Pewarnaan dengan Mask Besar dengan konvolusi Fourier cepat (FFC), kehilangan persepsi bidang reseptif tinggi, dan mask pelatihan besar untuk pewarnaan gambar yang kuat terhadap resolusi.

Diubah

  • Menambahkan tombol penyesuaian sekali klik, dan notebook khusus deployment, penyesuaian, kuantisasi, dan evaluasi untuk Llama 2.
  • Menambahkan tombol deployment sekali klik untuk lebih dari 20 model dengan artefak OSS terlatih, termasuk Salesforce/blip-image-captioning-base dan timbrooks/instruct-pix2pix.
  • Mendukung CodeLlaMA70b dengan notebook dan tombol deployment sekali klik.
  • Menambahkan notebook penyesuaian untuk model Mistral.
  • Menambahkan notebook penayangan untuk Stable Video Diffusion Img2Vid XT (untuk tujuan penelitian).

12 Januari 2024

Penyesuaian model untuk model textembedding-gecko dan textembedding-gecko-multilingual tersedia dalam GA. Anda dapat menggunakan fine-tuning yang diawasi untuk menyesuaikan model textembedding-gecko. Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan embedding teks.

8 Januari 2024

AutoSxS mengevaluasi LLM secara berdampingan

Alat evaluasi berdampingan otomatis (AutoSxS) tersedia dalam Pratinjau untuk melakukan pengujian A/B terhadap performa LLM atau prediksi yang telah dibuat sebelumnya. Model ini sebanding dengan evaluator manusia, tetapi lebih cepat, tersedia sesuai permintaan, dan lebih hemat biaya.

5 Januari 2024

Perluasan regional AI Generatif di Vertex AI

Fitur AI Generatif di Vertex AI untuk Prediksi Batch dan Evaluasi Model tersedia di 12 wilayah tambahan Google Cloud .

18 Desember 2023

Pembaruan Model Garden:

13 Desember 2023

Model Gemini Pro dan Gemini Pro Vision Vertex AI

Model bahasa multimodal Gemini Pro dan Gemini Pro Vision Vertex AI tersedia dalam Pratinjau. Untuk informasi selengkapnya, lihat topik berikut:

Ketersediaan Umum Imagen 2

Model pembuatan gambar Imagen versi 005 (imagegeneration@005) sudah tersedia secara umum untuk tugas pembuatan gambar. Versi model ini adalah versi default untuk tugas pembuatan gambar. Untuk mengetahui informasi selengkapnya, lihat dokumentasi produk.

Untuk mengetahui informasi umum tentang model dan versi Imagen, lihat Versi dan siklus proses model Imagen.

12 Desember 2023

Model penyematan teks 003 (textembedding-gecko@003) tersedia

Versi stabil yang telah diupdate dari model dasar embedding teks, textembedding-gecko@003, sudah tersedia. textembedding-gecko@003 menampilkan kualitas yang lebih baik dibandingkan dengan versi stabil sebelumnya, textembedding-gecko@001 dan textembedding-gecko@002. Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

8 Desember 2023

Pembaruan kontrol keamanan AI Generatif di Vertex AI

Kontrol keamanan Transparansi Akses (AXT) tersedia untuk fitur berikut:

  • Prediksi online Embedding untuk Multimodal
  • Prediksi online Imagen di Vertex AI
  • Penyesuaian Imagen di Vertex AI

6 Desember 2023

Model teks yang diperbarui

Model versi @002 untuk teks, chat, kode, dan chat kode sudah tersedia. Versi model @002 mencakup respons perintah yang lebih baik. Model @002 adalah:

  • text-bison@002
  • chat-bison@002
  • code-bison@002
  • codechat-bison@002

Untuk memastikan Anda selalu menggunakan versi model stabil, tentukan ID model dengan nomor versi. Contoh, text-bison@002. Untuk mengetahui informasi selengkapnya, lihat Versi dan siklus proses model.

5 Desember 2023

Fitur

Perujukan model tersedia dalam Pratinjau. Gunakan perujukan untuk menghubungkan model text-bison dan chat-bison ke penyimpanan data tidak terstruktur di Vertex AI Search. Dengan perujukan, model dapat mengakses dan menggunakan informasi dalam repositori data untuk menghasilkan respons yang lebih baik dan bernuansa. Untuk mengetahui informasi selengkapnya, lihat Ringkasan Perujukan.

1 Desember 2023

Ubah

Update model_garden_name berikut tersedia:

30 November 2023

Fitur

Ukuran model untuk PaLM 2 untuk Teks kini tersedia secara umum (GA). Model text-unicorn memberikan kualitas respons yang lebih baik untuk serangkaian tugas penalaran yang kompleks dibandingkan dengan model text-bison. Untuk mengetahui detailnya, lihat Informasi model.

17 November 2023

ComputeToken API tersedia di Pratinjau

ComputeToken API tersedia dalam (Pratinjau). Anda dapat menggunakan API ini untuk mendapatkan daftar token untuk prompt tertentu. Token adalah cara untuk merepresentasikan urutan karakter umum yang ditemukan dalam input teks. Untuk mempelajari lebih lanjut, lihat Mendapatkan daftar token.

10 November 2023

AI Generatif di Vertex AI

Kontrol keamanan tersedia untuk fitur Generative AI di Vertex AI tambahan.

3 November 2023

Pembaruan Model Garden

Fitur

Model berikut telah ditambahkan ke Model Garden:

  • ImageBind: Model embedding multimodal.
  • Vicuna v1.5: LLM yang di-fine-tune berdasarkan llama2.
  • OWL-ViT v2: Model Deteksi Objek dengan Kosakata Terbuka SoTA.
  • DITO: Model Deteksi Objek Kosakata Terbuka SoTA.
  • NLLB: Model terjemahan multibahasa.
  • Mistral-7B: LLM SoTA berukuran kecil.
  • BioGPT: LLM yang di-finetuning untuk domain biomedis.
  • BiomedCILP: Model dasar multimodal yang disesuaikan untuk domain biomedis.

Untuk melihat daftar semua model yang tersedia, lihat Mempelajari model di Model Garden.

Diubah

  • Peningkatan throughput inferensi model bahasa. Untuk mengetahui detailnya, lihat Menayangkan model bahasa besar open source secara efisien di Model Garden. Notebook di kartu model yang relevan telah diperbarui sebagaimana mestinya.
  • Kecepatan inferensi hingga 2 kali lebih cepat dibandingkan dengan penerapan asli untuk model Stable Diffusion 1.5, 2.1, dan XL.
  • Meningkatkan alur kerja tombol Deploy di semua kartu model yang didukung.
  • Memperbarui notebook untuk Llama2, OpenLlama, dan Falcon Instruct dengan spesifikasi mesin yang disarankan untuk penayangan model, dan docker EleutherAI's evaluation harness untuk evaluasi model.

Versi model stabil textembedding-gecko dan textembedding-gecko-multilingual baru

Versi model stabil berikut tersedia di AI Generatif di Vertex AI:

  • textembedding-gecko@002
  • textembedding-gecko-multilingual@001

Untuk mengetahui informasi selengkapnya tentang versi model, lihat Versi dan siklus proses model.

2 November 2023

AI Generatif di Vertex AI dapat diakses melalui 12 API regional di Amerika Utara, Eropa, dan Asia. API regional memungkinkan pelanggan mengontrol lokasi penyimpanan data dalam penyimpanan.

3 November 2023

Penyesuaian model untuk chat-bison@001 tersedia secara umum (GA).

Penyesuaian chat-bison@001 mendukung visualisasi metrik tensorboard. Untuk mengetahui detailnya, lihat Metrik penyesuaian dan evaluasi.

4 Oktober 2023

Penyesuaian model untuk textembedding-gecko tersedia dalam Pratinjau

Anda dapat menggunakan penyesuaian yang diawasi untuk menyesuaikan model textembedding-gecko. Fitur ini berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan embedding teks.

1 September 2023

Pembaruan harga

Harga untuk text-bison telah diturunkan menjadi $0,0005 per 1.000 karakter input dan output. Untuk mengetahui detailnya, lihat Harga Vertex AI.

29 Agustus 2023

Model AI Generatif di Vertex AI baru dan dukungan bahasa yang diperluas

AI Generatif di Vertex AI telah diupdate untuk menyertakan kandidat model bahasa baru (model terbaru), model bahasa yang mendukung token input dan output hingga 32 ribu, dan bahasa lainnya yang didukung. Untuk mengetahui detailnya, baca Model yang tersedia serta Versi dan siklus proses model.

Streaming respons dari model AI Generatif

Dukungan streaming model AI generatif Tersedia secara Umum (GA). Setelah Anda mengirim perintah, model akan menampilkan token respons saat dibuat, bukan menunggu seluruh output tersedia.

Model yang didukung adalah:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

Untuk mempelajari lebih lanjut, lihat Streaming respons dari model AI Generatif.

Penyesuaian yang diawasi untuk model text-bison Tersedia secara Umum (GA)

Penyesuaian yang diawasi untuk model text-bison Tersedia secara Umum (GA).

Penyesuaian model untuk model chat-bison tersedia dalam Pratinjau

Anda dapat menggunakan penyesuaian yang diawasi untuk menyesuaikan model chat-bison. Fitur ini berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menyesuaikan model teks.

Model embedding baru tersedia di Pratinjau

Pengguna AI Generatif di Vertex AI dapat membuat embedding menggunakan model baru yang dilatih pada berbagai bahasa selain bahasa Inggris. Model sedang dalam (Pratinjau).

  • textembedding-gecko-multilingual

Untuk mempelajari lebih lanjut, baca artikel Mendapatkan embedding teks.

Penyesuaian subjek dan penyesuaian gaya Imagen Tersedia secara Umum (GA)

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Penyesuaian model subjek (penyesuaian standar)*
  • Penyesuaian model gaya*

* Fitur akses terbatas.

Untuk mengetahui informasi selengkapnya tentang Imagen di Vertex AI atau cara mendapatkan akses ke GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Reinforcement learning from human feedback (RLHF) untuk text-bison

Model dasar pembuatan teks AI Generatif di Vertex AI (text-bison) mendukung penyesuaian RLHF. Fitur penyesuaian RLHF berada dalam (Pratinjau). Untuk mengetahui informasi selengkapnya, lihat Menggunakan penyesuaian model RLHF.

Dukungan bahasa Vertex AI Codey API

Vertex AI Codey API mendukung bahasa pemrograman tambahan. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Vertex AI Codey API mendukung penyesuaian yang diawasi

Model Vertex AI Codey API untuk chat kode (codechat-bison) dan pembuatan kode (code-bison) mendukung penyesuaian yang diawasi. Penyesuaian yang diawasi untuk fitur model Vertex AI Codey API berada dalam (Pratinjau). Untuk informasi selengkapnya, lihat Menyesuaikan model kode.

Evaluasi model berbasis metrik

Anda dapat mengevaluasi performa model dasar dan model yang disesuaikan berdasarkan set data evaluasi untuk klasifikasi, ringkasan, question answering, dan pembuatan teks umum. Fitur ini tersedia di (Pratinjau)

Untuk mempelajari lebih lanjut, lihat Mengevaluasi performa model.

CountToken API tersedia di Pratinjau

CountToken API tersedia dalam (Pratinjau). Anda dapat menggunakan API ini untuk mendapatkan jumlah token dan jumlah karakter yang dapat ditagih untuk prompt. Untuk mempelajari lebih lanjut, baca artikel Mendapatkan jumlah token.

9 Agustus 2023

Embedding Imagen Multimodal tersedia di GA

Imagen di Vertex AI menawarkan fitur GA berikut:

  • Embedding multimodal

Fitur ini menimbulkan harga yang berbeda jika Anda menggunakan input image atau input teks. Untuk informasi selengkapnya, lihat halaman fitur embedding multimodal.

21 Agustus 2023

Update parameter penyesuaian model

Tugas penyesuaian model menerima parameter opsional untuk evaluasi model dan integrasi Vertex AI TensorBoard. Dengan demikian, Anda dapat mengevaluasi model dan membuat visualisasi dengan satu perintah. Untuk mengetahui informasi selengkapnya, lihat Membuat tugas penyesuaian model.

28 Juli 2023

Update parameter penyesuaian model

Parameter learning_rate dalam penyesuaian model adalah learning_rate_multiplier. Untuk menggunakan kecepatan pembelajaran default model atau metode penyesuaian, gunakan nilai learning_rate_multiplier default 1.0.

Jika belum mengonfigurasi learning_rate sebelumnya, Anda tidak perlu melakukan tindakan apa pun. Jika menggunakan tuning_method=tune_v2 dengan template pipeline v2.0.0 (Python SDK v1.28.1+), kecepatan pembelajaran yang direkomendasikan adalah 0,0002. Untuk mengonversi learning_rate kustom Anda menjadi learning_rate_multiplier, hitung sebagai berikut:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

18 Juli 2023

Update penyesuaian model untuk text-bison

  • Pipeline penyesuaian yang diupgrade menawarkan penyesuaian yang lebih efisien dan performa yang lebih baik pada text-bison.
  • Region penyesuaian baru (us-central1) tersedia dengan dukungan GPU.
  • Parameter learning_rate baru memungkinkan Anda menyesuaikan ukuran langkah di setiap iterasi.

Untuk mengetahui detailnya, lihat Menyesuaikan model dasar bahasa.

Chirp GA

Chirp Tersedia Secara Umum (GA). Untuk mengetahui detailnya, lihat halaman berikut:

17 Juli 2023

Fitur Imagen di Vertex AI yang Tersedia secara Umum

Imagen di Vertex AI menawarkan fitur GA berikut:

* Fitur akses terbatas.

Untuk informasi selengkapnya tentang Imagen atau cara mendapatkan akses ke fitur Pratinjau atau GA yang dibatasi, lihat ringkasan Imagen di Vertex AI.

Pembuatan wajah manusia didukung

Imagen mendukung pembuatan wajah manusia untuk fitur berikut:

* Fitur akses terbatas.

Pembuatan wajah manusia diaktifkan secara default, kecuali gambar yang menampilkan anak-anak atau selebritas. Untuk informasi selengkapnya, lihat panduan penggunaan.

Dukungan bahasa tambahan

Vertex AI PaLM API telah menambahkan dukungan untuk bahasa berikut:

  • Spanyol (es)
  • Korea (ko)
  • Hindi (hi)
  • Mandarin (zh)

Untuk mengetahui daftar lengkap bahasa yang didukung, lihat Bahasa yang didukung.

13 Juli 2023

Dukungan batch untuk PaLM 2 untuk Teks

Dukungan untuk permintaan teks batch (text-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

10 Juli 2023

PaLM 2 untuk Chat

Dukungan untuk Chat (chat-bison) tersedia di (GA). Anda dapat meninjau harga untuk model chat-bison di halaman harga Vertex AI.

29 Juni 2023

Vertex AI Codey API

Vertex AI Codey API tersedia secara umum (GA). Gunakan Vertex AI Codey API untuk membuat solusi dengan pembuatan kode, penyelesaian kode, dan chat kode. Karena Vertex AI Codey API bersifat GA, Anda akan dikenai biaya penggunaan jika menggunakannya. Untuk mempelajari harga, lihat halaman harga AI Generatif di Vertex AI.

Model dalam rilis ini meliputi:

  • code-bison (pembuatan kode)
  • codechat-bison (chat kode)
  • code-gecko (penyelesaian kode)

Token maksimum untuk input ditingkatkan dari 4.096 menjadi 6.144 token untuk code-bison dan codechat-bison agar memungkinkan prompt dan histori chat yang lebih panjang. Token maksimum untuk output dinaikkan dari 1.024 menjadi 2.048 untuk code-bison dan codechat-bison agar memungkinkan respons yang lebih panjang.

Bahasa pemrograman tambahan didukung. Untuk informasi selengkapnya, lihat Bahasa coding yang didukung.

Beberapa set data fine-tuning telah dihapus dari model code-bison dan codechat-bison untuk menerapkan peningkatan berikut:

  • Chat yang berlebihan.
  • Artefak, seperti karakter NBSP (spasi non-breaking).
  • Respons kode berkualitas rendah.

Untuk mempelajari horizontal cloud, lihat sertifikasi Vertex AI.

15 Juni 2023

PaLM 2 untuk Chat

Model chat-bison telah diperbarui untuk mengikuti petunjuk di kolom context dengan lebih baik. Untuk mengetahui detail selengkapnya tentang cara membuat prompt chat untuk chat-bison, lihat Mendesain prompt chat.

7 Juni 2023

PaLM Text and Embeddings API, dan Vertex AI Studio

AI Generatif di Vertex AI tersedia di (GA). Dengan peluncuran fitur ini, Anda dapat menggunakan Vertex AI PaLM API untuk menghasilkan model AI yang dapat diuji, disesuaikan, dan di-deploy di aplikasi yang didukung teknologi AI. Karena fitur ini bersifat GA, Anda dikenai biaya penggunaan jika menggunakan PaLM API text-bison dan textembedding-gecko. Untuk mempelajari harga, lihat halaman harga Vertex AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa

Model Garden

Model Garden tersedia di (GA). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, dan semuanya tersedia di halaman Model Garden di Google Cloud konsol.

Untuk memulai, lihat Menjelajahi model dan API AI di Model Garden.

Vertex AI Codey API

Vertex AI Codey API berada dalam (Pratinjau). Dengan Codey API, pembuatan kode, penyelesaian kode, dan API chat kode dapat digunakan dari projectGoogle Cloud mana pun tanpa memerlukan daftar yang disetujui. API ini dapat diakses dari region us-central1. Codey API dapat digunakan di Vertex AI Studio atau secara terprogram dalam perintah REST.

Untuk memulai, lihat Ringkasan model kode.

10 Mei 2023

AI Generatif di Vertex AI

AI Generatif di Vertex AI tersedia di (Pratinjau). Dengan peluncuran fitur ini, Anda dapat menggunakan Vertex AI PaLM API untuk menghasilkan model AI yang dapat diuji, disesuaikan, dan di-deploy di aplikasi yang didukung teknologi AI.

Fitur dan model dalam rilis ini meliputi:

  • PaLM 2 untuk Teks: text-bison
  • PaLM 2 untuk Chat: chat-bison
  • Embedding untuk Teks: textembedding-gecko
  • Vertex AI Studio untuk Bahasa
  • Penyesuaian untuk PaLM 2
  • Vertex AI SDK v1.25, yang mencakup fitur baru, seperti TextGenerationModel (text-bison), ChatModel (chat-bison), TextEmbeddingModel (textembedding-gecko@001)

Anda dapat berinteraksi dengan fitur AI generatif di Vertex AI menggunakan Vertex AI Studio di konsol Google Cloud , Vertex AI API, dan Vertex AI SDK untuk Python.

Model Garden

Model Garden tersedia di (Pratinjau). Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model Vertex AI dan OSS tertentu. Model ini berkisar dari yang dapat disetel hingga khusus tugas, semuanya tersedia di halaman Model Garden di konsolGoogle Cloud .