Vertex AI 生成式 AI 發布說明

本頁面說明 Vertex AI 生成式 AI 和 Vertex AI Model Garden 的產品更新。您可以定期查看本頁的公告內容,瞭解各種全新或更新功能、修正的錯誤、已知問題和已淘汰的功能。

2024 年 3 月 29 日

我們已升級 MedLM-large 模型基礎架構,以改善延遲和穩定性。模型的回覆內容可能會略有不同。

2024 年 3 月 22 日

現在 Gemini 1.0 Pro Vision 多模態語言模型支援 PDF 輸入內容。您可以直接使用 PDF 呼叫 API,或在 Vertex AI Studio 中試用。如要瞭解詳情,請參閱傳送含有圖片或 PDF 的多模態提示要求

2024 年 3 月 19 日

Vertex AI 現已正式發布 Anthropic 的 Claude 3 Sonnet 和 Claude 3 Haiku 模型。

Vertex AI 現已提供 Anthropic 的 Claude 3 Haiku 和 Claude 3 Sonnet 受管理模型。如要在 Vertex AI 上使用 Claude 模型,請直接將要求傳送至 Vertex AI API 端點。詳情請參閱使用 Anthropic 的 Claude 模型,以及 Model Garden 中的 Claude 模型資訊卡:

2024 年 2 月 21 日

Gemma 開放模型現已推出。

Gemma 模型是一系列輕量級開放式模型,採用與建立 Gemini 模型時相同的研究成果和技術。您可以在硬體、行動裝置或代管服務上執行 Gemma 模型。詳情請參閱「使用 Gemma 開放式模型」和 Gemma Model Garden 資訊卡

2024 年 2 月 15 日

Vertex AI Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 模型

Vertex AI Gemini 1.0 Pro 和 Gemini 1.0 Pro Vision 多模態語言模型已正式發布。此外,這些功能也已在下列區域推出:europe-west1、europe-west2、europe-west3、europe-west4 和 europe-west9。

如需詳細資訊,請參閱下列主題:

2024 年 2 月 9 日

多模態嵌入影片支援功能現已正式推出

現在可使用多模態嵌入模型 (multimodalembedding) 取得影片資料的嵌入內容,這項功能已正式推出。詳情請參閱產品說明文件

這項功能會根據您使用的模式計費。詳情請參閱定價

2024 年 2 月 7 日

Model Garden 更新:

功能

新增的型號如下:

  • Stable Diffusion XL LCM:潛在一致性模型 (LCM) 可在潛在擴散模型中強化文字轉圖像生成功能,以更少的步驟快速生成高品質圖像。
  • LLaVA 1.5:部署 LLaVA 1.5 模型。
  • PyTorch-ZipNeRF:PyTorch-ZipNeRF 模型是 ZipNeRF 演算法在 PyTorch 架構中的頂尖實作項目,專為從 2D 圖片有效率且準確地重建 3D 模型而設計。
  • LLaMA 2 (量化):Meta Llama 2 模型的量化版本。
  • WizardLM:WizardLM 是 Microsoft 開發的大型語言模型 (LLM),透過改編 Evol-Instruct 方法,針對複雜指令進行微調。
  • WizardCoder:WizardCoder 是 Microsoft 開發的大型語言模型 (LLM),透過改編 Evol-Instruct 方法,在程式碼領域微調複雜指令。
  • AutoGluon:使用 AutoGluon 訓練及部署高準確度的機器學習和深度學習模型,處理表格資料。
  • Lama (大型遮罩修復):使用大型遮罩修復和快速傅立葉摺積 (FFC)、高感受野感知損失,以及大型訓練遮罩,修復解析度穩定的圖片。

已變更

  • 新增一鍵微調按鈕,並為 Llama 2 提供專屬的部署、微調、量化和評估筆記本。
  • 新增一鍵部署按鈕,可部署超過 20 個模型,這些模型都含有預先訓練的 OSS 構件,包括 Salesforce/blip-image-captioning-basetimbrooks/instruct-pix2pix
  • 支援 CodeLlaMA70b 筆記本和一鍵部署按鈕。
  • 新增 Mistral 模型微調筆記本。
  • 新增 Stable Video Diffusion Img2Vid XT 的服務筆記本 (僅供研究用途)。

2024 年 1 月 12 日

textembedding-geckotextembedding-gecko-multilingual 模型調整功能已在 GA 中推出。您可以透過監督式微調功能調整 textembedding-gecko 模型。詳情請參閱「調整文字嵌入」。

2024 年 1 月 8 日

AutoSxS 會並排評估 LLM

自動並排比較 (AutoSxS) 評估工具的預先發布版現已推出,可供您 A/B 測試 LLM 或預先產生的預測結果成效。這項技術的評估結果與真人評估員相近,但速度更快、可隨時使用,且更符合成本效益。

2024 年 1 月 5 日

Vertex AI 生成式 AI 服務擴展至更多區域

Vertex AI 的生成式 AI 功能 (適用於批次預測和模型評估) 現已在另外 12 個 Google Cloud 區域推出。

2023 年 12 月 18 日

Model Garden 更新:

2023 年 12 月 13 日

Vertex AI Gemini Pro 和 Gemini Pro Vision 模型

Vertex AI Gemini Pro 和 Gemini Pro Vision 多模態語言模型現已推出搶先版。詳情請參閱下列主題:

Imagen 2 正式發布

Imagen 圖像生成模型 (imagegeneration@005) 的 005 版已正式推出,可用於圖像生成工作。這個模型版本是圖像生成工作的預設版本。詳情請參閱產品說明文件

如需 Imagen 模型和版本的一般資訊,請參閱「Imagen 模型版本和生命週期」。

2023 年 12 月 12 日

文字嵌入模型 003 (textembedding-gecko@003) 現已推出

文字嵌入基礎模型已推出更新的穩定版本 textembedding-gecko@003textembedding-gecko@003 功能,與先前的穩定版相比,品質有所提升, textembedding-gecko@001以及 textembedding-gecko@002。 如要進一步瞭解模型版本,請參閱「模型版本和生命週期」。

2023 年 12 月 8 日

Vertex AI 生成式 AI 安全控管更新

資料存取透明化控管機制 (AXT) 安全性控制選項適用於下列功能:

  • 多模態線上預測的嵌入
  • Vertex AI 線上預測的 Imagen
  • Vertex AI 的 Imagen 調整

2023 年 12 月 6 日

更新文字模型

文字、對話、程式碼和程式碼對話模型第 @002 版現已推出。@002 模型版本可提供更優質的提示回覆。 @002 模型如下:

  • text-bison@002
  • chat-bison@002
  • code-bison@002
  • codechat-bison@002

如要確保一律使用穩定模型版本,請指定模型 ID 和版本號碼。例如,text-bison@002。詳情請參閱「模型版本和生命週期」。

2023 年 12 月 5 日

功能

模型基礎功能適用於預先發布版。使用基準功能,將 text-bisonchat-bison 模型連結至 Vertex AI Search 中的非結構化資料儲存庫。模型可透過基礎資訊存取及使用資料存放區中的資訊,生成更優質且細緻的回覆。詳情請參閱基礎總覽

2023 年 12 月 1 日

變更

下列「model_garden_name」model_garden_name更新現已推出:

2023 年 11 月 30 日

功能

PaLM 2 for Text 的模型大小現已GA (GA)。與 text-bison 模型相比,text-unicorn 模型可針對一組複雜的推理工作,提供品質更優異的回覆。詳情請參閱「模型資訊」。

2023 年 11 月 17 日

ComputeToken API 現已推出預先發布版

ComputeToken API 現已推出預先發布版。您可以使用這個 API 取得特定提示的權杖清單。權杖是代表文字輸入中常見字元序列的方式。詳情請參閱「取得權杖清單」。

2023 年 11 月 10 日

Vertex AI 生成式 AI

如要使用其他 Generative AI on Vertex AI 功能,請啟用安全控管機制

2023 年 11 月 3 日

Model Garden 更新

功能

Model Garden 新增了下列模型:

  • ImageBind:多模態嵌入模型。
  • Vicuna v1.5:以 llama2 為基礎微調的 LLM。
  • OWL-ViT v2:最先進的開放詞彙物件偵測模型。
  • DITO:最先進的開放式詞彙物件偵測模型。
  • NLLB:多語言翻譯模型。
  • Mistral-7B:體積小巧的 SoTA LLM。
  • BioGPT:針對生物醫學領域微調的大型語言模型。
  • BiomedCILP:針對生物醫學領域微調的多模態基礎模型。

如要查看所有可用模型的清單,請參閱「探索 Model Garden 中的模型」。

已變更

  • 提升語言模型服務輸送量。詳情請參閱「在 Model Garden 中有效率地提供開放原始碼大型語言模型」。相關模型資訊卡中的筆記本已相應更新。
  • 與原始實作項目相比,Stable Diffusion 1.5、2.1 和 XL 模型的推論速度最多可提升 2 倍。
  • 改善所有支援模型資訊卡中的「部署」按鈕工作流程。
  • 更新 Llama2、OpenLlama 和 Falcon Instruct 的筆記本,提供模型服務的建議機器規格,以及用於模型評估的 EleutherAI 評估架構 Docker。

推出新的 textembedding-geckotextembedding-gecko-multilingual 穩定版模型

Generative AI on Vertex AI 提供下列穩定模型版本:

  • textembedding-gecko@002
  • textembedding-gecko-multilingual@001

如要進一步瞭解模型版本,請參閱「模型版本和生命週期」。

2023 年 11 月 2 日

您可透過北美、歐洲和亞洲的 12 個區域 API 存取 Vertex AI 生成式 AI。客戶可透過區域 API,控管靜態資料的儲存位置。

2023 年 11 月 3 日

chat-bison@001 的模型微調功能已正式發布 (GA)。

微調 chat-bison@001 支援 TensorBoard 指標視覺化。詳情請參閱「微調和評估指標」。

2023 年 10 月 4 日

textembedding-gecko 的模型微調功能目前處於預先發布階段

您可以使用監督式調整方法調整 textembedding-gecko 模型。這項功能目前為預先發布版。詳情請參閱「調整文字嵌入」。

2023 年 9 月 1 日

價格更新

text-bison的價格已調降為每 1,000 個輸入和輸出字元 $0.0005 美元。詳情請參閱 Vertex AI 定價

2023 年 8 月 29 日

Vertex AI 生成式 AI 新模型和擴大語言支援

Vertex AI 生成式 AI 已更新,現在包含新的語言模型候選版本 (最新模型)、支援最多 32,000 個輸入和輸出權杖的語言模型,以及更多支援的語言。詳情請參閱「可用模型」和「模型版本和生命週期」。

逐句顯示生成式 AI 模型的回覆

生成式 AI 模型串流支援功能已正式發布 (GA)。 傳送提示後,模型會傳回生成的每個回覆權杖,而不是等待整個輸出內容生成完畢。

支援的機型包括:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

詳情請參閱「從生成式 AI 模型串流傳輸回覆」。

text-bison 模型監督式微調功能正式發布

text-bison 模型監督式微調功能已正式發布 (GA)。

chat-bison 模型調整功能目前為預先發布版

您可以使用監督式調整方法調整 chat-bison 模型。這項功能目前為預先發布版。詳情請參閱「微調文字模型」。

預先發布版提供新的嵌入模型

Vertex AI 生成式 AI 使用者可運用以各種非英文語言訓練的新模型建立嵌入。模型處於「預覽」狀態。

  • textembedding-gecko-multilingual

詳情請參閱「取得文字嵌入」。

Imagen 主體調整和樣式調整功能已正式發布

Vertex AI 的 Imagen 提供下列GA功能:

  • 主題模型調整 (標準調整)*
  • 調整樣式模型*

* 存取限制功能。

如要進一步瞭解 Vertex AI 的 Imagen,或如何存取受限的正式版,請參閱 Vertex AI 的 Imagen 總覽

針對 text-bison 進行人類回饋增強學習 (RLHF) 微調

Vertex AI 生成式 AI 文字生成基礎模型 (text-bison) 支援 RLHF 微調。RLHF 調整功能目前為預先發布版。詳情請參閱「使用 RLHF 模型調整」。

Vertex AI Codey API 支援的語言

Vertex AI Codey API 支援其他程式語言。詳情請參閱「支援的程式設計語言」。

Vertex AI Codey API 支援監督式微調

程式碼即時通訊 (codechat-bison) 和程式碼生成 (code-bison) Vertex AI Codey API 模型支援監督式微調。Vertex AI Codey API 模型監督式微調功能目前為預先發布版。詳情請參閱「微調程式碼模型」。

以指標為準的模型評估

您可以根據評估資料集,評估基礎模型和微調模型的成效,適用於分類、摘要、問答和一般文字生成。這項功能適用於 (預先發布版)

詳情請參閱「評估模型成效」。

預先發布版提供 CountToken API

CountToken API 現已推出 (預先發布版)。 您可以使用這個 API 取得提示的權杖數和可計費字元數。詳情請參閱「取得權杖計數」。

2023 年 8 月 9 日

Imagen 多模態嵌入功能正式發布

Vertex AI 的 Imagen 提供下列GA功能:

  • 多模態嵌入

這項功能會根據您使用圖片輸入或文字輸入,產生不同的價格。詳情請參閱多模態嵌入功能頁面。

2023 年 8 月 21 日

更新模型調整參數

模型微調工作會接受模型評估和 Vertex AI TensorBoard 整合的選用參數。您可以使用單一指令評估模型並產生視覺化內容。詳情請參閱「建立模型調整工作」。

2023 年 7 月 28 日

更新模型調整參數

模型微調的 learning_rate 參數為 learning_rate_multiplier。 如要使用模型或微調方法的預設學習率,請使用 1.0 的預設 learning_rate_multiplier 值。

如果您尚未設定 learning_rate,則無須採取任何行動。 如果搭配 v2.0.0 管道範本 (Python SDK v1.28.1 以上版本) 使用 tuning_method=tune_v2,建議的學習率為 0.0002。如要將自訂 learning_rate 轉換為 learning_rate_multiplier,請按照下列方式計算:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

2023 年 7 月 18 日

text-bison 模型微調更新

  • 升級後的微調管道可提供更有效率的微調,並提升 text-bison 的效能。
  • 新的微調區域 (us-central1) 支援 GPU。
  • 新的 learning_rate 參數可讓您在每次疊代時調整步長。

詳情請參閱「微調語言基礎模型」。

Chirp GA

Chirp 現已正式發布 (GA)。詳情請參閱下列頁面:

2023 年 7 月 17 日

Vertex AI 的 Imagen 正式發布功能

Vertex AI 的 Imagen 提供下列GA功能:

* 存取限制功能。

如要進一步瞭解 Imagen,或如何存取受限的正式版或搶先體驗功能,請參閱「Vertex AI 的 Imagen 總覽」。

支援生成人臉

Imagen 支援下列功能的人臉生成:

* 存取限制功能。

系統預設會生成人臉,但不會生成兒童或名人的臉部圖像。詳情請參閱使用指南

支援其他語言

Vertex AI PaLM API 已新增下列語言的支援:

  • 西班牙文 (es)
  • 韓文 (ko)
  • 北印度文 (hi)
  • 中文 (zh)

如需支援語言的完整清單,請參閱「支援的語言」一文。

2023 年 7 月 13 日

支援 PaLM 2 for Text 的批次作業

批次文字 (text-bison) 要求支援功能已在GA推出。如要查看 chat-bison 模型的定價,請前往 Vertex AI 定價頁面

2023 年 7 月 10 日

PaLM 2 for Chat

即時通訊 (chat-bison) 支援服務已在 (GA) 中推出。 如要查看 chat-bison 模型的定價,請前往 Vertex AI 定價頁面

2023 年 6 月 29 日

Vertex AI Codey API

Vertex AI Codey API 現已正式發布 (GA)。使用 Vertex AI Codey API 建立解決方案,包括程式碼生成、程式碼完成和程式碼聊天。由於 Vertex AI Codey API 已正式發布,因此使用時會產生費用。如要瞭解定價,請參閱 Vertex AI 的生成式 AI 定價頁面

這個版本包含下列模型:

  • code-bison (生成程式碼)
  • codechat-bison (程式碼即時通訊)
  • code-gecko (程式碼補全)

輸入內容的權杖上限從 4,096 個增加到 6,144 個,適用於 code-bisoncodechat-bison,可支援更長的提示和對話記錄。code-bisoncodechat-bison 的輸出權杖上限從 1,024 個增加到 2,048 個,可產生更長的回覆。

支援其他程式設計語言。詳情請參閱「支援的程式設計語言」。

我們從 code-bisoncodechat-bison 模型中移除了幾個微調資料集,以進行下列改善:

  • 過度閒聊。
  • 出現亂碼,例如 NBSP (不分行空格) 字元。
  • 程式碼回覆品質不佳。

如要瞭解雲端產業,請參閱 Vertex AI 認證

2023 年 6 月 15 日

PaLM 2 for Chat

chat-bison 模型已更新,可更準確地遵循 context 欄位中的指示。如要瞭解如何為 chat-bison 建立聊天提示,請參閱「設計聊天提示」。

2023 年 6 月 7 日

PaLM Text 和 Embeddings API,以及 Vertex AI Studio

Vertex AI 生成式 AI 現已GA。這項功能推出後,您就能使用 Vertex AI PaLM API 生成 AI 模型,並在 AI 輔助應用程式中測試、調整及部署這些模型。由於這些功能已正式發布,因此使用 text-bisontextembedding-gecko PaLM API 時會產生費用。如要瞭解定價,請參閱 Vertex AI 定價頁面

這個版本包含以下功能和模型:

  • PaLM 2 for Text:text-bison
  • 文字嵌入:textembedding-gecko
  • Vertex AI Studio for Language

Model Garden

Model Garden 現已GA。Model Garden 平台可協助您探索、測試、自訂及部署 Vertex AI 和選取的開放原始碼模型。這些模型包括可調整的模型和適用特定工作的模型,您可以在Google Cloud 控制台的 Model Garden 頁面中找到所有模型。

如要開始使用,請參閱「探索模型園地中的 AI 模型和 API」。

Vertex AI Codey API

Vertex AI Codey API 目前為預先發布版。 使用 Codey API 時,您可以在任何Google Cloud 專案中使用程式碼生成、程式碼自動完成和程式碼即時通訊 API,不必加入許可清單。這些 API 可從 us-central1 區域存取。您可以在 Vertex AI Studio 中使用 Codey API,也可以透過 REST 指令以程式輔助方式使用。

如要開始使用,請參閱程式碼模型總覽

2023 年 5 月 10 日

Vertex AI 生成式 AI

Vertex AI 生成式 AI 目前為搶先版。這項功能推出後,您就能使用 Vertex AI PaLM API 生成 AI 模型,並在 AI 輔助應用程式中測試、調整及部署這些模型。

這個版本包含以下功能和模型:

  • PaLM 2 for Text:text-bison
  • PaLM 2 for Chat:chat-bison
  • 文字嵌入:textembedding-gecko
  • Vertex AI Studio for Language
  • PaLM 2 的微調
  • Vertex AI SDK 1.25 版,內含 TextGenerationModel (text-bison)、ChatModel (chat-bison)、TextEmbeddingModel (textembedding-gecko@001) 等新功能

如要使用 Vertex AI 的生成式 AI 功能,可以透過 Google Cloud 控制台中的 Vertex AI Studio、Vertex AI API,以及 Vertex AI SDK for Python 進行操作。

Model Garden

Model Garden 適用於預先發布版。Model Garden 平台可協助您探索、測試、自訂及部署 Vertex AI 和選取的開放原始碼模型。這些模型包括可調整式模型和特定工作專用模型,全都可在Google Cloud 控制台的 Model Garden 頁面中找到。