什麼是基礎模型?

基礎模型 (有時也稱為「基底模型」) 是強大的人工智慧 (AI) 模型,以大量資料訓練而成,可靈活調整,運用於各種工作。「基礎模型」一詞由史丹佛大學人本人工智慧研究中心 (HAI) 於 2021 年提出

這項技術為各行各業創造全新的可能性,從簡化軟體開發到改善客服互動,都能派上用場。

Google Cloud 基礎模型簡介

基礎模型的定義

基礎模型是一種 AI 模型,會透過大量資料預先訓練,以便執行各種工作。透過這個訓練過程 (通常採用自我監督式學習),模型能學習資料中複雜的模式和關係,進而有效執行各種工作並展現更高的準確度。更重要的是,在這種大規模的訓練下,模型可能會培養出意想不到的新能力,能夠完成未明確訓練過的工作。從專用工具轉化為可靈活調整的一般用途模型,正是基礎模型的一大特色。

基礎模型與大型語言模型的差異

「基礎模型」和「大型語言模型」(LLM) 這兩個詞經常交替使用,但兩者之間有個關鍵差異。LLM 是基礎模型的主要類型,但並非唯一一種。這就像親子關係:所有 LLM 都是基礎模型,但並非所有基礎模型都是 LLM。

兩者的主要差異在於建構時使用的資料類型。顧名思義,LLM 特別以大量文字和程式碼訓練而成,而「基礎模型」這個更廣泛的類別,則還包含以其他資料類型 (例如圖像、音訊和影片) 或多種資料類型 (多模態) 訓練而成的模型。

生成式 AI 與基礎模型的差異

生成式 AI 和基礎模型雖然不同,但兩者密切相關。如要瞭解兩者差異,最有用的方式就是將它們視為「引擎」與「功能」:

  • 基礎模型是功能強大的預先訓練引擎,也就是以大量資料為基礎建構而成的底層技術,可靈活調整
  • 生成式 AI 是這類引擎的主要功能,可生成文字、圖像或程式碼等新內容

雖然大多數熱門的基礎模型都用於生成式工作,但這類模型也能改用於非生成式用途,如複雜的分類或分析。因此,雖然並非所有基礎模型都具備生成功能,但它們是帶動當前生成式 AI 應用浪潮的關鍵技術。

基礎模型的類型

基礎模型包含各種架構,每種架構都有自己獨特的優勢和應用方式。以下列舉幾種重要類型:

  • 大型語言模型 (LLM):專精於理解和生成人類語言,擅長翻譯、文字摘要製作和聊天機器人互動等工作。
  • 多模態模型:以各種資料類型 (包括文字、圖像和音訊) 訓練而成,可分析及生成多種型態的內容。
  • 生成對抗網路 (GAN):GAN 是一種基礎模型,由兩個類神經網路組成,兩者會透過零和遊戲互相競爭。其中一個網路 (生成器) 會生成新的資料樣本,另一個網路 (鑑別器) 則會評估這些樣本的真實性。透過這種對抗過程,模型就能生成越來越逼真且複雜的內容。
  • 電腦視覺模型:以圖像資料集訓練而成,能執行圖像分類、物件偵測和圖像生成等工作,而且可針對特定應用方式微調,例如醫療影像分析或自駕車的物件辨識。

基礎模型的運作方式

基礎模型是透過自我監督式學習技術,以龐大的資料集訓練而成。這種機器學習方法是運用非監督式學習技術,執行原本需要監督式學習的工作 (例如,以人工輸入的方式為內容加上標籤)。這樣的方式有助於訓練模型預測輸入資料中遮蓋或遺失的部分。模型在持續預測的過程中,能逐漸學會如何找出資料中的模式、關係和潛在結構。

基礎模型的訓練過程與機器學習模型類似,通常包含以下幾個主要步驟:

收集及準備資料

  • 收集大型且多元化的資料集,確保內容能夠反映出模型部署時會遇到的實際資料分布情形
  • 資料會經過預先處理,移除雜訊、離群值和不一致的部分,這可能會用到資料清理、正規化和特徵工程等技術

模型架構選擇

  • 要選出合適的模型架構,須考量多種因素,包括工作的複雜度、資料類型和數量,以及可用的運算資源
  • 自我監督式學習常用的模型架構包括卷積類神經網路 (CNN)、循環類神經網路 (RNN) 和 Transformer

自我監督式訓練

  • 模型採用自我監督式學習技術進行訓練,做法是為資料建立虛擬標籤,並訓練模型預測這些標籤
  • 這可透過多種方法完成,例如對比學習、遮蓋語言模型和拼圖任務
  • 自我監督式訓練可讓模型學到有用的資料表示方法,而不必仰賴手動加註的標籤 (可能昂貴又耗時)

微調

  • 模型透過自我監督式學習完成預先訓練後,就能以特定領域或工作專屬的資料集進行微調
  • 微調過程中會調整參數,讓模型在目標工作上達到最佳表現
  • 微調可協助模型有效因應工作的特定需求,並提升整體效能

校正與安全訓練

  • 完成預先訓練和微調後,大多數的先進模型都會進入校正階段,確保輸出內容實用、無害且符合人類意圖
  • 這個關鍵步驟通常會使用人類回饋增強學習 (RLHF) 和直接偏好最佳化 (DPO) 等技術,由人工審查員評估模型回覆,引導模型朝更理想的行為發展

評估與部署

  • 模型完成訓練和微調後,會透過預留的測試集進行評估,檢驗效能表現
  • 如果模型達到預期的效能標準,便可部署至正式環境,用來解決實際問題

使用基礎模型的好處

基礎模型可為企業和開發人員帶來多項潛在優勢:

功能多元

基礎模型可根據各種工作靈活調整,因此不需要為每種應用方式額外訓練個別模型。正因為有這樣的靈活彈性,這類模型得以在各種產業和用途上充分發揮價值。

提高效率

使用預先訓練的基礎模型,可大幅減少開發新 AI 應用程式所需的時間和資源。微調預先訓練模型通常比從頭訓練模型更快、更有效率。

準確率

基礎模型是以大量資料集大規模訓練而成,因此在各種工作上都能達到極高的準確率,表現優於以小型資料集訓練的模型。

符合成本效益

基礎模型可減少對大量訓練資料和運算資源的需求,為 AI 應用程式開發提供經濟實惠的解決方案。

創新

基礎模型有助於推動 AI 領域的創新,催生更先進的新型 AI 應用。

擴充性

基礎模型可靈活擴充,以處理大型資料集和複雜工作,因此適合用於要求嚴苛的應用場景。

基礎模型帶來的挑戰與風險

雖然基礎模型的優點眾所皆知,但使用者和開發人員仍須克服以下重大難題:

  • 偏誤與公平性:基礎模型可能會繼承並放大龐大訓練資料中的社會偏誤,導致輸出不公平或帶有偏見的內容
  • 幻覺:模型可能會生成感覺上很肯定,但事實上不正確或毫無意義的資訊,這種現象稱為「幻覺
  • 運算成本高昂:訓練這些模型需要龐大的運算資源和能源,可能會造成環境和財務上的負擔

基礎模型範例

基礎模型生態系統充滿活力且競爭激烈。以下列舉幾個產業龍頭的代表性範例:

  • Google:以 Gemini 系列和 Gemma 聞名,前者是一系列強大的多模態模型 (Gemini 2.5 Pro 正是代表作),後者則為一系列專供開發人員使用的輕量級開放權重模型;Google 也開發了專用模型,例如用於文字轉圖像的 Imagen,以及用於影片生成的 Veo
  • OpenAI:開發了極具影響力的 GPT (Generative Pre-trained Transformer) 系列模型,包括受到廣泛使用的 GPT-4
  • Anthropic:著重於 AI 安全,開發 Claude 系列模型;Claude 3 系列 (包括 Opus、Sonnet 和 Haiku) 以大型脈絡窗口和強大的推論能力聞名
  • Meta:Meta 是開放原始碼 AI 的重要推手,開發了 Llama 系列。Llama 3 是開放模型,帶動整個社群加速創新
  • Mistral AI:這家歐洲公司以高效能的開放商業模型受到廣泛關注,例如 Mistral Large 和採用混合專家 (MoE) 架構來提升效率的開放原始碼 Mixtral 模型

Google Cloud 如何使用基礎模型?

Google Cloud 提供端對端企業平台 Vertex AI,協助組織存取、自訂及部署基本模型,以便實際應用。這項策略是以提供多樣選擇、強大工具和整合式基礎架構為核心。

以下是 Google Cloud 使用基礎模型的方式:

  • 多元開放的模型生態系統:Google Cloud 透過 Vertex AI Model Garden 提供完整資源庫,內含超過 130 個基礎模型,其中包括 Google 自家的先進模型,例如 Gemini 系列 (用於多模態工作) 和 Gemma (用於開放式輕量開發),以及 Anthropic (Claude)、Meta (Llama) 和 Mistral 等合作夥伴提供的熱門第三方和開放原始碼模型。開發人員可以依特定成本和效能需求,選擇最合適的模型。
  • 自訂和基準建立工具:Vertex AI 提供全套工具,讓使用者不再只是透過簡單的提示詞下指令。團隊可透過 Generative AI Studio 測試及調整模型,其中的主要功能就是以組織本身的企業資料建立模型基準,將模型的推論功能與公司的特定資料來源連結,大幅減少幻覺,並確保回覆與事實相符且符合需求。
  • 建構 AI 代理和應用程式:Google Cloud 著重於協助開發人員建構精密的 AI 應用程式,而不僅限於聊天機器人。透過 Vertex AI Agent Builder,組織可以建構及部署對話式 AI 代理,用於客戶服務、內部服務中心和其他業務程序。
  • 將生成式 AI 嵌入工作流程:基礎模型直接整合至企業原本使用的 Google Cloud 服務。舉例來說,Gemini Code Assist 可做為 AI 助理,協助開發人員加速編寫、解釋及測試程式碼,而 BigQuery 的功能則可讓使用者直接在資料倉儲中執行 AI 輔助資料分析。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品,開始在 Google Cloud 中建構產品與服務。