基礎模型 (有時也稱為「基底模型」) 是強大的人工智慧 (AI) 模型,以大量資料訓練而成,可靈活調整,運用於各種工作。「基礎模型」一詞由史丹佛大學人本人工智慧研究中心 (HAI) 於 2021 年提出。
這項技術為各行各業創造全新的可能性,從簡化軟體開發到改善客服互動,都能派上用場。
基礎模型是一種 AI 模型,會透過大量資料預先訓練,以便執行各種工作。透過這個訓練過程 (通常採用自我監督式學習),模型能學習資料中複雜的模式和關係,進而有效執行各種工作並展現更高的準確度。更重要的是,在這種大規模的訓練下,模型可能會培養出意想不到的新能力,能夠完成未明確訓練過的工作。從專用工具轉化為可靈活調整的一般用途模型,正是基礎模型的一大特色。
「基礎模型」和「大型語言模型」(LLM) 這兩個詞經常交替使用,但兩者之間有個關鍵差異。LLM 是基礎模型的主要類型,但並非唯一一種。這就像親子關係:所有 LLM 都是基礎模型,但並非所有基礎模型都是 LLM。
兩者的主要差異在於建構時使用的資料類型。顧名思義,LLM 特別以大量文字和程式碼訓練而成,而「基礎模型」這個更廣泛的類別,則還包含以其他資料類型 (例如圖像、音訊和影片) 或多種資料類型 (多模態) 訓練而成的模型。
生成式 AI 和基礎模型雖然不同,但兩者密切相關。如要瞭解兩者差異,最有用的方式就是將它們視為「引擎」與「功能」:
雖然大多數熱門的基礎模型都用於生成式工作,但這類模型也能改用於非生成式用途,如複雜的分類或分析。因此,雖然並非所有基礎模型都具備生成功能,但它們是帶動當前生成式 AI 應用浪潮的關鍵技術。
基礎模型包含各種架構,每種架構都有自己獨特的優勢和應用方式。以下列舉幾種重要類型:
基礎模型是透過自我監督式學習技術,以龐大的資料集訓練而成。這種機器學習方法是運用非監督式學習技術,執行原本需要監督式學習的工作 (例如,以人工輸入的方式為內容加上標籤)。這樣的方式有助於訓練模型預測輸入資料中遮蓋或遺失的部分。模型在持續預測的過程中,能逐漸學會如何找出資料中的模式、關係和潛在結構。
基礎模型的訓練過程與機器學習模型類似,通常包含以下幾個主要步驟:
基礎模型可為企業和開發人員帶來多項潛在優勢:
功能多元
基礎模型可根據各種工作靈活調整,因此不需要為每種應用方式額外訓練個別模型。正因為有這樣的靈活彈性,這類模型得以在各種產業和用途上充分發揮價值。
提高效率
使用預先訓練的基礎模型,可大幅減少開發新 AI 應用程式所需的時間和資源。微調預先訓練模型通常比從頭訓練模型更快、更有效率。
準確率
基礎模型是以大量資料集大規模訓練而成,因此在各種工作上都能達到極高的準確率,表現優於以小型資料集訓練的模型。
符合成本效益
基礎模型可減少對大量訓練資料和運算資源的需求,為 AI 應用程式開發提供經濟實惠的解決方案。
創新
基礎模型有助於推動 AI 領域的創新,催生更先進的新型 AI 應用。
擴充性
基礎模型可靈活擴充,以處理大型資料集和複雜工作,因此適合用於要求嚴苛的應用場景。
雖然基礎模型的優點眾所皆知,但使用者和開發人員仍須克服以下重大難題:
基礎模型生態系統充滿活力且競爭激烈。以下列舉幾個產業龍頭的代表性範例:
Google Cloud 提供端對端企業平台 Vertex AI,協助組織存取、自訂及部署基本模型,以便實際應用。這項策略是以提供多樣選擇、強大工具和整合式基礎架構為核心。
以下是 Google Cloud 使用基礎模型的方式: