上次更新時間:4/23/2026
脈絡工程是人工智慧的意義架構。早期的 AI 應用主要依賴字詞選擇,但 Google Cloud 的現代系統需要結構化資料環境才能正常運作。這個過程就像為一位數位工作者打造一個高科技的工作空間。這不再只是給工作者一張寫有任務的便條紙,而是提供 BigQuery 中附有標籤的檔案櫃、使用 Gemini Enterprise Agent Platform 的即時連線,以及一套明確的規則。這可確保 AI 不會只是猜測您的需求,而是根據穩定、以資料為準的事實來運作。
產業已從最初的基本提示詞,轉向複雜的脈絡管道。過去,分析師必須花費數小時,在聊天方塊中微調幾句話,才能獲得更好的報告。如今,我們建構的系統會自動收集、篩選及結構化資料,再提供給 AI。我們已從手動輸入文字,轉為使用 Agent Platform 和 Model Context Protocol (MCP) 等自動化基礎架構。
功能 | 舊版提示工程 | 現代脈絡工程 |
焦點 | 遣詞用字與措辭 | 資料管道和環境狀態 |
方法 | 手動反覆試驗 | 使用 Vertex AI 自動檢索資料 |
輸入類型 | 靜態文字字串 | BigQuery 即時串流和多模態資料 |
擴充性 | 難以大規模複製 | 內建於 Google Cloud 架構 |
功能
舊版提示工程
現代脈絡工程
焦點
遣詞用字與措辭
資料管道和環境狀態
方法
手動反覆試驗
使用 Vertex AI 自動檢索資料
輸入類型
靜態文字字串
BigQuery 即時串流和多模態資料
擴充性
難以大規模複製
內建於 Google Cloud 架構
如要確保 AI 代理長期維持準確性,您需要管理三種不同的資訊層。如果這些層未經整理,模型可能會生成「幻覺」或編造內容。
這些是基礎規則,就像 AI 世界的「物理定律」。這些指令會定義代理的角色、語氣,以及嚴格禁止或允許的行為。在 Vertex AI 中,這些指令會在每次互動時保持有效。
這一層會追蹤對話記錄和使用者的特定偏好。如果使用者在三個步驟前提到偏好的資料格式,半永久記憶體可確保代理不會忘記。這樣一來,使用者不必重複說明,工作流程也能順利進行。
這是從外部世界即時植入的「真相」。其中包括透過 Agent Search 找到的文件、即時 API 輸出內容,以及模型用來「思考」問題的短期筆記。這類資料與當前任務高度相關,且會隨著每次新要求而變更。
詞元是 AI 的基本記憶體和費用單位。您可以將其視為大型語言模型的「RAM」。目前,Gemini 3.1 等模型已將脈絡窗口擴展到 100 萬到 200 萬個詞元。這個龐大的容量改變了我們設計軟體的方式。現在,我們不再需要把資訊硬塞進狹小的空間,而是能一次提供整個程式碼集、長達一小時的影片,或成千上萬列的 BigQuery 資料。
過去,開發人員常常必須大幅刪減或「修剪」資料來省錢,但這往往會導致資訊遺失。現在有了 Agent Platform 的脈絡快取功能,我們能以 1 折的價格,將大量資料儲存在模型的主動記憶體中。這樣一來,模型就能快速運作,且價格實惠,同時還能保留大量背景資訊,供重複使用。
以下是脈絡工程這個新興領域的常見問題。
提示工程的目標是撰寫最佳指令。脈絡工程則是更重大的任務,指在 Google Cloud 上設計整個資料系統和記憶體,供 AI 用於回答問題。
脈絡工程是指為 AI 管理資訊的做法。Model Context Protocol (MCP) 是一種專門工具,可讓 AI 輕鬆安全地連結至 BigQuery 等不同資料來源。
Google Cloud 提供的基礎架構,足以滿足這些龐大的脈絡需求。Agent Platform 和 Gemini 3.1 Flash 專為需要低延遲和高脈絡的任務設計。有了這項設定,開發人員就能建構出可「閱讀」整個文件庫的代理,並在幾秒內回答問題。
可預期的成本最佳化
Google Cloud 的脈絡快取功能可將詞元費用降低多達 90%。對於資料量大的應用程式,您可以將整個 BigQuery 結構定義或完整的技術手冊資料庫等內容儲存在主動記憶體中。也就是說,每當使用者提出新問題時,您不必再付費把那些資料「傳送」給模型。