什麼是 AI 脈絡工程？

上次更新時間：4/23/2026

脈絡工程是人工智慧的意義架構。早期的 AI 應用主要依賴字詞選擇，但 Google Cloud 的現代系統需要結構化資料環境才能正常運作。這個過程就像為一位數位工作者打造一個高科技的工作空間。這不再只是給工作者一張寫有任務的便條紙，而是提供 BigQuery 中附有標籤的檔案櫃、使用 Gemini Enterprise Agent Platform 的即時連線，以及一套明確的規則。這可確保 AI 不會只是猜測您的需求，而是根據穩定、以資料為準的事實來運作。

網誌

開發人員指南：打造可用於正式環境的 AI 代理

提示工程與脈絡工程的比較

產業已從最初的基本提示詞，轉向複雜的脈絡管道。過去，分析師必須花費數小時，在聊天方塊中微調幾句話，才能獲得更好的報告。如今，我們建構的系統會自動收集、篩選及結構化資料，再提供給 AI。我們已從手動輸入文字，轉為使用 Agent Platform 和 Model Context Protocol (MCP) 等自動化基礎架構。

功能	舊版提示工程	現代脈絡工程
焦點	遣詞用字與措辭	資料管道和環境狀態
方法	手動反覆試驗	使用 Agent Platform 自動檢索資料
輸入類型	靜態文字字串	BigQuery 即時串流和多模態資料
擴充性	難以大規模複製	內建於 Google Cloud 架構

功能

舊版提示工程

現代脈絡工程

焦點

遣詞用字與措辭

資料管道和環境狀態

方法

手動反覆試驗

使用 Agent Platform 自動檢索資料

輸入類型

靜態文字字串

BigQuery 即時串流和多模態資料

擴充性

難以大規模複製

內建於 Google Cloud 架構

三種脈絡層級

如要確保 AI 代理長期維持準確性，您需要管理三種不同的資訊層。如果這些層未經整理，模型可能會生成「幻覺」或編造內容。

永久 (系統指令)

這些是基礎規則，就像 AI 世界的「物理定律」。這些指令會定義代理的角色、語氣，以及嚴格禁止或允許的行為。在 Vertex AI 中，這些指令會在每次互動時保持有效。

半永久 (記憶體)

這一層會追蹤對話記錄和使用者的特定偏好。如果使用者在三個步驟前提到偏好的資料格式，半永久記憶體可確保代理不會忘記。這樣一來，使用者不必重複說明，工作流程也能順利進行。

暫時性 (動態資料)

這是從外部世界即時植入的「真相」。其中包括透過 Agent Search 找到的文件、即時 API 輸出內容，以及模型用來「思考」問題的短期筆記。這類資料與當前任務高度相關，且會隨著每次新要求而變更。

瞭解 2 百萬個詞元的經濟性

詞元是 AI 的基本記憶體和費用單位。您可以將其視為大型語言模型的「RAM」。目前，Gemini 3.1 等模型已將脈絡窗口擴展到 100 萬到 200 萬個詞元。這個龐大的容量改變了我們設計軟體的方式。現在，我們不再需要把資訊硬塞進狹小的空間，而是能一次提供整個程式碼集、長達一小時的影片，或成千上萬列的 BigQuery 資料。

策略性脈絡快取

過去，開發人員常常必須大幅刪減或「修剪」資料來省錢，但這往往會導致資訊遺失。現在有了 Agent Platform 的脈絡快取功能，我們能以 1 折的價格，將大量資料儲存在模型的主動記憶體中。這樣一來，模型就能快速運作，且價格實惠，同時還能保留大量背景資訊，供重複使用。

常見問題

以下是脈絡工程這個新興領域的常見問題。

提示工程與脈絡工程有何不同？

提示工程的目標是撰寫最佳指令。脈絡工程則是更重大的任務，指在 Google Cloud 上設計整個資料系統和記憶體，供 AI 用於回答問題。

MCP 與脈絡工程有何不同？

脈絡工程是指為 AI 管理資訊的做法。Model Context Protocol (MCP) 是一種專門工具，可讓 AI 輕鬆安全地連結至 BigQuery 等不同資料來源。

透過 Google Cloud 解決業務難題

新客戶可以獲得價值 $300 美元的免費抵免額，盡情試用各項 Google Cloud 功能。

與 Google Cloud 銷售專員聯絡，深入探討您面臨的特殊難題。

使用 Agent Platform 在 Google Cloud 最佳化脈絡

Google Cloud 提供的基礎架構，足以滿足這些龐大的脈絡需求。Agent Platform 和 Gemini 3.1 Flash 專為需要低延遲和高脈絡的任務設計。有了這項設定，開發人員就能建構出可「閱讀」整個文件庫的代理，並在幾秒內回答問題。

可預期的成本最佳化

Google Cloud 的脈絡快取功能可將詞元費用降低多達 90%。對於資料量大的應用程式，您可以將整個 BigQuery 結構定義或完整的技術手冊資料庫等內容儲存在主動記憶體中。也就是說，每當使用者提出新問題時，您不必再付費把那些資料「傳送」給模型。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品，開始在 Google Cloud 中建構產品與服務。

需要入門協助嗎？
聯絡銷售人員
與值得信賴的夥伴合作
尋找合作夥伴
繼續瀏覽
查看所有產品