最終更新日時: 4/23/2026
コンテキスト エンジニアリングとは、AI が意味を理解するためのアーキテクチャです。初期の AI の使用方法は単語の選択に依存していましたが、Google Cloud 上の最新のシステムは、構造化されたデータ環境が存在しないと正しく機能しません。コンテキスト エンジニアリングは、デジタル ワーカーのためにハイテク ワークスペースを構築するようなものです。ワーカーに付せんを 1 枚だけ渡してタスクを割り当てるのではなく、BigQuery のラベル付きファイル キャビネット、Gemini Enterprise Agent Platform を使用したライブ接続、明確なルールセットを提供します。これにより、AI はユーザーが何を求めているかを推測できるだけでなく、データに基づく安定した現実世界の中で動作できるようになります。
この業界は、基本的なプロンプトから複雑なコンテキスト パイプラインへとシフトしました。以前は、生成されるレポートを改良するために、アナリストが何時間もチャットボックスで文章を微調整しなければなりませんでした。現在では、Google は、データを自動的に収集してフィルタリングし、構造化してから AI に認識させるようするシステムを構築しました。手動のテキスト入力から、エージェント プラットフォームや Model Context Protocol(MCP)などの自動化されたインフラストラクチャへと移行しました。
特長 | 以前のプロンプト エンジニアリング | 最新のコンテキスト エンジニアリング |
フォーカス | 言葉の選択と言い回し | データ パイプラインと環境の状態 |
メソッド | 手動で試行錯誤 | Vertex AI を使用した自動取得 |
入力タイプ | 静的テキスト文字列 | BigQuery のライブ ストリームとマルチモーダル データ |
スケーラビリティ | 大規模に同じ処理を繰り返すのが困難 | Google Cloud アーキテクチャに組み込む |
特長
以前のプロンプト エンジニアリング
最新のコンテキスト エンジニアリング
フォーカス
言葉の選択と言い回し
データ パイプラインと環境の状態
メソッド
手動で試行錯誤
Vertex AI を使用した自動取得
入力タイプ
静的テキスト文字列
BigQuery のライブ ストリームとマルチモーダル データ
スケーラビリティ
大規模に同じ処理を繰り返すのが困難
Google Cloud アーキテクチャに組み込む
AI エージェントの精度を長期間維持するには、3 つの異なる情報レイヤを管理する必要があります。これらのレイヤが整理されていないと、モデルが「ハルシネーション」を起こす、つまり事実と異なる情報を創作する可能性があります。
これらは、AI の世界の「物理法則」のように機能する基本的なルールです。エージェントの役割、話し方、厳密に許可する行動と許可しない行動を定義します。Vertex AI では、これらの指示がすべての対話に適用されます。
このレイヤで、過去の会話やユーザー固有の好みを追跡します。ユーザーが望ましいデータ形式について 3 ステップ前に言及していた場合は、半永続メモリによってエージェントはその情報を思い出すことができます。これにより、ユーザーが同じことを何度も言わなくてもワークフローを前進させることができます。
これは、外部の世界からリアルタイムで注入される「真実」です。これには、Agent Search で見つかったドキュメント、API からのライブ出力、短期的なメモが含まれ、モデルはこれらを問題について「考える」ために使用します。これは、現在処理中のタスクに非常に特化したもので、新しいリクエストを受け取るたびに変化します。
トークンは、AI のメモリと費用の基本単位になります。大規模言語モデルの「RAM」のようなものだと考えることができます。現在、Gemini 3.1 などのモデルは、100 万~200 万トークンのコンテキスト ウィンドウに拡張されています。この膨大な量に増加したことでソフトウェアの設計方法が変わっています。情報を小さなスペースに押し込めるのではなく、コードベース全体、1 時間の動画、数千行の BigQuery データを一度に与えられるようになりました。
以前は、費用を節約するために、デベロッパーがデータを積極的に削減または「プルーニング」する必要があったため、結果的に情報が失われることがよくありました。現在では、エージェント プラットフォームのコンテキスト キャッシュ保存を使用することで、モデルのアクティブ メモリに大量のデータを 90% のコスト削減で保存できるようになりました。これにより、繰り返し使用する大量の背景情報をキープしながら、モデルのスピードと手頃な価格を維持することができます。
ここでは、成長を続けるコンテキスト エンジニアリング分野に関するよくある質問をいくつかご紹介します。
プロンプト エンジニアリングとは、可能な限り最善の指示を書くことです。コンテキスト エンジニアリングは、AI が Google Cloud で質問に答えるために使用するデータシステムとメモリ全体を設計する、より大きな規模の作業です。
コンテキスト エンジニアリングとは、AI のための情報を管理する手法です。Model Context Protocol(MCP)は、AI を BigQuery などのさまざまなデータソースに安全かつ簡単に接続できるようにするための専用ツールです。
Google Cloud は、こうした膨大なコンテキストを求めるニーズに対応できるインフラストラクチャを提供しています。エージェント プラットフォームと Gemini 3.1 Flash は、低レイテンシと高いコンテキストを必要とするタスク向けに設計されています。ドキュメントのライブラリ全体を「読み取り」、数秒で質問に回答することができるエージェントをデベロッパーが構築できるように構成されています。
費用の最適化に関する注目事項
Google Cloud のコンテキスト キャッシュを使用すると、トークンの費用を最大 90% 削減できます。データ量の多いアプリの場合、BigQuery スキーマ全体あるいは技術マニュアルのライブラリ一式といったデータをアクティブ メモリに保存できます。つまり、ユーザーが新しい質問をするたびに、費用を支払ってこうしたデータをモデルに「送信」する必要がありません。