AI コンテキストエンジニアリングとは

最終更新日時: 4/23/2026

コンテキストエンジニアリングとは、AI が意味を理解するためのアーキテクチャです。初期の AI の使用方法は単語の選択に依存していましたが、Google Cloud 上の最新のシステムは、構造化されたデータ環境が存在しないと正しく機能しません。コンテキストエンジニアリングは、デジタルワーカーのためにハイテクワークスペースを構築するようなものです。ワーカーに付せんを 1 枚だけ渡してタスクを割り当てるのではなく、BigQuery のラベル付きファイルキャビネット、Gemini Enterprise Agent Platform を使用したライブ接続、明確なルールセットを提供します。これにより、AI はユーザーが何を求めているかを推測できるだけでなく、データに基づく安定した現実世界の中で動作できるようになります。

BLOG

プロダクションレディな AI エージェントに関するデベロッパーガイド

プロンプトエンジニアリングとコンテキストエンジニアリング

この業界は、基本的なプロンプトから複雑なコンテキストパイプラインへとシフトしました。以前は、生成されるレポートを改良するために、アナリストが何時間もチャットボックスで文章を微調整しなければなりませんでした。現在では、Google は、データを自動的に収集してフィルタリングし、構造化してから AI に認識させるようするシステムを構築しました。手動のテキスト入力から、エージェントプラットフォームや Model Context Protocol（MCP）などの自動化されたインフラストラクチャへと移行しました。

機能	以前のプロンプトエンジニアリング	最新のコンテキストエンジニアリング
フォーカス	言葉の選択と言い回し	データパイプラインと環境の状態
メソッド	手動で試行錯誤	Agent Platform を使用した自動取得
入力タイプ	静的テキスト文字列	BigQuery のライブストリームとマルチモーダルデータ
スケーラビリティ	大規模に同じ処理を繰り返すのが困難	Google Cloud アーキテクチャに組み込む

機能

以前のプロンプトエンジニアリング

最新のコンテキストエンジニアリング

フォーカス

言葉の選択と言い回し

データパイプラインと環境の状態

メソッド

手動で試行錯誤

Agent Platform を使用した自動取得

入力タイプ

静的テキスト文字列

BigQuery のライブストリームとマルチモーダルデータ

スケーラビリティ

大規模に同じ処理を繰り返すのが困難

Google Cloud アーキテクチャに組み込む

3 つのレベルのコンテキスト

AI エージェントの精度を長期間維持するには、3 つの異なる情報レイヤを管理する必要があります。これらのレイヤが整理されていないと、モデルが「ハルシネーション」を起こす、つまり事実と異なる情報を創作する可能性があります。

永続（システム指示）

これらは、AI の世界の「物理法則」のように機能する基本的なルールです。エージェントの役割、話し方、厳密に許可する行動と許可しない行動を定義します。Vertex AI では、これらの指示がすべての対話に適用されます。

半永続（メモリ）

このレイヤで、過去の会話やユーザー固有の好みを追跡します。ユーザーが望ましいデータ形式について 3 ステップ前に言及していた場合は、半永続メモリによってエージェントはその情報を思い出すことができます。これにより、ユーザーが同じことを何度も言わなくてもワークフローを前進させることができます。

短期（動的データ）

これは、外部の世界からリアルタイムで注入される「真実」です。これには、Agent Search で見つかったドキュメント、API からのライブ出力、短期的なメモが含まれ、モデルはこれらを問題について「考える」ために使用します。これは、現在処理中のタスクに非常に特化したもので、新しいリクエストを受け取るたびに変化します。

200 万トークンエコノミーについて

トークンは、AI のメモリと費用の基本単位になります。大規模言語モデルの「RAM」のようなものだと考えることができます。現在、Gemini 3.1 などのモデルは、100 万～200 万トークンのコンテキストウィンドウに拡張されています。この膨大な量に増加したことでソフトウェアの設計方法が変わっています。情報を小さなスペースに押し込めるのではなく、コードベース全体、1 時間の動画、数千行の BigQuery データを一度に与えられるようになりました。

戦略的なコンテキストキャッシュ保存

以前は、費用を節約するために、デベロッパーがデータを積極的に削減または「プルーニング」する必要があったため、結果的に情報が失われることがよくありました。現在では、エージェントプラットフォームのコンテキストキャッシュ保存を使用することで、モデルのアクティブメモリに大量のデータを 90% のコスト削減で保存できるようになりました。これにより、繰り返し使用する大量の背景情報をキープしながら、モデルのスピードと手頃な価格を維持することができます。

よくある質問

ここでは、成長を続けるコンテキストエンジニアリング分野に関するよくある質問をいくつかご紹介します。

プロンプトエンジニアリングとコンテキストエンジニアリングの違いは何ですか？

プロンプトエンジニアリングとは、可能な限り最善の指示を書くことです。コンテキストエンジニアリングは、AI が Google Cloud で質問に答えるために使用するデータシステムとメモリ全体を設計する、より大きな規模の作業です。

MCP とコンテキストエンジニアリングの違いは何ですか？

コンテキストエンジニアリングとは、AI のための情報を管理する手法です。Model Context Protocol（MCP）は、AI を BigQuery などのさまざまなデータソースに安全かつ簡単に接続できるようにするための専用ツールです。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。

お客様独自の課題については、Google Cloud のセールススペシャリストまで詳しくご相談ください。

エージェントプラットフォームを使用して Google Cloud 上のコンテキストを最適化する

Google Cloud は、こうした膨大なコンテキストを求めるニーズに対応できるインフラストラクチャを提供しています。エージェントプラットフォームと Gemini 3.1 Flash は、低レイテンシと高いコンテキストを必要とするタスク向けに設計されています。ドキュメントのライブラリ全体を「読み取り」、数秒で質問に回答することができるエージェントをデベロッパーが構築できるように構成されています。

費用の最適化に関する注目事項

Google Cloud のコンテキストキャッシュを使用すると、トークンの費用を最大 90% 削減できます。データ量の多いアプリの場合、BigQuery スキーマ全体あるいは技術マニュアルのライブラリ一式といったデータをアクティブメモリに保存できます。つまり、ユーザーが新しい質問をするたびに、費用を支払ってこうしたデータをモデルに「送信」する必要がありません。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

開始にあたりサポートが必要な場合
お問い合わせ
信頼できるパートナーと連携する
パートナーを探す
もっと見る
すべてのプロダクトを見る

AI コンテキスト エンジニアリングとは

プロンプト エンジニアリングとコンテキスト エンジニアリング

3 つのレベルのコンテキスト

永続（システム指示）

半永続（メモリ）

短期（動的データ）

200 万トークン エコノミーについて

戦略的なコンテキスト キャッシュ保存

よくある質問

プロンプト エンジニアリングとコンテキスト エンジニアリングの違いは何ですか？

MCP とコンテキスト エンジニアリングの違いは何ですか？

Google Cloud でビジネスの課題を解決する

エージェント プラットフォームを使用して Google Cloud 上のコンテキストを最適化する

関連サービス