Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

AI コンテキスト エンジニアリングとは

最終更新日時: 4/23/2026

コンテキスト エンジニアリングとは、AI が意味を理解するためのアーキテクチャです。初期の AI の使用方法は単語の選択に依存していましたが、Google Cloud 上の最新のシステムは、構造化されたデータ環境が存在しないと正しく機能しません。コンテキスト エンジニアリングは、デジタル ワーカーのためにハイテク ワークスペースを構築するようなものです。ワーカーに付せんを 1 枚だけ渡してタスクを割り当てるのではなく、BigQuery のラベル付きファイル キャビネット、Gemini Enterprise Agent Platform を使用したライブ接続、明確なルールセットを提供します。これにより、AI はユーザーが何を求めているかを推測できるだけでなく、データに基づく安定した現実世界の中で動作できるようになります。

プロンプト エンジニアリングとコンテキスト エンジニアリング

この業界は、基本的なプロンプトから複雑なコンテキスト パイプラインへとシフトしました。以前は、生成されるレポートを改良するために、アナリストが何時間もチャットボックスで文章を微調整しなければなりませんでした。現在では、Google は、データを自動的に収集してフィルタリングし、構造化してから AI に認識させるようするシステムを構築しました。手動のテキスト入力から、エージェント プラットフォームModel Context Protocol(MCP)などの自動化されたインフラストラクチャへと移行しました。

特長

以前のプロンプト エンジニアリング

最新のコンテキスト エンジニアリング

フォーカス

言葉の選択と言い回し

データ パイプラインと環境の状態

メソッド

手動で試行錯誤

Vertex AI を使用した自動取得

入力タイプ

静的テキスト文字列

BigQuery のライブ ストリームとマルチモーダル データ

スケーラビリティ

大規模に同じ処理を繰り返すのが困難

Google Cloud アーキテクチャに組み込む

特長

以前のプロンプト エンジニアリング

最新のコンテキスト エンジニアリング

フォーカス

言葉の選択と言い回し

データ パイプラインと環境の状態

メソッド

手動で試行錯誤

Vertex AI を使用した自動取得

入力タイプ

静的テキスト文字列

BigQuery のライブ ストリームとマルチモーダル データ

スケーラビリティ

大規模に同じ処理を繰り返すのが困難

Google Cloud アーキテクチャに組み込む

3 つのレベルのコンテキスト

AI エージェントの精度を長期間維持するには、3 つの異なる情報レイヤを管理する必要があります。これらのレイヤが整理されていないと、モデルが「ハルシネーション」を起こす、つまり事実と異なる情報を創作する可能性があります。

これらは、AI の世界の「物理法則」のように機能する基本的なルールです。エージェントの役割、話し方、厳密に許可する行動と許可しない行動を定義します。Vertex AI では、これらの指示がすべての対話に適用されます。

このレイヤで、過去の会話やユーザー固有の好みを追跡します。ユーザーが望ましいデータ形式について 3 ステップ前に言及していた場合は、半永続メモリによってエージェントはその情報を思い出すことができます。これにより、ユーザーが同じことを何度も言わなくてもワークフローを前進させることができます。

これは、外部の世界からリアルタイムで注入される「真実」です。これには、Agent Search で見つかったドキュメント、API からのライブ出力、短期的なメモが含まれ、モデルはこれらを問題について「考える」ために使用します。これは、現在処理中のタスクに非常に特化したもので、新しいリクエストを受け取るたびに変化します。

200 万トークン エコノミーについて

トークンは、AI のメモリと費用の基本単位になります。大規模言語モデルの「RAM」のようなものだと考えることができます。現在、Gemini 3.1 などのモデルは、100 万~200 万トークンのコンテキスト ウィンドウに拡張されています。この膨大な量に増加したことでソフトウェアの設計方法が変わっています。情報を小さなスペースに押し込めるのではなく、コードベース全体、1 時間の動画、数千行の BigQuery データを一度に与えられるようになりました。

戦略的なコンテキスト キャッシュ保存

以前は、費用を節約するために、デベロッパーがデータを積極的に削減または「プルーニング」する必要があったため、結果的に情報が失われることがよくありました。現在では、エージェント プラットフォームのコンテキスト キャッシュ保存を使用することで、モデルのアクティブ メモリに大量のデータを 90% のコスト削減で保存できるようになりました。これにより、繰り返し使用する大量の背景情報をキープしながら、モデルのスピードと手頃な価格を維持することができます。

よくある質問

ここでは、成長を続けるコンテキスト エンジニアリング分野に関するよくある質問をいくつかご紹介します。

プロンプト エンジニアリングとは、可能な限り最善の指示を書くことです。コンテキスト エンジニアリングは、AI が Google Cloud で質問に答えるために使用するデータシステムとメモリ全体を設計する、より大きな規模の作業です。

コンテキスト エンジニアリングとは、AI のための情報を管理する手法です。Model Context Protocol(MCP)は、AI を BigQuery などのさまざまなデータソースに安全かつ簡単に接続できるようにするための専用ツールです。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。

エージェント プラットフォームを使用して Google Cloud 上のコンテキストを最適化する

Google Cloud は、こうした膨大なコンテキストを求めるニーズに対応できるインフラストラクチャを提供しています。エージェント プラットフォームと Gemini 3.1 Flash は、低レイテンシと高いコンテキストを必要とするタスク向けに設計されています。ドキュメントのライブラリ全体を「読み取り」、数秒で質問に回答することができるエージェントをデベロッパーが構築できるように構成されています。

費用の最適化に関する注目事項

Google Cloud のコンテキスト キャッシュを使用すると、トークンの費用を最大 90% 削減できます。データ量の多いアプリの場合、BigQuery スキーマ全体あるいは技術マニュアルのライブラリ一式といったデータをアクティブ メモリに保存できます。つまり、ユーザーが新しい質問をするたびに、費用を支払ってこうしたデータをモデルに「送信」する必要がありません。

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud