コンテキスト キャッシュを削除するには、キャッシュ ID、コンテキスト キャッシュが関連付けられている Google Cloud プロジェクト ID、コンテキスト キャッシュの作成リクエストが処理されたリージョンが必要です。コンテキスト キャッシュのキャッシュ ID は、コンテキスト キャッシュの作成時に返されます。コンテキスト キャッシュ リストコマンドを使用して、プロジェクトに関連付けられた各コンテキスト キャッシュのキャッシュ ID を取得することもできます。
コンテキスト キャッシュの削除例
次の例は、コンテキスト キャッシュを削除する方法を示しています。
Python
Vertex AI SDK for Python のインストールまたは更新方法については、Vertex AI SDK for Python をインストールするをご覧ください。詳細については、Vertex AI SDK for Python API のリファレンス ドキュメントをご覧ください。
ストリーミング レスポンスと非ストリーミング レスポンス
モデルがストリーミング レスポンスを生成するか、非ストリーミング レスポンスを生成するかを選択できます。ストリーミング レスポンスの場合、出力トークンが生成されるとすぐに各レスポンスが受信されます。非ストリーミング レスポンスの場合、すべての出力トークンが生成された後にすべてのレスポンスが届きます。
ストリーミング レスポンスの場合は、generate_content
の stream
パラメータを使用します。
response = model.generate_content(contents=[...], stream = True)
非ストリーミング レスポンスの場合は、パラメータを削除するか、パラメータを False
に設定します。
サンプルコード
REST
以下は、パブリッシャー モデルのエンドポイントに DELETE リクエストを送信して、REST を使用して Google Cloud プロジェクトに関連付けられたコンテキスト キャッシュを削除する方法を示しています。
リクエストのデータを使用する前に、次のように置き換えます。
- PROJECT_ID: 実際のプロジェクト ID。
- LOCATION: コンテキスト キャッシュの作成リクエストが処理され、キャッシュ化されたコンテンツが保存されるリージョン。
- CACHE_ID: 削除するコンテキスト キャッシュの ID。コンテキスト キャッシュ ID は、コンテキスト キャッシュの作成時に返されます。コンテキスト キャッシュ ID は、Google Cloud プロジェクトのコンテキスト キャッシュを一覧表示することでも確認できます。詳細については、コンテキスト キャッシュを作成するとコンテキスト キャッシュを一覧表示するをご覧ください。
HTTP メソッドと URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
次のコマンドを実行します。
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
次のコマンドを実行します。
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
削除オペレーションが成功すると、レスポンスは空になります。
curl コマンドの例
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}