取得脈絡快取清單
如要取得與 Google Cloud 專案相關聯的內容快取清單,您需要建立專案的區域和專案 ID。 Google Cloud 以下說明如何取得 Google Cloud 專案的內容快取清單。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
以下說明如何使用 REST,將 GET 要求傳送至發布商模型端點,列出與 Google Cloud 專案相關聯的內容快取。
使用任何要求資料之前,請先替換以下項目:
HTTP 方法和網址:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents
如要傳送要求,請選擇以下其中一個選項:
curl
執行下列指令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents"
PowerShell
執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents" | Select-Object -Expand Content
您應該會收到類似以下的 JSON 回應:
cURL 指令範例
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents
取得內容快取的相關資訊
如要取得單一內容快取資訊,您需要快取 ID、與內容快取相關聯的Google Cloud 專案 ID,以及處理建立內容快取要求的區域。建立脈絡快取時,系統會傳回脈絡快取的快取 ID。您也可以使用內容快取清單指令,取得與專案相關聯的每個內容快取快取 ID。
以下說明如何取得單一內容快取的相關資訊。
Go
在試用這個範例之前,請先按照 Vertex AI 快速入門導覽課程的操作說明設定 Go 環境。詳情請參閱 Vertex AI Go 版 Gemini SDK 參考說明文件。
如要向 Vertex AI 進行驗證,請設定應用程式預設憑證。 詳情請參閱「 為本機開發環境設定 ADC」。
串流和非串流回應
您可以選擇模型生成串流或非串流回覆。如果是串流回應,系統會在生成輸出權杖後立即傳送每個回應。如果不是逐句顯示回覆,系統會在生成所有輸出權杖後,傳送所有回覆。
如要取得串流回應,請使用
GenerateContentStream
方法。
iter := model.GenerateContentStream(ctx, genai.Text("Tell me a story about a lumberjack and his giant ox. Keep it very short."))
如為非串流回應,請使用 GenerateContent
方法。
resp, err := model.GenerateContent(ctx, genai.Text("What is the average size of a swallow?"))
程式碼範例
REST
以下說明如何使用 REST,將 GET 要求傳送至發布商模型端點,列出與 Google Cloud 專案相關聯的內容快取。
使用任何要求資料之前,請先替換以下項目:
- PROJECT_ID:。
- LOCATION:處理建立脈絡快取要求的區域。
- CACHE_ID:內容快取的 ID。建立脈絡快取時,系統會傳回脈絡快取 ID。您也可以列出 Google Cloud 專案的脈絡快取,找出脈絡快取 ID。詳情請參閱「建立脈絡快取」和「列出脈絡快取」。
HTTP 方法和網址:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
如要傳送要求,請選擇以下其中一個選項:
curl
執行下列指令:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
您應該會收到類似以下的 JSON 回應:
cURL 指令範例
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}
- 瞭解如何使用脈絡快取。
- 瞭解如何更新脈絡快取的到期時間。
- 瞭解如何刪除脈絡快取。