Informationen zu einem Kontext-Cache abrufen

Sie können erfahren, wann ein Kontext-Cache erstellt wurde, wann er zuletzt aktualisiert wurde und wann er abläuft. Um Informationen zu allen Kontext-Caches zu erhalten, die mit einem Google Cloud-Projekt verknüpft sind, einschließlich ihrer Cache-IDs, verwenden Sie den Befehl um Kontext-Caches aufzulisten. Wenn Sie die Cache-ID eines Kontext-Caches kennen, können Sie Informationen speziell zu diesem Kontext-Cache abrufen.

Liste der Kontext-Caches abrufen

Um eine Liste der Kontext-Caches abzurufen, die mit einem Google Cloud-Projekts verknüpft sind, benötigen Sie die Region, in der Sie sie erstellt haben, und die ID Ihres Google Cloud-Projekts. Im Folgenden wird gezeigt, wie Sie eine Liste der Kontext-Caches für ein Google Cloud-Projekt abrufen.

REST

Im Folgenden wird gezeigt, wie Sie mit REST die mit einem Google Cloud-Projekt verknüpften Kontext-Caches auflisten, indem Sie eine GET-Anfrage an den Endpunkt des Publisher-Modells senden.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

HTTP-Methode und URL:

GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents

Senden Sie die Anfrage mithilfe einer der folgenden Optionen:

curl

Führen Sie folgenden Befehl aus:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents"

PowerShell

Führen Sie folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents" | Select-Object -Expand Content

Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:

Beispiel: cURL-Befehls

LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"

curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents

Informationen zu einem Kontext-Cache abrufen

Wenn Sie Informationen zu einem Kontext-Cache abrufen möchten, benötigen Sie die entsprechende Cache-ID, die Google Cloud-Projekt-ID, mit der dieser Kontext-Cache verknüpft ist, und die Region, in der die Anfrage zum Erstellen des Kontext-Caches verarbeitet wurde. Die Cache-ID eines Kontext-Caches wird zurückgegeben, wenn Sie den Kontext-Cache erstellen. Sie können auch mit dem Befehl "Kontext-Cache-Liste" die Cache-ID jedes mit einem Projekt verknüpften Kontext-Cache abrufen.

Im Folgenden erfahren Sie, wie Sie Informationen zu einem Kontext-Cache abrufen.

Python

Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der API-Referenzdokumentation zur Vertex AI SDK for Python.

Streaming- und Nicht-Streaming-Antworten

Sie können auswählen, ob das Modell Streaming-Antworten oder Nicht-Streaming-Antworten generiert. Bei Streaming-Antworten erhalten Sie jede Antwort, sobald ihr Ausgabetoken generiert wurde. Bei Nicht-Streaming-Antworten erhalten Sie alle Antworten, nachdem alle Ausgabetokens erzeugt wurden.

Verwenden Sie für eine Streaming-Antwort den Parameter stream in generate_content.

  response = model.generate_content(contents=[...], stream = True)
  

Entfernen Sie für eine Nicht-Streamingantwort den Parameter oder setzen Sie den Parameter auf False.

Beispielcode

import vertexai

from vertexai.preview import caching

# TODO(developer): Update and un-comment below lines
# project_id = "PROJECT_ID"
# cache_id = "CACHE_ID"

vertexai.init(project=project_id, location="us-central1")

cached_content = caching.CachedContent(cached_content_name=cache_id)

print(cached_content.name)

REST

Im Folgenden wird gezeigt, wie Sie mit REST die mit einem Google Cloud-Projekt verknüpften Kontext-Caches auflisten, indem Sie eine GET-Anfrage an den Endpunkt des Publisher-Modells senden.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Projekt-ID.
  • LOCATION: Die Region, in der die Anfrage zum Erstellen des Kontext-Cache verarbeitet wurde.
  • CACHE_ID: Die ID des Kontext-Caches. Die Kontext-Cache-ID wird zurückgegeben, wenn Sie den Kontext-Cache erstellen. Sie können Kontext-Cache-IDs auch finden, indem Sie die Kontext-Caches für ein Google Cloud-Projekt auflisten. Weitere Informationen finden Sie unter Kontext-Cache erstellen und Kontext-Caches auflisten.

HTTP-Methode und URL:

GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID

Senden Sie die Anfrage mithilfe einer der folgenden Optionen:

curl

Führen Sie folgenden Befehl aus:

curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"

PowerShell

Führen Sie folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content

Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:

Beispiel: cURL-Befehls

LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"

curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}