Sie können erfahren, wann ein Kontext-Cache erstellt wurde, wann er zuletzt aktualisiert wurde und wann er abläuft. Um Informationen zu allen Kontext-Caches zu erhalten, die mit einem Google Cloud-Projekt verknüpft sind, einschließlich ihrer Cache-IDs, verwenden Sie den Befehl um Kontext-Caches aufzulisten. Wenn Sie die Cache-ID eines Kontext-Caches kennen, können Sie Informationen speziell zu diesem Kontext-Cache abrufen.
Liste der Kontext-Caches abrufen
Um eine Liste der Kontext-Caches abzurufen, die mit einem Google Cloud-Projekts verknüpft sind, benötigen Sie die Region, in der Sie sie erstellt haben, und die ID Ihres Google Cloud-Projekts. Im Folgenden wird gezeigt, wie Sie eine Liste der Kontext-Caches für ein Google Cloud-Projekt abrufen.
REST
Im Folgenden wird gezeigt, wie Sie mit REST die mit einem Google Cloud-Projekt verknüpften Kontext-Caches auflisten, indem Sie eine GET-Anfrage an den Endpunkt des Publisher-Modells senden.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfragen zum Erstellen der Kontext-Caches verarbeitet wurden.
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Beispiel: cURL-Befehls
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents
Informationen zu einem Kontext-Cache abrufen
Wenn Sie Informationen zu einem Kontext-Cache abrufen möchten, benötigen Sie die entsprechende Cache-ID, die Google Cloud-Projekt-ID, mit der dieser Kontext-Cache verknüpft ist, und die Region, in der die Anfrage zum Erstellen des Kontext-Caches verarbeitet wurde. Die Cache-ID eines Kontext-Caches wird zurückgegeben, wenn Sie den Kontext-Cache erstellen. Sie können auch mit dem Befehl "Kontext-Cache-Liste" die Cache-ID jedes mit einem Projekt verknüpften Kontext-Cache abrufen.
Im Folgenden erfahren Sie, wie Sie Informationen zu einem Kontext-Cache abrufen.
Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der API-Referenzdokumentation zur Vertex AI SDK for Python.
Streaming- und Nicht-Streaming-Antworten
Sie können auswählen, ob das Modell Streaming-Antworten oder Nicht-Streaming-Antworten generiert. Bei Streaming-Antworten erhalten Sie jede Antwort, sobald ihr Ausgabetoken generiert wurde. Bei Nicht-Streaming-Antworten erhalten Sie alle Antworten, nachdem alle Ausgabetokens erzeugt wurden.
Verwenden Sie für eine Streaming-Antwort den Parameter stream
in generate_content
.
response = model.generate_content(contents=[...], stream = True)
Entfernen Sie für eine Nicht-Streamingantwort den Parameter oder setzen Sie den Parameter auf False
.
Beispielcode
REST
Im Folgenden wird gezeigt, wie Sie mit REST die mit einem Google Cloud-Projekt verknüpften Kontext-Caches auflisten, indem Sie eine GET-Anfrage an den Endpunkt des Publisher-Modells senden.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfrage zum Erstellen des Kontext-Cache verarbeitet wurde.
- CACHE_ID: Die ID des Kontext-Caches. Die Kontext-Cache-ID wird zurückgegeben, wenn Sie den Kontext-Cache erstellen. Sie können Kontext-Cache-IDs auch finden, indem Sie die Kontext-Caches für ein Google Cloud-Projekt auflisten. Weitere Informationen finden Sie unter Kontext-Cache erstellen und Kontext-Caches auflisten.
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Beispiel: cURL-Befehls
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}