Puedes consultar la hora en la que se creó una caché de contexto, la hora en la que se actualizó por última vez y la hora en la que caduca. Para obtener información sobre cada caché de contexto asociado a un proyecto, incluidos sus IDs de caché, usa el comando para enumerar los cachés de contexto. Google Cloud Si conoces el ID de caché de una caché de contexto, puedes obtener información sobre esa caché de contexto.
Obtener una lista de cachés de contexto
Para obtener una lista de las cachés de contexto asociadas a un proyecto, necesitas la región en la que lo creaste y el ID del proyecto. Google Cloud Google Cloud A continuación, se muestra cómo obtener una lista de las cachés de contexto de un Google Cloud proyecto.
Python
Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.
Define variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Consulta cómo instalar o actualizar Go.
Para obtener más información, consulta la documentación de referencia del SDK.
Define variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Consulta cómo instalar o actualizar Java.
Para obtener más información, consulta la documentación de referencia del SDK.
Define variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
A continuación, se muestra cómo usar REST para enumerar las cachés de contexto asociadas a un proyecto Google Cloud enviando una solicitud GET al endpoint del modelo de editor.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- PROJECT_ID: tu ID de proyecto.
- LOCATION: la región en la que se han procesado las solicitudes para crear las cachés de contexto.
Método HTTP y URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents
Para enviar tu solicitud, elige una de estas opciones:
curl
Ejecuta el comando siguiente:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents"
PowerShell
Ejecuta el comando siguiente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents" | Select-Object -Expand Content
Deberías recibir una respuesta JSON similar a la siguiente:
Comando curl de ejemplo
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents
Obtener información sobre una caché de contexto
Para obtener información sobre una caché de contexto, necesitas su ID de caché, elGoogle Cloud ID de proyecto con el que está asociada y la región en la que se procesó la solicitud para crear la caché de contexto. El ID de caché de un contexto se devuelve cuando se crea la caché de contexto. También puedes obtener el ID de caché de cada caché de contexto asociado a un proyecto mediante el comando de lista de caché de contexto.
A continuación, se muestra cómo obtener información sobre una caché de contexto.
Go
Antes de probar este ejemplo, sigue las instrucciones de configuración de Go que se indican en la guía de inicio rápido de Vertex AI. Para obtener más información, consulta la documentación de referencia del SDK de Go de Vertex AI para Gemini.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configurar ADC en un entorno de desarrollo local.
Respuestas de streaming y no de streaming
Puedes elegir si el modelo genera respuestas en streaming o sin streaming. En el caso de las respuestas graduales, recibirás cada respuesta en cuanto se genere su token de salida. En el caso de las respuestas no graduales, recibes todas las respuestas después de que se hayan generado todos los tokens de salida.
Para obtener una respuesta gradual, usa el método
GenerateContentStream
.
iter := model.GenerateContentStream(ctx, genai.Text("Tell me a story about a lumberjack and his giant ox. Keep it very short."))
Para obtener una respuesta que no sea de streaming, usa el método GenerateContent
.
resp, err := model.GenerateContent(ctx, genai.Text("What is the average size of a swallow?"))
Código de muestra
REST
A continuación, se muestra cómo usar REST para enumerar las cachés de contexto asociadas a un proyecto Google Cloud enviando una solicitud GET al endpoint del modelo de editor.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- PROJECT_ID: .
- LOCATION: la región en la que se ha procesado la solicitud para crear la caché de contexto.
- CACHE_ID: ID de la caché de contexto. El ID de la caché de contexto se devuelve cuando creas la caché de contexto. También puedes encontrar IDs de caché de contexto enumerando las cachés de contexto de un proyecto Google Cloud . Para obtener más información, consulta los artículos sobre cómo crear una caché de contexto y listar cachés de contexto.
Método HTTP y URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Para enviar tu solicitud, elige una de estas opciones:
curl
Ejecuta el comando siguiente:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Ejecuta el comando siguiente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Deberías recibir una respuesta JSON similar a la siguiente:
Comando curl de ejemplo
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}
- Consulta cómo usar una caché de contexto.
- Consulta cómo actualizar el tiempo de vencimiento de una caché de contexto.
- Consulta cómo eliminar una caché de contexto.