Pode saber a hora em que uma cache de contexto foi criada, a hora em que foi atualizada mais recentemente e a hora em que expira. Para obter informações sobre cada cache de contexto associada a um projeto, incluindo os respetivos IDs de cache, use o comando para listar caches de contexto. Google Cloud Se souber o ID da cache de contexto, pode obter informações apenas sobre essa cache de contexto.
Aceda a uma lista de caches de contexto
Para obter uma lista das caches de contexto associadas a um Google Cloud projeto, precisa da região onde o criou e do ID do seu Google Cloud projeto. O exemplo seguinte mostra como obter uma lista de caches de contexto para um Google Cloud projeto.
Python
Instalação
pip install --upgrade google-genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA gen com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Saiba como instalar ou atualizar o Go.
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA gen com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Saiba como instalar ou atualizar o Java.
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA gen com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
Instalação
npm install @google/genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA gen com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
REST
O exemplo seguinte mostra como usar a API REST para listar as caches de contexto associadas a um projeto enviando um pedido GET para o ponto final do modelo de publicador. Google Cloud
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: o seu ID do projeto.
- LOCATION: a região onde os pedidos para criar as caches de contexto foram processados.
Método HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents
Para enviar o seu pedido, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents"
PowerShell
Execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte:
Comando curl de exemplo
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents
Obtenha informações sobre uma cache de contexto
Para obter informações sobre uma cache de contexto, precisa do respetivo ID da cache, do Google Cloud ID do projeto ao qual a cache de contexto está associada e da região onde o pedido para criar a cache de contexto foi processado. O ID da cache de contexto é devolvido quando cria a cache de contexto. Também pode obter o ID da cache de cada cache de contexto associada a um projeto através do comando context cache list.
O exemplo seguinte mostra como obter informações sobre uma cache de contexto.
Go
Antes de experimentar este exemplo, siga as instruções de configuração do Go no guia de início rápido do Vertex AI. Para mais informações, consulte a documentação de referência do SDK Go do Vertex AI para o Gemini.
Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure o ADC para um ambiente de desenvolvimento local.
Respostas de streaming e não streaming
Pode escolher se o modelo gera respostas de streaming ou respostas de não streaming. Para respostas de streaming, recebe cada resposta assim que o respetivo token de saída é gerado. Para respostas sem streaming, recebe todas as respostas depois de todos os tokens de saída serem gerados.
Para uma resposta de streaming, use o método
GenerateContentStream
.
iter := model.GenerateContentStream(ctx, genai.Text("Tell me a story about a lumberjack and his giant ox. Keep it very short."))
Para uma resposta sem streaming, use o método GenerateContent
.
resp, err := model.GenerateContent(ctx, genai.Text("What is the average size of a swallow?"))
Exemplo de código
REST
O exemplo seguinte mostra como usar a API REST para listar as caches de contexto associadas a um projeto enviando um pedido GET para o ponto final do modelo de publicador. Google Cloud
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: .
- LOCATION: a região onde o pedido para criar a cache de contexto foi processado.
- CACHE_ID: o ID da cache de contexto. O ID da cache de contexto é devolvido quando cria a cache de contexto. Também pode encontrar IDs da cache de contexto listando as caches de contexto de um projeto do Google Cloud Platform (GCP) com o comando: Google Cloud Para mais informações, consulte as secções Crie uma cache de contexto e Liste as caches de contexto.
Método HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Para enviar o seu pedido, escolha uma destas opções:
curl
Execute o seguinte comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte:
Comando curl de exemplo
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID"
CACHE_ID="CACHE_ID"
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}
- Saiba como usar uma cache de contexto.
- Saiba como atualizar o tempo de expiração de uma cache de contexto.
- Saiba como eliminar uma cache de contexto.