Anda dapat mempelajari waktu pembuatan cache konteks, waktu cache terakhir kali diperbarui, dan waktu habis masa berlakunya. Untuk mendapatkan informasi tentang setiap cache konteks yang terkait dengan project Google Cloud, termasuk ID cache-nya, gunakan perintah untuk mencantumkan cache konteks. Jika mengetahui ID cache cache konteks, Anda bisa mendapatkan informasi tentang cache konteks tersebut saja.
Mendapatkan daftar cache konteks
Untuk mendapatkan daftar cache konteks yang terkait dengan project Google Cloud, Anda memerlukan region tempat Anda membuat dan ID project Google Cloud Anda. Berikut ini cara mendapatkan daftar cache konteks untuk project Google Cloud.
Pelajari cara menginstal atau mengupdate Gen AI SDK for Python.
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Vertex AI SDK untuk Python.
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Go di Panduan memulai Vertex AI menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Go Vertex AI.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Berikut ini menunjukkan cara menggunakan REST untuk mencantumkan cache konteks yang terkait dengan project Google Cloud dengan mengirimkan permintaan GET ke endpoint model penayang.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID : Project ID Anda.LOCATION : Region tempat permintaan untuk membuat cache konteks diproses.
Metode HTTP dan URL:
GET https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
Jalankan perintah berikut:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents"
Jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents" | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Respons
{ "cachedContents": [ { "name": "projects/PROJECT_NUMBER /locations/us-central1/cachedContents/CACHE_ID_1 ", "model": "projects/PROJECT_ID /locations/us-central1/publishers/google/models/gemini-1.5-pro-002", "createTime": "2024-05-31T19:04:35.380412Z", "updateTime": "2024-05-31T19:04:35.380412Z", "expireTime": "2024-05-31T20:04:35.349680Z" }, { "name": "projects/PROJECT_NUMBER /locations/us-central1/cachedContents/CACHE_ID_2 ", "model": "projects/PROJECT_ID /locations/us-central1/publishers/google/models/gemini-1.5-pro-002", "createTime": "2024-05-30T21:14:39.880235Z", "updateTime": "2024-05-31T00:21:15.350969Z", "expireTime": "2024-05-31T01:21:15.348014Z" }, { "name": "projects/PROJECT_NUMBER /locations/us-central1/cachedContents/CACHE_ID_N ", "model": "projects/PROJECT_ID /locations/us-central1/publishers/google/models/gemini-1.5-pro-002", "createTime": "2024-05-30T21:14:39.880235Z", "updateTime": "2024-05-31T00:21:15.350969Z", "expireTime": "2024-05-31T01:21:15.348014Z" } ] }
Contoh perintah curl
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID "
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents
Mendapatkan informasi tentang cache konteks
Untuk mendapatkan informasi tentang satu cache konteks, Anda memerlukan ID cache-nya, project ID Google Cloud yang dikaitkan dengan cache konteks, dan region tempat permintaan untuk membuat cache konteks diproses. ID cache cache konteks ditampilkan saat Anda membuat cache konteks. Anda juga bisa mendapatkan ID cache dari setiap cache konteks yang terkait dengan project menggunakan perintah daftar cache konteks.
Berikut ini cara mendapatkan informasi tentang satu cache konteks.
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Vertex AI SDK untuk Python.
Respons streaming dan non-streaming
Anda dapat memilih apakah model menghasilkan respons streaming atau respons non-streaming. Untuk respons streaming, Anda akan menerima setiap respons segera setelah token output-nya dibuat. Untuk respons non-streaming, Anda akan menerima semua respons setelah semua token output dibuat.
Untuk respons streaming, gunakan parameter stream
di
generate_content
.
response = model.generate_content(contents=[...], stream = True)
Untuk respons non-streaming, hapus parameter, atau tetapkan parameter ke
False
.
Kode contoh
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Go di panduan memulai Vertex AI. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Vertex AI Go SDK untuk Gemini.
Untuk melakukan autentikasi ke Vertex AI, siapkan Kredensial Default Aplikasi. Untuk informasi selengkapnya, lihat Menyiapkan ADC untuk lingkungan pengembangan lokal.
Respons streaming dan non-streaming
Anda dapat memilih apakah model menghasilkan respons streaming atau respons non-streaming. Untuk respons streaming, Anda akan menerima setiap respons segera setelah token output-nya dibuat. Untuk respons non-streaming, Anda akan menerima semua respons setelah semua token output dibuat.
Untuk respons streaming, gunakan metode
GenerateContentStream
.
iter := model.GenerateContentStream(ctx, genai.Text("Tell me a story about a lumberjack and his giant ox. Keep it very short."))
Untuk respons non-streaming, gunakan metode GenerateContent
.
resp, err := model.GenerateContent(ctx, genai.Text("What is the average size of a swallow?"))
Kode contoh
Berikut ini menunjukkan cara menggunakan REST untuk mencantumkan cache konteks yang terkait dengan project Google Cloud dengan mengirimkan permintaan GET ke endpoint model penayang.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
PROJECT_ID : Project ID Anda.LOCATION : Region tempat permintaan untuk membuat cache konteks diproses.CACHE_ID : ID cache konteks. ID cache konteks ditampilkan saat Anda membuat cache konteks. Anda juga dapat menemukan ID cache konteks dengan mencantumkan cache konteks untuk project Google Cloud menggunakan. Untuk informasi selengkapnya, lihat membuat cache konteks dan mencantumkan cache konteks.
Metode HTTP dan URL:
GET https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents/CACHE_ID
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
Jalankan perintah berikut:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents/CACHE_ID "
Jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION -aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID /locations/LOCATION /cachedContents/CACHE_ID " | Select-Object -Expand Content
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
Respons
{ "name": "projects/PROJECT_NUMBER /locations/us-central1/cachedContents/CACHE_ID ", "model": "projects/PROJECT_ID /locations/us-central1/publishers/google/models/gemini-1.5-pro-002", "createTime": "2024-05-31T19:04:35.380412Z", "updateTime": "2024-05-31T19:04:35.380412Z", "expireTime": "2024-05-31T20:04:35.349680Z" }
Contoh perintah curl
LOCATION="us-central1"
PROJECT_ID="PROJECT_ID "
CACHE_ID="CACHE_ID "
curl \
-X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/${CACHE_ID}
- Pelajari cara menggunakan cache konteks.
- Pelajari cara memperbarui waktu habis masa berlaku cache konteks.
- Pelajari cara menghapus cache konteks.