Pengindeksan situs lanjutan dikenai biaya penyimpanan data bulanan berdasarkan ukuran data web yang Anda impor ke penyimpanan data. Untuk mendapatkan estimasi ukuran data web sebelum mengimpornya, Anda
dapat memanggil metode estimateDataSize
dan menentukan halaman
web yang ingin diimpor. Metode estimateDataSize
adalah operasi yang berjalan lama yang berjalan hingga proses untuk memperkirakan ukuran data selesai. Proses ini dapat memerlukan waktu dari beberapa menit hingga lebih dari satu jam,
bergantung pada jumlah halaman web yang Anda tentukan. Setelah memiliki
perkiraan ukuran data web, Anda bisa mendapatkan perkiraan biaya penyimpanan data
bulanan menggunakan halaman harga Vertex AI Agent Builder (lihat bagian Harga Indeks
Data) atau kalkulator harga
Google Cloud (telusuri Vertex AI Agent Builder).
Sebelum memulai
Tentukan pola URL untuk situs yang ingin Anda sertakan (dan
jika perlu, kecualikan) saat Anda mengimpor data web ke penyimpanan data. Anda
menentukan pola URL ini saat memanggil metode estimateDataSize
.
Prosedur
Untuk mendapatkan estimasi ukuran data web Anda, ikuti langkah-langkah berikut:
Panggil metode
estimateDataSize
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'
Ganti kode berikut:
PROJECT_ID
: ID project Anda.URI_PATTERN_TO_INCLUDE
: Pola URL untuk situs yang ingin Anda sertakan dalam estimasi ukuran data.URI_PATTERN_TO_EXCLUDE
: (Opsional) Pola URL untuk situs yang ingin Anda kecualikan dari estimasi ukuran data.Untuk
URI_PATTERN_TO_INCLUDE
danURI_PATTERN_TO_EXCLUDE
, Anda dapat menggunakan pola yang mirip dengan berikut:- Seluruh situs:
www.mysite.com
- Bagian situs:
www.mysite.com/faq
- Seluruh domain:
mysite.com
atau*.mysite.com
- Seluruh situs:
EXCLUSIVE_BOOLEAN
: (Opsional) Jikatrue
, pola URI yang diberikan mewakili halaman web yang dikecualikan dari estimasi ukuran data Anda. Defaultnya adalahfalse
, yang berarti bahwa pola URI yang diberikan mewakili halaman web yang disertakan dalam estimasi ukuran data Anda.EXACT_MATCH_BOOLEAN
: (Opsional) Jikatrue
, pola URI yang disediakan akan mewakili satu halaman web, bukan halaman web dan semua turunan halaman tersebut. Nilai defaultnya adalahfalse
, yang berarti bahwa pola URI yang disediakan mewakili halaman web dan semua turunannya.
Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Output ini mencakup kolom
name
, yang merupakan nama operasi yang berjalan lama. Simpan nilainame
untuk digunakan di langkah berikutnya.Lakukan polling pada metode
operations.get
.curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
Ganti
OPERATION_NAME
dengan nilainame
yang Anda simpan di langkah sebelumnya. Anda juga bisa mendapatkan nama operasi dengan mencantumkan operasi yang berjalan lama.Evaluasi setiap respons.
Jika respons tidak berisi
"done": true
, proses untuk memperkirakan ukuran data tidak akan selesai. Lanjutkan polling.Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Jika respons berisi
"done": true
, proses untuk memperkirakan ukuran data sudah selesai. Simpan nilaiDATA_SIZE_BYTES
dari respons untuk digunakan di langkah berikut.Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2023-12-08T19:54:06.911248Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }
Output ini mencakup nilai-nilai berikut:
DATA_SIZE_BYTES
: Estimasi ukuran data web Anda, dalam byte.DOCUMENT_COUNT
: Estimasi jumlah halaman web dalam data web Anda.
Bagi nilai
DATA_SIZE_BYTES
dari langkah sebelumnya dengan 1.000.000.000 untuk mendapatkan gigabyte. Simpan nilai ini untuk langkah berikutnya.Untuk mendapatkan estimasi biaya penyimpanan data bulanan:
Klik Tambahkan ke estimasi.
Telusuri
Vertex AI Agent Builder
, lalu klik kotak Vertex AI Agent Builder.Di kotak Data Index, masukkan estimasi ukuran data web Anda, dalam gigabyte, dari langkah sebelumnya.
Lihat kotak Perkiraan biaya untuk mengetahui perkiraan biaya penyimpanan data Anda.