進階網站索引會產生每月資料儲存空間費用,費用取決於您匯入資料存放區的網路資料大小。如要在匯入網頁資料前估算大小,可以呼叫 estimateDataSize
方法,並指定要匯入的網頁。estimateDataSize
方法是長時間執行的作業,會持續執行,直到資料大小估算程序完成為止。視您指定的網頁數量而定,這項作業可能需要幾分鐘到一小時以上。估算網頁資料大小後,您可以使用 AI 應用程式定價頁面 (請參閱「資料索引定價」一節) 或 Google Cloud 的定價計算機 (搜尋「AI 應用程式」),估算每月資料儲存空間費用。
事前準備
匯入網站資料至資料儲存庫時,請決定要納入 (並視需要排除) 的網站網址模式。呼叫 estimateDataSize
方法時,請指定這些網址模式。
程序
如要估算網頁資料的大小,請按照下列步驟操作:
呼叫
estimateDataSize
方法。curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'
更改下列內容:
PROJECT_ID
:您的專案 ID。URI_PATTERN_TO_INCLUDE
:您想納入資料大小預估的網站網址模式。URI_PATTERN_TO_EXCLUDE
:(選用) 要從資料大小預估中排除的網站網址模式。對於
URI_PATTERN_TO_INCLUDE
和URI_PATTERN_TO_EXCLUDE
,您可以使用類似下列的模式:- 整個網站:
www.mysite.com
- 網站的各個部分:
www.mysite.com/faq
- 整個網域:
mysite.com
或*.mysite.com
- 整個網站:
EXCLUSIVE_BOOLEAN
:(選填) 如果是true
,則提供的 URI 模式代表從資料大小預估值中排除的網頁。預設值為false
,表示提供的 URI 模式代表納入資料大小估算的網頁。EXACT_MATCH_BOOLEAN
:(選用) 如果是true
,則提供的 URI 模式代表單一網頁,而非網頁及其所有子項。預設值為false
,表示提供的 URI 模式代表網頁及其所有子項。
輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
這項輸出內容包含
name
欄位,也就是長時間執行作業的名稱。儲存name
值,以供後續步驟使用。輪詢
operations.get
方法。curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
將
OPERATION_NAME
改為您在上一步儲存的name
值。您也可以列出長時間執行的作業,以取得作業名稱。評估每則回覆。
如果回應不包含
"done": true
,表示估算資料大小的程序尚未完成。繼續輪詢。輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
如果回應包含
"done": true
,表示資料大小估算程序已完成。儲存回應中的DATA_SIZE_BYTES
值,以供後續步驟使用。輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2023-12-08T19:54:06.911248Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }
這項輸出內容包含下列值:
DATA_SIZE_BYTES
:網頁資料的預估大小 (以位元組為單位)。DOCUMENT_COUNT
:網頁資料中的網頁預估數量。
將上一個步驟中的
DATA_SIZE_BYTES
值除以 1,000,000,000,即可取得 GB。請儲存這個值,以供後續步驟使用。如要估算每月資料儲存空間費用,請按照下列步驟操作:
按一下「新增至估算值」。
搜尋
AI Applications
,然後點選「AI Applications」方塊。在「資料索引」方塊中,輸入上一步中估算的網頁資料大小 (以 GB 為單位)。
查看「預估費用」方塊,瞭解預估資料儲存費用。