Für die erweiterte Website-Indexierung fallen monatliche Speicherkosten an, die von der Größe der Webdaten abhängen, die Sie in Ihren Datenspeicher importieren. Wenn Sie vor dem Importieren eine Schätzung der Größe Ihrer Webdaten erhalten möchten, können Sie die Methode estimateDataSize
aufrufen und die Webseiten angeben, die Sie importieren möchten. Die Methode estimateDataSize
ist ein langer Vorgang, der ausgeführt wird, bis die Datengröße geschätzt wurde. Je nach Anzahl der angegebenen Webseiten kann das einige Minuten bis über eine Stunde dauern. Wenn Sie eine Schätzung der Größe Ihrer Webdaten haben, können Sie die monatlichen Kosten für den Datenspeicher mithilfe der Preisseite von Vertex AI Agent Builder (Abschnitt Preise für den Datenindex) oder dem Google Cloud-Preisrechner (nach „Vertex AI Agent Builder“ suchen) abschätzen.
Hinweise
Legen Sie die URL-Muster für die Websites fest, die Sie beim Importieren von Webdaten in Ihren Datenspeicher einbeziehen (und optional ausschließen) möchten. Sie geben diese URL-Muster an, wenn Sie die Methode estimateDataSize
aufrufen.
Prozedur
So erhalten Sie eine Schätzung der Größe Ihrer Web-Daten:
Rufen Sie die Methode
estimateDataSize
auf.curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'
Ersetzen Sie Folgendes:
PROJECT_ID
: Die ID Ihres Projekts.URI_PATTERN_TO_INCLUDE
: Die URL-Muster für die Websites, die Sie in die Schätzung der Datengröße einbeziehen möchten.URI_PATTERN_TO_EXCLUDE
: (Optional) Die URL-Muster für die Websites, die Sie von der Schätzung der Datengröße ausschließen möchten.Für
URI_PATTERN_TO_INCLUDE
undURI_PATTERN_TO_EXCLUDE
können Sie Muster wie die folgenden verwenden:- Gesamte Website:
www.mysite.com
- Bestandteile einer Website:
www.mysite.com/faq
- Gesamte Domain:
mysite.com
oder*.mysite.com
- Gesamte Website:
EXCLUSIVE_BOOLEAN
: (Optional) Wenntrue
angegeben ist, stellen die angegebenen URI-Muster Webseiten dar, die von der Schätzung der Datengröße ausgeschlossen sind. Der Standardwert istfalse
. Das bedeutet, dass das angegebene URI-Muster Webseiten darstellt, die in der Schätzung der Datengröße enthalten sind.EXACT_MATCH_BOOLEAN
: (Optional) Wenntrue
, stellt das angegebene URI-Muster eine einzelne Webseite dar, anstatt die Webseite und alle untergeordneten Elemente. Der Standardwert istfalse
. Das bedeutet, dass das angegebene URI-Muster die Webseite und alle untergeordneten Elemente darstellt.
Die Ausgabe sieht in etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Diese Ausgabe enthält das Feld
name
, den Namen des Vorgangs mit langer Ausführungszeit. Speichern Sie den Wert fürname
, um ihn im nächsten Schritt zu verwenden.Fragen Sie die Methode
operations.get
ab.curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
Ersetzen Sie
OPERATION_NAME
durch den Wertname
, den Sie im vorherigen Schritt gespeichert haben. Sie können den Vorgangsnamen auch abrufen, indem Sie Vorgänge mit langer Ausführungszeit auflisten.Bewerten Sie jede Antwort.
Wenn eine Antwort nicht
"done": true
enthält, ist die Schätzung der Datengröße noch nicht abgeschlossen. Polling fortsetzen.Die Ausgabe sieht in etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Wenn eine Antwort
"done": true
enthält, ist die Schätzung der Datengröße abgeschlossen. Speichern Sie den WertDATA_SIZE_BYTES
aus der Antwort, um ihn im nächsten Schritt zu verwenden.Die Ausgabe sieht in etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2023-12-08T19:54:06.911248Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }
Diese Ausgabe enthält die folgenden Werte:
DATA_SIZE_BYTES
: Die geschätzte Größe Ihrer Webdaten in Byte.DOCUMENT_COUNT
: Die geschätzte Anzahl der Webseiten in Ihren Webdaten.
Teilen Sie den Wert
DATA_SIZE_BYTES
aus dem vorherigen Schritt durch 1.000.000.000, um den Wert in Gigabyte zu erhalten. Speichern Sie diesen Wert für den nächsten Schritt.So erhalten Sie eine Schätzung Ihrer monatlichen Datenspeicherkosten:
Rufen Sie den Google Cloud-Preisrechner auf.
Klicken Sie auf Der Schätzung hinzufügen.
Suchen Sie nach
Vertex AI Agent Builder
und klicken Sie dann auf das Feld Vertex AI Agent Builder.Geben Sie im Feld Datenindex die geschätzte Größe Ihrer Webdaten in Gigabyte aus dem vorherigen Schritt ein.
Die geschätzten Kosten für den Datenspeicher finden Sie im Feld Geschätzte Kosten.