Für die erweiterte Website-Indexierung fallen monatliche Datenspeicherkosten an, die von der Größe der Webdaten abhängen, die Sie in Ihren Datenspeicher importieren. Wenn Sie vor dem Importieren eine Schätzung der Größe Ihrer Webdaten erhalten möchten, können Sie die Methode estimateDataSize
aufrufen und die Webseiten angeben, die Sie importieren möchten. Die Methode estimateDataSize
ist ein Vorgang mit langer Ausführungszeit, der so lange ausgeführt wird, bis der Prozess zum Schätzen der Datengröße abgeschlossen ist. Das kann je nach Anzahl der angegebenen Webseiten einige Minuten bis über eine Stunde dauern. Nachdem Sie eine Schätzung der Größe Ihrer Webdaten haben, können Sie die monatlichen Kosten für die Datenspeicherung auf der Preisseite für AI Applications (siehe Abschnitt Data Index – Preise) oder mit dem Google Cloud-Preisrechner (suchen Sie nach „AI Applications“) schätzen.
Hinweise
Legen Sie die URL-Muster für die Websites fest, die Sie beim Import von Webdaten in Ihren Datenspeicher einbeziehen (und optional ausschließen) möchten. Sie geben diese URL-Muster an, wenn Sie die Methode estimateDataSize
aufrufen.
Prozedur
So erhalten Sie eine Schätzung der Größe Ihrer Webdaten:
Rufen Sie die Methode
estimateDataSize
auf.curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID.URI_PATTERN_TO_INCLUDE
: Die URL-Muster für die Websites, die Sie in Ihre Schätzung der Datengröße einbeziehen möchten.URI_PATTERN_TO_EXCLUDE
: (Optional) Die URL-Muster für die Websites, die Sie aus Ihrer Schätzung der Datengröße ausschließen möchten.Für
URI_PATTERN_TO_INCLUDE
undURI_PATTERN_TO_EXCLUDE
können Sie Muster verwenden, die den folgenden ähneln:- Gesamte Website:
www.mysite.com
- Teile einer Website:
www.mysite.com/faq
- Gesamte Domain:
mysite.com
oder*.mysite.com
- Gesamte Website:
EXCLUSIVE_BOOLEAN
: (Optional) Wenntrue
, stellt das angegebene URI-Muster Webseiten dar, die aus Ihrer Schätzung der Datengröße ausgeschlossen werden. Der Standardwert istfalse
. Das bedeutet, dass das angegebene URI-Muster Webseiten darstellt, die in Ihre Schätzung der Datengröße einbezogen werden.EXACT_MATCH_BOOLEAN
: (Optional) Wenntrue
, dann stellt das angegebene URI-Muster eine einzelne Webseite dar und nicht die Webseite und alle untergeordneten Seiten. Der Standardwert istfalse
. Das bedeutet, dass das angegebene URI-Muster die Webseite und alle ihre untergeordneten Elemente darstellt.
Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Diese Ausgabe enthält das Feld
name
, das den Namen des Vorgangs mit langer Ausführungszeit enthält. Speichern Sie den Wertname
, um ihn im nächsten Schritt zu verwenden.Fragen Sie die Methode
operations.get
ab.curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
Ersetzen Sie
OPERATION_NAME
durch den Wertname
, den Sie im vorherigen Schritt gespeichert haben. Sie können den Vorgangsnamen auch abrufen, indem Sie Vorgänge mit langer Ausführungszeit auflisten.Bewerten Sie jede Antwort.
Wenn eine Antwort
"done": true
nicht enthält, ist der Prozess zur Schätzung der Datengröße nicht abgeschlossen. Abfragen fortsetzen.Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }
Wenn eine Antwort
"done": true
enthält, ist der Prozess zur Schätzung der Datengröße abgeschlossen. Speichern Sie den WertDATA_SIZE_BYTES
aus der Antwort, um ihn im nächsten Schritt zu verwenden.Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2023-12-08T19:54:06.911248Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }
Diese Ausgabe enthält die folgenden Werte:
DATA_SIZE_BYTES
: Die geschätzte Größe Ihrer Webdaten in Byte.DOCUMENT_COUNT
: Die geschätzte Anzahl der Webseiten in Ihren Webdaten.
Teilen Sie den
DATA_SIZE_BYTES
-Wert aus dem vorherigen Schritt durch 1.000.000.000, um Gigabyte zu erhalten. Speichern Sie diesen Wert für den folgenden Schritt.So erhalten Sie einen Kostenvoranschlag für Ihre monatlichen Datenspeicherkosten:
Rufen Sie den Preisrechner von Google Cloud auf.
Klicken Sie auf Der Schätzung hinzufügen.
Suchen Sie nach
AI Applications
und klicken Sie dann auf das Kästchen KI-Anwendungen.Geben Sie im Feld Datenindex die geschätzte Größe Ihrer Webdaten in Gigabyte aus dem vorherigen Schritt ein.
Die geschätzten Kosten für die Datenspeicherung finden Sie im Feld Geschätzte Kosten.