Schätzung der monatlichen Speicherkosten erhalten

Für die erweiterte Website-Indexierung fallen monatliche Datenspeicherkosten an, die von der Größe der Webdaten abhängen, die Sie in Ihren Datenspeicher importieren. Wenn Sie vor dem Importieren eine Schätzung der Größe Ihrer Webdaten erhalten möchten, können Sie die Methode estimateDataSize aufrufen und die Webseiten angeben, die Sie importieren möchten. Die Methode estimateDataSize ist ein Vorgang mit langer Ausführungszeit, der so lange ausgeführt wird, bis der Prozess zum Schätzen der Datengröße abgeschlossen ist. Das kann je nach Anzahl der angegebenen Webseiten einige Minuten bis über eine Stunde dauern. Nachdem Sie eine Schätzung der Größe Ihrer Webdaten haben, können Sie die monatlichen Kosten für die Datenspeicherung auf der Preisseite für AI Applications (siehe Abschnitt Data Index – Preise) oder mit dem Google Cloud-Preisrechner (suchen Sie nach „AI Applications“) schätzen.

Hinweise

Legen Sie die URL-Muster für die Websites fest, die Sie beim Import von Webdaten in Ihren Datenspeicher einbeziehen (und optional ausschließen) möchten. Sie geben diese URL-Muster an, wenn Sie die Methode estimateDataSize aufrufen.

Prozedur

So erhalten Sie eine Schätzung der Größe Ihrer Webdaten:

  1. Rufen Sie die Methode estimateDataSize auf.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \
    -d '{
      "website_data_source": {
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_INCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN
        },
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN,
          exclusive: EXCLUSIVE_BOOLEAN
        }
      }
    }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID.

    • URI_PATTERN_TO_INCLUDE: Die URL-Muster für die Websites, die Sie in Ihre Schätzung der Datengröße einbeziehen möchten.

    • URI_PATTERN_TO_EXCLUDE: (Optional) Die URL-Muster für die Websites, die Sie aus Ihrer Schätzung der Datengröße ausschließen möchten.

      Für URI_PATTERN_TO_INCLUDE und URI_PATTERN_TO_EXCLUDE können Sie Muster verwenden, die den folgenden ähneln:

      • Gesamte Website: www.mysite.com
      • Teile einer Website: www.mysite.com/faq
      • Gesamte Domain: mysite.com oder *.mysite.com
    • EXCLUSIVE_BOOLEAN: (Optional) Wenn true, stellt das angegebene URI-Muster Webseiten dar, die aus Ihrer Schätzung der Datengröße ausgeschlossen werden. Der Standardwert ist false. Das bedeutet, dass das angegebene URI-Muster Webseiten darstellt, die in Ihre Schätzung der Datengröße einbezogen werden.

    • EXACT_MATCH_BOOLEAN: (Optional) Wenn true, dann stellt das angegebene URI-Muster eine einzelne Webseite dar und nicht die Webseite und alle untergeordneten Seiten. Der Standardwert ist false. Das bedeutet, dass das angegebene URI-Muster die Webseite und alle ihre untergeordneten Elemente darstellt.

    Die Ausgabe sieht etwa so aus:

    {
      "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
      "metadata": {
        "@type":  "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
      }
    }
    

    Diese Ausgabe enthält das Feld name, das den Namen des Vorgangs mit langer Ausführungszeit enthält. Speichern Sie den Wert name, um ihn im nächsten Schritt zu verwenden.

  2. Fragen Sie die Methode operations.get ab.

    curl -X GET \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
    

    Ersetzen Sie OPERATION_NAME durch den Wert name, den Sie im vorherigen Schritt gespeichert haben. Sie können den Vorgangsnamen auch abrufen, indem Sie Vorgänge mit langer Ausführungszeit auflisten.

  3. Bewerten Sie jede Antwort.

    • Wenn eine Antwort "done": true nicht enthält, ist der Prozess zur Schätzung der Datengröße nicht abgeschlossen. Abfragen fortsetzen.

      Die Ausgabe sieht etwa so aus:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
        }
      }
      
    • Wenn eine Antwort "done": true enthält, ist der Prozess zur Schätzung der Datengröße abgeschlossen. Speichern Sie den Wert DATA_SIZE_BYTES aus der Antwort, um ihn im nächsten Schritt zu verwenden.

      Die Ausgabe sieht etwa so aus:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata",
          "createTime": "2023-12-08T19:54:06.911248Z"
        },
        "done": true,
        "response": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse",
          "dataSizeBytes": DATA_SIZE_BYTES,
          "documentCount": DOCUMENT_COUNT
        }
      }
      

      Diese Ausgabe enthält die folgenden Werte:

      • DATA_SIZE_BYTES: Die geschätzte Größe Ihrer Webdaten in Byte.

      • DOCUMENT_COUNT: Die geschätzte Anzahl der Webseiten in Ihren Webdaten.

  4. Teilen Sie den DATA_SIZE_BYTES-Wert aus dem vorherigen Schritt durch 1.000.000.000, um Gigabyte zu erhalten. Speichern Sie diesen Wert für den folgenden Schritt.

  5. So erhalten Sie einen Kostenvoranschlag für Ihre monatlichen Datenspeicherkosten:

    1. Rufen Sie den Preisrechner von Google Cloud auf.

    2. Klicken Sie auf Der Schätzung hinzufügen.

    3. Suchen Sie nach AI Applications und klicken Sie dann auf das Kästchen KI-Anwendungen.

    4. Geben Sie im Feld Datenindex die geschätzte Größe Ihrer Webdaten in Gigabyte aus dem vorherigen Schritt ein.

      Die geschätzten Kosten für die Datenspeicherung finden Sie im Feld Geschätzte Kosten.