Schätzung der monatlichen Speicherkosten erhalten

Für die erweiterte Website-Indexierung fallen monatliche Speicherkosten an, die von der Größe der Webdaten abhängen, die Sie in Ihren Datenspeicher importieren. Wenn Sie vor dem Importieren eine Schätzung der Größe Ihrer Webdaten erhalten möchten, können Sie die Methode estimateDataSize aufrufen und die Webseiten angeben, die Sie importieren möchten. Die Methode estimateDataSize ist ein langer Vorgang, der ausgeführt wird, bis die Datengröße geschätzt wurde. Je nach Anzahl der angegebenen Webseiten kann das einige Minuten bis über eine Stunde dauern. Wenn Sie eine Schätzung der Größe Ihrer Webdaten haben, können Sie die monatlichen Kosten für den Datenspeicher mithilfe der Preisseite von Vertex AI Agent Builder (Abschnitt Preise für den Datenindex) oder dem Google Cloud-Preisrechner (nach „Vertex AI Agent Builder“ suchen) abschätzen.

Hinweise

Legen Sie die URL-Muster für die Websites fest, die Sie beim Importieren von Webdaten in Ihren Datenspeicher einbeziehen (und optional ausschließen) möchten. Sie geben diese URL-Muster an, wenn Sie die Methode estimateDataSize aufrufen.

Prozedur

So erhalten Sie eine Schätzung der Größe Ihrer Web-Daten:

  1. Rufen Sie die Methode estimateDataSize auf.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \
    -d '{
      "website_data_source": {
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_INCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN
        },
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN,
          exclusive: EXCLUSIVE_BOOLEAN
        }
      }
    }'
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: Die ID Ihres Projekts.

    • URI_PATTERN_TO_INCLUDE: Die URL-Muster für die Websites, die Sie in die Schätzung der Datengröße einbeziehen möchten.

    • URI_PATTERN_TO_EXCLUDE: (Optional) Die URL-Muster für die Websites, die Sie von der Schätzung der Datengröße ausschließen möchten.

      Für URI_PATTERN_TO_INCLUDE und URI_PATTERN_TO_EXCLUDE können Sie Muster wie die folgenden verwenden:

      • Gesamte Website: www.mysite.com
      • Bestandteile einer Website: www.mysite.com/faq
      • Gesamte Domain: mysite.com oder *.mysite.com
    • EXCLUSIVE_BOOLEAN: (Optional) Wenn true angegeben ist, stellen die angegebenen URI-Muster Webseiten dar, die von der Schätzung der Datengröße ausgeschlossen sind. Der Standardwert ist false. Das bedeutet, dass das angegebene URI-Muster Webseiten darstellt, die in der Schätzung der Datengröße enthalten sind.

    • EXACT_MATCH_BOOLEAN: (Optional) Wenn true, stellt das angegebene URI-Muster eine einzelne Webseite dar, anstatt die Webseite und alle untergeordneten Elemente. Der Standardwert ist false. Das bedeutet, dass das angegebene URI-Muster die Webseite und alle untergeordneten Elemente darstellt.

    Die Ausgabe sieht in etwa so aus:

    {
      "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
      "metadata": {
        "@type":  "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
      }
    }
    

    Diese Ausgabe enthält das Feld name, den Namen des Vorgangs mit langer Ausführungszeit. Speichern Sie den Wert für name, um ihn im nächsten Schritt zu verwenden.

  2. Fragen Sie die Methode operations.get ab.

    curl -X GET \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
    

    Ersetzen Sie OPERATION_NAME durch den Wert name, den Sie im vorherigen Schritt gespeichert haben. Sie können den Vorgangsnamen auch abrufen, indem Sie Vorgänge mit langer Ausführungszeit auflisten.

  3. Bewerten Sie jede Antwort.

    • Wenn eine Antwort nicht "done": true enthält, ist die Schätzung der Datengröße noch nicht abgeschlossen. Polling fortsetzen.

      Die Ausgabe sieht in etwa so aus:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
        }
      }
      
    • Wenn eine Antwort "done": true enthält, ist die Schätzung der Datengröße abgeschlossen. Speichern Sie den Wert DATA_SIZE_BYTES aus der Antwort, um ihn im nächsten Schritt zu verwenden.

      Die Ausgabe sieht in etwa so aus:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata",
          "createTime": "2023-12-08T19:54:06.911248Z"
        },
        "done": true,
        "response": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse",
          "dataSizeBytes": DATA_SIZE_BYTES,
          "documentCount": DOCUMENT_COUNT
        }
      }
      

      Diese Ausgabe enthält die folgenden Werte:

      • DATA_SIZE_BYTES: Die geschätzte Größe Ihrer Webdaten in Byte.

      • DOCUMENT_COUNT: Die geschätzte Anzahl der Webseiten in Ihren Webdaten.

  4. Teilen Sie den Wert DATA_SIZE_BYTES aus dem vorherigen Schritt durch 1.000.000.000, um den Wert in Gigabyte zu erhalten. Speichern Sie diesen Wert für den nächsten Schritt.

  5. So erhalten Sie eine Schätzung Ihrer monatlichen Datenspeicherkosten:

    1. Rufen Sie den Google Cloud-Preisrechner auf.

    2. Klicken Sie auf Der Schätzung hinzufügen.

    3. Suchen Sie nach Vertex AI Agent Builder und klicken Sie dann auf das Feld Vertex AI Agent Builder.

    4. Geben Sie im Feld Datenindex die geschätzte Größe Ihrer Webdaten in Gigabyte aus dem vorherigen Schritt ein.

      Die geschätzten Kosten für den Datenspeicher finden Sie im Feld Geschätzte Kosten.