Mendapatkan estimasi biaya penyimpanan bulanan

Pengindeksan situs lanjutan menimbulkan biaya penyimpanan data bulanan berdasarkan ukuran data web yang Anda impor ke penyimpanan data. Untuk mendapatkan perkiraan ukuran data web Anda sebelum mengimpornya, Anda dapat memanggil metode estimateDataSize dan menentukan halaman web yang ingin Anda impor. Metode estimateDataSize adalah operasi yang berjalan lama yang berjalan hingga proses untuk memperkirakan ukuran data selesai. Proses ini dapat berlangsung dari beberapa menit hingga lebih dari satu jam, bergantung pada jumlah halaman web yang Anda tentukan. Setelah mendapatkan perkiraan ukuran data web, Anda dapat memperkirakan biaya penyimpanan data bulanan menggunakan halaman harga Aplikasi AI (lihat bagian harga Indeks Data) atau kalkulator harga Google Cloud (telusuri Aplikasi AI).

Sebelum memulai

Tentukan pola URL untuk situs yang ingin Anda sertakan (dan secara opsional dikecualikan) saat Anda mengimpor data web ke penyimpanan data. Anda menentukan pola URL ini saat memanggil metode estimateDataSize.

Prosedur

Untuk mendapatkan perkiraan ukuran data web Anda, ikuti langkah-langkah berikut:

  1. Panggil metode estimateDataSize.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \
    -d '{
      "website_data_source": {
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_INCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN
        },
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN,
          exclusive: EXCLUSIVE_BOOLEAN
        }
      }
    }'
    

    Ganti kode berikut:

    • PROJECT_ID: ID project Anda.

    • URI_PATTERN_TO_INCLUDE: pola URL untuk situs yang ingin Anda sertakan dalam perkiraan ukuran data.

    • URI_PATTERN_TO_EXCLUDE: (Opsional) Pola URL untuk situs yang ingin Anda kecualikan dari perkiraan ukuran data.

      Untuk URI_PATTERN_TO_INCLUDE dan URI_PATTERN_TO_EXCLUDE, Anda dapat menggunakan pola yang mirip dengan berikut:

      • Seluruh situs: www.mysite.com
      • Bagian-bagian situs: www.mysite.com/faq
      • Seluruh domain: mysite.com atau *.mysite.com
    • EXCLUSIVE_BOOLEAN: (Opsional) Jika true, maka pola URI yang diberikan mewakili halaman web yang dikecualikan dari perkiraan ukuran data Anda. Nilai defaultnya adalah false, yang berarti pola URI yang diberikan merepresentasikan halaman web yang disertakan dalam perkiraan ukuran data Anda.

    • EXACT_MATCH_BOOLEAN: (Opsional) Jika true, maka pola URI yang diberikan merepresentasikan satu halaman web, bukan halaman web dan semua turunannya. Nilai defaultnya adalah false, yang berarti bahwa pola URI yang diberikan merepresentasikan halaman web dan semua turunannya.

    Outputnya mirip dengan hal berikut ini:

    {
      "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
      "metadata": {
        "@type":  "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
      }
    }
    

    Output ini mencakup kolom name, yang merupakan nama operasi yang berjalan lama. Simpan nilai name untuk digunakan pada langkah berikutnya.

  2. Polling metode operations.get.

    curl -X GET \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
    

    Ganti OPERATION_NAME dengan nilai name yang Anda simpan di langkah sebelumnya. Anda juga bisa mendapatkan nama operasi dengan mencantumkan operasi yang berjalan lama.

  3. Evaluasi setiap respons.

    • Jika respons tidak berisi "done": true, maka proses untuk memperkirakan ukuran data belum selesai. Lanjutkan polling.

      Outputnya mirip dengan hal berikut ini:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
        }
      }
      
    • Jika respons berisi "done": true, proses untuk memperkirakan ukuran data telah selesai. Simpan nilai DATA_SIZE_BYTES dari respons untuk digunakan pada langkah berikutnya.

      Outputnya mirip dengan hal berikut ini:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata",
          "createTime": "2023-12-08T19:54:06.911248Z"
        },
        "done": true,
        "response": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse",
          "dataSizeBytes": DATA_SIZE_BYTES,
          "documentCount": DOCUMENT_COUNT
        }
      }
      

      Output ini mencakup nilai-nilai berikut:

      • DATA_SIZE_BYTES: perkiraan ukuran data web Anda, dalam byte.

      • DOCUMENT_COUNT: perkiraan jumlah halaman web dalam data web Anda.

  4. Bagi nilai DATA_SIZE_BYTES dari langkah sebelumnya dengan 1.000.000.000 untuk mendapatkan gigabyte. Simpan nilai ini untuk langkah berikutnya.

  5. Untuk mendapatkan estimasi biaya penyimpanan data bulanan Anda:

    1. Buka kalkulator harga Google Cloud.

    2. Klik Tambahkan ke estimasi.

    3. Telusuri AI Applications, lalu klik kotak AI Applications.

    4. Di kotak Indeks Data, masukkan perkiraan ukuran data web Anda, dalam gigabyte, dari langkah sebelumnya.

      Lihat kotak Perkiraan biaya untuk mengetahui perkiraan biaya penyimpanan data Anda.