Pilih fungsi pemrosesan dokumen

Dokumen ini memberikan perbandingan fungsi pemrosesan dokumen yang tersedia di BigQuery ML, yaitu ML.GENERATE_TEXT dan ML.PROCESS_DOCUMENT. Anda dapat menggunakan informasi dalam dokumen ini untuk membantu Anda memutuskan fungsi mana yang akan digunakan jika fungsi tersebut memiliki kemampuan yang tumpang-tindih.

Secara umum, perbedaan antara fungsi ini adalah sebagai berikut:

  • ML.GENERATE_TEXT adalah pilihan yang baik untuk melakukan tugas pemrosesan bahasa alami (NLP) yang sebagian kontennya berada dalam dokumen. Fungsi ini memberikan manfaat berikut:

    • Biaya yang lebih rendah
    • Dukungan bahasa lainnya
    • Throughput lebih cepat
    • Kemampuan penyesuaian model
    • Ketersediaan model multimodal

    Untuk melihat contoh tugas pemrosesan dokumen yang paling cocok dengan pendekatan ini, lihat Menjelajahi kemampuan pemrosesan dokumen dengan Gemini API.

  • ML.PROCESS_DOCUMENT adalah pilihan yang tepat untuk melakukan tugas pemrosesan dokumen yang memerlukan penguraian dokumen dan respons terstruktur yang telah ditentukan sebelumnya.

Perbandingan fungsi

Gunakan tabel berikut untuk membandingkan fungsi ML.GENERATE_TEXT dan ML.PROCESS_DOCUMENT:

ML.GENERATE_TEXT ML.PROCESS_DOCUMENT
Tujuan

Lakukan tugas NLP terkait dokumen apa pun dengan meneruskan perintah ke model partner atau Gemini atau ke model terbuka.

Misalnya, dengan dokumen keuangan perusahaan, Anda dapat mengambil informasi dokumen dengan memberikan perintah seperti What is the quarterly revenue for each division?.

Gunakan Document AI API untuk melakukan pemrosesan dokumen khusus untuk berbagai jenis dokumen, seperti invoice, formulir pajak, dan laporan keuangan. Anda juga dapat melakukan pemecahan dokumen.
Penagihan

Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat Harga BigQuery ML.

Mengenakan biaya Vertex AI untuk panggilan ke model. Jika Anda menggunakan model Gemini 2.0 atau yang lebih baru, panggilan akan ditagih sesuai tarif API batch. Untuk mengetahui informasi selengkapnya, lihat Biaya membangun dan men-deploy model AI di Vertex AI.

Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat Harga BigQuery ML.

Mengenakan biaya untuk panggilan ke Document AI API. Untuk mengetahui informasi selengkapnya, lihat Harga Document AI API.

Permintaan per menit (RPM) Tidak berlaku untuk model Gemini. Antara 25 dan 60 untuk model partner. Untuk mengetahui informasi selengkapnya, lihat Batas permintaan per menit. 120 RPM per jenis prosesor, dengan batas keseluruhan 600 RPM per project. Untuk mengetahui informasi selengkapnya, lihat Daftar kuota.
Token per menit Berkisar dari 8.192 hingga lebih dari 1 juta, bergantung pada model yang digunakan. Tidak ada batas token. Namun, fungsi ini memiliki batas halaman yang berbeda-beda bergantung pada prosesor yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Batas.
Penyesuaian yang diawasi Penyesuaian yang diawasi didukung untuk beberapa model. Tidak didukung.
Bahasa yang didukung Dukungan bervariasi berdasarkan LLM yang Anda pilih. Dukungan bahasa bergantung pada jenis pemroses dokumen; sebagian besar hanya mendukung bahasa Inggris. Untuk mengetahui informasi selengkapnya, lihat Daftar prosesor.
Region yang didukung Didukung di semua region AI Generatif untuk Vertex AI. Didukung di multi-region EU dan US untuk semua prosesor. Beberapa prosesor juga tersedia di region tunggal tertentu. Untuk mengetahui informasi selengkapnya, lihat Dukungan regional dan multiregional.