Pilih fungsi pemrosesan dokumen
Dokumen ini memberikan perbandingan fungsi pemrosesan dokumen yang tersedia di BigQuery ML, yaitu ML.GENERATE_TEXT
dan ML.PROCESS_DOCUMENT
.
Anda dapat menggunakan informasi dalam dokumen ini untuk membantu Anda memutuskan fungsi mana yang akan digunakan jika fungsi tersebut memiliki kemampuan yang tumpang-tindih.
Secara umum, perbedaan antara fungsi ini adalah sebagai berikut:
ML.GENERATE_TEXT
adalah pilihan yang baik untuk melakukan tugas pemrosesan bahasa alami (NLP) yang sebagian kontennya berada dalam dokumen. Fungsi ini memberikan manfaat berikut:- Biaya yang lebih rendah
- Dukungan bahasa lainnya
- Throughput lebih cepat
- Kemampuan penyesuaian model
- Ketersediaan model multimodal
Untuk melihat contoh tugas pemrosesan dokumen yang paling cocok dengan pendekatan ini, lihat Menjelajahi kemampuan pemrosesan dokumen dengan Gemini API.
ML.PROCESS_DOCUMENT
adalah pilihan yang tepat untuk melakukan tugas pemrosesan dokumen yang memerlukan penguraian dokumen dan respons terstruktur yang telah ditentukan sebelumnya.
Perbandingan fungsi
Gunakan tabel berikut untuk membandingkan fungsi ML.GENERATE_TEXT
dan
ML.PROCESS_DOCUMENT
:
ML.GENERATE_TEXT |
ML.PROCESS_DOCUMENT |
|
---|---|---|
Tujuan | Lakukan tugas NLP terkait dokumen apa pun dengan meneruskan perintah ke model partner atau Gemini atau ke model terbuka. Misalnya, dengan dokumen keuangan perusahaan, Anda dapat mengambil
informasi dokumen dengan memberikan perintah seperti |
Gunakan Document AI API untuk melakukan pemrosesan dokumen khusus untuk berbagai jenis dokumen, seperti invoice, formulir pajak, dan laporan keuangan. Anda juga dapat melakukan pemecahan dokumen. |
Penagihan | Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat
Harga BigQuery ML. |
Mengenakan biaya BigQuery ML untuk data yang diproses. Untuk mengetahui informasi selengkapnya, lihat
Harga BigQuery ML.
Mengenakan biaya untuk panggilan ke Document AI API. Untuk mengetahui informasi selengkapnya, lihat Harga Document AI API. |
Permintaan per menit (RPM) | Tidak berlaku untuk model Gemini. Antara 25 dan 60 untuk model partner. Untuk mengetahui informasi selengkapnya, lihat Batas permintaan per menit. | 120 RPM per jenis prosesor, dengan batas keseluruhan 600 RPM per project. Untuk mengetahui informasi selengkapnya, lihat Daftar kuota. |
Token per menit | Berkisar dari 8.192 hingga lebih dari 1 juta, bergantung pada model yang digunakan. | Tidak ada batas token. Namun, fungsi ini memiliki batas halaman yang berbeda-beda bergantung pada prosesor yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Batas. |
Penyesuaian yang diawasi | Penyesuaian yang diawasi didukung untuk beberapa model. | Tidak didukung. |
Bahasa yang didukung | Dukungan bervariasi berdasarkan LLM yang Anda pilih. | Dukungan bahasa bergantung pada jenis pemroses dokumen; sebagian besar hanya mendukung bahasa Inggris. Untuk mengetahui informasi selengkapnya, lihat Daftar prosesor. |
Region yang didukung | Didukung di semua region AI Generatif untuk Vertex AI. | Didukung di multi-region EU dan US
untuk semua prosesor. Beberapa prosesor juga tersedia di region tunggal tertentu. Untuk mengetahui informasi selengkapnya, lihat
Dukungan regional dan multiregional. |