Halaman ini diterjemahkan oleh Cloud Translation API.

Memilih fungsi pemrosesan bahasa alami

Dokumen ini memberikan perbandingan fungsi pemrosesan bahasa alami yang tersedia di BigQuery ML, yaitu ML.GENERATE_TEXT, ML.TRANSLATE, dan ML.UNDERSTAND_TEXT.

ML.GENERATE_TEXT juga dapat melakukan tugas yang dapat dilakukan oleh dua fungsi lainnya, seperti yang ditunjukkan pada gambar berikut:

Diagram yang menunjukkan alur kerja umum untuk model jarak jauh yang menggunakan model Vertex AI atau layanan Cloud AI.

Anda dapat menggunakan informasi dalam dokumen ini untuk membantu Anda memutuskan fungsi yang akan digunakan jika fungsi tersebut memiliki kemampuan yang tumpang-tindih.

Pada tingkat tinggi, perbedaan antara fungsi ini adalah sebagai berikut:

ML.GENERATE_TEXT adalah pilihan yang tepat untuk melakukan tugas natural language processing (NLP) yang disesuaikan dengan biaya lebih rendah. Fungsi ini menawarkan lebih banyak dukungan bahasa, throughput yang lebih cepat, dan kemampuan penyesuaian model, serta berfungsi dengan model multimodal.
ML.TRANSLATE adalah pilihan yang tepat untuk melakukan tugas NLP khusus terjemahan saat Anda perlu mendukung rasio kueri yang tinggi per menit.
ML.UNDERSTAND_TEXT adalah pilihan yang baik untuk melakukan tugas NLP yang didukung oleh Cloud Natural Language API.

Model yang didukung

Model yang didukung adalah sebagai berikut:

ML.GENERATE_TEXT: Anda dapat menggunakan subset model Vertex AI Gemini atau PaLM untuk membuat teks. Untuk informasi selengkapnya tentang model yang didukung, lihat sintaksis ML.GENERATE_TEXT.
ML.TRANSLATE: Anda menggunakan model default Cloud Translation API.
ML.UNDERSTAND_TEXT: Anda menggunakan model default Cloud Natural Language API.

Tugas yang didukung

Tugas yang didukung adalah sebagai berikut:

ML.GENERATE_TEXT: Anda dapat melakukan tugas NLP apa pun. Tugas yang dilakukan model didasarkan pada perintah yang Anda tentukan. Misalnya, untuk melakukan tugas menjawab pertanyaan, Anda dapat memberikan perintah yang mirip dengan CONCAT("What are the key concepts in the following article?: ", article_text). Anda juga dapat memberikan konteks sebagai bagian dari perintah. Contohnya, CONCAT("context: Only output 'yes' or 'no' to the following question: ", question).
ML.TRANSLATE: Anda dapat melakukan tugas berikut:
- TRANSLATE_TEXT
- DETECT_LANGUAGE
ML.UNDERSTAND_TEXT: Anda dapat melakukan tugas berikut:

Konteks data

Saat memilih fungsi yang akan digunakan, pertimbangkan apakah data Anda dapat dianalisis secara terpisah, atau apakah data tersebut memerlukan konteks tambahan untuk mendukung analisis. Jika data Anda memerlukan konteks tambahan, menggunakan ML.GENERATE_TEXT dengan model Vertex AI adalah pilihan yang lebih baik, karena model tersebut memungkinkan Anda memberikan konteks sebagai bagian dari perintah yang Anda kirimkan. Perlu diingat bahwa memberikan konteks tambahan sebagai input akan meningkatkan jumlah dan biaya token.

Jika data Anda dapat dianalisis tanpa konteks lain yang dipertimbangkan oleh model—misalnya, menerjemahkan string teks tanpa mengetahui alasan string tersebut ditulis, maka menggunakan ML.TRANSLATE atau ML.UNDERSTAND_TEXT mungkin merupakan pilihan yang lebih baik, asalkan tugas yang ingin Anda lakukan didukung.

Struktur output

ML.GENERATE_TEXT secara konsisten menampilkan hasil di kolom output ml_generate_text_llm_result. Anda juga dapat menggunakan perintah untuk menentukan struktur output. Misalnya, Anda dapat menginstruksikan model untuk menampilkan hasil sebagai JSON dengan kolom induk dan turunan kustom, dan memberikan contoh cara menghasilkan hasil ini.

ML.TRANSLATE dan ML.UNDERSTAND_TEXT menghasilkan output yang sama untuk jenis tugas tertentu untuk setiap panggilan yang berhasil ke API. Selain itu, output dari fungsi ini menyertakan metadata tambahan tentang hasilnya. Misalnya, output ML.TRANSLATE menyertakan informasi tentang bahasa input, dan output ML.UNDERSTAND_TEXT menyertakan informasi tentang besarnya sentimen untuk tugas analisis sentimen. Membuat metadata ini dapat dilakukan dengan model Vertex AI, tetapi hal ini memerlukan rekayasa perintah yang signifikan, dan kemungkinan tidak akan memberikan tingkat perincian yang sama.

Harga

Harganya sebagai berikut:

ML.GENERATE_TEXT: Untuk mengetahui harga model Vertex AI yang Anda gunakan dengan fungsi ini, lihat Harga Vertex AI. Penyesuaian yang diawasi untuk model yang didukung dikenai biaya dolar per jam kerja node dengan harga pelatihan kustom Vertex AI.
ML.TRANSLATE: Untuk mengetahui harga layanan Cloud AI yang Anda gunakan dengan fungsi ini, lihat Harga Cloud Translation API.
ML.UNDERSTAND_TEXT: Untuk mengetahui harga layanan Cloud AI yang Anda gunakan dengan fungsi ini, lihat Harga Cloud Natural Language API.

Penyesuaian yang diawasi

Dukungan penyesuaian yang diawasi adalah sebagai berikut:

ML.GENERATE_TEXT: penyesuaian terpantau didukung untuk beberapa model.
ML.TRANSLATE: penyesuaian yang diawasi tidak didukung.
ML.UNDERSTAND_TEXT: penyesuaian yang diawasi tidak didukung.

Multimodalitas

Dukungan multimodalitas adalah sebagai berikut:

ML.GENERATE_TEXT: mendukung input teks dan teks + gambar.
ML.TRANSLATE: mendukung input teks.
ML.UNDERSTAND_TEXT: mendukung input teks.

Batas kueri per menit (QPM)

Batas QPM adalah sebagai berikut:

ML.GENERATE_TEXT: berkisar dari batas 100 hingga 1.600 QPM di region us-central1 default, bergantung pada model yang digunakan.
ML.TRANSLATE: Batas 6.000 QPM untuk v3.
ML.UNDERSTAND_TEXT: Batas 600 QPM.

Token limit (batas token)

Batas token adalah sebagai berikut:

ML.GENERATE_TEXT: berkisar dari batas token 8.192 hingga 24.576, bergantung pada model yang digunakan.
ML.TRANSLATE: Tidak ada batas token. Namun, fungsi ini memiliki batas 30.000 byte.
ML.UNDERSTAND_TEXT: Batas token 100.000.

Bahasa yang didukung

Bahasa yang didukung adalah sebagai berikut:

ML.GENERATE_TEXT: mendukung bahasa yang sama dengan Gemini atau Embedding, bergantung pada model Vertex AI yang Anda pilih untuk endpoint model jarak jauh BigQuery ML. Model teks PaLM mendukung bahasa yang sama dengan model Embedding.
ML.TRANSLATE: mendukung bahasa Cloud Translation API.
ML.UNDERSTAND_TEXT: mendukung bahasa Cloud Natural Language API.

Ketersediaan wilayah

Ketersediaan wilayah adalah sebagai berikut:

ML.GENERATE_TEXT: tersedia di semua region AI Generatif untuk Vertex AI.
ML.TRANSLATE: tersedia di multi-region EU dan US.
ML.UNDERSTAND_TEXT: tersedia di multi-region EU dan US.