Pernyataan CREATE MODEL untuk model jarak jauh melalui layanan Cloud AI
Dokumen ini menjelaskan pernyataan CREATE MODEL
untuk membuat model jarak jauh di BigQuery melalui layanan Cloud AI. Misalnya, Cloud Natural Language API.
Sintaksis CREATE MODEL
{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL} `project_id.dataset.model_name` REMOTE WITH CONNECTION `project_id.region.connection_id` OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type [, DOCUMENT_PROCESSOR = document_processor] [, SPEECH_RECOGNIZER = speech_recognizer] );
CREATE MODEL
Membuat dan melatih model baru dalam set data yang ditentukan. Jika nama model ada, CREATE MODEL
akan menampilkan error.
CREATE MODEL IF NOT EXISTS
Membuat dan melatih model baru hanya jika model tidak ada dalam set data yang ditentukan.
CREATE OR REPLACE MODEL
Membuat dan melatih model serta mengganti model yang ada dengan nama yang sama di set data yang ditentukan.
model_name
Nama model yang Anda buat atau ganti. Nama model harus unik dalam set data: tidak ada model atau tabel lain yang boleh memiliki nama yang sama. Nama model harus mengikuti aturan penamaan yang sama dengan tabel BigQuery. Nama model dapat:
- Berisi maksimal 1.024 karakter
- Berisi huruf (huruf besar atau kecil), angka, dan garis bawah
model_name
tidak peka huruf besar/kecil.
Jika tidak memiliki project default yang dikonfigurasi, Anda harus menambahkan project ID ke nama model dalam format berikut, termasuk tanda kutip terbalik:
`[PROJECT_ID].[DATASET].[MODEL]`
Misalnya, `myproject.mydataset.mymodel`.
REMOTE WITH CONNECTION
Sintaks
`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`
BigQuery menggunakan koneksi resource Cloud untuk berinteraksi dengan layanan Cloud AI.
Elemen koneksi adalah sebagai berikut:
PROJECT_ID
: project ID untuk project yang berisi koneksi.LOCATION
: lokasi yang digunakan oleh koneksi. Koneksi harus berada di lokasi yang sama dengan set data yang berisi model.CONNECTION_ID
: ID koneksi—misalnya,myconnection
.Untuk menemukan ID koneksi Anda, lihat detail koneksi di Konsol Google Cloud. ID koneksi adalah nilai di bagian terakhir dari ID koneksi yang sepenuhnya memenuhi syarat yang ditampilkan dalam ID Koneksi—misalnya
projects/myproject/locations/connection_location/connections/myconnection
.
Anda perlu memberikan peran Vertex AI User ke akun layanan koneksi dalam project tempat Anda membuat model.
Contoh
`myproject.us.my_connection`
REMOTE_SERVICE_TYPE
Sintaks
REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }
Deskripsi
Menentukan layanan yang akan digunakan untuk membuat model:
- Cloud Natural Language API
- Cloud Translation API
- Cloud Vision API
- Document AI API (pratinjau)
- Speech-to-Text API (pratinjau)
Setelah membuat model jarak jauh berdasarkan layanan Cloud AI, Anda dapat menggunakan model tersebut dengan salah satu fungsi BigQuery ML berikut untuk menganalisis data BigQuery:
- Untuk model Cloud Natural Language API, gunakan
ML.UNDERSTAND_TEXT
- Untuk model Cloud Translation API, gunakan
ML.TRANSLATE
- Untuk model Cloud Vision API, gunakan
ML.ANNOTATE_IMAGE
- Untuk model Document AI API, gunakan
ML.PROCESS_DOCUMENT
(pratinjau) - Untuk model Speech-to-Text API, gunakan
ML.TRANSCRIBE
(pratinjau)
Contoh
REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'
DOCUMENT_PROCESSOR
Opsi ini mengidentifikasi pemroses dokumen yang akan digunakan saat nilai REMOTE_SERVICE_TYPE
adalah CLOUD_AI_DOCUMENT_V1
. Anda harus menggunakan opsi ini saat membuat model jarak jauh melalui Document AI API. Anda
tidak dapat menggunakan opsi ini dengan jenis model jarak jauh lainnya.
Document AI menyediakan prosesor bawaan untuk mengekstrak insight dari berbagai jenis dokumen, seperti berikut:
- Invoice
- Formulir pajak
- Laporan keuangan
Tidak semua jenis prosesor didukung. Pemroses yang didukung akan mengekstrak insight
dari dokumen dan memiliki deskripsi di
galeri prosesor
yang dimulai dengan Extract
. Misalnya, invoice, slip gaji, dan parser laporan mutasi bank. Pernyataan CREATE MODEL
akan gagal jika Anda menentukan prosesor
yang tidak didukung.
Nilai DOCUMENT_PROCESSOR
harus berupa string dalam format berikut:
projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
Ganti kode berikut:
PROJECT_NUMBER
: nomor project project yang berisi pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen project—misalnya,https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.LOCATION
: lokasi yang digunakan oleh pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen lokasi—misalnya,https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_ID
: ID pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen pemroses—misalnya,https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_VERSION
: versi pemroses dokumen. Anda dapat menemukan nilai ini dengan melihat detail prosesor, memilih tab Manage Versions, dan menyalin nilai Version ID dari versi yang ingin Anda gunakan.
SPEECH_RECOGNIZER
Opsi ini mengidentifikasi
pengenal ucapan untuk digunakan secara opsional saat
nilai REMOTE_SERVICE_TYPE
adalah CLOUD_AI_SPEECH_TO_TEXT_V2
. Jika tidak
menentukan opsi ini, Anda harus menentukan nilai untuk
argumen recognition_config
dari fungsi ML.TRANSCRIBE
jika Anda mereferensikan model jarak jauh. Anda tidak dapat menggunakan opsi ini dengan
jenis model jarak jauh lainnya.
Nilai SPEECH_RECOGNIZER
harus berupa string dalam format berikut:
projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID
Ganti kode berikut:
PROJECT_NUMBER
: nomor project project yang berisi pengenal ucapan. Anda dapat menemukan nilai ini di kartu Info project di halaman Dasbor pada Konsol Google Cloud.LOCATION
: lokasi yang digunakan oleh pengenal ucapan. Anda dapat menemukan nilai ini di kolom Lokasi di halaman Daftar pengenal pada Konsol Google Cloud.RECOGNIZER_ID
: ID pengenal ucapan. Anda dapat menemukan nilai ini di kolom ID pada halaman Daftar pengenal di Konsol Google Cloud.
Contoh
Contoh berikut membuat model jarak jauh BigQuery ML yang menggunakan Cloud Vision API:
CREATE MODEL `project_id.mydataset.mymodel` REMOTE WITH CONNECTION `myproject.us.test_connection` OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')
Langkah selanjutnya
Untuk mengetahui informasi selengkapnya tentang penggunaan layanan Cloud AI dengan BigQuery ML, lihat ringkasan aplikasi AI.