Pernyataan CREATE MODEL untuk model jarak jauh melalui layanan Cloud AI

Dokumen ini menjelaskan pernyataan CREATE MODEL untuk membuat model jarak jauh di BigQuery melalui layanan Cloud AI. Misalnya, Cloud Natural Language API.

Sintaksis CREATE MODEL

{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL}
`project_id.dataset.model_name`
REMOTE WITH CONNECTION `project_id.region.connection_id`
OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type
[, DOCUMENT_PROCESSOR = document_processor]
[, SPEECH_RECOGNIZER = speech_recognizer]
);

CREATE MODEL

Membuat dan melatih model baru dalam set data yang ditentukan. Jika nama model ada, CREATE MODEL akan menampilkan error.

CREATE MODEL IF NOT EXISTS

Membuat dan melatih model baru hanya jika model tidak ada dalam set data yang ditentukan.

CREATE OR REPLACE MODEL

Membuat dan melatih model serta mengganti model yang ada dengan nama yang sama di set data yang ditentukan.

model_name

Nama model yang Anda buat atau ganti. Nama model harus unik dalam set data: tidak ada model atau tabel lain yang boleh memiliki nama yang sama. Nama model harus mengikuti aturan penamaan yang sama dengan tabel BigQuery. Nama model dapat:

  • Berisi maksimal 1.024 karakter
  • Berisi huruf (huruf besar atau kecil), angka, dan garis bawah

model_name tidak peka huruf besar/kecil.

Jika tidak memiliki project default yang dikonfigurasi, Anda harus menambahkan project ID ke nama model dalam format berikut, termasuk tanda kutip terbalik:

`[PROJECT_ID].[DATASET].[MODEL]`

Misalnya, `myproject.mydataset.mymodel`.

REMOTE WITH CONNECTION

Sintaks

`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`

BigQuery menggunakan koneksi resource Cloud untuk berinteraksi dengan layanan Cloud AI.

Elemen koneksi adalah sebagai berikut:

  • PROJECT_ID: project ID untuk project yang berisi koneksi.
  • LOCATION: lokasi yang digunakan oleh koneksi. Koneksi harus berada di lokasi yang sama dengan set data yang berisi model.
  • CONNECTION_ID: ID koneksi—misalnya, myconnection.

    Untuk menemukan ID koneksi Anda, lihat detail koneksi di Konsol Google Cloud. ID koneksi adalah nilai di bagian terakhir dari ID koneksi yang sepenuhnya memenuhi syarat yang ditampilkan dalam ID Koneksi—misalnya projects/myproject/locations/connection_location/connections/myconnection.

Anda perlu memberikan peran Vertex AI User ke akun layanan koneksi dalam project tempat Anda membuat model.

Contoh

`myproject.us.my_connection`

REMOTE_SERVICE_TYPE

Sintaks

REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }

Deskripsi

Menentukan layanan yang akan digunakan untuk membuat model:

Setelah membuat model jarak jauh berdasarkan layanan Cloud AI, Anda dapat menggunakan model tersebut dengan salah satu fungsi BigQuery ML berikut untuk menganalisis data BigQuery:

Contoh

REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'

DOCUMENT_PROCESSOR

Opsi ini mengidentifikasi pemroses dokumen yang akan digunakan saat nilai REMOTE_SERVICE_TYPE adalah CLOUD_AI_DOCUMENT_V1. Anda harus menggunakan opsi ini saat membuat model jarak jauh melalui Document AI API. Anda tidak dapat menggunakan opsi ini dengan jenis model jarak jauh lainnya.

Document AI menyediakan prosesor bawaan untuk mengekstrak insight dari berbagai jenis dokumen, seperti berikut:

  • Invoice
  • Formulir pajak
  • Laporan keuangan

Tidak semua jenis prosesor didukung. Pemroses yang didukung akan mengekstrak insight dari dokumen dan memiliki deskripsi di galeri prosesor yang dimulai dengan Extract. Misalnya, invoice, slip gaji, dan parser laporan mutasi bank. Pernyataan CREATE MODEL akan gagal jika Anda menentukan prosesor yang tidak didukung.

Nilai DOCUMENT_PROCESSOR harus berupa string dalam format berikut:

projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION

Ganti kode berikut:

  • PROJECT_NUMBER: nomor project project yang berisi pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen project—misalnya, https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • LOCATION: lokasi yang digunakan oleh pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen lokasi—misalnya, https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_ID: ID pemroses dokumen. Untuk menemukan nilai ini, lihat detail pemroses, lihat endpoint Prediction, lalu ambil nilai setelah elemen pemroses—misalnya, https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_VERSION: versi pemroses dokumen. Anda dapat menemukan nilai ini dengan melihat detail prosesor, memilih tab Manage Versions, dan menyalin nilai Version ID dari versi yang ingin Anda gunakan.

SPEECH_RECOGNIZER

Opsi ini mengidentifikasi pengenal ucapan untuk digunakan secara opsional saat nilai REMOTE_SERVICE_TYPE adalah CLOUD_AI_SPEECH_TO_TEXT_V2. Jika tidak menentukan opsi ini, Anda harus menentukan nilai untuk argumen recognition_config dari fungsi ML.TRANSCRIBE jika Anda mereferensikan model jarak jauh. Anda tidak dapat menggunakan opsi ini dengan jenis model jarak jauh lainnya.

Nilai SPEECH_RECOGNIZER harus berupa string dalam format berikut:

projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID

Ganti kode berikut:

  • PROJECT_NUMBER: nomor project project yang berisi pengenal ucapan. Anda dapat menemukan nilai ini di kartu Info project di halaman Dasbor pada Konsol Google Cloud.
  • LOCATION: lokasi yang digunakan oleh pengenal ucapan. Anda dapat menemukan nilai ini di kolom Lokasi di halaman Daftar pengenal pada Konsol Google Cloud.
  • RECOGNIZER_ID: ID pengenal ucapan. Anda dapat menemukan nilai ini di kolom ID pada halaman Daftar pengenal di Konsol Google Cloud.

Contoh

Contoh berikut membuat model jarak jauh BigQuery ML yang menggunakan Cloud Vision API:

CREATE MODEL `project_id.mydataset.mymodel`
REMOTE WITH CONNECTION `myproject.us.test_connection`
 OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')

Langkah selanjutnya

Untuk mengetahui informasi selengkapnya tentang penggunaan layanan Cloud AI dengan BigQuery ML, lihat ringkasan aplikasi AI.