Ringkasan inferensi model

Dokumen ini menjelaskan jenis-jenis inferensi batch yang didukung oleh ML BigQuery, yang meliputi:

Prediksi batch
Prediksi online

Inferensi machine learning adalah proses menjalankan titik data ke dalam model machine learning untuk menghitung output seperti satu skor numerik. Proses ini juga disebut sebagai "mengoperasikan model machine learning" atau "memasukkan model machine learning ke dalam produksi".

Prediksi batch

Bagian berikut menjelaskan cara yang tersedia untuk melakukan prediksi di BigQuery ML.

Inferensi menggunakan model terlatih ML BigQuery

Prediksi di BigQuery ML tidak hanya digunakan untuk model supervised learning, tetapi juga model unsupervised learning.

BigQuery ML mendukung fungsi prediksi melalui fungsi ML.PREDICT, dengan model berikut:

Kategori Model	Jenis Model	Yang dilakukan `ML.PREDICT`
Supervised Learning	Regresi linear & logistik Hierarki yang ditingkatkan Hutan acak Jaringan Neural Dalam Wide-and-Deep AutoML Tables	Memprediksi label, baik nilai numerik untuk tugas regresi atau nilai kategori untuk tugas klasifikasi.
Unsupervised Learning	K-means	Menetapkan cluster ke entity.
	PCA	Menerapkan pengurangan dimensi ke entity dengan mengubahnya menjadi ruang yang direntangkan oleh vektor eigen.
	Autoencoder	Mengubah entity menjadi ruang sematan.

Inferensi menggunakan model yang diimpor

Dengan pendekatan ini, Anda akan membuat dan melatih model di luar BigQuery, mengimpornya menggunakan pernyataan CREATE MODEL, lalu menjalankan inferensi pada model tersebut menggunakan Fungsi ML.PREDICT. Semua pemrosesan inferensi terjadi di BigQuery, menggunakan data dari BigQuery. Model yang diimpor dapat melakukan supervised learning atau unsupervised learning.

BigQuery ML mendukung jenis model yang diimpor berikut:

Open Neural Network Exchange (ONNX) untuk model yang dilatih di PyTorch, scikit-learn, dan framework ML populer lainnya.
TensorFlow
TensorFlow Lite
XGBoost

Gunakan pendekatan ini untuk memanfaatkan model kustom yang dikembangkan dengan berbagai framework ML sekaligus memanfaatkan kecepatan inferensi ML BigQuery dan ko-lokasi dengan data.

Untuk mempelajari lebih lanjut, coba salah satu tutorial berikut:

Inferensi menggunakan model jarak jauh

Dengan pendekatan ini, Anda dapat membuat referensi ke model yang dihosting diPrediksi Vertex AI dengan menggunakan CREATE MODEL pernyataan , lalu jalankan inferensi padanya menggunakan fungsi ML.PREDICT. Semua pemrosesan inferensi terjadi di Vertex AI, menggunakan data dari BigQuery. Model jarak jauh dapat menjalankan supervised learning atau unsupervised learning.

Gunakan pendekatan ini untuk menjalankan inferensi terhadap model besar yang memerlukan dukungan hardware GPU yang disediakan oleh Vertex AI. Jika sebagian besar model Anda dihosting oleh Vertex AI, hal ini juga memungkinkan Anda menjalankan inferensi terhadap model tersebut menggunakan SQL, tanpa harus mem-build pipeline data secara manual untuk mengambil data ke Vertex AI dan membawa hasil prediksi kembali ke BigQuery.

Untuk mendapatkan petunjuk langkah demi langkah, lihat Membuat prediksi dengan model jarak jauh di Vertex AI.

Prediksi online

Kemampuan inferensi bawaan dari BigQuery ML dioptimalkan untuk kasus penggunaan berskala besar, seperti prediksi batch. Meskipun BigQuery ML memberikan hasil inferensi latensi rendah saat menangani data input kecil, Anda dapat mencapai prediksi online lebih cepat melalui integrasi yang lancar dengan Vertex AI.

Anda dapat mengelola model BigQuery ML dalam lingkungan Vertex AI sehingga Anda tidak perlu mengekspor model dari BigQuery ML sebelum men-deploy-nya sebagai endpoint Vertex AI. Dengan mengelola model dalam Vertex AI, Anda mendapatkan akses ke semua kemampuan MLOps Vertex AI, dan juga ke fitur seperti Vertex AI Feature Store.

Selain itu, Anda memiliki fleksibilitas untuk mengekspor model ML BigQuery ke Cloud Storage untuk ketersediaan di platform hosting model lainnya.

Langkah selanjutnya

Untuk mengetahui informasi selengkapnya tentang penggunaan model Vertex AI untuk membuat teks dan embedding, baca Ringkasan AI Generatif.
Untuk mengetahui informasi selengkapnya tentang penggunaan Cloud AI API untuk melakukan tugas AI, lihat ringkasan aplikasi AI.
Untuk mengetahui informasi tentang jenis model yang didukung dan fungsi SQL untuk setiap jenis inferensi, lihat Perjalanan pengguna menyeluruh untuk setiap model.