Perjalanan pengguna menyeluruh untuk model ML

Dokumen ini menjelaskan perjalanan pengguna untuk model machine learning (ML) yang dilatih di BigQuery ML, termasuk pernyataan dan fungsi yang dapat Anda gunakan untuk bekerja dengan model ML. BigQuery ML menawarkan jenis model ML berikut:

Perjalanan pengguna pembuatan model

Tabel berikut menjelaskan pernyataan dan fungsi yang dapat Anda gunakan untuk membuat dan menyesuaikan model:

Kategori model Jenis model Pembuatan model Pra-pemrosesan fitur Penyesuaian hyperparameter1 Bobot model Info fitur & pelatihan Tutorial
Supervised learning Regresi linear & logistik CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Menggunakan regresi linear untuk memprediksi berat penguin

Melakukan klasifikasi dengan model regresi logistik
Jaringan neural dalam (DNN) CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Jaringan Wide & Deep CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Pohon yang diperkuat CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
Melakukan klasifikasi dengan model pohon keputusan yang ditingkatkan
Hutan acak (random forest) CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Klasifikasi & regresi AutoML CREATE MODEL AutoML secara otomatis melakukan rekayasa fitur AutoML secara otomatis melakukan penyesuaian hyperparameter T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Pembelajaran yang tidak diawasi K-means CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
ML.CENTROIDS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Menemukan cluster dalam data stasiun sepeda
Faktorisasi matriks CREATE MODEL T/A Penyesuaian hyperparameter

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
Membuat rekomendasi film menggunakan masukan eksplisit

Membuat rekomendasi konten menggunakan masukan implisit
Analisis komponen utama (PCA) CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
T/A ML.PRINCIPAL
_COMPONENTS


ML.PRINCIPAL
_COMPONENT
_INFO
ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Autoencoder CREATE MODEL Pra-pemrosesan otomatis

Pra-pemrosesan manual
Penyesuaian hyperparameter

ML.TRIAL
_INFO
T/A2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
T/A
Khusus transformasi Khusus transformasi CREATE MODEL Pra-pemrosesan manual T/A T/A ML.FEATURE
_INFO
T/A

1Untuk contoh langkah demi langkah penggunaan penyesuaian hyperparameter, lihat Meningkatkan performa model dengan penyesuaian hyperparameter.

2BigQuery ML tidak menawarkan fungsi untuk mengambil bobot model ini. Untuk melihat bobot model, Anda dapat mengekspor model dari BigQuery ML ke Cloud Storage, lalu menggunakan library XGBoost atau library TensorFlow untuk memvisualisasikan struktur pohon untuk model pohon atau struktur grafik untuk jaringan neural. Untuk mengetahui informasi selengkapnya, lihat EXPORT MODEL dan Mengekspor model BigQuery ML untuk prediksi online.

Perjalanan pengguna penggunaan model

Tabel berikut menjelaskan pernyataan dan fungsi yang dapat Anda gunakan untuk mengevaluasi, menjelaskan, dan mendapatkan prediksi dari model:

Kategori model Jenis model Evaluasi Inferensi AI Explanations Pemantauan model
Supervised learning Regresi linear & logistik ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Jaringan neural dalam (DNN) ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Jaringan Wide & Deep ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Pohon yang diperkuat ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Hutan acak (random forest) ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Klasifikasi & regresi AutoML ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT ML.GLOBAL_EXPLAIN ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Pembelajaran yang tidak diawasi K-means ML.EVALUATE ML.PREDICT
ML.DETECT
_ANOMALIES


ML.TRANSFORM
T/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Faktorisasi matriks ML.EVALUATE ML.RECOMMEND

ML.GENERATE
_EMBEDDING
T/A T/A
Analisis komponen utama (PCA) ML.EVALUATE ML.PREDICT
ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.TRANSFORM
T/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Autoencoder ML.EVALUATE ML.PREDICT

ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.RECONSTRUCTION
_LOSS


ML.TRANSFORM
T/A ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Khusus transformasi Khusus transformasi T/A ML.TRANSFORM T/A T/A

1ML.CONFUSION_MATRIX hanya berlaku untuk model klasifikasi.

2ML.ROC_CURVE hanya berlaku untuk model klasifikasi biner.

3Fungsi ML.EXPLAIN_PREDICT mencakup fungsi ML.PREDICT karena outputnya adalah superset dari hasil ML.PREDICT.

4Untuk memahami perbedaan antara ML.GLOBAL_EXPLAIN dan ML.FEATURE_IMPORTANCE, lihat Ringkasan Explainable AI.

5Fungsi ML.ADVANCED_WEIGHTS mencakup fungsi ML.WEIGHTS karena outputnya adalah superset dari hasil ML.WEIGHTS.