Ringkasan data tabulasi

Dengan Vertex AI, Anda dapat menjalankan machine learning dengan data tabulasi menggunakan proses dan antarmuka yang sederhana. Anda dapat membuat jenis model berikut untuk masalah data tabulasi Anda:

  • Model klasifikasi biner memprediksi hasil biner (salah satu dari dua class). Gunakan jenis model ini untuk pertanyaan ya atau tidak. Misalnya, Anda mungkin ingin membuat model klasifikasi biner untuk memprediksi apakah pelanggan akan membeli langganan. Umumnya, masalah klasifikasi biner membutuhkan lebih sedikit data dibandingkan jenis model lainnya.
  • Model klasifikasi kelas jamak memprediksi satu class dari tiga class atau lebih yang terpisah. Gunakan jenis model ini untuk kategorisasi. Misalnya, sebagai retailer, Anda mungkin ingin membuat model klasifikasi kelas jamak untuk mengelompokkan pelanggan ke dalam berbagai persona.
  • Model regresi memprediksi nilai berkelanjutan. Misalnya, sebagai retailer, Anda mungkin ingin membuat model regresi untuk memprediksi jumlah yang akan dibelanjakan pelanggan bulan depan.
  • Model Perkiraan memprediksi urutan nilai. Misalnya, sebagai retailer, Anda mungkin ingin memperkirakan permintaan harian produk Anda selama 3 bulan ke depan, sehingga Anda dapat menyediakan inventaris produk dengan tepat di awal.

Untuk pengantar machine learning dengan data tabel, lihat Pengantar Data Tabulasi. Untuk mengetahui informasi selengkapnya tentang solusi Vertex AI, lihat Solusi Vertex AI untuk klasifikasi dan regresi serta Solusi Vertex AI untuk perkiraan.

Catatan tentang keadilan

Google berkomitmen untuk membuat kemajuan dalam mengikuti praktik AI yang bertanggung jawab. Untuk mencapai tujuan ini, produk ML kami, termasuk AutoML, dirancang berdasarkan prinsip inti seperti keadilan dan machine learning yang berpusat pada manusia. Untuk mengetahui informasi selengkapnya tentang praktik terbaik dalam memitigasi bias saat membangun sistem ML Anda sendiri, lihat Panduan ML inklusif - AutoML.

Solusi Vertex AI untuk klasifikasi dan regresi

Vertex AI menawarkan solusi berikut untuk klasifikasi dan regresi:

Tabular Workflow untuk AutoML End-to-End

Tabular Workflow untuk AutoML End-to-End adalah pipeline AutoML lengkap untuk tugas klasifikasi dan regresi. Hal ini mirip dengan AutoML API, tetapi memungkinkan Anda memilih apa yang akan dikontrol dan diotomatisasi. Alih-alih memiliki kontrol untuk seluruh pipeline, Anda memiliki kontrol untuk setiap langkah di pipeline. Kontrol pipeline ini mencakup:

  • Pemisahan data
  • Rekayasa fitur
  • Penelusuran arsitektur
  • Pelatihan model
  • Ansambel model
  • Distilasi model

Manfaat

  • Mendukung set data besar berukuran beberapa TB dan memiliki hingga 1.000 kolom.
  • Memungkinkan Anda meningkatkan stabilitas dan menurunkan waktu pelatihan dengan membatasi ruang penelusuran jenis arsitektur atau melewati penelusuran arsitektur.
  • Memungkinkan Anda meningkatkan kecepatan pelatihan dengan memilih secara manual hardware yang digunakan untuk penelusuran arsitektur dan pelatihan.
  • Memungkinkan Anda mengurangi ukuran model dan meningkatkan latensi dengan distilasi atau dengan mengubah ukuran ansambel.
  • Setiap komponen AutoML dapat diperiksa dengan antarmuka grafik pipeline andal yang memungkinkan Anda melihat tabel data yang ditransformasi, arsitektur model yang dievaluasi, dan banyak detail lainnya.
  • Setiap komponen AutoML mendapatkan fleksibilitas dan transparansi yang lebih luas, seperti kemampuan untuk menyesuaikan parameter, hardware, status proses tampilan, log, dan lain-lain.

Untuk mempelajari Tabular Workflow lebih lanjut, lihat Tabular Workflow di Vertex AI. Untuk mempelajari lebih lanjut Tabular Workflow untuk AutoML End-to-End, lihat Tabular Workflow untuk AutoML End-to-End.

Tabular Workflow untuk TabNet

Tabular Workflow untuk TabNet adalah pipeline yang dapat Anda gunakan untuk melatih model klasifikasi atau regresi. TabNet menggunakan sequential attention untuk memilih fitur yang akan menjadi alasan pada setiap langkah keputusan. Hal ini meningkatkan penafsiran dan pembelajaran yang lebih efisien karena kapasitas pembelajaran digunakan untuk fitur yang paling penting.

Manfaat

  • Secara otomatis memilih ruang penelusuran hyperparameter yang sesuai berdasarkan ukuran set data, jenis prediksi, dan anggaran pelatihan.
  • Terintegrasi dengan Vertex AI. Model yang dilatih adalah model Vertex AI. Anda dapat langsung menjalankan prediksi batch atau men-deploy model untuk prediksi online.
  • Memberikan penafsiran model yang melekat. Anda dapat memperoleh insight tentang fitur yang digunakan TabNet untuk membuat keputusan.
  • Mendukung pelatihan GPU.

Untuk mempelajari Tabular Workflow lebih lanjut, lihat Tabular Workflow di Vertex AI. Untuk mempelajari lebih lanjut Tabular Workflow untuk TabNet, lihat Tabular Workflow untuk TabNet.

Tabular Workflow untuk Wide & Deep

Tabular Workflow untuk Wide & Deep adalah pipeline yang dapat Anda gunakan untuk melatih model klasifikasi atau regresi. Wide & Deep bersama-sama melatih model linear lebar dan jaringan neural dalam. Cara ini menggabungkan manfaat menghafal dan generalisasi. Dalam beberapa eksperimen online, hasilnya menunjukkan bahwa Wide & Deep meningkatkan akuisisi aplikasi Google Store secara signifikan dibandingkan dengan model khusus wide dan model khusus deep.

Manfaat

  • Terintegrasi dengan Vertex AI. Model yang dilatih adalah model Vertex AI. Anda dapat langsung menjalankan prediksi batch atau men-deploy model untuk prediksi online.

Untuk mempelajari Tabular Workflow lebih lanjut, lihat Tabular Workflow di Vertex AI. Untuk mempelajari lebih lanjut tabular Workflow untuk Wide & Deep, lihat Tabular Workflow untuk Wide & Deep.

Klasifikasi dan regresi dengan AutoML

Vertex AI menawarkan pipeline terintegrasi dan terkelola sepenuhnya untuk tugas regresi atau klasifikasi menyeluruh. Vertex AI menelusuri kumpulan hyperparameter yang optimal, melatih beberapa model dengan beberapa kumpulan hyperparameter, lalu membuat satu model akhir dari ansambel model-model teratas. Vertex AI mempertimbangkan jaringan neural dan hierarki yang ditingkatkan untuk jenis model.

Manfaat

  • Mudah digunakan: jenis model, parameter model, dan hardware yang dipilih untuk Anda.

Untuk informasi selengkapnya, lihat Ringkasan Klasifikasi dan Regresi.

Solusi Vertex AI untuk perkiraan

Vertex AI menawarkan solusi berikut untuk perkiraan:

Tabular Workflow untuk Perkiraan

Tabular Workflow untuk Perkiraan adalah pipeline lengkap untuk tugas perkiraan. Hal ini mirip dengan AutoML API, tetapi memungkinkan Anda memilih apa yang akan dikontrol dan diotomatisasi. Alih-alih memiliki kontrol untuk seluruh pipeline, Anda memiliki kontrol untuk setiap langkah di pipeline. Kontrol pipeline ini mencakup:

  • Pemisahan data
  • Rekayasa fitur
  • Penelusuran arsitektur
  • Pelatihan model
  • Ansambel model

Manfaat

  • Mendukung set data besar yang berukuran hingga 1 TB dan memiliki maksimal 200 kolom.
  • Memungkinkan Anda meningkatkan stabilitas dan menurunkan waktu pelatihan dengan membatasi ruang penelusuran jenis arsitektur atau melewati penelusuran arsitektur.
  • Memungkinkan Anda meningkatkan kecepatan pelatihan dengan memilih secara manual hardware yang digunakan untuk penelusuran arsitektur dan pelatihan.
  • Untuk beberapa metode pelatihan model, Anda dapat mengurangi ukuran model dan meningkatkan latensi dengan mengubah ukuran ansambel.
  • Setiap komponen AutoML dapat diperiksa dengan antarmuka grafik pipeline andal yang memungkinkan Anda melihat tabel data yang ditransformasi, arsitektur model yang dievaluasi, dan banyak detail lainnya.
  • Setiap komponen AutoML mendapatkan fleksibilitas dan transparansi yang lebih luas, seperti kemampuan untuk menyesuaikan parameter, hardware, status proses tampilan, log, dan lain-lain.

Untuk mempelajari Tabular Workflow lebih lanjut, lihat Tabular Workflow di Vertex AI. Untuk mempelajari Tabular Workflow untuk Perkiraan lebih lanjut, lihat Tabular Workflow utuk Perkiraan.

Perkiraan dengan AutoML

Vertex AI menawarkan pipeline terintegrasi dan terkelola sepenuhnya untuk tugas perkiraan menyeluruh. Vertex AI menelusuri kumpulan hyperparameter yang optimal, melatih beberapa model dengan beberapa kumpulan hyperparameter, lalu membuat satu model akhir dari ansambel model-model teratas. Anda dapat memilih antara Time series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) , dan Seq2Seq+ untuk metode pelatihan model Anda. Vertex AI hanya mempertimbangkan jaringan neural untuk jenis model tersebut.

Manfaat

  • Mudah digunakan: parameter dan hardware model telah dipilihkan untuk Anda.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Perkiraan.

Perkiraan dengan ARIMA_PLUS BigQuery ML

ARIMA_PLUS BigQuery ML adalah model perkiraan univariat. Sebagai model statistik, model ini lebih cepat dilatih daripada model yang berdasar pada jaringan neural. Sebaiknya latih model ARIMA_PLUS BigQuery ML jika Anda perlu melakukan banyak iterasi cepat pada pelatihan model atau jika Anda memerlukan baseline yang murah untuk mengukur model lain.

Seperti Prophet, ARIMA_PLUS BigQuery ML berupaya mengurai setiap deret waktu ke dalam tren, musim, dan hari libur, sehingga menghasilkan perkiraan menggunakan gabungan prediksi model ini. Namun, perbedaan pentingnya adalah ARIMA+ BQML menggunakan ARIMA untuk membuat model komponen tren, sementara Prophet mencoba menyesuaikan kurva menggunakan model linear atau piecewise logistic.

Google Cloud menawarkan pipeline untuk melatih model ARIMA_PLUS BigQuery ML dan pipeline untuk mendapatkan prediksi batch dari model ARIMA_PLUS BigQuery ML. Kedua pipeline tersebut merupakan instance Vertex AI Pipelines dari Google Cloud Pipeline Components (GCPC).

Manfaat

  • Mudah digunakan: parameter dan hardware model telah dipilihkan untuk Anda.
  • Cepat: pelatihan model memberikan dasar pengukuran berbiaya rendah untuk dibandingkan dengan model lain.

Untuk informasi selengkapnya, lihat Perkiraan dengan ARIMA+.

Perkiraan dengan Prophet

Prophet adalah model perkiraan yang dikelola oleh Meta. Lihat makalah Prophet untuk mengetahui detail algoritma dan dokumentasi guna mengetahui informasi selengkapnya tentang library.

Seperti BigQuery ML ARIMA_PLUS, Prophet berupaya mengurai setiap deret waktu menjadi tren, musim, dan liburan, sehingga menghasilkan perkiraan menggunakan agregasi prediksi model ini. Namun, perbedaan pentingnya adalah ARIMA+ BQML menggunakan ARIMA untuk membuat model komponen tren, sementara Prophet mencoba menyesuaikan kurva menggunakan model linear atau piecewise logistic.

Google Cloud menawarkan pipeline untuk melatih model Prophet dan pipeline untuk mendapatkan prediksi batch dari model Prophet. Kedua pipeline tersebut merupakan instance Vertex AI Pipelines dari Google Cloud Pipeline Components (GCPC).

Integrasi Prophet dengan Vertex AI memungkinkan Anda melakukan hal berikut:

Meskipun Prophet adalah model multi-variasi, Vertex AI hanya mendukung versi univariatnya.

Manfaat

  • Fleksibel: Anda dapat meningkatkan kecepatan pelatihan dengan memilih hardware yang digunakan untuk pelatihan

Untuk informasi selengkapnya, lihat Perkiraan dengan Prophet.

Langkah berikutnya