Penyajian fitur
Dokumen ini menjelaskan opsi Anda untuk menyediakan fitur untuk pelatihan dan inferensi model BigQuery ML. Untuk semua opsi, Anda harus menyimpan fitur di tabel BigQuery sebagai langkah pertama prasyarat.
Keakuratan point-in-time
Data yang digunakan untuk melatih model sering kali memiliki dependensi waktu yang terintegrasi. Saat membuat tabel fitur untuk fitur yang sensitif terhadap waktu, sertakan kolom stempel waktu untuk mewakili nilai fitur seperti yang ada pada waktu tertentu untuk setiap baris. Kemudian, Anda dapat menggunakan fungsi pencarian titik waktu saat membuat kueri data dari tabel fitur ini untuk memastikan tidak ada kebocoran data antara pelatihan dan penayangan. Proses ini memungkinkan ketepatan point-in-time.
Gunakan fungsi berikut untuk menentukan batas waktu tertentu saat mengambil fitur yang sensitif terhadap waktu:
Menayangkan fitur di BigQuery ML
Untuk melatih model dan melakukan inferensi batch di BigQuery ML, Anda
dapat mengambil fitur menggunakan salah satu fungsi pencarian titik waktu yang dijelaskan
di bagian Keakuratan titik waktu. Anda dapat menyertakan fungsi ini dalam klausa query_statement
dari pernyataan CREATE MODEL
untuk pelatihan, atau dalam klausa query_statement
dari fungsi nilai tabel yang sesuai, seperti ML.PREDICT
, untuk penayangan.
Menayangkan fitur dengan Vertex AI Feature Store
Untuk menayangkan fitur ke model BigQuery ML yang terdaftar di Vertex AI, Anda dapat menggunakan Vertex AI Feature Store. Vertex AI Feature Store berfungsi di atas tabel fitur di BigQuery untuk mengelola dan menyalurkan fitur dengan latensi rendah. Anda dapat menggunakan penyaluran online untuk mengambil fitur secara real time untuk prediksi online, dan Anda dapat menggunakan penyaluran offline untuk mengambil fitur untuk pelatihan model.
Untuk informasi selengkapnya tentang cara menyiapkan data fitur BigQuery yang akan digunakan di Vertex AI Feature Store, lihat Menyiapkan sumber data.