Bagian berikut memperkenalkan model data dan terminologi Vertex AI Feature Store (Lama) yang digunakan untuk menjelaskan resource dan komponen Vertex AI Feature Store (Lama).
Model data Vertex AI Feature Store (Lama)
Vertex AI Feature Store (Lama) menggunakan model data deret waktu untuk menyimpan
serangkaian nilai untuk fitur. Model ini memungkinkan
Vertex AI Feature Store (Lama) mempertahankan nilai fitur yang berubah
dari waktu ke waktu. Vertex AI Feature Store (Lama) mengatur resource secara hierarkis
dalam urutan
berikut: Featurestore -> EntityType -> Feature
. Anda harus membuat resource ini
sebelum dapat mengimpor data ke Vertex AI Feature Store (Lama).
Sebagai contoh, anggaplah Anda memiliki contoh data sumber berikut dari tabel BigQuery. Data sumber ini adalah tentang film dan fiturnya.
Sebelum dapat mengimpor data ini ke Vertex AI Feature Store (Lama), Anda harus membuat featurestore, yang merupakan penampung tingkat teratas untuk semua resource lainnya. Di featurestore, buat jenis entity yang mengelompokkan dan berisi fitur terkait. Selanjutnya, Anda dapat membuat fitur yang dipetakan ke fitur dalam data sumber. Nama-nama fitur dan jenis entity dapat mencerminkan nama header kolom, tetapi hal ini tidak wajib.
Dalam contoh ini, header kolom movie_id
dapat dipetakan ke jenis entity
movie
. average_rating
, title
, dan genre
adalah fitur dari
jenis entity movie
. Nilai di setiap kolom dipetakan ke instance tertentu dari
fitur atau jenis entity, yang disebut entity dan nilai fitur.
Kolom stempel waktu menunjukkan kapan nilai fitur dihasilkan. Di featurestore, stempel waktu adalah atribut nilai fitur, bukan jenis resource terpisah. Jika semua nilai fitur dibuat secara bersamaan, Anda tidak perlu memiliki kolom stempel waktu. Anda dapat menentukan stempel waktu sebagai bagian dari permintaan impor.
Featurestore
Featurestore adalah container tingkat teratas untuk jenis entity, fitur, dan nilai fitur. Biasanya, organisasi membuat satu featurestore bersama untuk mengimpor, menyalurkan, dan berbagi fitur ke seluruh tim di organisasi. Namun, terkadang Anda mungkin memilih untuk membuat beberapa featurestore dalam project yang sama untuk mengisolasi lingkungan. Misalnya, Anda mungkin memiliki featurestore terpisah untuk eksperimen, pengujian, dan produksi.
Jenis entitas
Jenis entitas adalah kumpulan fitur yang terkait secara semantik. Anda menentukan
jenis entity Anda sendiri, berdasarkan konsep yang relevan dengan kasus penggunaan Anda. Misalnya, layanan film mungkin memiliki jenis entity movie
dan user
, yang mengelompokkan fitur terkait yang sesuai dengan film atau pelanggan.
Entity
Entity adalah instance dari jenis entity. Misalnya, movie_01
dan
movie_02
adalah entity dari jenis entity movie
. Di
featurestore, setiap entity harus memiliki ID unik dan harus berjenis STRING
.
Fitur
Fitur adalah properti atau atribut terukur dari suatu jenis entity. Misalnya,
jenis entity movie
memiliki fitur seperti average_rating
dan title
yang
melacak berbagai properti film. Fitur dikaitkan dengan jenis entity.
Fitur harus berbeda dalam jenis entity tertentu, tetapi tidak harus unik secara global. Misalnya, jika Anda menggunakan title
untuk dua jenis entity
yang berbeda, Vertex AI Feature Store (Lama) akan menafsirkan title
sebagai dua fitur
yang berbeda. Saat membaca nilai fitur, Anda memberikan fitur dan jenis entity-nya sebagai bagian dari permintaan.
Saat membuat fitur, Anda menentukan jenis nilainya seperti BOOL_ARRAY
, DOUBLE
, DOUBLE_ARRAY
, dan STRING
. Nilai ini menentukan jenis nilai yang dapat Anda impor untuk fitur tertentu. Untuk mengetahui informasi selengkapnya tentang
jenis nilai yang didukung, lihat valueType
dalam
referensi API.
Nilai fitur
Vertex AI Feature Store (Lama) merekam nilai fitur untuk fitur pada
titik waktu tertentu. Dengan kata lain, Anda dapat memiliki beberapa nilai untuk
entity dan fitur tertentu. Misalnya, entity movie_01
dapat memiliki beberapa nilai
fitur untuk fitur average_rating
. Nilainya dapat berupa 4.4
pada satu waktu dan
4.8
di lain waktu. Vertex AI Feature Store (Lama) mengaitkan ID tuple
dengan setiap nilai fitur (entity_id
, feature_id
, timestamp
),
yang digunakan Vertex AI Feature Store (Legacy) untuk mencari nilai pada waktu penyaluran.
Vertex AI Feature Store (Lama) menyimpan nilai terpisah meskipun waktu terus berjalan. Saat Anda meminta nilai fitur pada waktu t
,
Vertex AI Feature Store (Lama) akan menampilkan nilai terbaru yang disimpan pada atau sebelum
waktu t
. Misalnya, jika Vertex AI Feature Store (Lama) menyimpan
informasi lokasi mobil pada waktu 100
dan 110
, lokasi pada waktu
100
digunakan untuk permintaan di semua waktu antara 100
(inklusif) dan 110
(eksklusif). Jika memerlukan resolusi yang lebih tinggi, Anda dapat, misalnya, menyimpulkan lokasi di antara nilai atau meningkatkan frekuensi sampling data.
Pengimporan fitur
Impor fitur adalah proses mengimpor nilai fitur yang dihitung oleh tugas rekayasa fitur ke dalam featurestore. Sebelum Anda dapat mengimpor data, jenis entity dan fitur yang sesuai harus ditentukan di featurestore. Vertex AI Feature Store (Lama) menawarkan impor batch dan streaming, sehingga Anda dapat menambahkan nilai fitur secara massal atau real time.
Misalnya, Anda mungkin memiliki data sumber komputasi yang berada di lokasi seperti BigQuery atau Cloud Storage. Anda dapat mengimpor data secara massal dari sumber tersebut ke dalam featurestore pusat sehingga nilai fitur tersebut dapat disalurkan dalam format yang seragam. Saat data sumber berubah, Anda dapat menggunakan impor streaming untuk mengirimkan perubahan tersebut dengan cepat ke featurestore. Dengan begitu, Anda memiliki data terbaru yang tersedia untuk skenario penyaluran online.
Untuk mengetahui informasi selengkapnya, lihat Nilai fitur impor batch atau Impor streaming.
Penyajian fitur
Penyajian fitur adalah proses mengekspor nilai fitur yang disimpan untuk pelatihan atau inferensi. Vertex AI Feature Store (Lama) menawarkan dua metode untuk menyalurkan fitur: batch dan online. Penyaluran batch ditujukan untuk throughput tinggi dan menyajikan data dalam volume besar untuk pemrosesan offline (seperti untuk pelatihan model atau prediksi batch). Penyaluran online ditujukan untuk pengambilan data berlatensi rendah yang berisi sejumlah kecil data untuk pemrosesan real-time (seperti untuk prediksi online).
Untuk mengetahui informasi selengkapnya, lihat penyaluran online atau batch.
Tampilan entitas
Saat Anda mengambil nilai dari featurestore, layanan akan menampilkan tampilan entity yang berisi nilai fitur yang Anda minta. Anda dapat menganggap tampilan entity sebagai proyeksi fitur dan nilai yang ditampilkan Vertex AI Feature Store (Lama) dari permintaan penyaluran online atau batch:
- Untuk permintaan penyaluran online, Anda bisa mendapatkan semua atau sebagian fitur untuk jenis entity tertentu.
- Untuk permintaan penyaluran batch, Anda bisa mendapatkan semua atau sebagian fitur untuk satu atau beberapa jenis entity. Misalnya, jika fitur didistribusikan ke beberapa jenis entity, Anda dapat mengambilnya kembali dalam satu permintaan, yang menggabungkan fitur-fitur tersebut. Selanjutnya, Anda dapat menggunakan hasilnya untuk melakukan feed ke permintaan prediksi machine learning atau batch.
Mengekspor data
Dengan Vertex AI Feature Store (Lama), Anda dapat mengekspor data dari featurestore sehingga Anda dapat mencadangkan dan mengarsipkan nilai fitur. Anda dapat memilih untuk mengekspor nilai fitur terbaru (snapshot) atau rentang nilai (ekspor lengkap). Untuk mengetahui informasi selengkapnya, lihat Mengekspor nilai fitur.
Langkah berikutnya
- Pelajari cara menyiapkan project Anda untuk Vertex AI Feature Store (Lama).
- Pelajari persyaratan data sumber.