Model data dan resource

Bagian berikut memperkenalkan model data dan terminologi Vertex AI Feature Store (Lama) yang digunakan untuk menjelaskan resource dan komponen Vertex AI Feature Store (Lama).

Model data Vertex AI Feature Store (Lama)

Vertex AI Feature Store (Lama) menggunakan model data deret waktu untuk menyimpan serangkaian nilai untuk fitur. Model ini memungkinkan Vertex AI Feature Store (Lama) mempertahankan nilai fitur yang berubah dari waktu ke waktu. Vertex AI Feature Store (Lama) mengatur resource secara hierarkis dalam urutan berikut: Featurestore -> EntityType -> Feature. Anda harus membuat resource ini sebelum dapat mengimpor data ke Vertex AI Feature Store (Lama).

Sebagai contoh, anggaplah Anda memiliki contoh data sumber berikut dari tabel BigQuery. Data sumber ini adalah tentang film dan fiturnya.

Menampilkan cara pemetaan data sumber ke model data Vertex AI Feature Store (Lama)

Sebelum dapat mengimpor data ini ke Vertex AI Feature Store (Lama), Anda harus membuat featurestore, yang merupakan penampung tingkat teratas untuk semua resource lainnya. Di featurestore, buat jenis entity yang mengelompokkan dan berisi fitur terkait. Selanjutnya, Anda dapat membuat fitur yang dipetakan ke fitur dalam data sumber. Nama-nama fitur dan jenis entity dapat mencerminkan nama header kolom, tetapi hal ini tidak wajib.

Dalam contoh ini, header kolom movie_id dapat dipetakan ke jenis entity movie. average_rating, title, dan genre adalah fitur dari jenis entity movie. Nilai di setiap kolom dipetakan ke instance tertentu dari fitur atau jenis entity, yang disebut entity dan nilai fitur.

Kolom stempel waktu menunjukkan kapan nilai fitur dihasilkan. Di featurestore, stempel waktu adalah atribut nilai fitur, bukan jenis resource terpisah. Jika semua nilai fitur dibuat secara bersamaan, Anda tidak perlu memiliki kolom stempel waktu. Anda dapat menentukan stempel waktu sebagai bagian dari permintaan impor.

Featurestore

Featurestore adalah container tingkat teratas untuk jenis entity, fitur, dan nilai fitur. Biasanya, organisasi membuat satu featurestore bersama untuk mengimpor, menyalurkan, dan berbagi fitur ke seluruh tim di organisasi. Namun, terkadang Anda mungkin memilih untuk membuat beberapa featurestore dalam project yang sama untuk mengisolasi lingkungan. Misalnya, Anda mungkin memiliki featurestore terpisah untuk eksperimen, pengujian, dan produksi.

Jenis entitas

Jenis entitas adalah kumpulan fitur yang terkait secara semantik. Anda menentukan jenis entity Anda sendiri, berdasarkan konsep yang relevan dengan kasus penggunaan Anda. Misalnya, layanan film mungkin memiliki jenis entity movie dan user, yang mengelompokkan fitur terkait yang sesuai dengan film atau pelanggan.

Entity

Entity adalah instance dari jenis entity. Misalnya, movie_01 dan movie_02 adalah entity dari jenis entity movie. Di featurestore, setiap entity harus memiliki ID unik dan harus berjenis STRING.

Fitur

Fitur adalah properti atau atribut terukur dari suatu jenis entity. Misalnya, jenis entity movie memiliki fitur seperti average_rating dan title yang melacak berbagai properti film. Fitur dikaitkan dengan jenis entity. Fitur harus berbeda dalam jenis entity tertentu, tetapi tidak harus unik secara global. Misalnya, jika Anda menggunakan title untuk dua jenis entity yang berbeda, Vertex AI Feature Store (Lama) akan menafsirkan title sebagai dua fitur yang berbeda. Saat membaca nilai fitur, Anda memberikan fitur dan jenis entity-nya sebagai bagian dari permintaan.

Saat membuat fitur, Anda menentukan jenis nilainya seperti BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY, dan STRING. Nilai ini menentukan jenis nilai yang dapat Anda impor untuk fitur tertentu. Untuk mengetahui informasi selengkapnya tentang jenis nilai yang didukung, lihat valueType dalam referensi API.

Nilai fitur

Vertex AI Feature Store (Lama) merekam nilai fitur untuk fitur pada titik waktu tertentu. Dengan kata lain, Anda dapat memiliki beberapa nilai untuk entity dan fitur tertentu. Misalnya, entity movie_01 dapat memiliki beberapa nilai fitur untuk fitur average_rating. Nilainya dapat berupa 4.4 pada satu waktu dan 4.8 di lain waktu. Vertex AI Feature Store (Lama) mengaitkan ID tuple dengan setiap nilai fitur (entity_id, feature_id, timestamp), yang digunakan Vertex AI Feature Store (Legacy) untuk mencari nilai pada waktu penyaluran.

Vertex AI Feature Store (Lama) menyimpan nilai terpisah meskipun waktu terus berjalan. Saat Anda meminta nilai fitur pada waktu t, Vertex AI Feature Store (Lama) akan menampilkan nilai terbaru yang disimpan pada atau sebelum waktu t. Misalnya, jika Vertex AI Feature Store (Lama) menyimpan informasi lokasi mobil pada waktu 100 dan 110, lokasi pada waktu 100 digunakan untuk permintaan di semua waktu antara 100 (inklusif) dan 110 (eksklusif). Jika memerlukan resolusi yang lebih tinggi, Anda dapat, misalnya, menyimpulkan lokasi di antara nilai atau meningkatkan frekuensi sampling data.

Pengimporan fitur

Impor fitur adalah proses mengimpor nilai fitur yang dihitung oleh tugas rekayasa fitur ke dalam featurestore. Sebelum Anda dapat mengimpor data, jenis entity dan fitur yang sesuai harus ditentukan di featurestore. Vertex AI Feature Store (Lama) menawarkan impor batch dan streaming, sehingga Anda dapat menambahkan nilai fitur secara massal atau real time.

Misalnya, Anda mungkin memiliki data sumber komputasi yang berada di lokasi seperti BigQuery atau Cloud Storage. Anda dapat mengimpor data secara massal dari sumber tersebut ke dalam featurestore pusat sehingga nilai fitur tersebut dapat disalurkan dalam format yang seragam. Saat data sumber berubah, Anda dapat menggunakan impor streaming untuk mengirimkan perubahan tersebut dengan cepat ke featurestore. Dengan begitu, Anda memiliki data terbaru yang tersedia untuk skenario penyaluran online.

Untuk mengetahui informasi selengkapnya, lihat Nilai fitur impor batch atau Impor streaming.

Penyajian fitur

Penyajian fitur adalah proses mengekspor nilai fitur yang disimpan untuk pelatihan atau inferensi. Vertex AI Feature Store (Lama) menawarkan dua metode untuk menyalurkan fitur: batch dan online. Penyaluran batch ditujukan untuk throughput tinggi dan menyajikan data dalam volume besar untuk pemrosesan offline (seperti untuk pelatihan model atau prediksi batch). Penyaluran online ditujukan untuk pengambilan data berlatensi rendah yang berisi sejumlah kecil data untuk pemrosesan real-time (seperti untuk prediksi online).

Untuk mengetahui informasi selengkapnya, lihat penyaluran online atau batch.

Tampilan entitas

Saat Anda mengambil nilai dari featurestore, layanan akan menampilkan tampilan entity yang berisi nilai fitur yang Anda minta. Anda dapat menganggap tampilan entity sebagai proyeksi fitur dan nilai yang ditampilkan Vertex AI Feature Store (Lama) dari permintaan penyaluran online atau batch:

  • Untuk permintaan penyaluran online, Anda bisa mendapatkan semua atau sebagian fitur untuk jenis entity tertentu.
  • Untuk permintaan penyaluran batch, Anda bisa mendapatkan semua atau sebagian fitur untuk satu atau beberapa jenis entity. Misalnya, jika fitur didistribusikan ke beberapa jenis entity, Anda dapat mengambilnya kembali dalam satu permintaan, yang menggabungkan fitur-fitur tersebut. Selanjutnya, Anda dapat menggunakan hasilnya untuk melakukan feed ke permintaan prediksi machine learning atau batch.

Mengekspor data

Dengan Vertex AI Feature Store (Lama), Anda dapat mengekspor data dari featurestore sehingga Anda dapat mencadangkan dan mengarsipkan nilai fitur. Anda dapat memilih untuk mengekspor nilai fitur terbaru (snapshot) atau rentang nilai (ekspor lengkap). Untuk mengetahui informasi selengkapnya, lihat Mengekspor nilai fitur.

Langkah berikutnya