Vertex AI Feature Store adalah layanan penyimpanan fitur terkelola berbasis cloud yang merupakan bagian tak terpisahkan dari Vertex AI. Solusi ini menyederhanakan pengelolaan fitur ML dan proses penyaluran online dengan memungkinkan Anda mengelola data fitur dalam tabel atau tampilan BigQuery. Anda kemudian dapat menyalurkan fitur secara online langsung dari sumber data BigQuery.
Vertex AI Feature Store menyediakan resource yang memungkinkan Anda menyiapkan penyaluran online dengan menentukan sumber data fitur Anda. Kemudian, lapisan metadata ini berfungsi sebagai lapisan metadata yang bersinggungan dengan sumber data BigQuery dan menyalurkan nilai fitur terbaru langsung dari BigQuery untuk prediksi online dengan latensi rendah.
Di Vertex AI Feature Store, tabel atau tampilan BigQuery yang berisi data fitur secara kolektif membentuk penyimpanan offline. Anda dapat mempertahankan nilai fitur, termasuk data fitur historis, di penyimpanan offline. Karena semua data fitur dikelola di BigQuery, Vertex AI Feature Store tidak perlu menyediakan penyimpanan offline terpisah dalam Vertex AI. Selain itu, jika ingin menggunakan data di penyimpanan offline untuk melatih model ML, Anda dapat menggunakan API dan kemampuan di BigQuery untuk mengekspor atau mengambil data.
Alur kerja untuk menyiapkan dan memulai penyaluran online menggunakan Vertex AI Feature Store dapat dirangkum sebagai berikut:
Persiapkan sumber data Anda di BigQuery.
Opsional: Daftarkan sumber data Anda dengan membuat grup fitur dan fitur.
Siapkan referensi penyimpanan online dan tampilan fitur untuk menghubungkan sumber data fitur dengan cluster penyaluran online.
Menyajikan nilai fitur terbaru secara online dari tampilan fitur.
Model data dan resource Vertex AI Feature Store
Bagian ini menjelaskan model data dan resource yang terkait dengan aspek Vertex AI Feature Store berikut:
Persiapan sumber data di BigQuery
Selama penyaluran online, Vertex AI Feature Store menggunakan data fitur dari sumber data BigQuery. Sebelum menyiapkan Feature Registry atau resource penyaluran online, Anda harus menyimpan data fitur dalam satu atau beberapa tabel atau tampilan BigQuery.
Dalam tabel atau tampilan BigQuery, setiap kolom mewakili sebuah fitur. Setiap baris berisi nilai fitur yang sesuai dengan ID unik. Untuk mengetahui informasi selengkapnya tentang cara menyiapkan data fitur di BigQuery, lihat Menyiapkan sumber data.
Misalnya, dalam gambar 1, tabel BigQuery menyertakan kolom berikut:
f1
danf2
: Kolom fitur.entity_id
: Kolom ID yang berisi ID unik untuk mengidentifikasi setiap data fitur.feature_timestamp
: Kolom stempel waktu.

Karena Anda menyiapkan sumber data di BigQuery, bukan di Vertex AI, Anda tidak perlu membuat resource Vertex AI apa pun pada tahap ini.
Penyiapan Registry Fitur
Setelah menyiapkan sumber data di BigQuery, Anda dapat mendaftarkan sumber data tersebut, termasuk kolom fitur tertentu, di Registry Fitur.
Mendaftarkan fitur Anda bersifat opsional. Anda dapat menyalurkan fitur secara online meskipun tidak menambahkan sumber data BigQuery ke Registry Fitur. Namun, mendaftarkan fitur Anda akan menguntungkan dalam skenario berikut:
Data Anda berisi beberapa instance ID entity yang sama dan Anda harus menyiapkan data dalam format deret waktu dengan kolom stempel waktu. Saat Anda mendaftarkan fitur, Vertex AI Feature Store akan mencari stempel waktu dan hanya menyalurkan nilai fitur terbaru.
Anda ingin mendaftarkan kolom fitur tertentu dari sumber data.
Anda ingin menggabungkan kolom tertentu dari beberapa sumber data untuk menentukan instance tampilan fitur.
Anda ingin memantau statistik fitur dan mendeteksi penyimpangan fitur.
Ada dua jenis resource Vertex AI Feature Store di Registry Fitur:
Resource Registry Fitur untuk data fitur
Untuk mendaftarkan data fitur di Registry Fitur, Anda perlu membuat resource Vertex AI Feature Store berikut:
Grup fitur (
FeatureGroup
): ResourceFeatureGroup
dikaitkan dengan tabel atau tampilan sumber BigQuery tertentu. Elemen ini mewakili pengelompokan kolom fitur secara logis, yang direpresentasikan oleh resourceFeature
. Grup fitur juga berisi satu atau beberapa kolom ID entitas untuk mengidentifikasi data fitur. Jika data fitur dalam format deret waktu, grup fitur juga harus berisi kolom stempel waktu. Untuk mengetahui informasi tentang cara membuat grup fitur, lihat Membuat grup fitur.Fitur (
Feature
): ResourceFeature
mewakili kolom tertentu yang berisi nilai fitur dari sumber data fitur yang terkait dengan resourceFeatureGroup
induknya. Untuk mengetahui informasi cara membuat fitur dalam grup fitur, lihat Membuat fitur.
Misalnya, gambar 2 mengilustrasikan grup fitur termasuk kolom fitur f1
dan f2
, yang bersumber dari tabel BigQuery yang terkait dengan grup fitur. Sumber data BigQuery berisi empat kolom fitur—dua kolom digabungkan untuk membentuk grup fitur. Grup fitur
juga berisi kolom ID entitas dan kolom stempel waktu fitur.

FeatureGroup
yang berisi dua kolom Feature
yang bersumber dari sumber data BigQuery.Resource Registry Fitur untuk pemantauan fitur
Resource pemantauan fitur memungkinkan Anda memantau data fitur yang terdaftar menggunakan
resource FeatureGroup
dan Feature
. Anda dapat membuat resource berikut
yang terkait dengan pemantauan fitur:
Pemantau fitur (
FeatureMonitor
): ResourceFeatureMonitor
dikaitkan dengan resourceFeatureGroup
dan satu atau beberapa fitur dalam grup fitur tersebut. File ini menentukan jadwal pemantauan. Anda dapat membuat beberapa resource monitor fitur untuk menyiapkan jadwal pemantauan yang berbeda untuk kumpulan fitur yang sama dalam grup fitur. Misalnya, jika fiturf1
danf2
diperbarui setiap jam, tetapi fiturf3
danf4
diperbarui setiap hari, Anda dapat membuat dua resource monitor fitur untuk memantau fitur ini secara efisien:Pemantau fitur
fm1
yang menjalankan tugas pemantauan setiap jam pada fiturf1
danf2
.Pemantauan fitur
fm2
yang menjalankan tugas pemantauan setiap hari pada fiturf3
danf4
.
Tugas pemantauan fitur (
FeatureMonitorJob
): ResourceFeatureMonitorJob
berisi statistik dan informasi fitur yang diambil saat tugas pemantauan fitur dijalankan. Data ini juga dapat berisi informasi tentang anomali, seperti penyimpangan fitur, yang terdeteksi dalam data fitur.
Untuk mengetahui informasi selengkapnya tentang cara membuat resource pemantauan fitur, lihat Memantau fitur untuk menemukan anomali.
Penyiapan penyaluran online
Untuk menyalurkan fitur untuk prediksi online, Anda harus menentukan dan mengonfigurasi setidaknya satu cluster penyaluran online, dan mengaitkannya dengan sumber data fitur atau resource Registry Fitur Anda. Di Vertex AI Feature Store, cluster penyaluran online disebut instance penyimpanan online. Instance penyimpanan online dapat berisi beberapa instance tampilan fitur, tempat setiap tampilan fitur dikaitkan dengan sumber data fitur.
Referensi penyaluran online
Untuk menyiapkan penyaluran online, Anda harus membuat resource Vertex AI Feature Store berikut:
Penyimpanan online (
FeatureOnlineStore
): ResourceFeatureOnlineStore
mewakili instance cluster penyaluran online dan berisi konfigurasi penyaluran online, seperti jumlah node penyaluran online. Instance penyimpanan online tidak menentukan sumber data fitur, tetapi berisi resourceFeatureView
yang menentukan sumber data fitur di BigQuery atau Registry Fitur. Untuk mengetahui informasi tentang cara membuat instance penyimpanan online, lihat Membuat instance penyimpanan online.Tampilan fitur (
FeatureView
): ResourceFeatureView
adalah kumpulan fitur logis dalam instance penyimpanan online. Saat membuat tampilan fitur, Anda dapat menentukan lokasi sumber data fitur dengan salah satu cara berikut:Mengaitkan satu atau beberapa grup fitur dan fitur dari Registry Fitur. Grup fitur menentukan lokasi sumber data BigQuery. Fitur dalam grup fitur mengarah ke kolom fitur tertentu di dalam sumber data tersebut.
Atau, kaitkan tabel sumber atau tampilan BigQuery.
Untuk mengetahui informasi tentang cara membuat instance tampilan fitur dalam penyimpanan online, lihat Membuat tampilan fitur.
Misalnya, gambar 3 mengilustrasikan tampilan fitur yang terdiri dari kolom fitur f2
dan f4
, yang bersumber dari dua grup fitur terpisah yang terkait dengan tabel BigQuery.

FeatureView
yang berisi fitur dari dua grup fitur yang terpisah.Penyaluran online
Vertex AI Feature Store menyediakan jenis penyajian online berikut untuk prediksi online real-time:
Penayangan online Bigtable berguna untuk menayangkan volume data besar (data dalam skala terabyte). Layanan ini mirip dengan penyajian online di Vertex AI Feature Store (Lama) dan menyediakan caching yang lebih baik untuk mengurangi hotspotting. Penyaluran online Bigtable tidak mendukung penyematan. Jika Anda perlu menayangkan data dalam jumlah besar yang sering diperbarui dan tidak perlu menayangkan penyematan, gunakan penyaluran online Bigtable.
Penyaluran online yang dioptimalkan memungkinkan Anda menyalurkan fitur secara online dengan latensi ultra-rendah. Meskipun latensi penyaluran online bergantung pada beban kerja, Penyaluran online yang dioptimalkan dapat memberikan latensi yang lebih rendah daripada penyaluran online Bigtable dan direkomendasikan untuk sebagian besar skenario. Penyaluran online yang dioptimalkan juga mendukung pengelolaan penyematan.
Untuk menggunakan penayangan online yang Dioptimalkan, Anda perlu mengonfigurasi endpoint publik atau endpoint Private Service Connect khusus.
Untuk mempelajari cara menyiapkan penyaluran online di Vertex AI Feature Store setelah Anda menyiapkan fitur, lihat Jenis penyaluran online.
Penyaluran offline untuk prediksi batch atau pelatihan model
Karena Anda tidak perlu menyalin atau mengimpor data fitur dari BigQuery ke penyimpanan offline terpisah di Vertex AI, Anda dapat menggunakan kemampuan pengelolaan data dan ekspor BigQuery untuk melakukan hal berikut:
Membuat kueri data fitur, termasuk data historis pada waktu tertentu.
Melakukan prapemrosesan dan mengekspor data fitur untuk pelatihan model dan prediksi batch.
Untuk informasi selengkapnya tentang machine learning menggunakan BigQuery, lihat pengantar BigQuery ML.
Persyaratan Vertex AI Feature Store
Istilah yang terkait dengan rekayasa fitur
rekayasa fitur
- Rekayasa fitur adalah proses mengubah data mentah machine learning (ML) menjadi fitur yang dapat digunakan untuk melatih model ML atau membuat prediksi.
fitur
- Dalam machine learning (ML), fitur adalah karakteristik atau atribut instance atau entity yang digunakan sebagai input untuk melatih model ML atau membuat prediksi.
nilai fitur
- Nilai fitur sesuai dengan nilai aktual dan terukur fitur (atribut) dari sebuah instance atau entity. Kumpulan nilai fitur untuk entity unik yang mewakili data fitur yang sesuai dengan entity.
stempel waktu fitur
- Stempel waktu fitur menunjukkan kapan serangkaian nilai fitur dalam kumpulan data fitur tertentu untuk entity dihasilkan.
kumpulan data fitur
- Kumpulan data fitur adalah penggabungan semua nilai fitur yang mendeskripsikan atribut entitas unik pada titik waktu tertentu.
Istilah yang terkait dengan Registry Fitur
registry fitur
- Registry fitur adalah antarmuka pusat untuk merekam sumber data fitur yang ingin Anda sajikan untuk prediksi online. Untuk informasi selengkapnya, lihat Penyiapan Feature Registry.
grup fitur
- Grup fitur adalah resource registry fitur yang sesuai dengan tabel sumber BigQuery atau tampilan yang berisi data fitur. Tampilan fitur mungkin berisi fitur dan dapat dianggap sebagai pengelompokan kolom fitur yang logis dalam sumber data.
Istilah yang terkait dengan penyajian fitur
penyajian fitur
- Penyajian fitur adalah proses mengekspor atau mengambil nilai fitur untuk pelatihan atau inferensi. Di Vertex AI, ada dua jenis penyajian fitur, yaitu layanan online dan offline. Penyajian online mengambil nilai fitur terbaru dari subset sumber data fitur untuk prediksi online. Penyajian offline atau penyaluran batch mengekspor data fitur dalam jumlah besar—termasuk data historis—untuk pemrosesan offline, seperti pelatihan model ML.
penyimpanan offline
- Penyimpanan offline adalah fasilitas penyimpanan yang menyimpan data fitur terbaru dan historis, yang biasanya digunakan untuk melatih model ML. Penyimpanan offline juga berisi nilai fitur terbaru, yang dapat Anda sajikan untuk prediksi online.
penyimpanan online
- Dalam pengelolaan fitur, penyimpanan online adalah fasilitas penyimpanan untuk nilai fitur terbaru yang akan disajikan untuk prediksi online.
penyimpanan online
- Dalam pengelolaan fitur, penyimpanan online adalah fasilitas penyimpanan untuk nilai fitur terbaru yang akan ditayangkan untuk prediksi online.
tampilan fitur
- Tampilan fitur adalah kumpulan logis fitur yang terwujud dari sumber data BigQuery ke instance penyimpanan online. Tampilan fitur menyimpan dan memperbarui data fitur pelanggan secara berkala, yang diperbarui secara berkala dari sumber BigQuery. Tampilan fitur dikaitkan dengan penyimpanan data fitur baik secara langsung maupun melalui pengaitan ke resource registry fitur.
Batasan lokasi
Semua resource Vertex AI Feature Store harus berada di
region yang sama atau lokasi multi-regional yang sama dengan sumber data
BigQuery Anda. Misalnya, jika sumber data fitur berada di us-central1
, Anda harus membuat instance FeatureOnlineStore
hanya di us-central1
atau di lokasi multi-region US
.
Metadata fitur
Vertex AI Feature Store terintegrasi dengan Dataplex untuk menyediakan kemampuan tata kelola fitur, termasuk metadata fitur. Instance toko online, tampilan fitur, dan grup fitur otomatis terdaftar sebagai aset data di Data Catalog, fitur Dataplex yang mengatalogkan metadata dari resource ini. Selanjutnya, Anda dapat menggunakan kemampuan penelusuran metadata Dataplex untuk menelusuri, melihat, dan mengelola metadata untuk resource ini. Untuk informasi selengkapnya tentang cara menelusuri resource Vertex AI Feature Store di Dataplex, lihat Menelusuri metadata resource di Data Catalog.
Label fitur
Anda dapat menambahkan label ke resource selama atau setelah pembuatan resource. Untuk mengetahui informasi selengkapnya tentang cara menambahkan label ke resource Vertex AI Feature Store yang ada, lihat Memperbarui label.
Metadata versi resource
Vertex AI Feature Store hanya mendukung versi 0
untuk fitur.
Pemantauan fitur
Vertex AI Feature Store memungkinkan Anda menyiapkan pemantauan fitur untuk mengambil statistik fitur dan mendeteksi anomali dalam data fitur. Anda dapat menyiapkan jadwal pemantauan untuk menjalankan tugas pemantauan secara berkala, atau menjalankan tugas pemantauan secara manual. Untuk mengetahui informasi selengkapnya tentang cara menyiapkan pemantauan fitur dan menjalankan tugas pemantauan fitur, lihat Memantau fitur untuk menemukan anomali.
Pengelolaan embedding dan pengambilan vektor
Penyaluran online yang dioptimalkan di Vertex AI Feature Store mendukung
pengelolaan penyematan. Anda dapat menyimpan penyematan di BigQuery sebagai array double
reguler. Dengan menggunakan kemampuan pengelolaan embedding
Vertex AI Feature Store, Anda dapat melakukan penelusuran kesamaan vektor
untuk mengambil entity yang merupakan perkiraan terdekat untuk entity atau nilai
embedding yang ditentukan.
Untuk menggunakan pengelolaan embedding di Vertex AI Feature Store, Anda perlu melakukan hal berikut:
Siapkan sumber data BigQuery untuk mendukung embedding dengan menyertakan kolom
embedding
. Atau, sertakan kolom pemfilteran dan kepadatan. Untuk informasi selengkapnya, lihat Panduan persiapan sumber data.Buat instance toko online untuk Penyaluran online yang dioptimalkan.
Tentukan kolom
embedding
saat membuat tampilan fitur. Untuk mengetahui informasi selengkapnya tentang cara membuat tampilan fitur yang mendukung embedding, lihat Mengonfigurasi pengambilan vektor untuk tampilan fitur.
Untuk mengetahui informasi tentang cara melakukan penelusuran kesamaan vektor di Vertex AI Feature Store, lihat Melakukan penelusuran vektor untuk entity.
Retensi data
Vertex AI Feature Store mempertahankan nilai fitur terbaru untuk ID unik, berdasarkan stempel waktu yang terkait dengan nilai fitur dalam sumber data. Tidak ada batas retensi data di penyimpanan online.
Karena penyimpanan offline disediakan oleh BigQuery, batas atau kuota retensi data dari BigQuery mungkin berlaku untuk sumber data fitur, termasuk nilai fitur historis. Pelajari kuota dan batas di BigQuery lebih lanjut.
Kuota dan batas
Vertex AI Feature Store menerapkan kuota dan batas untuk membantu Anda mengelola resource dengan menetapkan batas penggunaan, dan melindungi komunitas penggunaGoogle Cloud dengan mencegah lonjakan penggunaan yang tidak terduga. Untuk menggunakan resource Vertex AI Feature Store secara efisien tanpa mencapai batasan ini, tinjau kuota dan batas Vertex AI Feature Store.
Harga
Untuk mengetahui informasi tentang harga penggunaan resource untuk Vertex AI Feature Store, lihat Harga Vertex AI Feature Store.
Tutorial notebook
Gunakan contoh dan tutorial berikut untuk mempelajari Vertex AI Feature Store lebih lanjut.
Penyajian fitur online dan pengambilan data BigQuery dengan penyajian online Bigtable Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara menggunakan penyaluran online Bigtable di Vertex AI Feature Store untuk penyaluran online dan pengambilan nilai fitur di BigQuery. |
Penyajian fitur online dan pengambilan data BigQuery dengan Penyaluran online yang dioptimalkan Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara menggunakan Penyaluran online yang dioptimalkan di Vertex AI Feature Store untuk menyalurkan dan mengambil nilai fitur dari BigQuery. |
Penyajian fitur online dan pengambilan vektor data BigQuery dengan Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara menggunakan Vertex AI Feature Store untuk penyaluran online dan pengambilan vektor nilai fitur di BigQuery. |
Agen Layanan tampilan fitur Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara mengaktifkan Agen Layanan tampilan fitur dan memberikan akses ke setiap tampilan fitur ke data sumber tertentu yang digunakan. |
Tutorial grounding LLM berbasis Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara mengelompokkan data yang disediakan pengguna, lalu membuat vektor penyematan untuk setiap bagian menggunakan Model Bahasa Besar (LLM) yang memiliki kemampuan pembuatan penyematan. Set data vektor penyematan yang dihasilkan kemudian dapat dimuat ke Vertex AI Feature Store, sehingga memungkinkan pengambilan fitur yang cepat dan penayangan online yang efisien. |
Mem-build aplikasi RAG GenAI dengan Vertex AI Feature Store dan BigQuery
![]() |
Dalam tutorial ini, Anda akan mempelajari cara membuat sistem penelusuran vektor latensi rendah untuk aplikasi AI Generatif menggunakan penelusuran vektor BigQuery dan Vertex AI Feature Store. |
Mengonfigurasi Kebijakan IAM di Vertex AI Feature Store
![]() |
Dalam tutorial ini, Anda akan mempelajari cara mengonfigurasi kebijakan IAM untuk mengontrol akses ke resource dan data yang disimpan dalam Vertex AI Feature Store. |
Langkah selanjutnya
Pelajari cara menyiapkan data Anda di BigQuery.
Pelajari cara membuat grup fitur dan fitur.
Pelajari cara membuat instance penyimpanan online.