Anda dapat memperbarui skema untuk data apa pun yang berisi data yang mendukung skema, seperti data terstruktur, data situs dengan data terstruktur, atau data tidak terstruktur lainnya dengan metadata.
Anda dapat memperbarui skema di konsol Google Cloud atau dengan menggunakan metode API schemas.patch
.
Memperbarui skema untuk situs hanya didukung melalui REST API.
Untuk memperbarui skema, Anda dapat menambahkan kolom baru, mengubah anotasi yang dapat diindeks, ditelusuri, dan
diambil untuk kolom, atau menandai kolom sebagai properti utama, seperti
title
, uri
, dan description
.
Memperbarui skema
Anda dapat memperbarui skema di konsol Google Cloud atau menggunakan API.
Konsol
Untuk memperbarui skema di konsol Google Cloud, ikuti langkah-langkah berikut:
Tinjau bagian Persyaratan dan batasan untuk memeriksa apakah pembaruan skema Anda valid.
Jika Anda memperbarui anotasi kolom (menetapkan kolom sebagai dapat diindeks, dapat diambil, tabel wajah dinamis, dapat ditelusuri, atau dapat diselesaikan), tinjau Mengonfigurasi setelan kolom untuk mengetahui batasan dan persyaratan setiap jenis anotasi.
Pastikan Anda telah menyelesaikan penyerapan data. Jika tidak, skema mungkin belum tersedia untuk diedit.
Di konsol Google Cloud, buka halaman Agent Builder.
Di menu navigasi, klik Penyimpanan Data.
Di kolom Name, klik penyimpanan data dengan skema yang ingin Anda perbarui.
Klik tab Schema untuk melihat skema data Anda.
Tab ini mungkin kosong jika ini adalah pertama kalinya Anda mengedit kolom.
Klik tombol Edit.
Perbarui skema Anda:
Pemetaan properti kunci: Di kolom Properti kunci skema Anda, pilih properti kunci yang akan dipetakan ke kolom. Misalnya, jika kolom bernama
details
selalu berisi deskripsi dokumen, petakan kolom tersebut ke properti kunci Deskripsi.Perbarui jumlah dimensi (Lanjutan): Anda dapat memperbarui setelan ini jika menggunakan penyematan vektor kustom dengan Vertex AI Search. Lihat Lanjutan: Menggunakan penyematan kustom.
Memperbarui anotasi kolom: Untuk memperbarui anotasi kolom, pilih atau batalkan pilihan setelan anotasi kolom. Anotasi yang tersedia adalah Dapat Diambil, Dapat Diindeks, Dapat Dibuat Tabel Dinamis, Dapat Ditelusuri, dan Dapat Diisi. Beberapa setelan kolom memiliki batasan. Lihat Mengonfigurasi setelan kolom untuk mengetahui deskripsi dan persyaratan untuk setiap jenis anotasi.
Menambahkan kolom baru: Menambahkan kolom baru ke skema sebelum mengimpor dokumen baru dengan kolom tersebut dapat mempersingkat waktu yang diperlukan Vertex AI Agent Builder untuk mengindeks ulang data Anda setelah impor.
Klik Tambahkan kolom baru untuk meluaskan bagian tersebut.
Klik add_box Tambahkan node dan tentukan setelan untuk kolom baru.
Untuk menunjukkan array, tetapkan Array ke Ya. Misalnya, untuk menambahkan array string, tetapkan type ke
string
dan Array keYes
.Untuk indeks penyimpanan data situs, semua kolom yang Anda tambahkan adalah array secara default.
Klik Simpan untuk menerapkan perubahan skema.
Mengubah skema akan memicu pengindeksan ulang. Untuk penyimpanan data yang besar, pengindeksan ulang dapat memerlukan waktu berjam-jam.
REST
Untuk menggunakan API guna memperbarui skema, ikuti langkah-langkah berikut:
Tinjau bagian Persyaratan dan batasan serta Contoh batasan (khusus REST) untuk memeriksa apakah perubahan skema Anda valid.
Untuk memperbarui skema penyimpanan data dengan situs atau data tidak terstruktur dengan metadata, lanjutkan ke Langkah 5 untuk memanggil metode
schema.patch
.Jika Anda memperbarui anotasi kolom (menetapkan kolom sebagai dapat diindeks, dapat diambil, tabel wajah dinamis, atau dapat ditelusuri), tinjau Mengonfigurasi setelan kolom untuk mengetahui batasan dan persyaratan setiap jenis anotasi.
Jika Anda mengedit skema yang terdeteksi otomatis, pastikan Anda telah menyelesaikan penyerapan data. Jika tidak, skema mungkin belum tersedia untuk diedit.
Temukan ID penyimpanan data Anda. Jika Anda sudah memiliki ID penyimpanan data, lanjutkan ke langkah berikutnya.
Di konsol Google Cloud, buka halaman Agent Builder dan di menu navigasi, klik Data Stores.
Klik nama penyimpanan data Anda.
Di halaman Data untuk penyimpanan data Anda, dapatkan ID penyimpanan data.
Gunakan metode API schemas.patch untuk memberikan skema JSON baru sebagai objek JSON.
curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/schemas/default_schema" \ -d '{ "structSchema": JSON_SCHEMA_OBJECT }'
Ganti kode berikut:
PROJECT_ID
: ID project Google Cloud Anda.DATA_STORE_ID
: ID penyimpanan data Vertex AI Search.JSON_SCHEMA_OBJECT
: skema JSON baru Anda sebagai objek JSON. Contoh:{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string", "keyPropertyMapping": "title" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } }, "uri": { "type": "string", "keyPropertyMapping": "uri" } } }
Opsional: Tinjau skema dengan mengikuti prosedur Melihat definisi skema.
C#
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API C# Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Go
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Go Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Java Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Python Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Ruby
Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Ruby Vertex AI Agent Builder.
Untuk melakukan autentikasi ke Vertex AI Agent Builder, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Persyaratan dan batasan
Saat memperbarui skema, pastikan skema baru kompatibel dengan skema yang Anda perbarui. Untuk memperbarui skema dengan skema baru yang tidak kompatibel dengan versi sebelumnya, Anda harus menghapus semua dokumen di penyimpanan data, menghapus skema, dan membuat skema baru.
Memperbarui skema akan memicu pengindeksan ulang semua dokumen. Hal ini dapat memerlukan waktu dan mengalami biaya tambahan:
Waktu. Membuat kembali indeks penyimpanan data yang besar dapat memerlukan waktu berjam-jam atau berhari-hari.
Pengeluaran. Pengindeksan ulang dapat menimbulkan biaya, bergantung pada parser. Misalnya, pengindeksan ulang penyimpanan data yang menggunakan parser OCR atau parser tata letak akan menimbulkan biaya. Untuk informasi selengkapnya, lihat Harga fitur Document AI.
Pembaruan skema tidak mendukung hal berikut:
- Mengubah jenis kolom. Update skema tidak mendukung perubahan jenis kolom. Misalnya, kolom yang dipetakan ke bilangan bulat tidak dapat diubah menjadi string.
- Menghapus kolom. Setelah ditentukan, kolom tidak dapat dihapus. Anda dapat terus menambahkan kolom baru, tetapi tidak dapat menghapus kolom yang ada.
Contoh batasan (khusus REST)
Bagian ini menunjukkan contoh jenis pembaruan skema yang valid dan tidak valid. Contoh ini menggunakan contoh skema JSON berikut:
{
"$schema": "https://json-schema.org/draft/2020-12/schema",
"type": "object",
"properties": {
"title": {
"type": "string"
},
"description": {
"type": "string",
"keyPropertyMapping": "description"
},
"categories": {
"type": "array",
"items": {
"type": "string",
"keyPropertyMapping": "category"
}
}
}
}
Contoh update yang didukung
Pembaruan berikut pada skema contoh didukung.
Menambahkan kolom. Dalam contoh ini, kolom
properties.uri
telah ditambahkan ke skema.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string" }, "description": { "type": "string", "keyPropertyMapping": "description" }, "uri": { // Added field. This is supported. "type": "string", "keyPropertyMapping": "uri" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Menambahkan atau menghapus anotasi properti utama untuk
title
,description
, atauuri
. Dalam contoh ini,keyPropertyMapping
telah ditambahkan ke kolomtitle
.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string", "keyPropertyMapping": "title" // Added "keyPropertyMapping". This is supported. }, "description": { "type": "string", "keyPropertyMapping": "description" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Contoh pembaruan skema yang tidak valid
Pembaruan berikut pada contoh skema tidak didukung.
Mengubah jenis kolom. Dalam contoh ini, jenis kolom
title
telah diubah dari string menjadi angka. Tindakan ini tidak didukung.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "number" // Changed from string. Not allowed. }, "description": { "type": "string", "keyPropertyMapping": "description" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Menghapus kolom. Dalam contoh ini, kolom
title
telah dihapus. Tindakan ini tidak didukung.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { // "title" is removed. Not allowed. "description": { "type": "string", "keyPropertyMapping": "description" }, "uri": { "type": "string", "keyPropertyMapping": "uri" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Langkah selanjutnya
- Melihat definisi skema untuk data terstruktur
- Menghapus skema untuk data terstruktur
- Melihat pratinjau hasil penelusuran