Halaman ini menjelaskan pengelolaan endpoint model. Pengelolaan endpoint model memungkinkan Anda bereksperimen dengan mendaftarkan endpoint model AI dan memanggil prediksi. Untuk menggunakan model AI di lingkungan produksi, lihat Mem-build aplikasi AI generatif menggunakan Cloud SQL dan Memanggil prediksi online dari instance Cloud SQL.
Setelah endpoint model ditambahkan dan terdaftar di pengelolaan endpoint model, Anda dapat mereferensikannya menggunakan ID model untuk memanggil prediksi.
Sebelum memulai
Pastikan Anda menyelesaikan tindakan berikut:
- Daftarkan endpoint model Anda dengan pengelolaan endpoint model. Untuk mengetahui informasi selengkapnya, lihat Mendaftarkan dan memanggil model AI jarak jauh menggunakan pengelolaan endpoint model.
- Buat atau perbarui instance Cloud SQL Anda agar dapat terintegrasi dengan Vertex AI. Untuk mengetahui informasi selengkapnya, lihat Mengaktifkan integrasi database dengan Vertex AI.
Memanggil prediksi untuk model generik
Gunakan fungsi SQL google_ml.predict_row()
untuk memanggil endpoint model generik terdaftar guna memanggil
prediksi. Anda dapat menggunakan fungsi google_ml.predict_row()
dengan jenis model apa pun.
SELECT
google_ml.predict_row(
model_id => 'MODEL_ID',
request_body => 'REQUEST_BODY');
Ganti kode berikut:
MODEL_ID
: ID model yang Anda tentukan saat mendaftarkan endpoint modelREQUEST_BODY
: parameter ke fungsi prediksi, dalam format JSON
Contoh
Untuk membuat prediksi untuk endpoint model gemini-pro
terdaftar, jalankan pernyataan berikut:
SELECT
json_array_elements(
google_ml.predict_row(
model_id => 'gemini-pro',
request_body => '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
}
]
}
]
}'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';