本页介绍了一种预览版功能,可让您通过模型端点管理功能试用注册 AI 模型端点和调用预测功能。如需了解如何在生产环境中使用 AI 模型,请参阅使用 AlloyDB AI 构建生成式 AI 应用。
在“模型端点管理”中添加并注册模型端点后,您可以使用模型 ID 引用这些端点来调用预测。
准备工作
确保您已在“模型端点管理”中注册模型端点。如需了解详情,请参阅使用模型端点管理服务注册模型端点
调用通用模型的预测
使用 google_ml.predict_row()
SQL 函数调用已注册的通用模型端点以调用预测。您可以将 google_ml.predict_row()
函数与任何模型类型搭配使用。
SELECT
google_ml.predict_row(
model_id => 'MODEL_ID',
request_body => 'REQUEST_BODY');
替换以下内容:
MODEL_ID
:您在注册模型端点时定义的模型 ID。REQUEST_BODY
:预测函数的参数,采用 JSON 格式。
示例
本部分列出了使用已注册的模型端点调用预测的一些示例。
如需为已注册的 gemini-pro
模型端点生成预测,请运行以下语句:
SELECT
json_array_elements(
google_ml.predict_row(
model_id => 'gemini-pro',
request_body => '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
}
]
}
]
}'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';
如需为 Hugging Face 上已注册的 facebook/bart-large-mnli
模型端点生成预测,请运行以下语句:
SELECT
google_ml.predict_row(
model_id => 'facebook/bart-large-mnli',
request_body =>
'{
"inputs": "Hi, I recently bought a device from your company but it is not working as advertised and I would like to get reimbursed!",
"parameters": {"candidate_labels": ["refund", "legal", "faq"]}
}'
);