Auf dieser Seite wird die Verwaltung von Modellendpunkten beschrieben. Mit der Modellendpunktverwaltung können Sie experimentieren, indem Sie einen Endpunkt für ein KI-Modell registrieren und Vorhersagen aufrufen. Informationen zur Verwendung von KI-Modellen in Produktionsumgebungen finden Sie unter Generative KI-Anwendungen mit Cloud SQL erstellen und Onlinevorhersagen aus Cloud SQL-Instanzen aufrufen.
Nachdem die Modellendpunkte hinzugefügt und in der Modellendpunktverwaltung registriert wurden, können Sie sie mithilfe der Modell-ID referenzieren, um Vorhersagen aufzurufen.
Hinweise
Führen Sie die folgenden Aktionen aus:
- Registrieren Sie Ihren Modellendpunkt bei der Modellendpunktverwaltung. Weitere Informationen finden Sie unter Remote-KI-Modelle mit der Modellendpunktverwaltung registrieren und aufrufen.
- Erstellen oder aktualisieren Sie Ihre Cloud SQL-Instanz, damit sie in Vertex AI eingebunden werden kann. Weitere Informationen finden Sie unter Datenbankeinbindung mit Vertex AI aktivieren.
Vorhersagen für generische Modelle aufrufen
Verwenden Sie die SQL-Funktion google_ml.predict_row()
, um einen registrierten generischen Modellendpunkt aufzurufen und Vorhersagen zu erhalten. Sie können die Funktion google_ml.predict_row()
mit jedem Modelltyp verwenden.
SELECT
google_ml.predict_row(
model_id => 'MODEL_ID',
request_body => 'REQUEST_BODY');
Ersetzen Sie Folgendes:
MODEL_ID
: die Modell-ID, die Sie beim Registrieren des Modellendpunkts festgelegt habenREQUEST_BODY
: die Parameter für die Vorhersagefunktion im JSON-Format
Beispiele
Um Vorhersagen für einen registrierten gemini-pro
-Modellendpunkt zu generieren, führen Sie die folgende Anweisung aus:
SELECT
json_array_elements(
google_ml.predict_row(
model_id => 'gemini-pro',
request_body => '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
}
]
}
]
}'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';