Auf dieser Seite wird die Verwaltung von Modellendpunkten beschrieben. Mit der Verwaltung von Modellendpunkten können Sie das Registrieren eines KI-Modellendpunkts und das Aufrufen von Vorhersagen testen. Informationen zur Verwendung von KI-Modellen in Produktionsumgebungen finden Sie unter Generative KI-Anwendungen mit Cloud SQL erstellen und Onlinevorhersagen aus Cloud SQL-Instanzen aufrufen.
Nachdem die Modellendpunkte hinzugefügt und in der Modellendpunktverwaltung registriert wurden, können Sie mit der Modell-ID auf sie verweisen, um Vorhersagen aufzurufen.
Hinweise
Führen Sie die folgenden Aktionen aus:
- Registrieren Sie Ihren Modellendpunkt bei der Modellendpunktverwaltung. Weitere Informationen finden Sie unter Remote-KI-Modelle mit der Modellendpunktverwaltung registrieren und aufrufen.
- Erstellen oder aktualisieren Sie Ihre Cloud SQL-Instanz, damit die Instanz in Vertex AI eingebunden werden kann. Weitere Informationen finden Sie unter Datenbankeinbindung mit Vertex AI aktivieren.
Vorhersagen für generische Modelle aufrufen
Verwenden Sie die SQL-Funktion google_ml.predict_row()
, um einen registrierten generischen Modellendpunkt aufzurufen und Vorhersagen zu generieren. Sie können die Funktion google_ml.predict_row()
mit jedem Modelltyp verwenden.
SELECT
google_ml.predict_row(
model_id => 'MODEL_ID',
request_body => 'REQUEST_BODY');
Ersetzen Sie Folgendes:
MODEL_ID
: die Modell-ID, die Sie beim Registrieren des Modellendpunkts definiert habenREQUEST_BODY
: Die Parameter für die Vorhersagefunktion im JSON-Format
Beispiele
Führen Sie die folgende Anweisung aus, um Vorhersagen für einen registrierten gemini-pro
-Modellendpunkt zu generieren:
SELECT
json_array_elements(
google_ml.predict_row(
model_id => 'gemini-pro',
request_body => '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "For TPCH database schema as mentioned here https://www.tpc.org/TPC_Documents_Current_Versions/pdf/TPC-H_v3.0.1.pdf , generate a SQL query to find all supplier names which are located in the India nation."
}
]
}
]
}'))-> 'candidates' -> 0 -> 'content' -> 'parts' -> 0 -> 'text';