Remote-KI-Modelle in Cloud SQL registrieren und aufrufen

Auf dieser Seite wird beschrieben, wie Sie einen KI-Modellendpunkt registrieren und Vorhersagen mit der Modellendpunktverwaltung in Cloud SQL aufrufen. Informationen zur Verwendung von KI-Modellen in Produktionsumgebungen finden Sie unter Generative AI-Anwendungen mit Cloud SQL erstellen und Mit Vektoreinbettungen arbeiten.

Übersicht

Mit der Verwaltung von Modellendpunkten können Sie einen Modellendpunkt registrieren, Metadaten von Modellendpunkten in Ihrer Cloud SQL-Instanz verwalten und dann mit den Modellen über SQL-Abfragen interagieren. Cloud SQL bietet die Erweiterung google_ml_integration, die Funktionen zum Hinzufügen und Registrieren der Metadaten des Modellendpunkts für die Modelle enthält. Sie können diese Modelle verwenden, um Vektoreinbettungen zu generieren oder Vorhersagen aufzurufen.

Sie können die folgenden Modelltypen mit der Modellendpunktverwaltung registrieren:

  • Vertex AI-Modelle zur Texteinbettung.
  • Benutzerdefinierte Texteinbettungsmodelle, die in Netzwerken innerhalb von Google Cloudgehostet werden.
  • Generische Modelle mit einer JSON-basierten API. Beispiele für diese Modelle:
    • Das Modell gemini-pro aus dem Vertex AI Model Garden
    • Das open_ai-Modell für OpenAI-Modelle
    • Modelle, die in Netzwerken innerhalb von Google Cloudgehostet werden

Funktionsweise

Mit der Verwaltung von Modellendpunkten können Sie einen Modellendpunkt registrieren, der den folgenden Anforderungen entspricht:

  • Die Modell-Ein- und -Ausgabe unterstützen das JSON-Format.
  • Sie können das REST-Protokoll verwenden, um das Modell aufzurufen.

Wenn Sie einen Modellendpunkt bei der Modellendpunktverwaltung registrieren, registriert die Modellendpunktverwaltung jeden Endpunkt mit einer eindeutigen Modell-ID als Referenz zum Modell. Sie können diese Modell-ID verwenden, um Modelle abzufragen:

  • Einbettungen generieren, um Text-Prompts in numerische Vektoren zu übersetzen. Sie können generierte Einbettungen als Vektordaten speichern, wenn die pgvector-Erweiterung in der Datenbank aktiviert ist. Weitere Informationen finden Sie unter Einbettungen mit pgvector abfragen und indexieren.

  • Rufen Sie Vorhersagen auf, um ein Modell mithilfe von SQL innerhalb einer Transaktion aufzurufen.

Ihre Anwendungen können ihre Modellendpunkte mit der Erweiterung google_ml_integration verwalten. Diese Erweiterung bietet die folgenden SQL-Funktionen:

  • google_ml.create_model(): Registriert den Modellendpunkt, der in der Vorhersage- oder Einbettungsfunktion verwendet wird.
  • google_ml.create_sm_secret(): verwendet Secrets in Google CloudSecret Manager, wo die API-Schlüssel gespeichert sind
  • google_ml.embedding(): Generiert Texteinbettungen
  • google_ml.predict_row(): Generiert Vorhersagen, wenn Sie generische Modelle aufrufen, die die JSON-Eingabe- und ‑Ausgabeformate unterstützen.

Wichtige Konzepte

Bevor Sie mit der Verwaltung von Modellendpunkten beginnen, sollten Sie sich mit den Konzepten vertraut machen, die für die Verbindung zu den Modellen und deren Verwendung erforderlich sind.

Modellanbieter

Modellanbieter sind die unterstützten Anbieter von Modell-Hosting. In der folgenden Tabelle sehen Sie den Wert für den Modellanbieter, den Sie basierend auf dem von Ihnen verwendeten Modellanbieter festlegen müssen:

Modellanbieter In Funktion festgelegt als…
Vertex AI (einschließlich Gemini) google
OpenAI open_ai
Andere Modelle, die außerhalb von Vertex AI gehostet werden custom

Der Standardanbieter für Modelle ist custom.

Modelltypen

Modelltypen sind die Typen des KI-Modells. Wenn Sie einen Modellendpunkt registrieren, können Sie die Modelltypen text-embedding oder generic für den Endpunkt festlegen.

Texteinbettungsmodelle mit integrierter Unterstützung
Die Verwaltung von Modellendpunkten bietet integrierte Unterstützung für alle Versionen des textembedding-gecko-Modells. Verwenden Sie die Funktion google_ml.create_model(), um diese Modellendpunkte zu registrieren. Cloud SQL richtet automatisch Standardtransformationsfunktionen für diese Modelle ein.
Der Modelltyp für diese Modelle ist text-embedding.
Andere Modelle zur Texteinbettung
Für andere Modelle für Texteinbettungen müssen Sie Transformationsfunktionen erstellen, um die vom Modell unterstützten Eingabe- und Ausgabeformate zu verarbeiten. Optional können Sie die Funktion zur Generierung von HTTP-Headern verwenden, mit der benutzerdefinierte Header generiert werden, die für Ihr Modell erforderlich sind.
Der Modelltyp für diese Modelle ist text-embedding.
Generische Modelle
Die Verwaltung von Modellendpunkten unterstützt auch die Registrierung aller anderen Modelltypen außer Modelle für Texteinbettungen. Verwenden Sie die Funktion google_ml.predict_row(), um Vorhersagen für generische Modelle aufzurufen. Sie können Metadaten für Modellendpunkte festlegen, z. B. einen Anfrageendpunkt und HTTP-Header, die für Ihr Modell spezifisch sind.
 Sie können keine Transformationsfunktionen übergeben, wenn Sie einen generischen Modellendpunkt registrieren. Achten Sie darauf, dass die Eingabe für die Funktion im JSON-Format vorliegt, wenn Sie Vorhersagen aufrufen, und dass Sie die JSON-Ausgabe parsen, um die endgültige Ausgabe zu erhalten.
Der Modelltyp für diese Modelle ist generic. Da generic der Standardmodelltyp ist, ist die Festlegung des Modelltyps optional, wenn Sie Modellendpunkte für diesen Typ registrieren.

Authentifizierungsmethoden

Mit der google_ml_integration-Erweiterung können Sie verschiedene Authentifizierungsmethoden für den Zugriff auf Ihr Modell angeben. Das Festlegen dieser Methoden ist optional und nur erforderlich, wenn Sie sich authentifizieren müssen, um auf Ihr Modell zuzugreifen.

Bei Vertex AI-Modellen wird das Cloud SQL-Dienstkonto für die Authentifizierung verwendet. Bei anderen Modellen kann der API-Schlüssel oder das Bearer-Token, das als Secret im Secret Manager gespeichert ist, mit der SQL-Funktion google_ml.create_sm_secret() verwendet werden.

In der folgenden Tabelle sind die Authentifizierungsmethoden aufgeführt, die Sie festlegen können:

Authentifizierungsmethode In Funktion festgelegt als… Modellanbieter
Cloud SQL-Dienst-Agent cloudsql_service_agent_iam Vertex AI-Anbieter
Secret Manager secret_manager Modelle, die außerhalb von Vertex AI gehostet werden

Vorhersagefunktionen

Die google_ml_integration-Erweiterung enthält die folgenden Vorhersagefunktionen:

google_ml.embedding()
Ruft einen registrierten Endpunkt für das Texteinbettungsmodell auf, um Einbettungen zu generieren. Es bietet integrierte Unterstützung für das Modell textembedding-gecko von Vertex AI.
Bei Modelleinbettungsmodellen ohne integrierte Unterstützung sind die Ein- und Ausgabeparameter für ein Modell eindeutig und müssen für die Funktion transformiert werden, damit das Modell aufgerufen werden kann. Erstellen Sie eine Funktion zum Transformieren der Eingabe, um die Eingabe der Vorhersagefunktion in die modellspezifische Eingabe zu transformieren, und eine Funktion zum Transformieren der Ausgabe, um die modellspezifische Ausgabe in die Ausgabe der Vorhersagefunktion zu transformieren.
google_ml.predict_row()
Ruft einen registrierten generischen Modellendpunkt auf, wenn der Endpunkt JSON-basierte APIs zum Aufrufen von Vorhersagen unterstützt.

Transformationsfunktionen

Transformationsfunktionen ändern die Eingabe in ein Format, das das Modell versteht, und wandeln die Modellantwort in das Format um, das die Vorhersagefunktion erwartet. Die Transformationsfunktionen werden verwendet, wenn der text-embedding-Modellendpunkt ohne integrierte Unterstützung registriert wird. Die Signatur der Transformationsfunktionen hängt von der Vorhersagefunktion für den Modelltyp ab.

Sie können keine Transformationsfunktionen verwenden, wenn Sie einen generic-Modellendpunkt registrieren.

Nachfolgend sehen Sie die Signaturen für die Vorhersagefunktion für Modelle für Texteinbettungen:

// define custom model specific input/output transform functions.
CREATE OR REPLACE FUNCTION input_transform_function(model_id VARCHAR(100), input_text TEXT) RETURNS JSON;

CREATE OR REPLACE FUNCTION output_transform_function(model_id VARCHAR(100), response_json JSON) RETURNS real[];

Weitere Informationen zum Erstellen von Transformationsfunktionen finden Sie unter Beispiel für Transformationsfunktionen.

Funktion zum Generieren von HTTP-Headern

Die Funktion zum Generieren von HTTP-Headern generiert die Ausgabe in JSON-Schlüssel/Wert-Paaren, die als HTTP-Header verwendet werden. Die Signatur der Vorhersagefunktion definiert die Signaturen der Header-Generierungsfunktion.

Das folgende Beispiel zeigt die Signatur für die Vorhersagefunktion google_ml.embedding():

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input TEXT) RETURNS JSON;

Für die Vorhersagefunktion google_ml.predict_row() lautet die Signatur so:

CREATE OR REPLACE FUNCTION generate_headers(model_id VARCHAR(100), input JSON) RETURNS JSON;

Weitere Informationen zum Erstellen einer Funktion zum Generieren von Headern finden Sie unter Beispiel für eine Funktion zum Generieren von Headern.

Beschränkungen

  • Wenn Sie KI-Modelle mit Ihrer Cloud SQL-Instanz verwenden möchten, muss die Wartungsversion Ihrer Instanz R20240910.01_02 oder höher sein. Informationen zum Upgrade Ihrer Instanz auf diese Version finden Sie unter Selfservice-Wartung durchführen.

Nächste Schritte