Die google_ml_integration
-Erweiterung enthält Einbettungsfunktionen in zwei verschiedenen Namespaces: public
und google_ml
. Auf dieser Seite wird beschrieben, wie Sie Texteinbettungen mit Funktionen aus diesen Namespaces generieren.
Die Funktion embedding()
im Schema public
kann mit jedem Vertex AI-Einbettungsmodell verwendet werden, ohne den Endpunkt zu registrieren. Wenn Sie benutzerdefinierte Informationen wie den Aufgabentyp übergeben möchten, registrieren Sie den Endpunkt und verwenden Sie dann die Funktion google_ml.embedding()
im google_ml
-Schema. Weitere Informationen zum Registrieren eines Endpunkts finden Sie unter Modell registrieren.
Funktionsweise von Einbettungen
Angenommen, Sie haben eine Datenbank, die in AlloyDB ausgeführt wird und die folgenden Merkmale aufweist:
Die Datenbank enthält eine Tabelle,
items
. Jede Zeile in dieser Tabelle beschreibt einen Artikel, den Ihr Unternehmen verkauft.Die Tabelle
items
enthält die Spaltecomplaints
. In dieserTEXT
-Spalte werden Käuferbeschwerden gespeichert, die zu den einzelnen Artikeln protokolliert werden.Die Datenbank kann in den Vertex AI Model Garden eingebunden werden und ermöglicht so Zugriff auf die
gemini-embedding-001
-Modelle.
In dieser Datenbank werden zwar Beschwerden über Artikel gespeichert, diese Beschwerden werden jedoch als Nur-Text gespeichert, was die Abfrage erschwert. Wenn Sie beispielsweise sehen möchten, welche Artikel die meisten Beschwerden von Kunden haben, die eine falsche Farbversion erhalten haben, können Sie normale SQL-Abfragen auf der Tabelle ausführen und nach verschiedenen Schlüsselwortübereinstimmungen suchen. Bei diesem Ansatz werden jedoch nur Zeilen berücksichtigt, die genau diese Keywords enthalten.
Eine einfache SQL-Abfrage wie SELECT * FROM item WHERE complaints LIKE
"%wrong color%"
gibt beispielsweise keine Zeile zurück, in der das Feld complaints
nur
The picture shows a blue one, but the one I received was red
enthält.
SQL-Abfragen mit LLM-basierten Einbettungen können dabei helfen, semantisch ähnliche Antworten auf solche Anfragen zurückzugeben. Wenn Sie Einbettungen anwenden, können Sie die Tabelle in diesem Beispiel nach Elementen abfragen, in denen Beschwerden eine semantische Ähnlichkeit mit einem bestimmten Text-Prompt haben, beispielsweise It was the
wrong color
.
Wählen Sie eines der folgenden Schemas aus, um Einbettungen zu generieren.
Nächste Schritte
- Suchen nach Vektorähnlichkeiten durchführen
- Smart Shopping Assistant mit AlloyDB, pgvector und der Verwaltung von Modellendpunkten erstellen
- Indizes erstellen und Vektoren abfragen
- Beispiel für einen Einbettungsworkflow