產生及管理向量嵌入

本頁說明如何產生及儲存向量嵌入項目。如需總覽,請參閱「向量嵌入儲存空間」。

事前準備

您必須擁有已啟用向量資料庫旗標的 Cloud SQL 執行個體。

根據資料列資料生成向量嵌入

您可以使用文字嵌入 API (例如 Vertex AIOpenAI),為指定資料列的資料產生向量嵌入。您可以搭配 Cloud SQL 向量嵌入功能使用任何文字嵌入 API。不過,您必須使用相同的文字嵌入 API,產生查詢字串向量。您無法合併使用不同的 API 來處理來源資料和查詢向量化。

舉例來說,您可以透過 Vertex AI 生成向量嵌入

from vertexai.language_models import TextEmbeddingModel

def text_embedding() -> list:
    """Text embedding with a Large Language Model."""
    model = TextEmbeddingModel.from_pretrained("text-embedding-004")
    embeddings = model.get_embeddings(["What is life?"])
    for embedding in embeddings:
        vector = embedding.values
        print(f"Length of Embedding Vector: {len(vector)}")
    return vector

if __name__ == "__main__":
    text_embedding()

儲存向量嵌入

本節提供將向量嵌入儲存在 Cloud SQL 中的範例陳述式。

建立含有向量嵌入資料欄的新資料表

搭配使用 CREATE TABLE 陳述式和使用 VECTOR 資料類型的資料欄。

請使用下列語法建立資料表:

CREATE TABLE TABLE_NAME(
  id INTEGER
  PRIMARY KEY
    AUTO_INCREMENT,
    title VARCHAR(60),
    EMBEDDING_COLUMN_NAME
      VECTOR(VECTOR_DIMENSIONS)
  USING VARBINARY);

替換下列參數:

  • TABLE_NAME:要儲存嵌入內容的資料表名稱。
  • EMBEDDING_COLUMN_NAME:儲存嵌入內容的資料欄名稱。
  • VECTOR_DIMENSIONS:用於嵌入的維度數量。

在下列範例中,嵌入資料欄含有三維向量。這個資料欄中儲存的資料具有 VARBINARY 資料類型。

CREATE TABLE books(
  id INTEGER PRIMARY KEY AUTO_INCREMENT, title VARCHAR(60), embedding VECTOR(3) USING VARBINARY);

在現有資料表中新增向量嵌入欄

如要將向量嵌入資料欄新增至現有資料表,請使用 ALTER TABLE 陳述式。資料欄必須使用 VECTOR 資料類型來保存嵌入內容。

在下列範例中,系統會將具有三維向量的嵌入資料欄插入資料表。這個資料欄中儲存的資料具有 VARBINARY 資料類型。

ALTER TABLE books
ADD COLUMN embedding
  VECTOR(3)
USING VARBINARY;

插入向量嵌入

搭配 string_to_vector 函式使用 INSERT,即可將向量嵌入值插入表格。

在下列範例中,系統會將三維向量插入嵌入資料欄。

INSERT INTO books
  (
    title,
    embedding)
VALUES (('book title', string_to_vector('[1,2,3]')));

插入多個向量嵌入

使用 INSERTstring_to_vector 函式,插入以半形逗號分隔的向量嵌入清單。

在下列陳述式中,兩個嵌入內容各包含一個三維向量,並插入嵌入內容資料欄。

INSERT INTO books
  (
    title,
    embedding)
VALUES
  (
    (
      'book title',
      string_to_vector('[1,2,3]')),
    ('book title', string_to_vector('[4,5,6]')));

插入或更新向量嵌入

在資料表上使用 INSERTUPDATE 運算搭配 string_to_vector 函式,按照下列語法新增向量嵌入資料欄。

在下列陳述式中,系統會使用 upsert 插入或更新嵌入欄,並在其中加入含有三維向量的嵌入。

INSERT INTO books
  (
    id,
    title,
    embedding)
VALUES
  (
    (
      1,
      'book title',
      string_to_vector('[1,2,3]')))
ON DUPLICATE KEY UPDATE embedding = string_to_vector('[1,2,3]');

更新向量嵌入

使用 UPDATE 搭配 string_to_vector 函式更新向量嵌入。

在下列陳述式中,UPDATE 用於更新嵌入資料欄,並提供三維向量。

UPDATE books
SET embedding = string_to_vector('[7,8,9]')
WHERE id = 1;

擷取向量嵌入

如要擷取向量嵌入,請使用 Cloud SQL vector_to_string 函式和嵌入名稱。

在下列陳述式中,系統會擷取嵌入資料欄以供檢視。

SELECT vector_to_string(embedding) FROM books WHERE id = 1;

刪除向量嵌入

使用 DELETEstring_to_vector 函式,從資料表移除向量嵌入項目。如有向量索引,請務必先刪除。詳情請參閱「捨棄向量索引」。

在下列陳述式中,DELETE 用於刪除 embedding 資料欄中的值。

DELETE FROM books
WHERE embedding = string_to_vector('[1,2,3]');

後續步驟