벡터 임베딩 저장

이 페이지에서는 pgvector 함수와 연산자가 포함된 vector 확장자를 사용하여 AlloyDB를 벡터 데이터베이스로 사용하는 방법을 보여줍니다. 이러한 함수와 연산자를 사용하면 임베딩을 벡터 값으로 저장할 수 있습니다.

필수 데이터베이스 확장 프로그램

pgvector 함수와 연산자가 포함된 vector 확장 프로그램 버전 0.5.0.google-1 이상을 사용하여 생성된 임베딩을 vector 값으로 저장합니다. 이는 Google에서 AlloyDB용 최적화를 통해 확장한 pgvector 버전입니다.

CREATE EXTENSION IF NOT EXISTS vector;

생성된 임베딩 저장

AlloyDB 데이터베이스에 이미 테이블을 만들었는지 확인합니다.

벡터 임베딩을 저장하려면 다음 단계를 따르세요.

  1. 테이블에 vector[] 열을 만들어 임베딩을 저장합니다.

    ALTER TABLE TABLE ADD COLUMN EMBEDDING_COLUMN vector(DIMENSIONS);
    

    다음을 바꿉니다.

    • TABLE: 테이블 이름

    • EMBEDDING_COLUMN: 새 임베딩 열의 이름

    • DIMENSIONS: 모델에서 지원하는 차원 수

      예를 들어 Vertex AI에서 textembedding-gecko 영어 모델 중 하나(예: textembedding-gecko@003)를 사용하는 경우 768을 지정합니다.

  2. 벡터를 벡터 열에 복사합니다. 다음 예에서는 임베딩을 CSV 파일에서 사용할 수 있다고 가정합니다.

    COPY TABLE (EMBEDDING_COLUMN) FROM 'PATH_TO_VECTOR_CSV (FORMAT CSV);
    

    다음을 바꿉니다.

    • PATH_TO_VECTOR_CSV: CSV 파일을 저장한 위치의 전체 경로입니다.

임베딩을 저장한 후 vector 확장 프로그램 또는 alloydb_scann 확장 프로그램을 사용하여 더 빠른 쿼리 성능을 위한 색인을 만들 수 있습니다.

다음 단계