AlloyDB AI는 PostgreSQL용 AlloyDB 및 AlloyDB Omni에 포함된 기능 모음으로, 머신러닝 (ML) 모델의 시맨틱 및 예측 기능을 데이터에 적용할 수 있습니다. 이 페이지에서는 AlloyDB를 통해 사용할 수 있는 ML 기반 AI 함수에 대해 간략히 설명합니다.
벡터 저장, 색인 생성, 쿼리
기본 pgvector
PostgreSQL 확장 프로그램 확장 프로그램은 AlloyDB용으로 맞춤설정되며 vector
라고 합니다.
생성된 임베딩을 벡터 열에 저장하는 것을 지원합니다. 또한 이 확장 프로그램은 IVF
색인을 만들기 위한 스칼라 양자화 기능에 관한 지원을 추가합니다. 또한 기본 pgvector
에서 사용할 수 있는 IVFFlat
색인 또는 HSNW
색인을 만들 수 있습니다.
벡터 저장에 관한 자세한 내용은 벡터 저장을 참고하세요.
맞춤설정된 vector
확장 프로그램 외에도 AlloyDB에는 ScaNN 알고리즘을 기반으로 하는 매우 효율적인 최근접 이웃 색인을 구현하는 alloydb_scann
확장 프로그램이 포함되어 있습니다.
색인 생성 및 벡터 쿼리에 관한 자세한 내용은 색인 생성 및 벡터 쿼리를 참고하세요.
벡터 쿼리 성능 조정
쿼리로 초당 쿼리 수 (QPS)와 검색 결과 사이의 균형을 맞추도록 색인을 조정할 수 있습니다. 색인 조정에 관한 자세한 내용은 벡터 쿼리 성능 조정을 참고하세요.
임베딩 및 텍스트 예측 생성
AlloyDB AI는 google_ml_integration
확장 프로그램을 사용하여 모델을 쿼리하는 두 가지 함수를 사용하여 PostgreSQL 구문을 확장합니다.
트랜잭션 내에서 SQL을 사용하여 모델을 호출하려면 예측을 호출합니다.
LLM이 텍스트 프롬프트를 숫자 벡터로 변환하도록 임베딩을 생성합니다.
embedding()
함수를 사용하여 Vertex AI 모델을 쿼리할 수 있고google_ml.embedding()
함수를 사용하여 등록된 Vertex AI, 호스팅된 모델, 서드 파티 모델을 쿼리할 수 있습니다.그런 다음 이러한 벡터 임베딩을
pgvector
함수의 입력으로 적용할 수 있습니다. 여기에는 상대적 시맨틱 거리에 따라 텍스트 샘플을 비교하고 정렬하는 메서드가 포함됩니다.
Vertex AI를 사용하여 클라우드에서 모델 사용
Vertex AI와 호환되도록 AlloyDB를 구성할 수 있습니다.
이렇게 하면 애플리케이션에 다음과 같은 이점이 있습니다.
애플리케이션은 액세스할 수 있는 Vertex AI Model Garden에 저장된 모든 모델을 사용하여 예측을 호출할 수 있습니다.
애플리케이션은
text-embedding-005
영어 모델 LLM을 사용하여 임베딩을 생성할 수 있습니다.