시작하기 전에

벡터 검색을 사용하기 전에 임베딩을 선택하고 데이터를 준비하며 사용할 엔드포인트 유형을 결정해야 합니다. 이 페이지에서는 이러한 작업에 관한 몇 가지 정보를 제공합니다.

임베딩 준비

벡터 검색을 사용하려면 임베딩이 있어야 합니다. 이미 임베딩이 있으면 엔드포인트 선택으로 건너뜁니다.

임베딩을 만들려면 다음을 수행합니다.

임베딩 모델 선택: 서로 다른 기능을 제공하는 사용 가능한 외부 임베딩이 많이 있습니다.

벡터 검색은 밀집 임베딩을 지원합니다. 벡터 검색은 공개 미리보기 기능으로 희소 임베딩과 하이브리드 검색을 지원합니다. 하이브리드 검색은 임베딩 유형에 지정한 가중치에 따라 밀집 및 희소 엠비딩을 사용합니다.

사용 사례에 따라 다음 모델 유형 중 하나를 선택합니다.
- 즉시 사용 가능: 텍스트 또는 이미지만의 관련성에 따라 텍스트 대 텍스트 또는 이미지와 텍스트를 의미상 일치시키려는 경우. 이는 표준 사용 사례이므로 모델을 학습시키거나 조정할 필요가 없습니다 이 사용 사례에 권장되는 옵션은 Vertex AI의 생성형 AI입니다. Vertex AI의 생성형 AI는 밀집 임베딩 모델을 지원합니다.
- 임베딩을 위한 커스텀 모델: 자체 데이터나 특정 사용 사례를 기반으로 일치시키려는 경우
데이터 준비: 데이터가 임베딩 모델에서 사용할 수 있는 형식인지 확인하기 위해 데이터를 정리하고 사전 처리합니다.
커스텀 모델을 사용하는 경우 임베딩 모델 학습: 커스텀 임베딩 모델(조정)을 사용하도록 선택한 경우 데이터로 학습시켜야 합니다. 데이터 크기와 복잡성에 따라 이를 처리하는 데 시간이 오래 걸릴 수 있습니다. Model Garden에서 선행 학습된 모델을 사용하는 경우 이 단계를 건너뛸 수 있습니다.
임베딩 생성: 모델이 학습된 후 데이터의 임베딩을 생성하는 데 사용합니다.

엔드포인트 선택

색인을 만든 후에는 엔드포인트에 배포합니다. 자세한 내용은 공개 색인 엔드포인트 배포 및 관리와 VPC 네트워크에서 색인 엔드포인트 배포 및 관리를 참조하세요. 색인을 만들기 전에 필요한 엔드포인트 종류를 결정하는 데 도움이 됩니다.

쿼리 색인을 다음 중 하나에 배포할 수 있습니다.

공개 엔드포인트: 공개 엔드포인트에 배포하는 경우에는 네트워크를 설정할 필요가 없습니다. 공용 네트워크에서는 지연 시간이 약간 길지만 더 빠르고 설정하고 쉽게 유지보수할 수 있습니다.
비공개 엔드포인트: VPC를 사용하려면 먼저 네트워킹을 설정해야 합니다. 벡터 검색은 두 가지 유형의 비공개 네트워크를 지원합니다.
- 네트워크 지연 시간 감소를 위한 VPC 네트워크 피어링 연결.
- 다른 그룹, 팀, 프로젝트, 조직에 속하는 VPC 네트워크 간에 서비스의 비공개 소비를 위한 Private Service Connect.

다음 단계

임베딩을 생성하고 색인을 배포할 위치를 결정했으면 다음 단계로 색인을 구성합니다.

입력 데이터 형식 및 구조 구성 방법 알아보기
노트북 튜토리얼을 사용하여 벡터 검색 색인을 만드는 방법 알아보기
색인 관리 방법 알아보기