벡터 검색을 사용하기 전에 임베딩 모델을 선택하고, 데이터를 준비하고, 사용할 엔드포인트 유형을 결정해야 합니다. 이 페이지에서는 이러한 작업을 수행하는 방법에 대한 몇 가지 정보를 제공합니다.
임베딩 준비
벡터 검색을 사용하려면 임베딩이 있어야 합니다. 임베딩이 이미 있으면 엔드포인트 선택으로 건너뜁니다.
임베딩을 만들려면 다음을 수행합니다.
임베딩 모델 선택: 다양한 기능을 제공하는 여러 외부 임베딩 모델이 존재합니다. 사용 사례에 따라 다음 모델 유형 중 하나를 선택합니다.
즉시 사용 가능: 텍스트 또는 이미지만의 관련성에 따라 텍스트 대 텍스트 또는 이미지와 텍스트를 의미상 일치시키려는 경우. 이는 표준 사용 사례이므로 모델을 학습시키거나 조정할 필요가 없습니다. 이 사용 사례에는 Vertex AI의 생성형 AI가 권장되는 옵션입니다.
임베딩을 위한 커스텀 모델: 자체 데이터 또는 특정 사용 사례를 기준으로 의미상 일치를 수행하려는 경우
데이터 준비: 데이터가 임베딩 모델에서 사용할 수 있는 형식인지 확인하기 위해 데이터를 정리하고 사전 처리합니다.
커스텀 모델을 사용하는 경우 임베딩 모델 학습: 커스텀 임베딩 모델(조정)을 사용하도록 선택한 경우 데이터로 학습시켜야 합니다. 이 과정은 데이터의 규모와 복잡성에 따라 시간이 오래 걸릴 수 있습니다. Model Garden에서 선행 학습된 모델을 사용하는 경우 이 단계를 건너뛸 수 있습니다.
임베딩 생성: 모델이 학습된 후에는 모델을 사용하여 데이터의 임베딩을 생성합니다.
엔드포인트 선택
색인을 만든 후에는 엔드포인트에 배포합니다. 자세한 내용은 공개 색인 엔드포인트 배포 및 관리와 VPC 네트워크에서 색인 엔드포인트 배포 및 관리를 참조하세요. 색인을 만들기 전에 필요한 엔드포인트의 종류를 결정하는 것이 좋습니다.
쿼리 색인을 다음 중 하나에 배포할 수 있습니다.
공개 엔드포인트: 공개 엔드포인트에 배포하는 경우 네트워크를 설정할 필요가 없습니다. 공개 네트워크는 지연 시간이 약간 더 길지만 설정이 더 빠르고 유지보수가 더 쉽습니다.
비공개 엔드포인트: VPC를 사용하려면 먼저 네트워킹을 설정해야 합니다. 벡터 검색은 두 가지 유형의 비공개 네트워크를 지원합니다.
네트워크 지연 시간 감소를 위한 VPC 네트워크 피어링 연결.
다른 그룹, 팀, 프로젝트, 조직에 속하는 VPC 네트워크 간에 서비스의 비공개 소비를 위한 Private Service Connect.
다음 단계
임베딩을 생성하고 색인을 배포할 위치를 결정했으면 다음 단계로 색인을 구성합니다.
- 입력 데이터 형식 및 구조 구성 방법 알아보기
- 노트북 튜토리얼을 사용하여 벡터 검색 색인을 만드는 방법 알아보기
- 색인 관리 방법 알아보기