시작하기 전에

벡터 검색을 사용하기 전에 임베딩 모델을 선택하고, 데이터를 준비하고, 사용할 엔드포인트 유형을 결정해야 합니다. 이 페이지에서는 이러한 작업을 수행하는 방법에 대한 몇 가지 정보를 제공합니다.

임베딩 준비

벡터 검색을 사용하려면 임베딩이 있어야 합니다. 임베딩이 이미 있으면 엔드포인트 선택으로 건너뜁니다.

임베딩을 만들려면 다음을 수행합니다.

임베딩 모델 선택: 다양한 기능을 제공하는 여러 외부 임베딩 모델이 존재합니다. 사용 사례에 따라 다음 모델 유형 중 하나를 선택합니다.
- 즉시 사용 가능: 텍스트 또는 이미지만의 관련성에 따라 텍스트 대 텍스트 또는 이미지와 텍스트를 의미상 일치시키려는 경우. 이는 표준 사용 사례이므로 모델을 학습시키거나 조정할 필요가 없습니다. 이 사용 사례에는 Vertex AI의 생성형 AI가 권장되는 옵션입니다.
- 임베딩을 위한 커스텀 모델: 자체 데이터 또는 특정 사용 사례를 기준으로 의미상 일치를 수행하려는 경우
데이터 준비: 데이터가 임베딩 모델에서 사용할 수 있는 형식인지 확인하기 위해 데이터를 정리하고 사전 처리합니다.
커스텀 모델을 사용하는 경우 임베딩 모델 학습: 커스텀 임베딩 모델(조정)을 사용하도록 선택한 경우 데이터로 학습시켜야 합니다. 이 과정은 데이터의 규모와 복잡성에 따라 시간이 오래 걸릴 수 있습니다. Model Garden에서 선행 학습된 모델을 사용하는 경우 이 단계를 건너뛸 수 있습니다.
임베딩 생성: 모델이 학습된 후에는 모델을 사용하여 데이터의 임베딩을 생성합니다.

색인을 만든 후에는 엔드포인트에 배포합니다. 자세한 내용은 공개 색인 엔드포인트 배포 및 관리와 VPC 네트워크에서 색인 엔드포인트 배포 및 관리를 참조하세요. 색인을 만들기 전에 필요한 엔드포인트의 종류를 결정하는 것이 좋습니다.

쿼리 색인을 다음 중 하나에 배포할 수 있습니다.

공개 엔드포인트: 공개 엔드포인트에 배포하는 경우 네트워크를 설정할 필요가 없습니다. 공개 네트워크는 지연 시간이 약간 더 길지만 설정이 더 빠르고 유지보수가 더 쉽습니다.
비공개 엔드포인트: VPC를 사용하려면 먼저 네트워킹을 설정해야 합니다. 벡터 검색은 두 가지 유형의 비공개 네트워크를 지원합니다.
- 네트워크 지연 시간 감소를 위한 VPC 네트워크 피어링 연결.
- 다른 그룹, 팀, 프로젝트, 조직에 속하는 VPC 네트워크 간에 서비스의 비공개 소비를 위한 Private Service Connect.

임베딩을 생성하고 색인을 배포할 위치를 결정했으면 다음 단계로 색인을 구성합니다.