검색 및 RAG 환경을 빌드하기 위한 Vertex AI API

Vertex AI는 자체 검색 증강 생성(RAG) 애플리케이션을 빌드하거나 자체 검색엔진을 빌드하는 데 도움이 되는 API 모음을 제공합니다. 이 페이지에서는 이러한 API를 소개합니다.

검색 및 생성

대규모 언어 모델(LLM)은 RAG를 통해 사용자가 선택한 데이터 소스에 그라운딩된 응답을 생성할 수 있습니다. RAG에는 두 가지 단계가 있습니다.

검색: 가장 관련성 있는 사실을 빠르게 가져오는 것이 일반적인 검색 문제일 수 있습니다. RAG를 이용하면 답변을 생성하는 데 중요한 사실을 빠르게 검색할 수 있습니다.
생성: LLM은 검색된 사실을 이용해서 그라운딩된 응답을 생성합니다.

Vertex AI는 다양한 개발자 요구사항에 맞게 두 단계 모두에 옵션을 제공합니다.

검색 옵션에는 Vertex AI, 자체 검색기 빌드, Vertex AI의 LlamaIndex, 자체 검색기 가져오기, Google 검색이 포함됩니다. 생성 옵션에는 Grounded Generation API와 Gemini가 포함됩니다.

검색

필요에 따라 가장 적합한 검색 방법을 선택하세요.

Vertex AI Search: Vertex AI Search는 Google 검색 수준의 정보 검색 엔진으로, 엔터프라이즈 데이터를 사용하는 모든 생성형 AI 애플리케이션의 구성요소가 될 수 있습니다. Vertex AI Search는 다양한 문서 유형을 처리할 수 있는 기능과 BigQuery 및 여러 서드 파티 시스템을 비롯한 다양한 소스 시스템에 연결하는 커넥터를 갖춘 즉시 사용 가능한 RAG용 시맨틱 및 키워드 검색엔진으로 작동합니다.

자세한 내용은 Vertex AI Search를 참조하세요.
자체 검색 빌드: 시맨틱 검색을 빌드하려면 커스텀 RAG 시스템의 구성요소에 Vertex AI API를 사용할 수 있습니다. 이 API 모음은 문서 파싱, 임베딩 생성, 벡터 검색, 시맨틱 순위에 관한 고품질 구현을 제공합니다. 이러한 하위 수준 API를 사용하면 검색기 설계를 완전히 유연하게 할 수 있으며 동시에 하위 수준 Vertex AI API를 사용하여 TTM(time to market) 속도를 높이고 품질을 높일 수 있습니다.

자세한 내용은 자체 검색 증강 생성 빌드를 참조하세요.
기존 검색 가져오기: 기존 검색을 그라운딩된 생성의 검색기로 사용할 수 있습니다. RAG용 Vertex API를 사용하여 기존 검색을 더 높은 품질로 업그레이드할 수도 있습니다.
Vertex AI 기반 LlamaIndex: Vertex AI 기반 LlamaIndex를 사용하면 이 인기 있는 오픈소스 소프트웨어(OSS) 프레임워크에 익숙한 개발자가 프로덕션 및 엔터프라이즈 지원 컨텍스트에서 사용할 검색 도구를 빌드할 수 있습니다.

자세한 내용은 Vertex AI의 생성형 AI 문서에서 RAG용 Vertex AI의 LlamaIndex 개요를 참조하세요.
Google 검색: Gemini 모델에 Google 검색을 사용한 그라운딩을 사용하면 Gemini가 Google 검색을 사용하고 관련 검색 결과에 그라운딩된 출력을 생성합니다. 이 검색 방법은 관리가 필요하지 않으며 Gemini에서 사용할 수 있는 전 세계의 지식을 얻을 수 있습니다.

자세한 내용은 Vertex AI의 생성형 AI 문서에서 Google 검색을 사용한 그라운딩을 참조하세요.

생성

필요에 가장 적합한 생성 방법을 선택하세요.

Grounded Generation API(허용 목록이 포함된 GA): Grounded Generation API를 사용하여 사용자의 쿼리에 대한 적절하게 그라운딩된 답변을 생성합니다. 이 API는 특수화되고 미세 조정된 Gemini 모델을 사용하며, 할루시네이션을 줄이고 소스, 서드 파티 소스 또는 Google 검색에 그라운딩된 응답을 제공하는 효과적인 방법입니다(그라운딩 지원 콘텐츠 참조 포함).

자세한 내용은 그라운딩된 답변 생성을 참조하세요.
Gemini: Gemini는 Google의 가장 뛰어난 모델로, Google 검색을 통해 즉시 그라운딩할 수 있습니다. 이를 사용하여 완전히 맞춤설정된 그라운딩된 생성 솔루션을 빌드할 수 있습니다.

자세한 내용은 Vertex AI의 생성형 AI 문서에서 Google 검색을 사용한 그라운딩을 참조하세요.
Model Garden: 전체 제어 및 원하는 모델을 사용하려면 생성에 Vertex AI Model Garden의 모델을 사용하면 됩니다.

자체 검색 증강 생성 빌드

그라운딩용 커스텀 RAG 시스템을 개발하면 프로세스의 모든 단계에서 유연성과 제어 기능을 제공할 수 있습니다. Vertex AI는 자체 검색 솔루션을 만드는 데 도움이 되는 API 모음을 제공합니다. 이러한 API를 사용하면 RAG 애플리케이션의 설계를 완전히 유연하게 할 수 있으며 동시에 하위 수준의 Vertex AI API를 사용하여 TTM(time to market) 속도를 높이고 품질을 높일 수 있습니다.

Vertex AI는 처리 및 주석 추가, 임베딩, 색인 생성 및 검색, 순위 지정, 그라운딩된 생성, 검증을 위한 API를 제공합니다.

Document AI 레이아웃 파서 Document AI 레이아웃 파서는 다양한 형식의 문서를 구조화된 표현으로 변환하여 단락, 표, 목록과 같은 콘텐츠와 제목, 페이지 헤더, 바닥글과 같은 구조적 요소에 액세스할 수 있도록 하고 다양한 생성형 AI 및 탐색 앱에서 정보 검색을 용이하게 하는 컨텍스트 인식 청크를 만듭니다.

자세한 내용은 Document AI 문서의 Document AI 레이아웃 파서를 참조하세요.
Embeddings API: Vertex AI 임베딩 API를 사용하면 텍스트 또는 멀티모달 입력의 임베딩을 만들 수 있습니다. 임베딩은 입력의 의미를 포착하도록 설계된 부동 소수점 수 벡터입니다. 임베딩을 사용하여 벡터 검색을 통해 시맨틱 검색을 강화할 수 있습니다.

자세한 내용은 Vertex AI의 생성형 AI 문서에서 텍스트 임베딩 및 멀티모달 임베딩을 참조하세요.
벡터 검색. 검색 엔진은 RAG 또는 검색 애플리케이션의 핵심 부분입니다. Vertex AI 벡터 검색은 수십억 개의 의미상 유사하거나 관련된 항목을 대규모로 검색할 수 있는 검색 엔진으로 높은 초당 쿼리 수(QPS), 높은 재현율, 낮은 지연 시간, 뛰어난 비용 효율성을 제공합니다. 밀집 임베딩을 검색할 수 있으며 공개 미리보기에서 희소 임베딩 키워드 검색 및 하이브리드 검색을 지원합니다.

자세한 내용은 Vertex AI 문서의 Vertex AI 벡터 검색 개요를 참조하세요.
Ranking API Ranking API는 문서 목록을 가져와 문서가 특정 쿼리와 얼마나 관련성이 있는지에 따라 문서의 순위를 다시 지정합니다. 문서와 쿼리의 시맨틱 유사성만을 고려하는 임베딩과 비교하여 Ranking API는 문서가 특정 쿼리에 얼마나 잘 대답하는지에 대한 더 정확한 점수를 제공할 수 있습니다.

자세한 내용은 문서 순위 지정 및 순위 재지정을 참조하세요.
Grounded Generation API Grounded Generation API를 사용하여 사용자의 프롬프트에 대한 적절하게 그라운딩된 답변을 생성합니다. 그라운딩 소스는 Vertex AI Search 데이터 스토어, 제공한 커스텀 데이터 또는 Google 검색일 수 있습니다.

자세한 내용은 그라운딩된 답변 생성을 참조하세요.
Check Grounding API Check Grounding API는 지정된 참조 텍스트 집합에서 지정된 텍스트가 얼마나 그라운딩되었는지 확인합니다. 이 API는 참조 텍스트에서 참조 인용을 생성하여 참조 텍스트에서 특정 텍스트가 지원되는 위치를 나타낼 수 있습니다. 이 API는 RAG 시스템의 응답의 그라운딩 정도를 평가하는 데 사용할 수 있습니다. 또한 실험용 기능으로 API는 주어진 텍스트와 참조 텍스트가 일치하지 않는 부분을 보여주는 상반된 인용문을 생성합니다.

자세한 내용은 그라운딩 확인을 참조하세요.

워크플로: 비정형 데이터에서 그라운딩된 대답 생성

다음은 Vertex AI RAG API를 통합하여 비정형 데이터에서 그라운딩된 응답을 생성하는 방법을 간략히 보여주는 워크플로입니다.

PDF 파일, HTML 파일, 텍스트가 포함된 이미지와 같은 비정형 문서를 Cloud Storage 위치로 가져옵니다.
레이아웃 파서를 사용하여 가져온 문서를 처리합니다. 레이아웃 파서는 비정형 문서를 청크로 분해하고 비정형 콘텐츠를 정형 표현으로 변환합니다. 레이아웃 파서는 청크에서 주석도 추출합니다.
Vertex AI 텍스트 임베딩 API를 사용하여 청크의 텍스트 임베딩을 만듭니다.
벡터 검색을 사용하여 청크 임베딩을 색인 생성 및 검색합니다.
Ranking API를 사용하여 청크 순위를 매기고 순위가 가장 높은 청크를 결정합니다.
Grounded Generation API를 사용하여 순위가 가장 높은 청크를 기반으로 그라운딩된 답변을 생성합니다.

Google 모델이 아닌 답변 생성 모델을 사용하여 답변을 생성한 경우 그라운딩 확인 메서드를 사용하여 이러한 답변의 그라운딩을 확인할 수 있습니다.