검색 증강 생성(RAG)이란 무엇인가요?

RAG(검색 증강 생성)는 검색과 데이터베이스와 같은 기존 정보 검색 시스템의 강점과 생성형 대규모 언어 모델(LLM)의 기능을 결합한 AI 프레임워크입니다. 데이터와 세상의 지식을 LLM 언어 능력과 결합하여 보다 정확하고 특정한 니즈와 관련성이 높은 최신 상태의 그라운딩된 생성을 제공합니다. 이 eBook을 확인하여 '기업 지식'을 실현하세요.

무료로 시작하기

35:30

Vertex AI Search 및 DIY RAG로 Gemini 그라운딩

검색 증강 생성은 어떻게 작동하나요?

RAG는 생성형 AI 출력 향상에 도움이 되는 몇 가지 주요 단계로 작동합니다.

검색 및 사전 처리: RAG는 강력한 검색 알고리즘을 활용하여 웹페이지, 기술 자료, 데이터베이스와 같은 외부 데이터를 쿼리합니다. 검색된 관련 정보는 토큰화, 어간 추출, 금지어 제거 등의 사전 처리 과정을 거칩니다.
그라운딩된 생성: 사전 처리된 검색 정보가 선행 학습된 LLM에 원활하게 통합됩니다. 이러한 통합을 통해 LLM의 컨텍스트가 강화되어 주제를 보다 포괄적으로 이해할 수 있습니다. LLM은 이러한 증강된 컨텍스트를 통해 보다 정확하고 유익하며 몰입도 높은 대답을 생성할 수 있습니다.

RAG를 사용하는 이유

RAG는 특히 사실에 기반한 정보 또는 데이터 기반 응답을 다룰 때 기존 텍스트 생성 방법을 보강하는 여러 이점을 제공합니다. RAG를 사용하는 것이 유용할 수 있는 몇 가지 주요 이유는 다음과 같습니다.

사실 그라운딩

LLM은 창의적이고 흥미로운 텍스트를 생성하는 강력한 도구이지만 사실에 기반한 정확성에서 어려움을 겪을 수 있습니다. LLM은 부정확하거나 편향된 내용이 포함될 수 있는 방대한 양의 텍스트 데이터를 토대로 학습되기 때문입니다.

입력 프롬프트의 일부로 '사실'을 LLM에 제공하면 '생성형 AI 할루시네이션'을 완화할 수 있습니다. 이 접근 방식의 핵심은 가장 관련성 높은 사실을 LLM에 제공하고 LLM 출력이 이러한 사실에 완전히 그라운딩되면서도 사용자의 질문에 답변하고 시스템 지침 및 안전 제한을 준수하도록 하는 것입니다.

Gemini의 긴 컨텍스트 윈도우(LCW)를 사용하면 LLM에 소스 자료를 제공하는 좋은 방법이 됩니다. LCW에 맞는 것보다 더 많은 정보를 제공해야 하거나 성능을 확장해야 하는 경우 RAG 접근 방식을 사용하여 토큰 수를 줄여 시간과 비용을 절약할 수 있습니다.

벡터 데이터베이스 및 관련성 순위 조정으로 검색

RAG는 일반적으로 검색을 통해 사실을 가져오며, 최신 검색엔진은 벡터 데이터베이스를 활용하여 관련 문서를 효율적으로 가져옵니다. 벡터 데이터베이스는 문서를 고차원 공간에 임베딩으로 저장하므로 시맨틱 유사성을 기반으로 빠르고 정확하게 검색할 수 있습니다. 멀티모달 임베딩은 이미지, 오디오, 동영상 등에 사용할 수 있으며 이러한 미디어 임베딩은 텍스트 임베딩 또는 다국어 임베딩과 함께 검색할 수 있습니다.

Vertex AI Search와 같은 고급 검색엔진은 시맨틱 검색과 키워드 검색을 함께 사용(하이브리드 검색이라고 함)하고, 검색 결과를 평가하여 가장 상단에 표시되는 결과가 가장 관련성이 높은 결과가 되도록 하는 순위 조정을 사용합니다. 또한 철자 오류가 없는 명확하고 집중된 쿼리를 사용하면 검색 성능이 향상됩니다. 따라서 검색을 수행하기 전에 고급 검색엔진이 쿼리를 변환하고 철자 오류를 수정합니다.

RAG, 에이전트, 챗봇

RAG와 그라운딩은 새로운 비공개 또는 전문 데이터에 대한 액세스가 필요한 모든 LLM 애플리케이션 또는 에이전트에 통합될 수 있습니다. RAG 기반 챗봇과 대화형 에이전트는 외부 정보에 액세스하여 외부 지식을 활용해 보다 포괄적이고 유익하며 상황에 맞는 대답을 제공하여 전반적인 사용자 경험을 개선합니다.

데이터와 사용 사례에 따라 생성형 AI로 무엇을 빌드하는지가 달라집니다. RAG와 그라운딩을 사용하면 데이터를 LLM에 효율적이고 확장 가능한 방식으로 가져올 수 있습니다.

추가 자료

이 리소스를 통해 검색 증강 생성을 사용하는 방법을 자세히 알아보세요.

다음 단계 수행

$300의 무료 크레딧과 20여 개의 항상 무료 제품으로 Google Cloud에서 빌드하세요.

무료로 시작하기

시작하는 데 도움이 필요하신가요?
영업팀에 문의
신뢰할 수 있는 파트너 지원
파트너 찾기
계속 탐색
모든 제품 보기

검색 증강 생성(RAG)이란 무엇인가요?

검색 증강 생성은 어떻게 작동하나요?

RAG를 사용하는 이유

최신 정보 액세스

사실 그라운딩

벡터 데이터베이스 및 관련성 순위 조정으로 검색

관련성, 정확성, 품질

RAG, 에이전트, 챗봇

RAG와 관련된 Google Cloud 제품 및 서비스는 무엇인가요?

추가 자료

다음 단계 수행

시작하는 데 도움이 필요하신가요?

신뢰할 수 있는 파트너 지원

계속 탐색