Vertex AI RAG Engine 결제

이 페이지에서는 모델, 재순위 지정, 벡터 스토리지 등 사용하는 Vertex AI RAG Engine 구성요소를 기반으로 Vertex AI RAG Engine 가격 책정 및 청구를 설명합니다.

자세한 내용은 Vertex AI RAG Engine 개요 페이지를 참고하세요.

가격 책정 및 결제

Vertex AI RAG Engine은 무료로 사용할 수 있습니다. 하지만 Vertex AI RAG Engine 구성요소를 구성하면 청구에 영향을 미칠 수 있습니다.

이 표에서는 RAG 구성요소를 사용할 때 청구가 어떻게 이루어지는지 설명합니다.

구성요소 Vertex AI RAG Engine의 청구 방식
데이터 수집 Vertex AI RAG 엔진은 다양한 데이터 소스에서 데이터를 수집하는 것을 지원합니다. 예를 들어 로컬 파일, Cloud Storage, Google Drive를 업로드합니다. Vertex AI RAG Engine에서 이러한 데이터 소스의 파일에 액세스하는 것은 무료이지만 이러한 데이터 소스에서 데이터 전송에 요금을 청구할 수 있습니다. 예를 들어 데이터 이그레스 비용이 있습니다.
데이터 변환 (파일 파싱)
  • 기본 파서: 무료
  • LLM 파서: Vertex AI RAG Engine은 지정한 LLM 모델을 사용하여 파일을 파싱하며, LLM 모델 비용이 프로젝트에 직접 표시되고 청구됩니다.
  • Document AI 레이아웃 파서: Vertex AI RAG Engine은 지정한 Document AI 레이아웃 파서를 사용하여 파일을 처리하며, 프로젝트에서 직접 Document AI 레이아웃 파서의 사용량을 확인하고 비용을 지불합니다.
데이터 변환 (파일 청킹) 무료인 고정 크기 청크를 지원합니다.
임베딩 생성 Vertex AI RAG Engine은 지정한 임베딩 모델을 사용하여 임베딩 생성을 오케스트레이션하며, 프로젝트에 해당 모델과 관련된 비용이 청구됩니다.

자세한 가격 정보는 Vertex AI에서 AI 모델을 빌드하고 배포하는 데 드는 비용을 참고하세요.

데이터 색인 생성 및 검색 RAG Engine은 벡터 검색을 위해 두 가지 카테고리의 벡터 데이터베이스를 지원합니다.
  • RAG 관리 데이터베이스
  • 자체 벡터 데이터베이스 사용

RAG 관리 데이터베이스에는 두 가지 목적이 있습니다.
  • RAG 관리 데이터베이스는 RAG 코퍼스, RAG 파일과 같은 RAG 리소스를 저장합니다. 파일 콘텐츠는 제외됩니다.
  • 선택에 따라 벡터 검색을 위한 임베딩 색인 생성 및 검색

RAG 관리 데이터베이스는 Spanner 인스턴스를 백엔드로 사용합니다.

각 프로젝트에 대해 Vertex AI RAG Engine은 고객별 Google Cloud 프로젝트를 프로비저닝하고 Vertex AI RAG Engine에 저장된 RAG 관리 리소스를 관리하여 데이터가 물리적으로 격리되도록 합니다.

RagManagedDB 기본 등급 또는 확장 등급을 선택하면 Vertex AI RAG Engine이 해당 프로젝트에 Spanner Enterprise 버전 인스턴스를 프로비저닝합니다.

  • 기본 등급: 백업이 포함된 처리 단위 100개
  • 확장형 등급: 노드 1개 (처리 단위 1,000개)에서 시작하여 백업을 포함한 노드 10개까지 자동 확장

프로젝트의 RAG 코퍼스에서 벡터 검색에 RAG 관리형 데이터베이스를 사용하도록 선택하면 RAG 관리형 Spanner 인스턴스에 요금이 청구됩니다.

Vertex AI RAG Engine은 해당 RAG 관리 프로젝트의 Spanner 비용을 Google Cloud 프로젝트에 표시하므로 Spanner 인스턴스 비용을 확인하고 지불할 수 있습니다.

Spanner 가격 책정 세부정보는 Spanner 가격 책정을 참고하세요.

Vertex AI RAG Engine 순위 조정 검색 후 지원되는 순위 지정 도구는 다음과 같습니다.
  • LLM 순위 조정: Vertex AI RAG Engine은 지정한 LLM 모델을 사용하여 검색 결과를 순위 조정하며, 프로젝트에서 직접 LLM 모델 비용을 확인하고 지불합니다.
  • Vertex AI Search Ranking API: Vertex AI RAG Engine은 Vertex AI Search Ranking API를 사용하여 검색 결과를 다시 순위 지정하며, 프로젝트에서 직접 Ranking API를 확인하고 비용을 지불합니다.

다음 단계