Vertex AI RAG Engine の課金

このページでは、使用する Vertex AI RAG Engine コンポーネント(モデル、再ランキング、ベクトル ストレージなど)に基づく Vertex AI RAG Engine の料金と請求について説明します。

詳細については、Vertex AI RAG Engine の概要のページをご覧ください。

料金と課金

Vertex AI RAG Engine は無料で使用できます。ただし、Vertex AI RAG Engine コンポーネントを構成すると、課金に影響する可能性があります。

次の表では、RAG コンポーネントを使用した場合の課金の仕組みについて説明します。

コンポーネント Vertex AI RAG Engine での課金の仕組み
データの取り込み Vertex AI RAG Engine は、さまざまなデータソースからのデータ取り込みをサポートしています。たとえば、ローカル ファイル、Cloud Storage、Google ドライブのアップロードなどです。Vertex AI RAG Engine からこれらのデータソース内のファイルにアクセスするのは無料ですが、これらのデータソースではデータ転送に料金が発生する場合があります。たとえば、データの下り(外向き)費用などです。
データ変換(ファイルの解析)
  • デフォルト パーサー: 無料。
  • LLM パーサー: Vertex AI RAG Engine は、指定した LLM モデルを使用してファイルを解析します。LLM モデルの費用はプロジェクトから直接確認して支払うことができます。
  • Document AI レイアウト パーサー: Vertex AI RAG Engine は、指定した Document AI レイアウト パーサーを使用してファイルを処理します。Document AI レイアウト パーサーの使用状況はプロジェクトから直接確認でき、料金もプロジェクトから直接支払います。
データ変換(ファイルのチャンク化) 固定サイズのチャンク化をサポートします(無料)。
エンベディングの生成 Vertex AI RAG Engine は、指定したエンベディング モデルを使用してエンベディング生成をオーケストレートします。プロジェクトには、そのモデルに関連する費用が請求されます。

料金の詳細については、Vertex AI での AI モデルの構築とデプロイの費用をご覧ください。

データのインデックス作成と取得 RAG Engine は、ベクトル検索用に次の 2 つのカテゴリのベクトル データベースをサポートしています。
  • RAG 管理データベース
  • Bring-Your-Own ベクトル データベース

RAG 管理データベースには次の 2 つの目的があります。
  • RAG 管理データベースには、RAG コーパスや RAG ファイルなどの RAG リソースが保存されます。ファイルの内容は除外されます。
  • ベクトル検索用のエンベディングのインデックス登録と取得。

RAG 管理データベースは、バックエンドとして Spanner インスタンスを使用します。

Vertex AI RAG Engine は、各プロジェクトに対して顧客固有の Google Cloud プロジェクトをプロビジョニングし、Vertex AI RAG Engine に保存されている RAG 管理リソースを管理して、データが物理的に分離されるようにします。

RagManagedDB ベーシック ティアまたはスケーリング ティアを選択すると、Vertex AI RAG Engine は対応するプロジェクトに Spanner Enterprise エディションのインスタンスをプロビジョニングします。

  • ベーシック ティア: バックアップ付きの 100 処理ユニット
  • スケーリング ティア: 1 ノード(1,000 処理ユニット)から始まり、バックアップを使用して最大 10 ノードまで自動スケーリング

プロジェクト内の RAG コーパスがベクトル検索に RAG 管理データベースを使用する場合、RAG 管理の Spanner インスタンスに対して課金されます。

Vertex AI RAG Engine は、対応する RAG マネージド プロジェクトから Google Cloud プロジェクトに Spanner の費用を表示します。これにより、Spanner インスタンスの費用を確認して支払うことができます。

Spanner の料金の詳細については、Spanner の料金をご覧ください。

Vertex AI RAG Engine の再ランキング 取得後にサポートされるランキング ツールは次のとおりです。
  • LLM 再ランキング ツール: Vertex AI RAG Engine は、指定した LLM モデルを使用して検索結果を再ランキングします。LLM モデルの費用はプロジェクトから直接確認して支払うことになります。
  • Vertex AI Search ランキング API: Vertex AI RAG Engine は、Vertex AI Search ランキング API を使用して検索結果を再ランキングします。ランキング API はプロジェクトから直接確認して支払うことができます。

次のステップ