このページでは、RagManagedDb
、その基盤となるテクノロジーと、Vertex AI RAG Engine での RagManagedDb
の使用方法について説明します。また、パフォーマンスの調整に使用できるさまざまなティアについて説明します。これらのティアは費用に影響する可能性があります。さらに、課金を停止する Vertex AI RAG Engine データを削除する手順についても説明します。
概要
Vertex AI RAG Engine は RagManagedDb
を使用します。これは、Vertex AI RAG Engine のリソース ストレージに使用されるエンタープライズ対応のフルマネージド Google Spanner インスタンスです。必要に応じて、RAG コーパスのベクトル データベースとして使用することもできます。
Vertex AI RAG Engine は、Spanner を介して、アプリケーションをサポートする一貫性、高可用性、高スケーラビリティのデータベースを提供します。Google Spanner の詳細については、Spanner をご覧ください。
Vertex AI RAG Engine は、ベクトル データベースの選択に関係なく、RAG コーパスと RAG ファイル リソースのメタデータを RagManagedDb
に保存します。ベクトル データベースは、エンベディングの保存と取得にのみ使用されます。RagManagedDb
は、リソースの保存に加えて、ドキュメントのベクトル表現の保存と管理にも使用できます。ベクトル データベースは、指定されたクエリに対するドキュメントの意味的な類似性に基づいて、関連するドキュメントを取得するために使用されます。
ティアを管理する
Vertex AI RAG Engine では、2 つのティアから選択して、使用量とパフォーマンスの要件に基づいて RagManagedDb
インスタンスをスケーリングできます。また、必要に応じて、3 つ目のティアを使用して Vertex AI RAG Engine データを削除することもできます。
ティアは、RagManagedDb
を使用する RAG コーパスに影響する RagEngineConfig
リソースで使用可能なプロジェクト レベルの設定です。RagEngineConfig
では、次のティアを使用できます。
スケーリング ティア: このティアは、自動スケーリング機能とともに本番環境規模のパフォーマンスを提供します。大量のデータを処理するワークロードやパフォーマンスが重要なワークロードに適しています。内部的には、このティアは、最小 1 ノード(1,000 処理ユニット)と最大 10 ノード(10,000 処理ユニット)で Spanner インスタンスを自動スケーリング構成にします。
ベーシック ティア(デフォルト): このティアは、費用対効果が高く、コンピューティング パフォーマンスが低いティアです。次のようなケースに適している可能性があります。
RagManagedDb
のテスト。- 小規模のデータ。
- レイテンシの影響を受けにくいワークロード。
- Vertex AI RAG Engine は、他のベクトル データベースでのみを使用します。
ベーシック ティアを提供するために、
RagManagedDb
は基盤となる Spanner インスタンスを 100 処理単位(0.1 ノードに相当)の固定構成に設定します。プロビジョニングされていないティア: このティアでは、
RagManagedDb
とその基盤となる Spanner インスタンスが削除されます。プロビジョニングされていないティアでは、Vertex AI RAG Engine サービスが無効になり、RagCorpora
に使用されるベクトル データベースに関係なく、このサービス内に保持されているデータが削除されます。これにより、サービスの課金が停止します。課金の詳細については、Vertex AI RAG Engine の課金をご覧ください。データを削除すると、復元できなくなります。Vertex AI RAG Engine の使用を再開するには、
UpdateRagEngineConfig
API を呼び出してティアを更新する必要があります。
プロジェクト構成を取得する
次のコードサンプルは、各タイプのティアで GetRagEngineConfig
API を使用する方法を示しています。
バージョン 1(v1)API コードサンプル。
v1beta1 API コードサンプル。
プロジェクト構成を更新する
次のコードサンプルは、各タイプのティアで UpdateRagEngineConfig
API を使用する方法を示しています。
バージョン 1(v1)API コードサンプル。
v1beta1 API コードサンプル。
次のステップ
- デフォルトの RAG API v1 の使用方法について確認する。RAG API v1 をご覧ください。
- RAG API v1beta1 の使用方法について確認する。RAG API v1beta1 をご覧ください。
RagManagedDb
、ティア構成と RAG コーパスレベルの検索戦略を管理する方法については、Vertex AI RAG Engine で RagManagedDb を使用するをご覧ください。