このページでは、Vertex AI RAG Engine でサポートされているベクトル データベースの選択について説明します。また、ベクトル データベース(ベクトル ストア)を RAG コーパスに接続する方法についても説明します。
LLM の一般的な問題は、プライベート データ(組織のデータ)を理解していないことです。Vertex AI RAG Engine を使用すると、追加の非公開情報で LLM のコンテキストを拡充できます。これは、モデルがハルシネーションを低減し、質問に正確に答えることができるためです。
ベクトル データベースは、RAG アプリケーションの検索を可能にするうえで重要な役割を果たします。ベクトル データベースは、ベクトル エンベディングを保存してクエリする専用の方法を提供します。ベクトル エンベディングは、意味的な意味と関係をキャプチャするテキストなどのデータの数学的表現です。ベクトル エンベディングにより、RAG システムは、複雑なクエリや微妙なニュアンスのクエリを処理する場合でも、広大なナレッジベース内で最も関連性の高い情報を迅速かつ正確に見つけることができます。ベクトル データベースをエンベディング モデルと組み合わせると、LLM の制限を克服し、より正確で関連性の高い包括的な回答を提供できます。
サポートされているベクトル データベース
RAG コーパスを作成するときに、Vertex AI RAG Engine はベクトル データベースのデフォルトとして RagManagedDb
を提供します。これにより、追加のプロビジョニングや管理は必要ありません。Vertex AI RAG Engine がベクトル データベースを自動的に作成して管理するには、RAG コーパスを作成するをご覧ください。
Vertex AI RAG Engine では、デフォルトの RagManagedDb
に加えて、RAG コーパス内で使用するためにベクトル データベースをプロビジョニングして取り込むことができます。この場合、ベクトル データベースのライフサイクルとスケーラビリティはユーザーが責任を負います。
ベクター データベースのオプションを比較する
次の表に、Vertex AI RAG Engine でサポートされているベクトル データベースの選択肢を示します。また、RAG コーパス内でベクトル データベースを使用する方法を説明するページへのリンクも示します。
ニーズに合ったベクトル データベースを特定するには、次の表を使用してベクトル データベース オプションを比較します。
ベクトル データベース | 説明 | 利点 | 欠点 | Vertex AI RAG Engine でサポートされている距離指標 | 検索のタイプ | Vertex AI RAG Engine でステージを起動する | 本番環境対応 | 最適な用途 |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb は、整合性と高可用性を提供するリージョン分散スケーラブル データベース サービスです。RagManagedDb はベクトル検索に使用できます。 |
|
|
cosine |
KNN | プレビュー |
|
|
ベクトル検索 | ベクトル検索は、Vertex AI 内のベクトル データベース サービスです。 ベクトル検索は ML タスク用に最適化されており、他の Google Cloud サービスと統合できます。 |
|
|
cosine dot-product |
ANN | GA |
|
|
Vertex AI Feature Store | Vertex AI Feature Store は、ML の特徴を整理、保存、提供するためのマネージド サービスです。 Vertex AI Feature Store は ML タスク用に最適化されており、他の Google Cloud サービスと統合できます。 |
|
|
cosine dot-product L2 squared |
ANN | プレビュー |
|
|
Weaviate | Weaviate は、柔軟性とモジュラ性に重点を置いたオープンソースのベクトル データベースです。 Weaviate はさまざまなデータ型をサポートし、組み込みのグラフ機能を提供します。 |
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + ハイブリッド検索のサポート | プレビュー |
|
|
Pinecone | Pinecone は、高パフォーマンスの類似性検索用に設計されたフルマネージドのクラウドネイティブ ベクトル データベースです。 |
|
|
cosine euclidean dot-product |
ANN | GA |
|