LlamaIndex を使用して LLM を活用したアプリケーションを構築する

プレビュー版 - AlloyDB for PostgreSQL

この機能は、サービス固有の規約の「一般サービス規約」セクションの「Pre-GA サービス規約」の対象となります。お客様はこの機能の個人データを Cloud のデータ処理に関する追加条項に記載されているとおりに処理できます。ただし、Google Cloud へのアクセスに関する契約に記載されている義務と制限事項が適用されます。 pre-GA の機能は「現状のまま」で提供されるものであり、サポートが制限されることがあります。詳細については、リリースステージの説明をご覧ください。

このページでは、AlloyDB for PostgreSQL と統合された LlamaIndex を使用して LLM を活用したアプリケーションを構築するユースケースについて説明します。アプローチの検討やアプリケーションの開発に役立つように、GitHub のノートブックへのリンクが用意されています。

LlamaIndex は、データソースを大規模言語モデル（LLM）に接続して統合できる生成 AI オーケストレーションフレームワークです。LlamaIndex を使用すると、自然言語クエリを使用して限定公開データまたはドメイン固有のデータにアクセスしてクエリを実行するアプリケーションを構築できます。

LlamaIndex は、カスタムデータと LLM の間のブリッジとして機能し、検索拡張生成（RAG）機能を使用してナレッジアシスタントアプリケーションを開発することを容易にします。

LlamaIndex は、構造化ドキュメント管理を重視しているため、インデックス作成と取得を簡素化し、ドキュメント中心のアプリケーションに適しています。このフレームワークには、情報アクセスの速度と関連性を高める最適化されたクエリメカニズムと、詳細なフィルタリングを可能にする堅牢なメタデータ処理が組み込まれています。

LlamaIndex フレームワークの詳細については、LlamaIndex プロダクトのドキュメントをご覧ください。

LlamaIndex コンポーネント

AlloyDB には、次のような LlamaIndex インターフェースがあります。

ベクトルストア
ドキュメントストア
インデックスストア
チャットストア
ドキュメントリーダー

LlamaIndex の使用方法については、AlloyDB Omni のクイックスタートをご覧ください。

ベクトルストア

この LlamaIndex との統合により、AlloyDB の堅牢でスケーラブルな性質を利用して LlamaIndex データを保存、管理できます。LlamaIndex のインデックス作成機能とクエリ機能に、AlloyDB の高パフォーマンスと信頼性を組み合わせることで、より効率的でスケーラブルな LLM 活用型アプリケーションを構築できます。

LlamaIndex は、ドキュメント（ドキュメント、テキスト、PDF）をノードと呼ばれるドキュメントコンポーネントに分割します。VectorStore に格納できるのは、取り込まれたノードコンテンツのエンベディングベクトルとノードのテキストのみです。ノードはファーストクラスコンセプトであり、テキストコンテンツ、ベクトルエンベディング、メタデータが含まれます。これらのメタデータフィールドにフィルタを適用すると、指定したメタデータ条件に一致するノードの取得を制限できます。

AlloyDB でベクトルストアを扱うには、AlloyDBVectorStore クラスを使用します。詳細については、LlamaIndex ベクトルストアをご覧ください。

AlloyDBVectorStore クラスを使用してベクトルエンベディングを保存する

ベクトルストア用の AlloyDB ノートブックでは、次の方法について説明します。

ベクトルエンベディングを格納するテーブルを初期化する
任意の Llama Index エンベディングモデルを使用して、エンベディングクラスインスタンスを作成する。
デフォルトの AlloyDBVectorStore ベクトルストアを初期化する。
VectorStoreIndex を使用して、ベクトルストアからインデックスを作成し、クエリを実行する。
カスタムベクトルストアを作成して、メタデータを効果的に保存、フィルタする。
ANN インデックスを追加して検索レイテンシを改善する。

ドキュメントストアとインデックスストア

LlamaIndex ドキュメントストアとのインテグレーションにより、構造化ドキュメントの保存と取得を管理し、LlamaIndex のドキュメント中心の機能を最適化します。ドキュメントストアは、ベクトルに関連するコンテンツをベクトルストアに保存します。

詳細については、LlamaIndex ドキュメントストアのプロダクトドキュメントをご覧ください。

インデックスストアは、インデックスの管理を容易にし、サマリー、キーワード、ツリーインデックスなどのクエリとデータの取得を迅速に行うことができます。LlamaIndex の Index は、ノードメタデータ専用の軽量ストレージです。ノードのメタデータを更新する場合、ドキュメント内のノード全体またはすべてのノードの再インデックス化（読み取りエンベディングの生成）は必要ありません。

詳細については、LlamaIndex インデックスストアをご覧ください。

ドキュメントとインデックスを保存する

ドキュメントストア用の AlloyDB ノートブックでは、AlloyDB を使用して AlloyDBDocumentStore クラスと AlloyDBIndexStore クラスを使用しドキュメントとインデックスを保存する方法について説明します。次の操作の実行方法について学びます。

AlloyDBEngine.from_instance() を使用して AlloyDBEngine を作成する。
DocumentStore と IndexStore のテーブルを作成する。
デフォルトの AlloyDBDocumentStore を初期化する。
AlloyDBIndexStore を設定する。
Docstore にドキュメントを追加する。
複数のインデックスでドキュメントストアを使用する。
既存のインデックスを読み込む。

チャットストア

チャットストアは、チャットベースのアプリケーションの会話履歴とコンテキストを保持し、パーソナライズされたインタラクションを可能にします。チャットストアは、会話内のチャットメッセージを保存して取得する中央リポジトリを提供します。これにより、LLM はコンテキストを維持し、進行中の会話に基づいてより関連性の高いレスポンスを提供できます。

大規模言語モデルはデフォルトでステートレスです。つまり、入力が毎回明示的に指定されない限り、以前の入力は保持されません。チャットストアを使用すると、会話のコンテキストを保持できるため、モデルは時間の経過とともにより関連性の高い一貫したレスポンスを生成できます。

LlamaIndex のメモリモジュールにより、会話コンテキストを効率的に保存および取得できるため、チャットアプリケーションでよりパーソナライズされたコンテキスト対応のインタラクションを実現できます。LlamaIndex のメモリモジュールは、ChatStore と ChatMemoryBuffer と統合できます。
詳細については、LlamaIndex チャットストアをご覧ください。

チャットの履歴を保存する

チャットストア用の AlloyDB ノートブックでは、AlloyDB for PostgreSQL で AlloyDBChatStore クラスを使用してチャット履歴を保存する方法について説明します。次の操作の実行方法について学びます。

AlloyDBEngine.from_instance() を使用して AlloyDBEngine を作成する。
デフォルトの AlloyDBChatStore を初期化する。
ChatMemoryBuffer を作成する。
LLM クラスインスタンスを作成する。
ストレージコンテキストなしで AlloyDBChatStore を使用する。
ストレージコンテキストで AlloyDBChatStore を使用する。
Chat Engine を作成して使用する。

ドキュメントリーダー

ドキュメントリーダーは、AlloyDB からデータを効率的に取得し、LlamaIndex 互換の形式に変換してインデックスに登録します。ドキュメントリーダーのインターフェースには、ソースから Documents としてデータを読み込むメソッドが用意されています。Document は、テキストと関連するメタデータを保存するクラスです。ドキュメントリーダーを使用すると、ドキュメントストアに保存するドキュメントや、インデックスの作成に使用するドキュメントを読み込むことができます。

詳細については、LlamaIndex ドキュメントリーダーをご覧ください。

データをドキュメントとして取得する

ドキュメントリーダー用の AlloyDB ノートブックでは、AlloyDB を使用して AlloyDBReader クラスを使用し、データをドキュメントとして取得する方法について説明します。次の操作の実行方法について学びます。

AlloyDBEngine.from_instance() を使用して AlloyDBEngine を作成する。
AlloyDBReader を作成する。
table_name 引数を使用してドキュメントを読み込む。
SQL クエリを使用してドキュメントを読み込む。
ページコンテンツの形式を設定する。
ドキュメントを読み込む。

次のステップ

LangChain を使用して LLM を活用したアプリケーションを構築する。

LlamaIndex を使用して LLM を活用したアプリケーションを構築する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。