このページは Cloud Translation API によって翻訳されました。

Cloud SQL を使用して生成 AI アプリケーションを作成する

MySQL | PostgreSQL | SQL Server

このページでは、生成 AI アプリケーションの構築に役立つ Cloud SQL for PostgreSQL の機能の概要について説明します。サンプルアプリケーションの使用方法については、Cloud SQL を使用して生成 AI アプリケーションを開始するをご覧ください。

検索拡張生成（RAG）は、回答を生成する前に信頼できるナレッジベースを参照し、大規模言語モデル（LLM）の出力を最適化する手法です。RAG は、精度を向上させることで生成 AI アプリケーションの機能を強化します。このページで説明されているように、Cloud SQL データベースは、RAG と生成 AI アプリケーション向けにキュレートされた機能を提供します。

ベクトルエンベディングを生成する

ベクトルエンベディングは、セマンティックな理解と効率的な類似検索を可能にするため、RAG に不可欠です。これらのエンベディングはテキスト、画像、音声、動画の数値表現です。エンベディングモデルはベクトルエンベディングを生成します。これにより、2 つのコンテンツが意味的に類似している場合、それらのエンベディングはエンベディングベクトル空間内で互いに近接した場所に配置されます。

Cloud SQL は Vertex AI と統合されています。ベクトルエンベディングは、Vertex AI がホストするモデルを使用して SQL クエリで生成できます。

Cloud SQL は、テキストのベクトルエンベディングを生成するエンベディング関数を使用して PostgreSQL 構文を拡張します。生成したエンベディングは Cloud SQL データベースに保存できます。ベクトルデータベースを別途用意する必要はありません。

Cloud SQL を使用して、Cloud SQL の外部で生成されたベクトルエンベディングを保存することもできます。たとえば、事前トレーニング済みモデルで生成されたベクトルエンベディングを Vertex AI Model Garden に保存できます。これらのベクトルエンベディングは、類似検索とセマンティック検索の pgvector 関数の入力として使用できます。

`pgvector` を使用してベクトルエンベディングの保存、インデックス登録、クエリを行う

pgvector PostgreSQL 拡張機能を使用すると、Cloud SQL でベクトルエンベディングの保存、インデックス登録、クエリを行うことができます。

この拡張機能の構成の詳細については、PostgreSQL 拡張機能の構成をご覧ください。ベクトルエンベディングの保存、インデックス登録、クエリの詳細については、生成されたエンベディングを保存すると pgvector を使用したエンベディングのクエリとインデックス登録をご覧ください。

SQL クエリを使用してオンライン予測を呼び出す

SQL クエリを使用して、Vertex AI Model Garden に保存されているモデルでオンライン予測を呼び出すことができます。

LangChain 統合を使用する

Cloud SQL は、オープンソースの LLM オーケストレーションフレームワークである LangChain と連携して、生成 AI アプリケーションの開発を簡素化します。次の LangChain パッケージを使用できます。

ドキュメントローダー: ドキュメントから情報を読み込んで保存します
ベクトルストア: LangChain を使用してセマンティック検索を有効にします
チャットメッセージ: チェーンによって以前の会話を確認できます

ベクトル検索のパフォーマンスを改善する

ベクトル検索のパフォーマンスを改善するには、次のものを使用します。

データキャッシュ: 組み込みのデータキャッシュを使用して、頻繁に読み取られるデータページを高速のローカル SSD に保存します。永続ディスクからの読み取りと比較して、読み取りパフォーマンスが最大で 3 倍向上します。

データキャッシュ指標: ベクトル検索でデータキャッシュがどれだけ効率的に使用されているかに基づいてクエリを最適化します。

Cloud SQL は、Cloud Monitoring の Metrics Explorer に次の指標を提供します。

指標	説明	指標ラベル
使用されたデータキャッシュ	データキャッシュの使用量（バイト単位）	`database/data_cache/bytes_used`
データキャッシュの割り当て	データキャッシュの最大サイズ（バイト単位）	`database/data_cache/quota`
データキャッシュヒット数	インスタンスのデータキャッシュヒット読み取りオペレーションの合計数	`database/postgresql/data_cache/hit_count`
データキャッシュミス数	インスタンスのデータキャッシュミス読み取りオペレーションの合計数	`database/postgresql/data_cache/miss_count`
データキャッシュヒット率	インスタンスのデータキャッシュヒット読み取りオペレーションとデータキャッシュミス読み取りオペレーションの比率	`database/postgresql/data_cache/hit_ratio`

システム分析情報: CPU 使用率、ディスク使用率、スループットなどのシステム指標を提供します。インスタンスの健全性をモニタリングして、生成 AI アプリケーションのパフォーマンスに影響する問題のトラブルシューティングに役立ちます。これらの指標を表示するには、Cloud SQL システム分析情報ダッシュボードを使用します。
Query Insights: クエリのパフォーマンスの問題を検出、診断し、防止します。これは、生成 AI アプリケーションのベクトル検索のパフォーマンスを向上させる際に役立ちます。

Cloud SQL Query Insights ダッシュボードを使用すると、上位のクエリのパフォーマンスを把握し、視覚的なクエリプランを使用してクエリを分析できます。また、SQLcommenter を使用して、アプリケーションレベルでパフォーマンスをモニタリングし、アプリケーションスタック全体で問題のあるクエリの原因をデータベースまでトレースすることもできます。これは、オープンソースのオブジェクトリレーショナルマッピング（ORM）自動計測ライブラリです。

Query Insights を既存のアプリケーションモニタリング（APM）ツールと統合し、使い慣れたツールでクエリの問題をトラブルシューティングすることもできます。

生成 AI アプリケーションで Cloud SQL を使用するメリット

Cloud SQL を使用して生成 AI アプリケーションを構築すると、次のようなメリットがあります。

PostgreSQL を使用して生成 AI アプリケーションを構築する。Cloud SQL for PostgreSQL は pgvector をサポートし、Vertex AI と LangChain の両方と統合されます。
エンタープライズクラスのデータ保護、セキュリティ、ガバナンスを備えた信頼できるサービスを使用する。Cloud SQL を使用すると、次のようなメリットがあります。
- 99.99% の高可用性 SLA（メンテナンスを含む）
- 自動バックアップ、レプリケーション、パッチ、暗号化、ストレージの自動増量などの機能を提供するマネージドサービス
- セキュリティ、ガバナンス、コンプライアンス機能
コンテキストオペレーションデータと組み合わせる。ベクトルエンベディングを使用しながら、オペレーションデータに対して結合とフィルタを使用し、生成 AI アプリケーションからコンテキストに沿った正確で最新の回答を得ることができます。
運用の負担を軽減する。ベクトルデータベースとして Cloud SQL を使用すると、別のベクトルデータベースにデータをエクスポートするための作業を減らすことができます。
最新の生成 AI モデルにアクセスする。SQL クエリを使用して、Vertex AI でホストされている最新の AI モデルにアクセスできます。

生成 AI アプリケーションでの Cloud SQL の使用を開始する

生成 AI アプリケーションを初めて作成する場合は、このサンプルアプリを使用してください。このアプリでは、Cloud SQL、Vertex AI、Google Kubernetes Engine（GKE）、Cloud Run を使用します。このアプリを使用すると、次の機能を備えた基本的な chatbot API を作成できます。

GKE または Cloud Run を Cloud SQL、Vertex AI、pgvector と統合する
Virtual Private Cloud（VPC）で Private Service Connect を使用して Cloud SQL に接続する方法を示す
Terraform を使用してインフラストラクチャを構成する
asyncpg と FastAPI で Python を使用する
Cloud SQL と、GKE または Cloud Run で実行されるアプリを別々の Google Cloud プロジェクトに設定する

このソリューションには次のコンテンツが含まれています。

セキュリティのベストプラクティスに従ってインフラストラクチャを設定するための Terraform テンプレート
GKE または Cloud Run にデプロイできる LLM 搭載の Chatbot のサンプルアプリ