Google Cloud データベース、新しい機能で生成 AI アプリの強化に備える
Google Cloud Japan Team
※この投稿は米国時間 2024 年 3 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。
Google Cloud は、お客様がデータを統合し、それを画期的な AI と連携させ、変革をもたらすエクスペリエンスを構築できるように取り組んでいます。オペレーショナル データベースの構造化データであれ、データレイクの非構造化データであれ、データは AI をより効果的に活用するために役立ちます。企業が生成 AI を真に活用するには、運用システムと分析システム全体で構造化データや非構造化データにアクセスし、管理し、有効利用できるようにする必要があります。
Next ‘23 で Google Cloud は、開発者がエンタープライズ向け生成 AI アプリケーションを構築できるよう支援するための、世界クラスのベクトル機能の提供、デベロッパー エコシステムとの緊密なインテグレーション、AI 推論サービスへの容易な接続といったビジョンを打ち出しました。こうしたビジョンを実現すべく取り組みを続け、このたび、エンタープライズ向け生成 AI アプリを簡単に構築するための AlloyDB の統合機能セットである AlloyDB AI の一般提供(GA)が開始されたことをお知らせします。
また、ベクトル検索機能が Spanner、MySQL、Redis を含む、より多くのデータベースに対応するようになったため、開発者はお気に入りのデータベースで生成 AI アプリを構築できます。さらに、言語モデルを活用したアプリケーション開発で人気のフレームワークである LangChain とのインテグレーションも追加されています。
これらの機能はすべて、Vertex AI との既存のインテグレーションとともに、開発者に統合プラットフォームを提供します。Spanner と AlloyDB は Vertex AI とネイティブに統合され、使い慣れた SQL でモデルの提供や推論を行うことができます。一方、Firestore と Bigtable は Vertex AI ベクトル検索と統合され、生成 AI アプリにセマンティック検索機能を提供します。
生成 AI の真価が発揮されるのは、運用データが生成 AI と統合され、エンタープライズ アプリケーション全体にわたってリアルタイムで正確、かつコンテキストに合ったエクスペリエンスを提供できるときであると Google Cloud は考えています。ベクトル サポートを備えたオペレーショナル データベースは、基盤モデルとエンタープライズ向け生成 AI アプリの間のギャップを解消するのに役立ちます。また、オペレーショナル データベースは通常、アプリケーション データの大部分を保存することから、開発者が AI を活用した新しいユーザー エクスペリエンスを構築するうえで重要な役割を果たします。そのため、組織の 71% が、統合された生成 AI 機能を備えたデータベースの使用を計画しています。利便性の高いデータベースは、AI ファーストへと進化し、ベクトル検索などのテクノロジーと融合して、AI モデルへのシームレスな接続、そして AI ツールやフレームワークとの緊密なインテグレーションを実現します。これらはすべて、必要不可欠な要素として、オペレーショナル データベース自体に、あるいは関連機能としてネイティブに組み込まれます。
AlloyDB: 生成 AI ワークロードに対応する最新の PostgreSQL データベース
AlloyDB は、優れたパフォーマンス、スケーリング、可用性を実現するよう設計された Google Cloud のフルマネージド PostgreSQL 互換データベースです。そしてこのたび、AlloyDB AI が AlloyDB と AlloyDB Omni の両方で一般提供されることになりました。将来を見据えて構築された AlloyDB には次のような特長があります。
-
リアルタイムかつ正確なレスポンスを必要とするエンタープライズ向け生成 AI アプリに合わせて最適化されています。
-
トランザクション、分析、ベクトルのワークロードに優れたパフォーマンスを提供します。
-
オンプレミスやその他のクラウドなど、どこでも実行できるため、お客様がいる場所に関係なくモダナイゼーションとイノベーションを可能にします。
Character AI、FLUIDEFI、B4A、Regnology などのお客様は、AlloyDB を使用して自社のアプリケーションを強化しています。たとえば、Regnology の法令上の報告 chatbot は、自然言語処理を活用して複雑な規制用語やクエリを理解しています。
「AlloyDB は動的なベクトルストアとして機能し、規制ガイドライン、コンプライアンス文書、過去の報告データのリポジトリをインデックス処理し、chatbot の基盤となっています。コンプライアンス アナリストやレポートの専門家は、chatbot と会話形式でやり取りできるため、時間の節約はもちろん、法令上の報告に関するさまざまな質問に対処できます。」 - Regnology、最高情報責任者 Antoine Moreau 氏
すべての Google Cloud データベースを横断するベクトル検索
ベクトル検索は、生成 AI による有用かつ正確なアプリケーションを構築するための重要な機能として登場しました。近似最近傍アルゴリズムを使って、商品カタログからテキストや画像といった非構造化データの類似の検索結果を簡単に見つけることができます。このたび、Cloud SQL for MySQL、Memorystore for Redis、Spanner など、複数の Google Cloud データベースにおいて、ベクトル検索のプレビュー版を提供することをお知らせします。
Cloud SQL for MySQL は、Cloud SQL for PostgreSQL と AlloyDB で昨年リリースした pgvector 機能に加え、近似最近傍ベクトル検索および厳密最近傍ベクトル検索の両方をサポートできます。開発者は、すでに使用しているのと同じ MySQL インスタンスに何百万ものベクトルを保存できます。MySQL であれ PostgreSQL であれ、ベクトル検索に Cloud SQL を活用することで、新しいシステムを学んだり設定したりすることなく、すでに使用しているのと同じオペレーショナル データベースに直接ベクトル検索を保存し実行できます。
また、生成 AI アプリケーションに超高速なパフォーマンスを提供するために、Memorystore for Redis のベクトル ストレージとベクトル検索の組み込みサポートも開始します。各 Redis インスタンスは数千万のベクトルを保存でき、ミリ秒単位 1 桁のレイテンシでベクトル検索を実行できます。これにより、LLM セマンティック キャッシングやレコメンデーション システムなど、さまざまなユースケースに対応する超低レイテンシのデータストアが実現します。
Spanner は、高度にパーティショニング可能なワークロードに、ベクトル検索をスケールできます。数十億ものベクトルと 1 秒あたり数百万のクエリが必要となる大規模なベクトル ワークロードは、多くのシステムにとって難しい課題となり得ます。Spanner は検索空間を効率的に縮小し、低レイテンシで正確なリアルタイムの結果を提供できるため、このようなワークロードは Spanner の厳密最近傍検索に最適です。
LangChain のエコシステム サポートを加速
LangChain は、よく利用されているオープンソースの LLM オーケストレーション フレームワークの中でも特によく使用されています。Google Cloud では、アプリケーション開発者に、生成 AI アプリの迅速な構築を支援するツールを提供する取り組みとして、すべての Google Cloud データベースに対応する LangChain インテグレーションをオープンソース化しています。ベクトルストア、ドキュメント ローダ、チャット メッセージ メモリを含む 3 つの LangChain インテグレーションをサポートします。
LangChain の機能を Google Cloud のデータベースで活用することで、開発者はコンテキスト アウェアな生成 AI アプリケーションをすばやく簡単に作成できるようになります。LangChain インテグレーションにより、開発者はエンタープライズ グレードの Google Cloud データベースを選択して、希望のデータソースで組み込みの検索拡張生成(RAG)ワークフローを提供できます。サンプル ユースケースには、おすすめ商品のパーソナライズ、質問への応答、ドキュメントの検索と統合、カスタマー サービスの自動化などが挙げられます。
特定の LangChain コンポーネントとのインテグレーションにより、Google データベースをアプリケーションに組み込むプロセスが簡素化されます。サポートされているコンポーネントは、次のとおりです。
-
ベクトルストア: ベクトル類似性クエリをサポートします。LangChain ベクトルストアのインテグレーションは、AlloyDB、Cloud SQL for PostgreSQL、Cloud SQL for MySQL、Memorystore for Redis、Spanner で利用できます。
-
ドキュメント ローダ: ウェブページのコンテンツや YouTube 動画の文字起こしなど、さまざまな外部ソースからのシームレスなデータ読み込みを可能にします。
-
チャット メッセージ メモリ: 以前の会話からより詳細なコンテキストを提供することで、後で参照するためにチャットの履歴の保存できます。
ドキュメント ローダとメモリのインテグレーションは、AlloyDB、Firestore、Bigtable、Memorystore for Redis、Spanner、Cloud SQL for MySQL、PostgreSQL、SQL Server など、すべての Google Cloud データベースで利用できます。
これらのパッケージは、GitHub で入手できます。
AI 主導の未来へとつなげる
オペレーショナル データベースには、次の変革をもたらす生成 AI モデルやアプリケーションを実現するための豊富なデータが存在します。エンタープライズ グレードの本番環境のワークロード向けに AlloyDB AI を強化し、データベース ポートフォリオ全体に広範なベクトル検索機能を追加し、コミュニティの生成 AI フレームワークを採用することで、開発者は、エンタープライズ データベースの豊富なデータを基盤とした、インテリジェントで正確かつ有用な生成 AI 機能をアプリケーションに追加していくのに必要なツールを手に入れることができます。
ご利用を開始する方法について詳しくは、2024 年 3 月 7 日午前 9 時~10 時(太平洋標準時)にライブ配信される Data Cloud Innovation(データクラウド イノベーション)ライブ ウェブセミナーにご参加ください。プロダクト エンジニアリング リーダーがこれらの最新のイノベーションを紹介します。