新たにリリースされる最先端の Vertex AI Ranking API で検索エージェントと RAG エージェントを強化
Lukas Bruderer
Product Manager
Mihai Ciorobea
Technical Lead
※この投稿は米国時間 2025 年 5 月 31 日に、Google Cloud blog に投稿されたものの抄訳です。
AI 時代の到来によってユーザーの期待は飛躍的に高まっており、ユーザーは、より複雑なクエリを発行し、正確な結果を要求するようになっています。そのため、必要な情報をすばやく見つけられない場合には、82% の確率で顧客を失うことになります。同様に、AI エージェントは、信頼性の高いタスクの実行のために、極めて関連性の高いコンテキストを必要とします。しかし、従来の検索方法ではノイズが混入し(通常、取得した回答の約 70% が正しい情報を含んでいない)、信頼できない結果が返されるため、エージェント ワークフローやユーザー エクスペリエンスに悪影響が及ぶことがあります。
このような高まる期待に応えるべく、Google はこのたび、最先端の Vertex AI Ranking API を新たにリリースしました。これにより、検索、エージェント ワークフロー、検索拡張生成(RAG)システムで表示される情報の精度を簡単に高めることができ、従来の検索システムや AI アプリケーションを、数か月ではなく数分で強化できます。
単なる検索の枠を超える
上述のような状況では、正確なランキングが重要になります。Vertex AI Ranking API は、検索パイプラインの重要な最終段階において精度をフィルタする役割を果たします。最初の候補セットをインテリジェントにふるいにかけ、最も関連性の高い情報のみを特定して優先します。この絞り込みのステップは、より高品質で信頼性が高く、効率的な AI アプリケーションを実現するための鍵となります。
Vertex AI Ranking API は、この絞り込みの強力なレイヤとして機能し、インテグレーションが容易です。既存の検索システムから候補リストを取得し、詳細なセマンティック理解に基づいて並べ替えて、最適な結果が上位に表示されるようにします。また、以下のような、システムのレベルアップに役立つ機能を備えています。
-
従来の検索システムのアップグレード: 既存の検索結果に最先端の関連性スコアリングを簡単に追加できます。現在のスタックを大幅に変更することなく、商用検索におけるユーザー満足度とビジネス成果を向上させることができます。
-
RAG システムの強化: 生成モデルに送信するドキュメントの数を減らし、関連性の高いドキュメントのみを送信します。これにより、回答の信頼性が向上し、コンテキスト ウィンドウの使用を最適化することでレイテンシと運用コストを削減できます。
インテリジェント エージェントのサポート: 関連性の高い情報を AI エージェントに提供し、コンテキストとトレースを合理化することで、タスク完了の成功率を大幅に向上させます。


図 1: 一般的な検索と取得のフローにおける Ranking API の使用
Ranking API の新機能
このたび、以下の新しいセマンティック再ランキング モデルをリリースします。
-
semantic-ranker-default-004 - あらゆるユースケースに対応する最も正確なモデル
-
semantic-ranker-fast-004 - レイテンシが重要なユースケース向けの最も高速なモデル
Google のモデルは、ランキング パフォーマンスの新しいベンチマークを確立しています。
最先端のランキング: 業界標準の BEIR データセットを使用した評価によると、Google のモデルは競合するスタンドアロンの再ランキング API サービスの中で最も精度が優れています。ランキングされた項目が実際にどの程度関連していて、関連性の高い結果が上位に優先的に表示されているか評価する際には、ランキング システムの品質を評価するための nDCG という指標を使用します。なお、結果の再現性を確保するために、評価スクリプトを公開しています。


図 2: 他のランカーとの比較。BEIR データセットの NDCG@5 で semantic-ranker-default-004 が優位に立っている。
-
業界をリードする低レイテンシ: デフォルト モデル(semantic-ranker-default-004)は、あらゆる規模において、競合する再ランキング API サービスよりも 2 倍以上高速です。高速モデル(semantic-ranker-fast-004)は、レイテンシが重要なアプリケーション向けにチューニングされており、通常、デフォルト モデルと比較してレイテンシが 3 分の 1 になります。
また、API リクエストあたり合計 20 万トークンまでの長いコンテキスト ランキングもリリースします。Ranking API に長いドキュメントを渡すことで、クエリと情報の間の微妙な関係(小売業における顧客レビューや商品の仕様など)をより適切に把握できるようになります。
さまざまな分野における実世界への影響
こうしたメリットは単に理論上のものではありません。業界固有のデータセットのベンチマークでは、Ranking API を統合することで、小売、ニュース、金融、ヘルスケアなど、価値の高いさまざまな分野で検索結果の品質を大幅に向上できることが実証されています。


図 3: 内部データセットに基づき、価値の高いさまざまな分野において、semantic-ranker-default-004 により nDCG@5 のパフォーマンスが向上。語彙検索とセマンティック検索のベースラインでは、Vertex AI text-embedding-004 と BM25 ベースの最善の検索結果を使用。
検索結果を数分で向上
Vertex AI Ranking API は、シームレスなインテグレーションを実現するために設計されています。この強力な関連性レイヤは簡単に追加でき、以下のような選択肢があります。
-
実際に試す: インタラクティブな Vertex Vector Search のデモで Ranking API を有効にして、実際のデータで違いをご体験ください(リンク)
-
Vertex AI で構築する: 既存のシステムに直接統合して、柔軟性を最大限に高めます(リンク)
-
RAG Engine で有効にする: RAG Engine で Ranking API を選択して、生成 AI アプリケーションからより堅牢で正確な回答を取得します(リンク)
-
AlloyDB で使用する: 真に効率的なエクスペリエンスを実現するために、AlloyDB 内で組み込みの ai.rank() SQL 関数を直接使用します。これは、AlloyDB で検索ユースケースを簡素化する新しい統合機能です(リンク)
-
AI フレームワークで使用する: GenKit や LangChain などの一般的な AI フレームワークとのネイティブな統合を利用します(リンク)
-
Elasticsearch で使用する: Elasticsearch に組み込まれている Ranking API を統合することで、精度をすばやく高めることができます(リンク)
-プロダクト マネージャー、Lukas Bruderer
-テクニカル リード、Mihai Ciorobea