AI & 機械学習

Gemini 2.5 がエンタープライズユースケース向けに強化された推論機能を提供

2025年4月21日

https://storage.googleapis.com/gweb-cloudblog-publish/images/Gemini_2.5.max-2500x2500.jpg

Jason Gelman

Director, Product Management, Vertex AI

Tulsee Doshi

Director, Product Management, Google DeepMind

Try Gemini 3.1 Pro

Our most intelligent model available yet for complex tasks on Gemini Enterprise and Vertex AI

Try now

※この投稿は米国時間 2025 年 4 月 10 日に、Google Cloud blog に投稿されたものの抄訳です。

Google は先日、Google 史上最も高性能な AI モデルである Gemini 2.5 を発表しました。Gemini 2.5 のモデルは Thinking モデルであり、回答する前に推論ができるため、パフォーマンスが劇的に向上しています。企業の信頼とコンプライアンスを確保するうえで、この透明性の高い段階的な推論は非常に重要と言えるでしょう。

このファミリーの最初のモデルである Gemini 2.5 Pro は、Vertex AI で公開プレビュー版として利用可能であり、高度な推論を必要とするコーディングやタスクにおいて世界最高水準のモデルの一つとなっています。広範なベンチマークで最高水準のパフォーマンスを発揮し、エンタープライズ向けの推論モデルとして多くのユーザーに認められています。LM Arena Leaderboard では、大差をつけてトップの座を獲得しています。

これを追い風に、Google は AI アプリケーションやエージェントを構築、管理するための包括的なプラットフォームである Vertex AI と Google AI Studio で、低レイテンシかつ費用効果に優れた主力モデルの Gemini 2.5 Flash をリリースします。

これらの機能が Google Cloud での AI 開発にどのような変革をもたらすのか詳しく見ていきましょう。

詳細な推論で企業の問題解決を促進

企業は、複雑な情報環境、多段階の分析、繊細な意思決定を必要とする課題に直面しており、これらのタスクでは、AI は処理だけではなく推論も行う必要があります。このような状況に対処するために、Google は Vertex AI の Gemini 2.5 Pro を提供しています。このモデルは、最高の品質を実現し、詳細な推論とコーディングの専門知識を必要とする最も複雑なタスクに対応するよう設計されています。Gemini 2.5 Pro は、100 万トークンのコンテキストウィンドウと組み合わせることで、詳細なデータ分析を実行したり、法的契約書や医療記録など情報密度の高いドキュメントから重要な分析情報を抽出したり、コードベース全体を理解して複雑なコーディングタスクを処理したりすることができます。

「Box は、企業がコンテンツにインテリジェンスを適用する方法を刷新しています。Gemini を活用した Box AI 抽出エージェントを使用することで、ユーザーは非構造化データを実用的なものにしてタスクを即座に合理化できます。これは、調達やレポート作成など、さまざまなユースケースをサポートする数百万件の抽出で確認されています。Gemini 2.5 は高度な推論において飛躍的な進歩を遂げているため、私たちはより強力なエージェントシステムの構築を思い描くことができます。それは、抽出された分析情報が自動的にダウンストリームのアクションをトリガーし、複数のステップにわたって調整を行うといったものです。この進化は自動化の限界を押し広げ、企業は最も価値のある情報を活用して行動し、効果と効率をさらに高めることができるでしょう。」- Box、AI プロダクト管理担当バイスプレジデント、Yashodha Bhavnani 氏

「Moody's は、モデルに依存しないフレームワークで Vertex AI の Gemini の高度な推論機能を活用しています。当社の現在の本番環境システムでは、インテリジェントなフィルタリングに Gemini 2.0 Flash を、高精度な抽出には Gemini 1.5 Pro を使用しており、複雑な PDF の処理において 95% 以上の精度と 80% の処理時間短縮を実現しています。この成功を基に、私たちは現在 Gemini 2.5 Pro のテストの初期段階にあります。大きなコンテキストウィンドウなどの機能により、広範なドキュメントセットにわたってより詳細で構造化された推論を実行できる可能性があるため、より複雑なデータ課題への対応はもちろん、データカバレッジをさらに強化するうえで非常に期待が持てます。まだ本番環境で使用していませんが、初期の結果は非常に有望なものです。」- Moody’s、AI データソリューション担当シニアディレクター、Wade Moss 氏

企業は、Gemini を特定のニーズに合わせてカスタマイズするために、教師ありチューニング（固有データの特殊化）やコンテキストキャッシュ保存（長いコンテキストの効率的な処理）といった Vertex AI の機能を活用し、パフォーマンスを向上させ、費用を削減できるようになります。これらの機能は、Gemini 2.5 モデル向けに今後数週間のうちにリリースされる予定です。

応答性の高い効率的な AI アプリケーションを大規模に構築

Gemini 2.5 Pro は複雑な課題に対して最高の品質を目指していますが、多くのエンタープライズアプリケーションでは、速度、低レイテンシ、費用効率が優先されています。このニーズに応えるべく、Google はまもなく Vertex AI の Gemini 2.5 Flash を提供する予定です。この主力モデルは、低レイテンシと費用削減を考慮して最適化されており、カスタマーサービスやリアルタイムの情報処理といった大規模なシナリオ向けに、バランスの取れた優れた品質を提供します。大規模での効率性が重要となる、応答性の高いバーチャルアシスタントやリアルタイムの要約ツールに最適なエンジンです。

Gemini 2.5 Flash の特徴として、動的で制御可能な推論も挙げられます。このモデルは、クエリの複雑さに基づいて処理時間（「思考予算」）を自動的に調整するため、単純なリクエストには迅速に回答できます。また、この予算を細かく制御できるため、特定のニーズに合わせて速度、精度、費用のバランスを明示的に調整できます。この柔軟性が、大規模かつ費用重視のアプリケーションで Flash のパフォーマンスを最適化するための鍵となります。

「Gemini 2.5 Flash の強化された推論機能（見識に富んだ回答を含む）は、AI による将来の脅威の検出や、AI ポートフォリオ全体にわたるより効果的なカスタマーサポートなど、Palo Alto Networks にとって大きな可能性を秘めています。私たちは、最新モデルが AI アシスタントのパフォーマンスに与える影響（要約や応答など）を評価することに取り組んでおり、このモデルに移行して高度な機能を活用するつもりです。」- Palo Alto Networks、エンジニアリング担当バイスプレジデント、Rajesh Bhagwat 氏

Vertex AI でのエクスペリエンス最適化

Gemini 2.5 Pro や Gemini 2.5 Flash などの強力なモデルの選択は、具体的なニーズによって異なります。これを簡単にするために、Vertex AI Model Optimizer の試験運用版を導入し、品質と費用の望ましいバランスに基づいて、各プロンプトに対して最高品質の回答を自動的に生成できます。特定の場所での処理を必要としないワークロードをお持ちのお客様には、Vertex AI グローバルエンドポイントが複数のリージョンを横断して Gemini モデルの容量を考慮したルーティングを提供し、トラフィックのピーク時やリージョンサービスの変動時でもアプリケーションの応答性を維持します。

洗練されたエージェントとマルチエージェントエコシステムで未来を切り開く

Gemini 2.5 Pro の高度なマルチモーダル推論により、洗練された現実的なエージェントワークフローが実現します。視覚的なコンテキスト（マップ、フローチャート）を解釈し、テキストの理解を統合し、ウェブ検索などの基本的なアクションを実行し、多様な情報を統合することで、エージェントが複雑な入力に対して有意義なやり取りを行えるようにします。

この可能性を基に、このたび Google はマルチエージェントエコシステムを実現する Vertex AI のさまざまなイノベーションを発表しました。動的なリアルタイムのやり取りをサポートする重要なイノベーションの一つが、Gemini モデル向けの Live API です。この API により、エージェントはストリーミングの音声、動画、テキストを低レイテンシで処理できるため、人間のような会話、ライブ会議への参加、リアルタイムの状況のモニタリング（タスクの途中での音声指示の理解など）が可能になります。

さらに、これらのやり取りを強化する主な Live API の機能として、長時間の再開可能なセッションのサポート（30 分以上）、多言語の音声出力、分析用のタイムスタンプ付き文字起こし、セッション内での動的な指示の更新、強力なツールインテグレーション（検索、コード実行、関数呼び出し）などがあります。こうした進歩により、Gemini 2.5 Pro などのモデルをインタラクティブ性の高いアプリケーションで活用できるようにします。

使ってみる

複雑な問題に取り組み、効率的なアプリケーションを構築し、洗練された AI エージェントを作成する準備はできましたか？Vertex AI の Gemini 2.5 を今すぐお試しください。

-Vertex AI、プロダクトマネジメント担当ディレクター、Jason Gelman
-Google DeepMind、プロダクト管理担当ディレクター、Tulsee Doshi

投稿先

Financial Services

Google Cloud の AI による机上演習で金融レジリエンスを高める

執筆者: Florian Graf • 所要時間: 5 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/google_ai_this_month.max-700x700.jpg

AI & Machine Learning

Google Cloud が今月発表した AI に関する最新情報

執筆者: Andrea Sanin • 所要時間: 4 分

https://storage.googleapis.com/gweb-cloudblog-publish/images/GEAR_Website_Graphics_1920x1080-2.max-700x700.png

AI & Machine Learning

AI エージェントを大規模に構築する新たな道筋、Gemini Enterprise Agent Ready（GEAR）プログラムが利用可能に

執筆者: Peder Ulander • 所要時間: 3 分

Containers & Kubernetes

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

執筆者: Fisayo Feyisetan • 所要時間: 4 分