コンテンツに移動
AI & 機械学習

Gemini の勢いは止まらない: Gemini 2.5 Flash-Lite の公開プレビュー版をリリース、Vertex AI での Gemini 2.5 Flash と Pro の一般提供も開始

2025年6月26日
Jason Gelman

Director, Product Management, Vertex AI

Try Gemini 2.5

Our most intelligent model is now available on Vertex AI

Try now

※この投稿は米国時間 2025 年 6 月 18 日に、Google Cloud blog に投稿されたものの抄訳です。

Gemini 2.5 の勢いは加速しています。Google は、最近の発表に続き、企業内で構築や開発を担当する方々が、エンタープライズ規模の AI 開発用統合プラットフォーム Vertex AI 内で、Google の最も高性能なモデルのインテリジェンスと柔軟性をさらに活用できるようにする取り組みを続けています。

このたび発表する重要なアップデートは、組織がより確実に、洗練かつカスタマイズされた効率的な AI ソリューションを構築できるように設計されています。アップデートの主な内容を以下にご紹介します。

  • Gemini 2.5 Flash と 2.5 Pro の安定版の一般提供を開始: 高速かつ高度な推論を実現する Google の最もインテリジェントなモデルが本番環境に対応しました。このモデルは安定性、信頼性、スケーラビリティに優れ、組織はミッション クリティカルなアプリケーションに非常に高度な AI 機能を確実にデプロイできるようになります。

  • 新たに Gemini 2.5 Flash-Lite を公開プレビュー版で提供開始: コスト効率に優れた Gemini 2.5 モデルをお試しください。このモデルでは、大量のタスク向けにパフォーマンスが最適化されています。

  • Gemini 2.5 Flash の新しい教師ありファインチューニング(SFT)の一般提供を開始: この高速モデルは、企業ごとのデータやニーズに合わせてカスタマイズできます。

  • ネイティブ音声に対応した新しい Live API を公開プレビュー版で提供開始: 複雑なリアルタイム音声 AI システムの開発を効率化します。

プロダクション レディな Gemini 2.5 で確実な構築を

Gemini 2.5 Flash: スピード、効率、大規模な利用に向けて最適化

Vertex AI、Gemini API、Google AI Studio において一般提供が開始された Gemini 2.5 Flash は、大規模な要約、レスポンスが速いチャット アプリケーション、効率的なデータ抽出など、高スループットのエンタープライズ タスク向けに設計されています。こうした進歩により、エンタープライズ アプリケーションを強化し、生産性やイノベーションを新たなレベルまで引き上げられる包括的なツールキットが実現しました。組織は、この本番環境対応の基盤上で確実な構築が可能です。

「SmartBear は、ウェブ、デスクトップ、モバイル向けの回帰テストを構築および実行するソリューションである Test Hub に AI を利用しています。Vertex AI で Gemini 2.5 Flash を使用して、膨大な手動テスト スクリプトを堅牢な自動テストに変換するといったタスクを迅速化し、驚異的なスピードと費用対効果を実現しています。投資に対する効果はさまざまな場面で見てとれます。当社は、お客様がテストの自動化実行のメリットを享受し、意図ベースで変更に強いテストプランを作成できるよう支援しています。これにより、テストの速度が大幅に向上し、円滑な機能提供が可能となります。お客様はより効率的でスケーラブルな AI 基盤を利用して、より迅速かつ確実に業務を遂行できるようになります。」- SmartBear、AI 担当バイス プレジデント、Fitz Nowlan 博士

「Connective Health の使命は、医療機関を支援し、患者の治療効果を改善することです。Vertex AI の Gemini 2.5 Flash は、複雑な自由形式テキストの記録から重要な医療記録を抽出するうえで非常に役立っています。お客様からの信頼は当社の最重要事項であるため、常に医療機関と緊密に連携してAI プロジェクトを開発し、正確かつ効果的に使用されるようにしています。Gemini の機能の急速な進歩により、当社はこうした重要な分析情報の提供方法を継続的に強化できるようになりました。Gemini の応用をさらに探求することで、より多くの患者さんと医療従事者の生活を改善できると期待しています。」- Connective Health、最高技術責任者、Joe Athman 氏

「Suggestic は、最先端の画像ベース推論 API を通じて栄養データを即座に実用化し、将来的には一人ひとりに合わせた栄養プランを提供できるよう取り組みを進めています。当社は Gemini 2.5 Flash をコアモデルとして利用し、卓越した精度と処理効率を継続的に実現するだけでなく、Nutrition5k データセット テストにおいて他のモデルを大幅に上回る性能を達成しています。Gemini 2.5 Flash は、処理速度などの重要なベンチマークで 25% 向上という驚異的な結果を実現しています。これにより、当社は応答時間を犠牲にすることなく、推論精度を高める高度な画像修正ツールを実装することができました。構造化出力のネイティブ サポートと、複雑なツール拡張型タスクの処理におけるこれまでにない性能により、シームレスなリアルタイム エクスペリエンスを実現できます。Gemini 2.5 Flash は、堅牢な本番環境レベルのソリューションに最適です。」- Suggestic、共同創業者、Shai Rozen 氏

Gemini 2.5 Pro: 最先端のインテリジェンスを引き出す

Vertex AI、Gemini API、Google AI Studio では、Google の最も高性能なモデルである Gemini 2.5 Pro の一般提供も開始されました。科学的発見を目的とした膨大なデータセットの分析や、重要なレガシーコードの移行の加速など、最も要求の厳しいエンタープライズ AI の課題に対応できるように設計されたこのモデルは、非常に複雑な推論、高度なコード生成、マルチモーダルの深い理解に優れています。

「Snap は、現在のデバイスとユーザー インターフェースでは AI の可能性を最大限に引き出せないと考えています。そこで、没入感のあるスタンドアロンのシースルー型 AR グラス『Spectacles』と Google Cloud の Gemini を通じて、AI を世界に広めています。当社の Depth Module API と Gemini 2.5 Pro の強力な組み合わせにより、画像の 2D 座標を 3D 空間に変換することはすでに可能となり、移動中であっても情報や注釈を現実世界に重ねて表示できます。Spectacles で空間インテリジェンスのまったく新しいパラダイムを開拓できることが楽しみでなりません。」- Snap Inc.、スタッフ プロダクト マネージャー、Terek Judi 氏

「Multimodal では、金融と保険を担当するビジネスチームと IT チームが、インテリジェントなエージェント ワークフローを共同で作成する方法を再考しています。Gemini 2.5 Pro を当社の AgentFlow プラットフォームに統合することで、顧客企業が即座に効果を体験できる AI を利用できるよう変革しました。これにより、顧客企業は長期のパイロットやカスタムデモを必要とせずに、AI エージェントが自社のドキュメント、ワークフロー、ユースケースでどのように機能するかをすばやく確認できるようになります。Gemini 2.5 が提供する大きなコンテキスト ウィンドウと構造化された推論により、これまで不可能だったレベルの深さと適応性が実現し、エージェントが非常に特殊なドメインのワークフローを理解し、推論し、対応することが可能になりました。これにより、市場開拓の方法が根本的に変化し、ビジネスチームは初日からその効果を可視化して検証できるようになりました。信頼、コンプライアンス、精度が最優先される業界において、これは画期的な変化です。」- Multimodal、エンジニアリング担当バイス プレジデント、Andrew McKishnie 氏

ニーズに合わせて強化されたカスタマイズと効率性

Gemini 2.5 Flash-Lite の公開プレビュー版: コスト効率と低レイテンシの両立Gemini 2.5 Flash-Lite をいち早くご体験ください。これまでで最も費用対効果の高い Gemini 2.5 モデルであり、大量のワークロード向けにパフォーマンスが最適化されています。2.5 Flash-Lite は、以前の Flash-Lite モデルよりも高いパフォーマンスを実現します。Vertex AI において 2.0 Flash よりも 1.5 倍高速でありながら、より低コストです。分類、翻訳、インテリジェントなルーティングなどのタスク、その他のコスト重視の大規模オペレーションに最適です。

Gemini 2.5 Flash の教師ありファインチューニング(SFT): ビジネス向けにカスタマイズされた AIVertex AI の Gemini 2.5 Flash 用の教師ありファインチューニング(SFT)の一般提供により、前例のないレベルのカスタマイズを実現できます。Gemini を企業の特定のデータ セット、業界特有の用語、独自のブランドボイスに適合させることで、専門的なタスクで精度を高めることができます。

ネイティブ音声に対応した Live API の公開プレビュー版: リアルタイムのインタラクティブ サービスを構築ネイティブ音声間処理機能を備えた Live API の公開プレビュー版の提供を開始します。この API を利用すれば、高度なリアルタイム AI システム開発の効率化と、より自然で応答性の高い音声駆動型アプリケーションや、複雑な AI エージェントのインタラクションが可能になります。

「Newo.ai により、中小規模企業はすべての受信通信チャネルにおける音声・テキストに対応する有能な AI 受付係を、1 回のクリックで、わずか 3 分でデプロイできます。当社は、Google マップのリスティングやウェブサイトのみを使用して AI 従業員を作成できるように、何千ものお客様のシナリオを検証してきました。一見シンプルなようですが、この会話フローを実現するには、Vertex AI の Live API と Gemini 2.5 Flash によって可能になる高度な推論、低レイテンシ、多言語機能、共感的な応答といった高度な機能が必要です。この組み合わせにより、最大で 30 倍の投資収益率を実現する、本番環境に対応した AI 従業員をお客様に提供できます。」- Newo.ai、共同創業者、David Yang 氏

AI プロジェクトの推進にあたり、組織はこうした Vertex AI の包括的なアップデートにより、堅牢な本番環境グレードのモデルを使用して、確実かつ継続的にスケールできるようになります。これにより、独自の運用ニーズやデータに合わせて強力な AI を正確にカスタマイズし、高スループット シナリオでコスト効率を最適化し、イノベーションの限界を押し広げる、次世代の相互接続された AI ソリューションを構築できます。

「Citizen Health では、希少疾患の患者や介護者が治療の過程を理解し、対応できるよう支援する AI アドボケイトを開発しています。当社のデータ パイプラインは、数十年にわたる臨床医の記録、画像診断レポート、ゲノムパネルといった縦断的な電子カルテのデータを Gemini 2.5 Pro の 100 万トークンのコンテキスト ウィンドウに直接ストリーミングしています。これにより、患者や介護者が、簡潔でコンテキストが豊富な回答をほぼリアルタイムで受け取れます。また、LangGraph を活用したマルチエージェント フレームワーク内で Gemini 2.5 Flash モデルと Gemini 2.5 Pro モデルをオーケストレートすることで、最も関連性の高いエビデンスがハルシネーションなしで患者や介護者に届くようにしています。Gemini の長いコンテキストの理解能力と迅速な推論能力により、膨大なドキュメントのレビューをシームレスな会話に変換できるため、患者の家族は記録の解読に費やす時間を減らし、十分な情報に基づいたケアに関する意思決定に時間をかけられるようになりました。」- Citizen Health、最高技術責任者、Daniel Wang 氏

料金と提供状況Gemini 2.5 モデル ファミリーには、企業の多様なニーズに対応する幅広いオプションが用意されています。Gemini 2.5 Flash は一般提供開始に併せて、品質向上と包括的な機能の提供を反映して料金を改定しました。また、Gemini 2.5 モデルの中で最もコスト効率に優れた Gemini 2.5 Flash-Lite のプレビュー版料金も導入しました。Gemini 2.5 Flash、Gemini 2.5 Pro、Gemini 2.5 Flash-Lite プレビュー版の料金の詳細については、料金ページをご覧ください。

Vertex AI での一般提供が開始された Gemini 2.5 FlashGemini 2.5 Pro を使用して、今すぐ本番環境への移行を開始しましょう。

-Vertex AI、プロダクト マネジメント担当ディレクター、Jason Gelman

投稿先