コンテンツに移動
Next

Google Cloud Next ‘24 における発表

2024年4月10日
https://storage.googleapis.com/gweb-cloudblog-publish/images/tk-blog2x-100.max-2600x2600.jpg
Google Cloud Japan Team

Gemini 1.5 モデル をお試しください。

Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。

試す

※この投稿は、2024 年 4 月 10 日に、Google Cloud blog に投稿されたブログを APAC 地域向けに要約したものの抄訳です。

2023 年、世界は生成 AI テクノロジーがどのようにビジネスを変革できるか想像し始めたばかりでした。その変革は着実に進行しています。Google では、AI がすべての人に役立ち、できるだけ多くの人々の生活を向上させることを目指しています。

クラウドとつながった AI エージェント

インフラストラクチャ、Gemini モデル、オープン モデルやパートナー モデルなど様々なモデル、Vertex AI など、Google Cloud の AI ポートフォリオ全体を通して、当社のお客様とパートナーは、消費者へのサービス提供、従業員のサポート、コンテンツの作成支援などに洗練された AI エージェントを構築しています。

優れた顧客エージェントは、ウェブ、モバイル、コールセンター、POS などのチャネルを横断して、テキストや音声などの複数のモダリティで連携することで、消費者がそのビジネスとよりシームレスにやり取りできるように支援します。

  • IHG ホテルズ & リゾーツは、宿泊者が次の休暇を簡単に計画できるよう、生成 AI を活用した旅行計画機能をローンチします。

  • Target は、Target アプリと Target.com でセールや店舗受け取りサービスを最適化しています。

従業員エージェントは、すべての従業員の生産性を高め、連携を強化できるように支援します。

  • Etsy は Vertex AI トレーニングを使用して検索を改善、よりパーソナライズされたレコメンデーションをバイヤーに提供、広告モデルを最適化しているほか、配送日の精度も高めています。

  • ブラジルの Dasa では、医師が検査結果から関連する所見をより迅速に検出できるようにしています。

クリエイティブ エージェントは、デザイナーおよび制作チームとして機能し、画像やスライドを使い、一緒にコンセプトを検討します。Google Cloud は、クリエイティブ エージェントを構築するための最も強力なプラットフォームとスタックを提供します。

  • Canva は Vertex AI を使用して動画のマジックデザイン機能を強化し、ユーザーは編集作業にかかる時間を短縮できます。

  • Carrefour は従来数か月かかっていたSNS 向けの動的なマーケティング キャンペーンの作成を Vertex AI を活用することで数週間で作成することが可能になりました。

あらゆる規模の組織が AI 時代に新たな道を切り開くことを支援すべく、Google Cloud Next ‘24 で発表した製品イノベーションを紹介します。

AI に最適化されたインフラストラクチャで拡張

急速な変革を推進する生成 AI の可能性は、それを支えるインフラストラクチャと同じくらい強力です。Google Cloud ではスタックのあらゆるレイヤーでお客様をサポートすべく、重要な進歩を遂げています。

  • A3 Mega: NVIDIA と、H100 Tensor Core GPU を使用して開発した新たな GPU ベースのインスタンスを 2024 年 5 月より一般提供します。このインスタンスは、A3 インスタンスと比較して、GPU あたりの帯域幅が 2 倍になり、要求の厳しいワークロードもサポートします。また、トレーニングおよび推論中に機密データと AI ワークロードの機密性と整合性をより適切に保護する Confidential A3 も発表しました。

  • NVIDIA HGX B200 および NVIDIA GB200 NVL72: 最新の NVIDIA Blackwell プラットフォームは HGX B200 と GB200 NVL72 の 2 つのバージョンが 2025 年初頭に Google Cloud に導入される予定です。HGX B200 は、要求が厳しい AI、データ アナリティクス、および HPC ワークロード向けに設計されており、GB200 NVL72 はリアルタイムの大規模言語モデル推論と、数兆パラメータ規模のモデルの大規模トレーニング パフォーマンスを強化します。

  • TPU v5p: 前世代 TPU と比べて、ポッドあたりの計算能力が 4 倍に強化された、トレーニングと推論において最も強力、スケーラブル、かつ柔軟な AI アクセレレーターである、TPU v5p の一般提供を発表しました。また、Google Kubernetes Engine (GKE) で TPU v5p がサポートされるようになりました。過去 1 年間で、GKE での GPU と TPU の使用は 900% 以上増加しています。

  • AI に最適化されたストレージ オプション: Cloud Storage FUSE と Parallelstore の新たなキャッシュ機能により、データをお客様の TPU または GPU に近づけることで、トレーニング速度を高速化します。また、次世代ブロック ストレージ サービスである Hyperdisk ML (プレビュー版) も導入されており、一般的な代替サービスと比較してモデルの読み込み時間が最大 3.7 倍短縮されます。

  • Dynamic Workload Scheduler における新しいオプション: 開始時刻を保証するカレンダー モードと経済性を最適化するフレックス スタートにより、お客様は複雑なトレーニングと推論ジョブを分散するための効率的なリソース管理を確保できます。

また、エッジ、ネットワーク的に隔離された環境、Google Sovereign Clouds、Cross-Cloud など、データが生成および消費される場所に AI を近づけています。さらに、Google Distributed Cloud(GDC)を通じて AI をあらゆる場所で有効にし、組織固有のニーズに最適な環境、構成、制御を選択できるようにします。

本日、以下の多数の GDC の新機能を発表しました。

  • NVIDIA GPU から GDC へ: 接続構成とネットワーク隔離環境構成の両方で NVIDIA GPU を GDC に導入します。それぞれ、AI モデルを効率的に実行するための新しい GPU ベースのインスタンスをサポートします。

  • GDC での GKE: 主要な AI 企業が Google Cloud で使用しているのと同じ GKE テクノロジーが GDC でも利用可能になります。

  • AI モデルのサポート: Gemma、Llama 2 など、さまざまなオープン AI モデルを GDC で検証し、ネットワーク隔離された環境および接続されたエッジ環境で実行できます。

  • AlloyDB Omni でのベクトル検索: AlloyDB Omni でのベクトル検索機能を導入し、GDC 上で個人データや機密データを超低レイテンシで検索および情報取得できるようになりました。

  • Sovereign Cloud: 最も厳しい規制要件に対応するため、Google またはお客様が選択したパートナーを通じて、ローカルで運用され、存続性を備えた完全なネットワーク隔離構成で GDC を提供します。お客様は完全に制御でき、規制が変更された場合でも、迅速に対応できる柔軟性を備えることができます。

  • Imagen 2.0: Google Cloud の最先端のテキストから画像への変換テクノロジーは、企業が特定のブランド要件に一致する画像を生成できるよう、さまざまな画像生成機能を備えています。新たなテキストからライブ画像への変換機能により、マーケティング チームやクリエイティブ チームはテキスト プロンプトから gif などのアニメーション画像を生成できるようになります。生成されるライブ画像には、安全フィルターと電子透かしが実装されています。また、インペインティングやアウトペインティングなど、高度な画像編集機能の一般提供も発表しました。

  • 電子透かし: Google DeepMind の SynthID を利用して、Imagen 2.0 が生成した AI 生成画像を本日から一般提供開始しました。

すべてのワークロードが AI ワークロードであるわけではありませんが、クラウドで実行するすべてのワークロードには最適化が必要であり、各アプリケーションには固有の技術的ニーズがあります。新しい汎用コンピューティング オプションは、お客様がコストを削減しつつ、パフォーマンスを最大化し、アプリケーション間の相互運用性を実現し、持続可能性の目標を達成することを支援します。

  • Google Axion: データセンター向けに設計された当社初のカスタム Arm ベース CPU である Axion は、同等の現行世代 x86 ベース インスタンスより 50% 優れたパフォーマンスと最大 60% 優れたエネルギー効率を実現します。

Google Cloud の汎用 VM ポートフォリオに、新たに 2 つのマシン シリーズ N4 と C4 を追加、C3 マシン ファミリーにネイティブ ベアメタル マシン シェイプを追加、 Hyperdisk Advanced Storage Pools の一般提供も発表しました。

また、Vertex AI サービス上の生成 AI のデータ保存に関する Data Residency(DRZ)、オーストラリア、ブラジル、フィンランド、香港、インド、イスラエル、イタリア、ポーランド、スペイン、スイス、台湾の 11 か国に拡大します。

  • Gemini 1.0 Pro および Imagen を使用する場合、お客様は機械学習処理を米国または欧州連合(EU)に制限できるようになりました。

  • 2023 年に発表した 10 か国にこれらの新しいリージョンが加わったことにより、お客様はデータの所在地とアクセス方法をより詳細に制御できるようになり、世界中の規制要件やセキュリティ要件を満たすことが容易になります。

Vertex AI でエージェントを作成

Google Cloud は、Vertex AI で 130 以上のファーストパーティ モデルとサードパーティ モデルを提供しており、さまざまなモデルへのアクセスを拡大します。これによりお客様はより多くのモデルをご利用できます。

  • Gemini 1.5 Pro: Gemini 1.5 Pro では、12万8000K トークン、100 万トークンの 2 つのサイズのコンテキスト ウィンドウがパブリック プレビューで利用可能になりました。さらに、音声付きの動画を含む、音声ファイル処理機能も発表しました。お客様は、1 時間の動画、11 時間の音声、30,000 行以上のコード、700,000 文字を超えるコードベースなど、膨大な量の情報を 1 つのストリームで処理できます。

  • Claude 3: 最先端モデル Claude 3 Sonnet と Claude 3 Haiku が、Anthropic とのパートナーシップを通して Vertex AI で一般提供されました。また、Claude 3 Opus も今後数週間以内に利用可能になる予定です。

  • CodeGemma : Gemma は、Gemini モデルと同じ研究とテクノロジーにより開発された、最先端の軽量オープン モデルのファミリーです。コード生成やコード支援などのために設計された、ファインチューンされた新たな Gemma のバージョン、CodeGemma が Vertex AI で利用できるようになりました。

お客様は、企業のデータでモデルを強化し、グラウンディングすることで、モデルからはるかに多くの恩恵を得ることができます。この度、 Vertex AI グラウンディング機能を 2 つの方法で拡張します。

  • Google 検索: Google 検索のグラウンディング モデルは、Google の最新の基盤モデルの機能と、新鮮で高品質の情報へのアクセスを組み合わせて、回答の完全性と精度を大幅に向上させます。

  • あなたのデータ: Workday や Salesforce などのエンタープライズ アプリケーションからのデータ、または AlloyDB や BigQuery などの Google Cloud のデータベースに保存されている情報でモデルをグラウンディングし、エージェントにエンタープライズ トゥルースを提供します。

適切なモデルの選択、チューニング、グラウンディングに加え、Vertex AI はモデルのデプロイ、管理、監視も支援します。本日発表した ML opps 機能は以下の通りです。

    • プロンプト管理ツール: メモやステータスを含む、組み込みプロンプトで共同作業したり、変更箇所を追跡したり、さまざまなプロンプトからの応答の品質を比較したりできます。

    • Automatic side-by-side (AutoSxS): この度一般提供された Auto SxS は、特定の回答が別の回答よりも優れている理由と確実性スコアの説明を提供します。ユーザーが評価の精度を理解するのに役立ちます。 

Rapid Evaluation 機能: 現在プレビュー中の本機能により、お客様はプロンプト設計を反復する際、小規模なデータ セットでモデルを迅速に評価できます。

さらに、基盤モデル、Google 検索、その他の開発者ツールを統合し、エージェントの構築とデプロイを容易にする Vertex AI Agent Builder を発表しました。Vertex AI Agent Builder は、コード不要のエージェント ビルダー コンソールの利便性と、強力なグラウンディング、オーケストレーション、および拡張機能を提供し、Google 検索と組織のデータに基づいたさまざまな生成 AI エージェントを迅速に作成できるようになります。

開発を加速化

Gemini Code Assist は、エンタープライズ向けの AI コード支援ソリューションです。開発者をサポートすべく、次のことを発表しました。

  • Gemini 1.5 Pro in Gemini Code Assist: 100 万トークンという膨大なコンテキスト ウィンドウが実現し、大規模なプロジェクトのコーディングに革命をもたらします。Gemini Code Assist は現在プライベート プレビュー中で、さらに正確なコードの提案、より深い洞察、合理化されたワークフローを提供します。

  • Gemini Cloud Assist: これにより、アプリケーションのライフサイクル全体にわたって AI 支援が提供され、アプリケーションの設計、保護、運用、トラブルシューティング、パフォーマンスとコストの最適化が容易になります。

Google の一部の開発者を対象に Gemini Code Assist を導入したところ、一般的な開発タスクにかかる時間が 40% 短縮され、新しいコードの作成時間が約 55% 短縮されるなどの効果が見られました。Gemini Code Assist は、オンプレミス、GitHub、GitLab、Bitbucket、さらには複数の場所など、どこでもプライベート コード ベースをサポートできます。

データで AI の可能性を解き放つ

Google Cloud では、データのプライバシーと安全性を保ちながら、AI の利点と根拠となるエンタープライズ データを組み合わせることができます。本日、組織が優れたデータ エージェントを構築できるようにするための新しい機能強化が発表されました。

  • Gemini in BigQuery: Gemini in BigQuery は AI を駆使し、データの準備、検出、分析、ガバナンスにおいてデータ チームを支援します。新しい BigQuery データ キャンバスと組み合わせることで、データ パイプラインを構築、実行できるようになるため、自然言語と埋め込みビジュアライゼーションを備えた、まるで新しいノートブックのようなエクスペリエンスを提供します。これらは、どちらもプレビュー版をご利用いただけます。

  • Gemini in Databases: データベースを AlloyDB などの最新のクラウド データベースに変換するなど、レガシー システムからデータを安全かつ確実に移行することが簡単になります。

  • ベクトル インデックス: BigQuery と AlloyDB で直接ベクトル インデックスを使用する新しいクエリ機能により、データが保存されている場所で AI を活用し、リアルタイムかつ正確な応答を得ることができます。

  • Gemini in Looker: 現在プレビュー版のこの機能は、データ エージェントとワークフローを簡単に統合できます。ビジネス データとチャットできる新世代の 生成 AI 機能も追加しており、Google Workspace と統合されています。

AI を活用し、サイバーセキュリティ体制を強化

生成 AI 守備側を有利にするポテンシャルを持っており、セキュリティ ライフサイクルのあらゆる段階で、セキュリティ エージェントを支援します。 Google Cloud では、セキュリティ ポートフォリオのイノベーションが、より強力な成果を生み出し、あらゆる組織が Google をセキュリティ チームの一部としてとらえてくれることを目指しています。

  • Gemini in Threat Intelligence: 自然言語を使用して、脅威アクターの行動に関する深い洞察を提供します。Gemini を使用し、潜在的に悪意のあるコードの大規模なサンプルも分析できます。Gemini のより大きなコンテキスト ウィンドウにより、モジュール間の相互作用の分析が可能になり、コードの真の意図についての新たな洞察が得られます。

  • Gemini in Security Operations: 新しい調査支援機能は、自然言語を検出に変換、イベント データを要約、実行するアクションを推奨するほか、ユーザーとの会話型チャットを通じてプラットフォームを誘導します。

Google Workspace で生産性を飛躍的に向上

Gemini for Google Workspace により、お客様は Gmail、ドキュメント、スプレッドシート などに組み込まれた AI を活用したエージェントを利用できます。Google Cloud では本日、Gemini for Google Workspace の次のイノベーションと機能強化を発表しました。

  • Google Vids: 今回発表した最新の AI を活用した業務用動画作成アプリは、動画の脚本、制作、編集アシスタントをすべて 1 つにまとめたものです。簡単に編集できるストーリーボードを生成し、スタイルを選択すると、ストック ビデオ、画像、BGM から提案されたシーンを組み合わせて最初のドラフトが作成されます。また、プリセットのナレーションを選択するか、独自のナレーションを使用して、適切なメッセージを伝えることもできます。Google Vids は、ドキュメント、スプレッドシート、スライドなどと同様に Google Workspace アプリとして提供されます。シンプルで使いやすいインターフェイスと、ブラウザからプロジェクトを安全に共同作業および共有できる機能が含まれています。Google Vids は 2024 年 6 月に Workspace Labs に公開予定です。

  • AI Meetings and Messaging アドオン: Take notes for me 機能、会議中の会話の要約機能、69 言語 (4,600 の言語ペアに相当) でのリアルタイム翻訳機能を備えたこのコラボレーション ツールは、ユーザーあたり月額わずか 1,130 円でご利用いただけます。

  • 新しい AI Securityアドオン: Google Workspace の管理者は、組織向けにトレーニングされたプライバシー保護 AI モデルとデータ損失防止コントロールを使用して、機密ファイルとデータを自動的に分類して保護できるようになりました。 AI Security アドオンは、ユーザーあたり月額 1,130 円で利用でき、ほとんどの Google Workspace プランに追加できます。

この 1 年を振り返ると、Google Cloud のお客様が AI ツールを導入する初期段階から、AI ツールの実行や製品の発売にいかに早く移行したかを目の当たりにしました。私たちはさらなるお客様のイノベーションを拝見できることを楽しみにしています。

-Google Cloud, CEO, Thomas Kurian 

投稿先