コンテンツに移動
デベロッパー

Gemini Live Agent Challenge: 受賞者とハイライトを発表

2026年6月2日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Landscape_16x9_rxRY4RH.max-2000x2000.png
Dilasha Panigrahi

Product Marketing Manager, Google Cloud

Try Gemini Enterprise Business Edition today

The front door to AI in the workplace

Try now

※この投稿は米国時間 2026 年 5 月 16 日に、Google Cloud blog に投稿されたものの抄訳です。

Gemini Live Agent Challenge が無事に終了しました。このチャレンジでは、世界中のデベロッパーに従来の「テキスト ボックス」から脱却する次世代の AI エージェントの構築を呼びかけました。最初の発表から、151 か国 11,878 人の参加者と 1,536 件のプロジェクト応募まで、その結果は驚くべきものでした。

ミッションは、Gemini Live API、Agent Development Kit(ADK)、Google Cloud の堅牢なインフラストラクチャを使用して、マルチモーダル機能をシームレスに統合し、リアルタイムで「見る、聞く、話す、つくる」をサポートするエージェントを構築することでした。参加者は、ライブ対応のエージェント、クリエイティブ ストーリーテラー、UI ナビゲーターの 3 つのカテゴリで、インタラクティブ AI の限界に挑戦しました。

最優秀賞を受賞したビルダーの皆様、おめでとうございます。優勝チームは、技術的な正確さと大胆な想像力を組み合わせ、ユーザーがエージェントと対話して体験する方法を完全に一新しました。受賞者のうち 2 人の開発者は、Google Cloud Next 2026 の会場でも表彰されました。受賞エージェントの完全なリストとともに、受賞者の体験をご紹介します。

Google Cloud Next '26 で各部門の受賞者を発表

部門賞を受賞した Jeremiah Somoine 氏と Bryen Param 氏は、ラスベガスで開催される Google Cloud Next 2026 に招待され、より広範なデベロッパー コミュニティと自身の経験や知見を共有しました。受賞者 2 名は、展示会場のデベロッパー シアターでライトニング トークを行い、GDE および認定ラウンジのクリエイター スタジオ ポッドで独占インタビューを受けました。

イベント期間中、Bryen 氏は drone-copilot の開発における主なインスピレーションについて語りました。プロジェクトの原動力となったのは「モデルが現実世界とやり取りできたらどうなるだろうか?」という疑問だったと説明し、マルチモーダル機能が AI と物理環境のギャップを埋める方法を紹介しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/bryen.max-2200x2200.jpg

現役大学生の Jeremiah 氏は、Sankofa の開発プロセスを振り返り、「技術的な制限に対する最善の対応は、創造力だった」と述べています。次世代の AI アプリケーションの構築を目指す他の学生たちへのアドバイスを求められたとき、彼はテクノロジーを実際に体験する機会があれば、すぐに始めることが重要だと強調しました。「学ぶには、実際にやってみるのが一番です」と語り、意欲的なデベロッパーに、とにかく飛び込んで構築を始めてみるよう促しています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/jeremiah_edited.max-2200x2200.jpg

受賞者

最優秀賞: ORION - Operating Room Intelligent Orchestration Node 作成者: Aditya Shukla 氏

ORION(Operating Room Intelligent Orchestration Node)は、音声指示によるロボット手術の支援コパイロットです。外科医は、スクラブを破ることなく、自然に話してすぐに回答を得たり、ディスプレイにライブデータを表示したり、リアルタイムの視覚的支援を受けたりできます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_0lhMev0.max-1300x1300.jpg
Orion - 音声指示による手術 AI アシスタント | Gemini Live Agent ハッカソン

ライブ対応エージェント部門の受賞者: drone-copilot 作成者: Bryen Param 氏

ドローン コパイロットは、ユーザーがジョイスティックや複雑なメニューを使用する代わりに、ドローンと自然なリアルタイムの会話ができるようにすることで、ハードウェアの操作方法を変革します。ユーザーは話すだけで、ドローンにナビゲーション、自律的な視覚検査、周囲の状況の説明を指示できます。ドローンはリアルタイムで音声応答し、アクションを確認します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_C6lpyed.max-1300x1300.jpg
ドローン コパイロット: Gemini Live API を使用した音声制御ドローンと自律検査

クリエイティブ ストーリーテラー部門の受賞者: Sankofa 作成者: Jeremiah Somoine 氏

Sankofa は、マルチモーダル AI の「グリオ」(西アフリカの伝統的な語り部)として機能し、断片的な家族の歴史を没入感のある物語に変えます。ユーザーのわずかな詳細情報に基づいて、豊かな音声ナレーション、水彩画の画像、アンビエント サウンドスケープを織り交ぜて歴史物語を紡ぎ出します。ユーザーは、語り部とリアルタイムで音声会話をしながら、自分のルーツをさらに探ることができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-1_1ApjCQc.max-1300x1300.jpg
Sankofa デモ動画

UI ナビゲーター部門の受賞者: Moonwalk 作成者: Enaiho Uwas Paul 氏、Aman Kumar Sah 氏

Moonwalk は、会話型のハンズフリー デスクトップ アシスタントです。ユーザーは声だけでコンピュータを直感的に操作し、複雑なタスクを完了できます。個人の好みや過去のやり取りを記憶することで、インテリジェントなコパイロットとして機能し、マウスやキーボードをシームレスに制御して、フライトの予約やスプレッドシートの管理などの日常的なワークフローを実行します。ユーザーはただ座って話すだけです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-2_djltYYE.max-1300x1300.jpg
Moonwalk のデモ動画 #geminiliveagentchallenge

マルチモーダル統合とユーザー エクスペリエンス部門最優秀賞: Wand 作成者: David Li 氏

Wand は、ボイス ファーストのポインタ対応ブラウザ アシスタントです。自然な会話とハンド ジェスチャーを組み合わせて、あらゆるウェブサイトをシームレスに操作できます。画面を指差して「この動画を再生して」や「ここを拡大して」などと話しかけるだけで、このライブ対応エージェントがクリック、検索、コマンドの実行を即座に行うお手伝いをします。マウスやキーボードに触れる必要はありません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-3_EsDTsNv.max-1300x1300.jpg
Wand -- ユーザーとともに見て、検索して、クリックするライブ対応エージェント

技術運用とエージェント アーキテクチャ部門の最優秀賞: JohnKeats.AI 作成者: Matthew Keats 氏

JohnKeats.AI は、ユーザーの言葉に積極的に耳を傾け、解決策を急いで提供することなく、ユーザーの気持ちに寄り添うことを目的としたボイス ファーストの感情コンパニオンです。ピッチ、ペース、トーンなどの微妙な口調を処理することで、ユーザーの感情状態にリアルタイムで自然に反応し、深い思考で感情に寄り添う会話機能を提供します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-4_DmxDSNY.max-1300x1300.jpg
JohnKeats.AI — 黙るべき時を知るために構築された初の AI エージェント

イノベーションおよびソート リーダーシップ部門の最優秀賞: Rayan Memory 作成者: Yusuf Elnady 氏

Rayan Memory は、日々の学習内容を完全に探索可能な 3D の「記憶の宮殿」に変えることで、忘却という普遍的な問題に取り組んでいます。バックグラウンド エージェントが現実世界の音声を受動的に聞き取り、重要なアイデアを物理的なアーティファクトとして抽出します。ユーザーはテーマ別の仮想ルームを歩き回り、専用の AI コンパニオンと会話することで、正確な記憶を簡単に取り出すことができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-5_rlthVRd.max-1300x1300.jpg
Rayan - 3D の記憶の宮殿が聞き取り、記憶し、話しかける

特別賞: NagarDrishti 作成者: Nikita Dongre 氏、Omkar Dongre 氏

NagarDrishti は、運転中にハンズフリーの音声アシスタントを使用して、市民が安全に道路の穴や冠水を報告できるようにすることで、危険な道路状況に対処します。これらのリアルタイム レポートは、インタラクティブなダッシュボードに即座に表示されます。市の職員は自然言語を使用して、危険な場所を簡単に特定し、重要な修理を管理できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-6_LY4Wry4.max-1300x1300.jpg

特別賞: Ekaette 作成者: Bassey John 氏

Ekaette は、通話とテキスト メッセージの両方で動作する会話型のマルチモーダル AI アシスタントを使ってイライラする保留音を置き換えることでカスタマー サービスに革命を起こします。顧客は、通常の電話回線でエージェントと自然に会話しながら、WhatsApp を介してシームレスに写真を共有したり、製品オプションを確認したり、支払いを完了したりできます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-7_WUG5wng.max-1300x1300.jpg
Ekaette - マルチモーダル AI 音声およびメッセージング アシスタント

特別賞: VibeCat 作成者: Sejun Kim 氏、Michael Chang 氏

VibeCat は、画面を継続的に監視し、コンテキストを理解して、ユーザーが尋ねる前に役立つアクションを提案する、プロアクティブな macOS デスクトップ コンパニオンです。コマンドを待つのではなく、コードの欠落行の修正やターミナル コマンドの実行などを最初に提案し、ユーザーの許可を得てからタスクを完了します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-8_FyBBOlB.max-1300x1300.jpg
vibeCat - プロアクティブなデスクトップ コンパニオン

特別賞: Call My Parts 作成者: Sugam Palav 氏、Nikhil Lohar 氏、Siddhant Panday 氏、Vishal Parekh 氏

Call My Parts は、中古車部品の調達という面倒で時間のかかるプロセスを自動化します。調査やベンダーへの連絡を代行してくれます。ユーザーは部品のリクエストを話すだけで、AI エージェントが自律的にベンダーのウェブサイトを検索し、サプライヤーに電話して価格と在庫を確認して、最適な選択肢をランク付けして読みやすいダッシュボードにまとめます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-9.max-1300x1300.jpg
Call My Parts AI Tool : ハッカソン Gemini Live 2026

特別賞: Relay 作成者: Faith Ogundimu 氏

Relay は、ウェブカメラを使用して物理電子工学プロジェクトをリアルタイムで監視し、ガイドするインタラクティブな AI ラボ パートナーです。回路の組み立てを手順を追って支援する音声サポート、配線ミスを事前に検出する機能、組み込みの 3D シミュレーション サンドボックスとパーソナライズされたクイズによるスキルの強化機能が用意されています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-10.max-1300x1300.jpg
Relay - 電子機器向けのリアルタイム Voice AI および Vision AI チューター | Gemini Live API + Google Cloud

この流れを推し進めましょう

素晴らしいプロジェクトに触発されましたか?Google の最新のプログラムやイベントを通じて、構築を開始し、コミュニティとのつながりを維持しましょう。

  • Gemini Enterprise Agent Ready(GEAR)にご参加ください。このプログラムは、開発者や意思決定者を支援し、プロダクション レディな AI エージェントを構築、デプロイできるように設計されています

  • Google Cloud Next 2026 の最新情報: Google Cloud Next は大盛況のうちに終了しました。会場にお越しいただけなかった方、あるいはもう一度あの熱気を味わいたい方は、SNSライブ配信のハイライトをご覧ください。魅力的な開発者の活躍の一部を会場の雰囲気とともにお楽しみいただけます。

  • 新しいツール、プロダクトの最新情報、今後のハッカソンについていち早く知りたい方は、毎週火曜日のライブ配信をお見逃しなく。午前 9 時(太平洋夏時間)/ 正午(東部夏時間)に配信が開始されます。Google Cloud の最新情報をチェックしてください。

受賞者の皆様、参加者の皆様、本当におめでとうございます。皆様が次にどのようなものを構築されるのか楽しみにしています。

- Google Cloud、プロダクト マーケティング マネージャー、Dilasha Panigrahi

投稿先