Infinite Nature と業界の特性: AI の多様な可能性を示す「自然」デモ
Kaz Sato
Developer Advocate, Cloud AI
Mauricio Ruiz
Creative Lead, Demos & Experiments, Google Cloud
Infinite Nature は、自然の中に隠された思いがけない繋がりを示してくれます。そして、そのような繋がりはみなさんが持つデータの中にも隠されている可能性があります。
世界屈指の知識を持つ生物学者、動物学者、生態学者のチームとともに、自然の果てしない驚異を探索することを想像してみてください。彼らはあらゆる環境へ案内してくれるし、その分野の他の専門家が気づかないような繋がりも見つけてくれます。
これこそが、Infinite Nature の世界です。
Google Cloud Next ‘24 で発表された Infinite Nature は、生成 AI に潜在する予想外の能力の一部を示す実験でした。Infinite Nature は、最新世代の Gemini モデルの機能と分析情報を活用し、自然界の驚くべき繋がりを明らかにする没入型エクスペリエンスです。
私たちのインスピレーションは、地球上に無限に広がる多様性と創造力からもたらされるものです。Infinite Nature は、Gemini の優れた洞察力に導かれる発見の旅への招待状とも呼べるものです。
Infinite Nature は新たな AI 機能のショーケースにもなっています。また、 Infinite Nature では、想像力を押し広げることで、訪れる多くのオーディエンスが自分たちの世界とそこに広がる美しい偶発的な繋がりを見直すきっかけとなるように考えられています。そして、オーディエンスに探求心を呼び覚ます、という狙いもあります。同様のモデルが応用されるとしたなら、物流や金融、マーケティングといった面に何をもたらすでしょう?
生物多様性をデータとして捉えるのは奇妙に思えるかもしれません。しかし、Infinite Nature においては、バイオマーカーとメタデータがショウジョウコウカンチョウ、コンゴウインコ、ミナミキンランチョウを結び付ける接点として機能します(プロンプトは、「赤い鳥をいくつか見せて」です)。同様の考え方で、「米国中西部で最も繁盛している 10 店舗で最も売れた商品は何?」というクエリを適用してみましょう。
言い換えると、これは、これまで想像もつかなかったデータの活用方法を考えるということなのです。
Infinite Nature とは
根本的に Infinite Nature とは、Google Cloud 上の Vertex AI と Gemini を活用した生成 AI プレイグラウンドです。その仕組みをご紹介します。
- 質問をする: まず、自然について何か質問やプロンプトを投げかけます。「最もカラフルな鳥は何ですか」や、「長生きする動物を教えてください」など、何でも構いません。エクスペリエンスへの入力は、音声、テキスト、位置座標、画像で行えます。これは、さまざまな入力タイプを簡単に理解できる、Gemini のようなネイティブ マルチモーダル モデルの力を実証しています。
- マルチモーダル AI 分析: プロンプトは、地球規模生物多様性情報機構(GBIF)のマルチメディア野生生物データの 9 TB オープン データセットでトレーニングされたGemini のチューニング済みバージョンによって取り込まれます。Infinite Nature は、LLM を利用した検索機能を使用して、何百万もの実際の動物の画像やデータポイントから最も意味的に関連性の高い結果を探し出します。
テキスト生成と映像生成: Infinite Nature は、Gemini で動的に生成される視覚的に魅力的なクラスタで検出結果を提示します。これらのクラスタは、一見バラバラに見える概念の間に関連性を見出し、好奇心を掻き立て、GBIF データセットのさらなる探索を促します。
森と木々: Infinite Nature の構築
Infinite Nature が見せてくれる、現実世界のデータセットをリアルタイムで処理して関連付ける AI の優れた機能をご紹介します。
1.マルチモーダル セマンティック検索で GBIF の力を活用: Infinite Nature は、世界中の 730 万枚の動物画像と、その動物の種、食性、生息地、習性、寿命、その他の多数のマーカーなどの関連メタデータを含む GBIF データセットを活用しています。このデータセットにより、Infinite Nature モデルがこれらの生物間の関連性を導き出すのです。
この豊富なデータセットは、各動物のエンべディング(モデルが各データポイントを理解し比較するために使用できる数値ベクトル)を生成するために使用されました。これらは、Vertex AI マルチモーダル エンベディングと Vertex AI ベクトル検索によるマルチモーダル セマンティック検索を使用して作成されました。
これらのエンべディングにより、システムは各ユーザーのプロンプトの背後にある微妙な意図を把握できるため、モデルは何百万もの実際の動物の画像と特徴から最も意味的に関連性の高い結果を識別できます。把握した意図をふまえ、モデルは「水浴びをするカバ」や「輪になって飛ぶ鳥」のような複雑なクエリに対しても、関連する画像を収集できます。これらはすべて数ミリ秒以内に行われます。
「輪になって飛ぶ鳥」というクエリに対して GBIF データセット内の 730 万枚の画像から抽出されたマルチモーダル セマンティック検索の結果。
2. 無限のインスピレーションを支えるレコメンデーション生成: Gemini の推論機能を活用したレコメンデーション生成(GR)は、ユーザーの興味と世界中の動物に関する膨大な知識に基づいて、詩的で感情に訴えるセマンティック クエリを動的に生成します。たとえば、「ハチドリ」のようなクエリが与えられると、Infinite Nature は「花にとまるハチドリの写真。半透明の羽と色鮮やかな体が際立っています」というクエリを生成し、自然界の魅力的な側面を発見させてくれるかもしれません。
3. Wikipedia を使用した検索拡張生成(RAG): Infinite Nature は検索拡張生成(RAG)を採用しており、特定の動物への関心が示されると、モデルの内部知識に加えてモデル外のソースに基づいた豊富で詳細な情報を提供します。
クエリが実行されると、Infinite Nature は、Wikipedia の動物種に関する 19,000 ページの関連データと GBIF データセット内の 730 万行のメタデータを、Vertex AI Feature Store とミリ秒単位で相互参照し、このコンテキストを Gemini にフィードします。そして、LLM がハルシネーションのリスクを大幅に軽減しながら、その動物に関する有益な質問、回答、視覚的な説明を生成します。
4. 自然なインタラクションのための関数呼び出し: Gemini モデルは、システムが LLM からの結果を構造化された JSON 出力(簡素化されたデータ交換形式)に適切にマッピングできるようにする関数呼び出しをサポートしています。この変換により、従来 LLM を周囲のシステムと統合する際に一般的だった、プロンプトやコーディングの試行錯誤が不要になります。
5. Google Cloud を活用: Infinite Nature は、さまざまな Google Cloud ツールを活用してエクスペリエンスを構築します。BigQuery で効率的なデータ マネジメントを、Vertex AI でモデルのトレーニングとサービングの強化を、その他のサービスでスムーズなパフォーマンスとスケーラビリティを保証しています。
発見の魔法
Infinite Nature は単なる事実の集合体ではありません。驚きを生み出すためのツールです。Next '24 の期間中、ユーザーは AI が見せてくれた繋がりの幅広さに驚かされました。
たとえば、開催地のラスベガスにちなみ、ある参加者が「ネバダ州の最も象徴的な動物は何ですか?」と質問しました。その結果は、砂漠に生息する動物から、個別にはオオツノヒツジやセージブラシ州(ネバダ州の愛称)の州鳥であるマウンテン ブルーバードまで、さまざまなトピックに及びました。
Infinite Nature のユーザー インターフェースとエクスペリエンスは、驚きと発見の感覚を呼び起こすように特別に設計されています。動的な可視化で AI が発見した繋がりを垣間見せ、チャットのようなインターフェースで会話の感覚を生み出します。Infinite Nature とのインタラクションは、知識豊富なガイドと一緒に発見の旅に出ているような気分にしてくれます。
Infinite Nature と対話する Google Cloud Next '24 の参加者。
全体を通して、私たちのゴールは AI の「思考プロセス」を可視化して透明性を高めることで、オーディエンスの意識を高め、オーディエンス自身のユースケースに関するアイデアの橋渡しをすることでした。画面に表示され続けるモジュールが、各動物群の背景を説明することで、エクスペリエンスの透明性を高め、より深いエンゲージメントをつくるのです。
無限の可能性
Infinite Nature を支える AI テクノロジーは、業界や用途を問わず、企業の顧客やデータとの関わり方に革命をもたらす可能性を秘めています。会話型 AI、レコメンデーション生成、リアルタイムのマルチモーダル セマンティック検索とデータ取得の力を活用することで、企業はこれまで以上に魅力的で直感的な、インパクトのあるエクスペリエンスを生み出せます。
次のような目的で、同様の AI を活用したアプローチを使用することを想像してみてください。
- 過去のデータから隠れたパターンとつながりを発見する
- プラットフォームにおける顧客の行動を特定する
- ウェブサイト上の顧客のショッピング経路をカスタマイズする
- 既存のライブラリに基づいてブランドの新しいコンテンツを作成する
プロンプト「砂漠の動物」に対する Infinite Nature の出力例。
Infinite Nature は、私たちが情報とどのように関わっていくのか、その未来を垣間見せてくれます。従来の検索エンジンの「質問と回答」モデルから脱却し、代わりに探索と発見に焦点を当てています。AI は単に事実を提供するだけではなく、膨大なデータセット内で積極的に繋がりを生み出し、ユーザーが考えもしなかった新しい分析情報や創造的な飛躍を呼び起こします。
このアプローチは、私たち自身の心が探求し、学び、創造的な解決策を見出す方法と同じやり方です。Infinite Nature は、AI が優れた思考パートナーとなり得ることを示しています。これは、今後、情報とのインタラクションがより直感的でパーソナライズされたものになり、世界の知識の中に隠された可能性を解き放つことに重点が置かれていくことを示唆しているのです。
-Google Cloud、デベロッパー アドボケイト、Kaz Sato
-Google Cloud、デモ&テスト、クリエイティブ リード、Mauricio Ruiz