Web3 向け生成 AI を Google Cloud で実現
Google Cloud Japan Team
※この投稿は米国時間 2023 年 10 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。
生成 AI が広く注目を集めています。この 1 年間、大規模言語モデル(LLM)は毎日のようにニュースになっていました。話題の中心が暗号通貨から生成 AI に移るなか、研究コミュニティはブロックチェーンと AI の接点について探究し、Web3 コミュニティはためらうことなく試験運用を始めています。以下にその例を示します。
- Coinbase、ML とブロックチェーンのリサーチ サミットを主催
- SAKSHI、分散型 AI プラットフォームを提案し、攻撃の課題に対する実証レイヤを装備
- FalconX、暗号通貨トレーダーの支援に Satoshi を導入
- Etherscan、スマート コントラクトのコードの理解に Code Reader を導入
- Solana Labs、リアルタイム データや、トークン転送などの現実のトランザクションのためのプラグインを導入
このブログ投稿では、試験運用の段階からさらに一歩進め、こうしたコミュニティが何を構築しているかを紹介します。具体的には、お客様による実装を Google が支えている、デジタル アセットや Web3 のユースケースを取り上げます。
最初のユースケースはドキュメントの検索と統合です。これは特定、要約、説明を特徴とし、技術系以外の(ビジネス)ユーザーが、大規模なドキュメント セットから分析情報を得られるようにするものです。たとえば、生成 AI を使用して、ブロックチェーン プロトコルに関するホワイトペーパーを要約したり、スマート コントラクトの定義に含まれる脆弱性を検出したりできます。多くのお客様が、LLM を評価するための最初のユースケースとしてこの分野を選んでいます。この場合、社内のユーザーは非公開データと公開データの両方にアクセスします。Vertex AI Search を使用すると、このユースケースを単純化して、生成 AI の検索エンジンを容易に短時間で構築できます。
次のユースケースは、カスタマー サービスのサポートと高度な仮想アシスタントです。これは顧客向けのアプリケーションとなります。対話型 AI は、仮想エージェント、bot、アシスタントが進化したものです。LLM を活用した仮想エージェントは、これをさらに次の段階へと発展させます。顧客はより自然なやり取りが可能になり、仮想エージェントがトランザクションを実行することもできるようになります。Vertex AI Conversation と DialogFlow CX を使用すると、最先端の仮想エージェントを備えた、生身の人間のような対話型 AI を構築できます。
コンテンツの検出も重要なユースケースの一つです。Web3 における事例としては、暗号通貨取引の調査が挙げられます。アナリストは、各自の暗号通貨のポートフォリオに関連するニュースの概要を確認することから 1 日を始められます。重要な情報は集中的に深掘りできます。たとえば、この Vertex AI Search のデモを暗号通貨の取引に応用できます。それだけではありません。アナリストは、学んだことに基づいて取引を行うとともに、アルゴリズムによる暗号通貨取引戦略を立てられます。
そのときに役立つのがデベロッパーの効率向上のユースケースです。これは AI 支援型の開発であり、おそらく Web3 の最大級のユースケースです。AI 支援型の開発は、たとえばデベロッパーがスマート コントラクトを作成するときに、複雑な Solidity への対応を支援できます。同様に、Web3 インフラストラクチャ プロバイダは、生成 AI を使用して API のドキュメントを作成できます。その際には、Google Cloud の Codey などの基盤モデルを利用するか、統合開発環境(IDE)やコードエディタで Duet AI for Google Cloud などの AI ソリューションを利用できます。重要な用途として、以下の 4 つが挙げられます。
1- インラインのコード補完
2- ボイラープレート コードの生成
3- コードの説明: コード関連の質問に chatbot が回答
4- コードのセキュリティ ガードレール: 脆弱な依存関係、推奨される修正など
LLM のオーケストレーションとルーティングは、より高度なユースケースで、お客様が実際に構築していることが確認されています。ほとんどの企業は、複数のユースケースに複数の LLM を利用しています。この記事では多数のユースケースを取り上げましたが、そのすべてを、同じ LLM を使って実現するわけではありません。ある特定のユーザークエリ(プロンプト)に基づき、最適なモデルを選択して呼び出すには、どうすればよいのでしょうか。Google の text-bison モデルと LangChain の RouterChain を使ってこれを行ったデモがあるので、ぜひご覧ください。
最後に、Web3 のクリエイティブなユースケース、具体的には画像と動画の生成 AI があります。これは NFT の領域に入ります。Google の基盤モデルは Imagen で、Vertex AI を介して利用可能になっています。たとえば、NFT を所有していて、その NFT と同じスタイルで新しい画像を作成する、またはその NFT をサブジェクトとして新しい画像や動画を生成するとします。現在、Imagen は電子透かしと検証機能(試験運用段階)を備えており、次のようなことができます。
- テキスト プロンプトに基づいて新しい画像を生成する
- テキスト プロンプトに基づいて画像を編集する
- 画像の説明を生成する
- 特定のサブジェクトに合わせてモデルをファイン チューニングする
Web3 における生成 AI のユースケースを急ぎ足でご紹介しました。Web3 やその他のデベロッパーは、Google Cloud の生成 AI を使用して上述のユースケースを構築できます。これらのユースケースに関連する詳細情報、プラットフォームやアーキテクチャのチュートリアルやデモについては、Web3 における生成 AI のユースケースのウェブセミナーの録画をご覧ください。
このブログ投稿の執筆に協力してくれた Prakash Hariramani に心より感謝します。
-Google Cloud、デジタル アセット担当プリンシパル Bertrand Portier