The Prompt: 確率、データ、そして生成 AI に向き合うマインドセットとは
Google Cloud Japan Team
※この投稿は米国時間 2023 年 10 月 26 日に、Google Cloud blog に投稿されたものの抄訳です。
このところ、ビジネス リーダーたちの間では、生成 AI が話題の中心となっています。急速に進化を続け、変革をもたらすこの分野の話題をフォローできるよう、「The Prompt」と題したシリーズを通じ、Google がお客様やパートナーと接するなかでの気づきや、Google の AI の最新動向を紹介していきます。今回は、Google Cloud の AI &ビジネス ソリューション担当グローバル VP の フィリップ モイヤーが、リーダーが模索すべき 3 つのマインドシフトについて解説します。
生成 AI は、コンピュータ サイエンスがこれまで築き上げてきた中で最も親しみやすい、柔軟なテクノロジーだと私は考えています。しかし、だからといって、どのように企業がカスタムの生成アプリを追求すべきかが明らかになるというわけではありません。
生成 AI の何が他と違って、エキサイティングなのかと問われれば、ほとんどの企業リーダーは、このテクノロジーがユーザーの簡単な自然言語の指示に人間のように流暢に応答し、複雑なソフトウェア インターフェースを直感的なインタラクションやチャットに置き換えるという点を挙げるでしょう。この違いは、単なる空想上のアイデアではなく、実際に体感しているという点で特筆すべきものです。
モデルの品質と生成 AI の手法が向上すれば、その出力は驚くほど人間に近いものであると感じるかもしれません。とはいえ、鉛筆が消しゴムの存在を知らないのと同じように、生成 AI を支える基盤モデルは人間の存在を把握していないことを忘れてはいけません。表面上は人間のように見える彼らの行動は、統計的推論にしっかりと根ざしており、人が何を望むかを予測することはできても人間のように考えることはできません。
したがって、生成 AI の能力を最大限活用するためには、リーダーはモデルが何を実際にするのかだけでなく、何をするように見えるのかを認識する必要があります。今回は、生成 AI が過去のソフトウェア パラダイムと異なる理由と、生成 AI が経営幹部に求める 3 つのマインドシフトについて詳しく解説します。
生成 AI が他と異なる理由
生成 AI は、よくあるタイプのソフトウェアとは動作とデータ活用の仕方が異なるため、リーダーは、考えられるユースケースや推奨されるユースケースを定義するためのいくつかの骨子を理解する必要があります。
生成 AI と他のテクノロジーの違いを理解するには、哲学の領域へ深々とまではいかないまでも、データ サイエンスの深い領域には足を踏み入れなければならないでしょう。勾配降下法、活性化関数、「混合エキスパート」手法、「世界モデル」、プロンプト チェーン、スケーリング則など、複雑なトピックを中心に深い議論が展開されます。技術的に掘り下げると深みにはまってしまう可能性は大いにありますが、企業のリーダーにとっての重要な違いは、従来のソフトウェアがプログラムされるのに対し、生成 AI はトレーニング、調整、強化、指示が行われるという点です。
それは、「郵便番号が 94015 の場合、都市はサンフランシスコ」と認識するマシンと、「サンフランシスコを 1 週間訪問し、3 人の子供たちと一緒にエンバーカデロに滞在する予定です。子供たちは全員 10 歳未満で、そのうちの 1 人は毎日午後に昼寝が必要です。私たちにとって楽しくて教育的なアクティビティは何ですか?」に対する回答例を推測するマシンの違いです。前者は 2 つの情報間の静的な 1 対 1 の関係(if-then ダイナミック)ですが、後者はコンテキストとデータの複雑なブレンドであり、考えられる回答の分散です(どちらかというと what-if ダイナミック)。
考え方 1: 生成モデルは確率エンジンである
この違いを詳しく見ていきましょう。
今日のアプリの機能のほとんどは、特定の出力を返すルールに基づいた決定論的なものです。アプリが製品の価格を調べたり、顧客情報を検証したりする必要がある場合、データベースを呼び出す関数を使用して、正確で再現性のある回答を返します。
対照的に、生成 AI を動かす基盤モデルは確率的であり、人間が求める結果に向けて調整できる確率エンジンとして考えるのが最も正しいと言えそうです。基盤モデルはトレーニングや調整の際に学習したパターンを使用し、質問に対して最も可能性の高い回答や、画像に対する正確なキャプションなど、特定のプロンプトに対する最も確率の高い出力を計算します。データベースの行や列によって確定的に制限されることがないため、基盤モデルは非常に強力で、従来のソフトウェアでは対応できなかった複雑で斬新な自由回答式のタスクを数多く実行できます。ただし、あらゆることに適しているわけではありません。
たとえば、お客様が生成型の小売アプリを操作しているとします。一方では、モデルの確率的な柔軟性により、深くパーソナライズされ差別化されたエクスペリエンスを生み出せるかもしれません。このモデルが、商品の解説、レビュー、ドキュメントなど、小売業者独自のデータで調整されたものであれば、お客様はウェブサイトのナビゲーションではなく、フレキシブルかつまとまりのある会話を通じて製品を検索、比較、選択し、さらには製品に付属品を加えられるようになる可能性があります。しかしその一方で、現在の在庫を調べるといったやり取りはどうでしょうか。この決定論的で常に更新される情報が、モデル自身から得られるはずがありません。このようなアプローチでは、モデルがトレーニング中に遭遇したパターンに基づいて確率をつなぎ合わせ、可能性のある在庫の値を淡々と吐き出すようになるだけで、実際の数値を推測することはほとんどありません。
モデル自体の確率的な性質のため、リアルタイム データや常に更新されるデータにつなげることはできません。そのため、生成アプリはモデルと他のシステム間のやり取りを必要とします。
考え方 2: データがどのように確率エンジンを形成するかを定義する
生成モデルをさまざまなデータソースや決定論的関数と組み合わせる場合、具体的な作業のほとんどは、デベロッパー、データ サイエンティスト、プロダクト マネージャーのような専門家が担当します。しかし、確率的プロセスと決定論的プロセスがどのようにさまざまな方法で価値を引き出すのかを理解することで、リーダーはこれらの取り組みの方向性を定め、技術人材がどのデータソースを新しいアプリやエクスペリエンスに活用できるのかを見極める必要があります。
たとえば、スプレッドシートの精査やさまざまなソースからの情報の取りまとめに、どれだけの従業員が時間を費やしているかを考えてみてください。それ自体が仕事だからではなく、仕事をするために情報を追跡しているのです。多くの場合、従業員が AI アシスタントに必要な情報を集めるように依頼できれば、従業員は行動するための準備にかかる時間を減らして、より多くの時間を行動に費やせるようになり、はるかに負担が少なくなることでしょう。
このシナリオに当てはまる具体的で潜在的なユースケースとしては、お客様向けの情報を探すコールセンターのエージェント、レポートの調査を実施するアナリスト、ブランドのトーンとスタイルのガイドラインが確実に実装されるように取り組むブログ編集者などがあり、他にも多くのケースが考えられます。ただし、それらを達成するには、データと生成 AI の交差部分を把握し、それに基づいて行動するリーダーが必要です。
組織はデータ収集に何年も費やしてきましたが、時にはデータが多すぎて管理しきれないと不満を漏らすこともありました。生成 AI では、もはやそのようなことはありません。従業員がすべてのデータと効率的にやり取りできる、つまりは、データに質問し、理論を提起して、すぐに実行可能な回答を得ることが可能になるのです。しかし、こうした新しいワークフローには新しい考え方が必要です。
前述したとおり、ほとんどの生成アプリは、シームレスでパーソナライズされたユーザー エクスペリエンスを維持しつつ、コンテキストに応じて決定論的な出力と確率的な出力を組み合わせるように設計する必要があります。このような組み合わせでは、技術的なスキルだけでなく、生成 AI でデータをどのように有効活用するかについての明確な経営ビジョンも求められます。最良の基盤モデルは、リリースされたばかりであっても、投げかけられた多くのプロンプトに沿って適切に機能します。しかし、トピックがニッチであればあるほど、モデルの確率の信頼性は低くなる傾向があります。データとその活用方法が慎重に検討されない限り、不正確あるいは有用性の低い出力につながる可能性があります。
こうした課題からは、ごく早期のうちにデータのリーダーシップという面で質問が生じます。基盤モデルは、ユースケースに特化したデータでファインチューニングする必要があるのか。あるとすればどのようなデータでファイン チューニングするのか。それとも、最適なアプリとはモデルを調整することではなく、それをトランザクションやリアルタイム情報のためのさまざまな決定論的システムに拡張することの方に重点が置かれているのか。エクスペリエンスはどのような場合に、決定論的プロセスに接続することによって定義されるのか、確率モデル自体の改良によって定義されるのか、あるいは両方のコンセプトの組み合わせによって定義されるのか。
このような質問から、組織全体と個々のプロジェクト内の両方で総合的なデータ戦略が非常に重要になる理由がわかります。経営幹部が組織全体のすべての決定に関与する必要はありませんが、プロジェクトごとに、リーダーがデータと AI 全体について明確な戦略を定義しているかどうかが問われます。
ある旅行会社が、予算内でより簡単かつ迅速にお客様が休暇を計画できるよう、AI アシスタントを立ち上げたいと考えているとします。ユーザーは、具体的な場所、あるいは「ビーチ」や「美術館がたくさんある」といった一般的なアイデアなど、探しているものを説明します。アシスタントは、休暇プランの候補やお得な情報を特定し、さまざまな場所について詳しいチャットを提供して、指示があれば、航空券やホテルの予約、ツアーの旅程作成、各種予約をシームレスに行います。
この理論上のサービスには、質問に対する確率的な回答を生成する基盤モデルだけでなく、トランザクションや予約情報などのリアルタイム情報を取得するためのさまざまな決定論的システムなど、かなりの数の動的な部分があります。特定のデータを使用してモデルのトレーニングやファインチューニングを行う、またはエンべディングやコネクタを利用してモデルを他のシステムに拡張するなど、さまざまなテクノロジーが重要になる可能性があります。ただし、技術的な詳細はともかくとして、このアプリの潜在的な価値の起点となるのは、生成 AI がどのように新しい方法でデータの価値を引き出せるのかを特定することです。たとえば、そのアプリは、さまざまな航空会社やホテルの API から予約データおよび目的地データに至るまで、他のサービスが複製できる情報を単純にパッケージ化するために生成 AI を使用しているのか、それとも具体的な詳細や見解を含む長年の旅行レビューのような、旅行会社のみが利用できる独自のデータを有効活用しているのか。
リーダーはこうしたデータ有効活用の取り組みのアーキテクトであるべきです。生成 AI でどの潜在的なデータソースを有効活用できるのか、生成アプリが適切な情報をより効果的に適切な人々に届けるにはどうすればいいのか、新たな価値を有効活用するにはどうすればいいのかを見極める必要があります。
考え方 3: 機会を持つことは、責任を担うということである
生成アプリは、データの使用方法や動作がほとんどの従来のアプリとは異なるため、新たな責任を伴うことになります。望ましくないモデルの動作に対するガードレールやモデルの精度を向上させるさまざまな方法など、これらのアイデアのいくつかについて軽く触れてきました。セキュリティとプライバシーへの配慮も最重要事項です。
しかし、その責任はどのような考慮事項よりもはるかに大きなものです。革新的なテクノロジーは多くのことを効率化する可能性を秘めていますが、本当の価値はそれが物事をより良いものにするかどうかにあります。
そこには、新しいテクノロジーが情報とのやり取りをどのように形成できるかを定義し、従業員の仕事のやり方を改善して、お客様が企業とどのように関わるかを発展させるという、リーダーにとって力を発揮できる機会があります。すべての経営幹部は、責任ある AI 原則を定義する取り組みに参加する必要があります。上層部こそが効果的に主導できる取り組みだと言えるでしょう。
生成 AI のビジョンと戦略を構築する
多くの点で、ML やデータ サイエンスの経験がないデベロッパーでも、高度な AI アプリを構築するのはこれまでより簡単になっています。しかし、このような移行はシームレスなものではなく、企業のリーダーはすぐに大規模な移行を進められると期待すべきではありません。
キーボードやデスクトップからタッチスクリーンやモバイルへの移行に比べると、生成 AI への移行はもっと複雑で広範囲に及ぶ可能性があります。何が変わったのか、そしてその変化において必要とされる考え方を理解することは、新しい環境で舵を取るために必要不可欠なのです。
冒頭の画像は、Google Cloud で Midjourney を使用して、「確率分布が特定の結果に変換される」というプロンプトで作成しました。
- Google Cloud、AI & ビジネス ソリューション担当グローバル VP、Phil Moyer